超メモ帳(Web式)@復活

小説書いたり、絵を描いたり、プログラムやったりするブログ。統失プログラマ。


SPONSORED LINK

ブログに組み込む長文要約システムをどんな風に作るか考えている。

ブログに組み込む長文要約システムをどんな風に作るか考えている。


日曜日ー。明日から仕事ですな。明日が月曜日で鬱になるとかはないけど普通につまらんとは思いますな。今日は午前中に歯医者に行ってきて歯茎に薬を塗ってもらってきた。僕は歯医者に定期検診に通ってるんですよ。3ヶ月にいっぺんぐらい歯医者に通って歯石取りと歯茎の腫れを引かせる薬を塗ってもらってるんです。週末なのでちょっと友人とスタバに行って外食で夕食を済ませてきた。今回行ったのは与那原町にある「うさぎ」といううどんのお店。



ここは夜は居酒屋でランチの時間にうどん屋をやってるというお店。うどんは自家製麺ですごくコシがあって美味しい。だしもこだわっていて内地とおんなじような甘いツユを使っている。割と気に入っていてたまに通う。一応、情報は載せておきますね。



手打ちうどんのうさぎ


それ以外は主に新しく買ったMacbookGoogle Cloudについて調べてた。なんかさ、今作りたいアプリを動かすためのバックエンドをどうしようかとかそういうことを考えていて、無料で使えるクラウドサービスはないか色々と調べまくってるんですよ。だいたいまぁ、無料枠があって使えそうなクラウドサービスというとAWSGoogle CloudかHerokuぐらいしかないんですけど、それぞれとても使うまでのハードルが高くてなかなかに手強い。


別にさくらインターネットVPNサーバをひとつばかしレンタルしてそちらで色々と開発するのもアリかと思ったけど、どうせやるんだったら今時のバックエンドを色々といじるような開発をやってみたい。無料でどこまでやれるのかの自由度とかも調べてみたいし、僕の趣味の開発と言うのは勉強も兼ねているのでちょっとずつ色々なことを調べながら開発を進めたい。


まぁ、今作りたいのはアプリではなくて、このブログに記事の要約を表示する機能でも追加してみたいと思ってるんですけど、それにはバックエンドで動いてDBに要約を保存する仕組みが必要だな。やり方は何種類かあってそれぞれ難易度が違う。今回のブログはこれから作るシステムをどんな風に作るのか思考の整理でも行っておくか。


まず、長文の要約というのはいろんなやり方がある。長文要約するWebAPIを提供している企業もいくつかあって、朝日新聞社の研究チームが出しているこのAPIは無料で1日20件まで使うことができる。


cl.asahi.com


お手軽に長文要約のシステムを作るのであれば、このAPIを使って一日20本の記事を要約してDBに保存して、それをブログの方でサーバから呼び出して表示してやれば良い。僕が今考えているのはこのやり方で、さっさとやっちまおうかなーと思っている。一応、さくらインターネットのスタンダートプランのレンタルサーバは借りているので、テキトーにPHPスクリプトを作ってAPI叩いてMySQLにデータを保存して、リクエストがあればDBのデータをJSONで返す処理を作れば希望する要件は満たすことができる。ひとまずはこっちの方で開発を進めておくとするか。


次に考えているvar2は、自前で本文要約する自然言語処理のプログラムを組んでしまって、それでDBを作成して対応させるやり方だ。Python自然言語処理のライブラリというのは充実していて長文要約のライブラリも存在する。


itdepends.hateblo.jp


これで適当に長文要約のPythonの処理を作っておいて、それをGoogle cloudのcloud runで走らせて夜間バッチ処理でDBに保存させられないかなーとか思ってるんですよ。頭ではこんな感じかなーというのは分かってるんだけど、やることが高度で僕程度の腕ではなかなかに難易度が高い。慣れないpythonクラウドを扱っていきなりここまでの処理を書くことができるもんか?と思ってる。


ひとまずvar1.0の朝日新聞社の無料APIを使ったシステムを完成させてしまって、それからvar2.0の開発でも進めていこうかな。セキュリティ面も考えないといけないからやることは多いんだ。最近の日々の開発は仕事の疲れを癒してくれる働きもあるんだ。自分が作って楽しいシステム開発をしてどんどん成長していけたらなと思う。

プライバシーポリシー免責事項