ブログカスタマイズの記事要約システムをブラッシュアップしたいよな。
さて、土曜日であるね。僕はここ最近、非常に忙しい。仕事でも納期が詰まっておるが、プライベートでもやることがいっぱいで週末も忙しい。また、来週の土曜日にG検定の試験の本番があるので、それに向けて勉強のつめに入らないといけない。G検定については、ある程度参考書を読んでいたらどのような流れなのかというのは把握できたので、明日にでももう一度、過去問を本番と同じ流れで解き直してみる。ここまで時間を費やして勉強してきたのだから結果は残したいところである。
とりあえず来週G検定の試験が終わったのならば、プライベートの方で期限が区切られたタスクというのはなくなる。ようやく自由な時間ができたので、なにかプライベートを充実させる趣味なんかをやってみたいなと考えている。今日は資格勉強の次は何をするのかのプランについて考えて参ろうか。
ひとまず僕は、G検定の勉強をしてみて自分は技術的なことが勉強不足であるなと痛感しているところである。ここんところの世の中の流行りを追いかけてみると、AIのブームが本格的になっていくのではないかという流れになっている。ちょうど今、G検定の勉強をしていたのはトレンドに乗っかるにはドンピシャりのラッキーであった。ちょっと小難しい感じの技術ドキュメントを読んでみても、そこで使われているキーワードがちょうど今勉強している内容と同じものが頻出してくるのである。これはそのまま機械学習とかディープラーニングなんかを勉強してみて、AIエンジニアとしてのキャリアアップを目指してみる好機であるなと認識している。
最近のAIブームに関してはChatGPTのおかげで流行り出した感じであるけど、別にAIが使われてる領域に関してはここがはじめてという感じではなくてさ、スマホなんかを使ってるとその中にはAIのテクノロジーというのはたくさん詰まってる感じなのであるよ。たとえばちょっと英文を日本語へ翻訳して読んでみたいという時、使う翻訳サービスにしても、最近の翻訳サービスはほとんどAIによって翻訳エンジンは動いている。
僕んところのブログについてる記事要約システムに関しても、これは朝日新聞社が出してる記事要約APIを利用して動いており広義のAIを使ってるようなものであるよ。
この朝日新聞社の記事要約APIであるけど、新規利用者の登録を停止しておりいつまで使えるか分からないというのは不安なところであるね。まぁ、WebAPIに関しては無料で使えるものに関しては管理者の思惑1つですぐに停止したりするものである。それをずっと続く前提で運営するサービスに組み込むのはケガの元であるよな。
ちょっと、こちらの記事要約システムに関しても長文要約する側のエンジンを少し組み替えるブログカスタマイズが必要かなと感じてる。こちらの記事要約エンジンをChatGPTに置き換えるのを試しにやってみるのを試してみようかなと思ってる。
まぁ、ChatGPTのOpenAI社は、API越しにGPT-3のエンジンを使えるようなサービスがあるので、そちらに「記事の本文を英語で要約して200文字程度に日本語で翻訳して」みたいなお願いをしたら割と簡単に実現できるタスクであると思う。しかし、OpenAIのAPIは無料分がついてるけど有料のサービスであるので、継続的に使うには課金しながら使用し続けることになる。
まー、それでも良いかなと思うけど、できれば自分で記事の要約エンジンをディープラーニングの勉強がてらで作ってみたいよな。ChatGPTのエンジンに組み込まれているというTransformersを使って自前で記事を要約するPythonのスクリプトを書けないかな? という気もするんだよね。
動作環境を用意するのがそこそこ難しい。クラウド環境をセッティングする必要があるだろうから素直にGPT-3を使っとけという気もするんだけどね。
長文の記事要約には、抽出型と生成型という二種類のタイプがあって、GPT-3とかHugging Face Transformersは生成型だ。抽出型というのは、記事の中から重要性の高いキーワードや文章などを抜き出してそれを返してくれる処理で、今んところ僕のブログに組み込んである朝日新聞社のAPIもおそらくそれである。抽出型の記事要約ライブラリにはsumyなどがある。
生成型の記事要約というのは、記事本文を読み込んで意味だけ抜き出したあと、それを元に文章を書き出すタイプの要約でChatGPTに要約をお願いした場合もそうやって要約文を書いてくれる。
ちょっと今、このブログに組み込んである抽出型の記事要約エンジンはあんまりわかりやすい記事要約をしてくれないから、そこを自分で生成型の記事要約エンジンなんかを作れないかなと思うんだよね。個人ブログに組み込むブログカスタマイズとしては、まさしく鶏に牛刀みたいなものであるが、ディープラーニングの勉強がてらやってみたいよな。