※Finance Sentimentはクローズしました。開発レポートのみ残しています。
この度金融関連ツィートの感情分析結果をレポートするウェブサイト Finance Sentimentを公開しました。この記事では開発にあたっての話、今後のことなどにふれらればと思います。
目次
Finance Sentimentとは
Finance SentimentはTwitterで投稿された金融関連ツィートの感情解析を行っています。 本Webサイトでは毎日の金融市場に関わる人々の感情をレポートしております。
きっかけ
本当に単純な動機です。このブログ自体もWordPressを使わず1から開発していますが、そろそろ公開から1年たち、「せっかくサーバ借りて1から開発してるなら本ブログのサブコンテンツとして公開可能なWEBアプリを何か、できればAIとか使っていて面白そうなもの作れるといいなー」と考えて思いついたものがこのサイトでした。
以前以下の本を読んで行動経済学視点でTwitterなどの掲示板コメントをかき集めて株価との相関性を研究があると知っていました。
しかしながら、投資商品としての利用紹介や論文のみで、WEBサイトとしてデイリーオンタイムで見れるサイトはみつかりませんでした。そういう背景から、精度がたとえ悪くても、オンタイムで見れるWEBサイトを作って公開できたらおもしろいのではないか。自分以外に興味を持ってチェックしてみたいと思う人がいるのではないかと思い開発に着手することになりました。
ちなみにどちらかというとファンダメンタル重視の私にとっては、本当に投資に役立つかどうかは仮に精度がよかったとしても懐疑的です。というのもあくまで過去のデータの分析レポートであるので、それが未来をどう作るかは正直のところわからないです。その点でこのデータの投資利用については、自己責任でお願いしますという原則はここでも変わらないと思います。
どのようにTwitterの投稿の解析しているか
詳細なロジックや利用技術は公開できませんが、仕組み自体は単純です。TwitterAPIを使って特定キーワードで検索してヒットしたTwitterの投稿を抽出したあと、感情分析APIにアクセスして感情分析を行い、分析した結果をデータベースに保存してWEBサイト上で閲覧できるようにしているだけです。
ちなみになるべく低コスト・無料のものを扱っているので、全てのTwitter投稿を解析しているわけではありません。一定時間ごとに区切ってサンプリングした数十件の投稿を感情分析APIにかけているだけです。また、分析項目も主要指標・金融商品・個人的にピックアップした主要銘柄だけです。
今後について
また、β版の位置付けでUIも雑ですし、私がこの手の自然言語処理におけるAIや機械学習について素人であるので解析精度もいまいちです。
ポジネガの感情スコアは正直のところニュートラルの50前後ばかりです。おそらく、感情の揺れ幅を見れば賛否両論・悲喜こもごもな投稿が多すぎて結局中間点になってしまうのではとも思っていますが、ちょっと物足りなさを感じています。
解析対象を3件だけサンプルで登録していますが、たまに全く的外れの投稿を拾っています。この点も抽出条件に課題を感じています。
API提供者としても日々改良していると思いますが、私自身のレベルでもチューニング余地はかなりあると思うので、随時できる範囲でチューニングしていこうと思います。単純に既成のAI系のAPIを利用しているだけなので、例えば、自分で金融系・経済系投稿を収集して機械学習させ、金融系経済系投稿だけを選別させるなども検討しようと思います。
その他、投資に役立つか微妙と言いましたが、行動経済学もどきの一環として、精度も落ち着いてデータが貯まってきたら、実際に市場価格との相関性なども分析して本ブログにレポート記事もかけるといいなと思っています。
あと、このブログと同様費用マネタイズとして広告つけてます。β版のいまいちなシステムでも興味を持ってアクセスいただける人が多い状況でしたら、ユーザーへの還元として解析指数などを増やしたりなどできればと思っています。
終わりに
最後まで読んでいただきありがとうございました。まだまだとても荒削りなシステムですが温かい目でみていただけますと幸いです。
Photo by Roberto Junior on Unsplash