今年は平年よりも非常に早いペースで梅雨入りしました。

この記事では梅雨についての投稿を自然言語処理技術で解析してみました。

新しい気づきがあれば幸いです。

目次

概要

意外とソーシャルネットワーク上はポジティブなようです。しかしながら、頭痛・肌・毛など梅雨特有の健康に関する懸念は多くみられました。

投稿傾向

まず全体の投稿傾向です。今回は5/21から5/27の5月末の1週間からサンプリングして抽出しました。

  • 個人コメント:

    81%
  • 広告:

    17%
  • メディア系(ニュース・ブログ・YouTube):

    1%

解析対象の投稿のサンプルは以下です。
※ページをリロードするたびに表示される投稿が変わります。

一般個人の方のコメントが多めですが、懸賞などを中心に広告コメントがみられました。また、意外にも天気予報系の投稿含めてメディア系記事は少なめでした。

感情判定

続いて感情判定を見てみます。まずは一般個人のコメントの感情の全体平均を見てみます。

ポジティブ:55.0
ネガティブ:45.0

わずかにポジティブの方が高いようです。感情ごとの投稿の偏りを見てみましょう。

ポジティブ:45%
ニュートラル:35%
ネガティブ:20%

ネガティブ投稿は20%しかありません。全体平均は僅かに高めでしたが、そもそもネガティブ投稿はあまりなく、高い評価のポジティブ投稿が少ないだけのようです。

ちなみに、もともと割合少なめですがメディア系記事の感情評価は以下のようになっております。メディアは梅雨に対してネガティブな投稿が多めのようです。

ポジティブ:47.5
ネガティブ:52.5

ワードクラウド

最後にワードクラウドを見てみましょう。まず一般個人の投稿の全体から見てみましょう。

一般個人の投稿全体のワードクラウド

 

頭痛がトップワードです。やはり頭痛に対する懸念が大きいようです。私も天気が怪しくなってから気象病のような頭痛に悩まされることがたまにあります。

続いて、花・紫陽花といった花に関する言及があるようです。やはり梅雨に咲くあじさいは梅雨の楽しみのひとつなのでしょうか。

ポジティブ投稿のワードクラウド

次にポジティブ評価だけの投稿のワードクラウドを見てみましょう。

 

やはり花・紫陽花・晴れといったワードが多めです。意外にもポジティブ投稿にも頭痛や体調を気にする投稿が多いようです。

ネガティブ投稿のワードクラウド

最後にネガティブ投稿を見てみましょう。

 

意外にも頭痛のワードが消えました。もっともカミナリへの嫌悪や、髪の毛の心配、憂鬱といったワードがでております。

終わりに

最後まで読んでいただきありがとうございました。

梅雨の過ごし方として新たな発見があれば幸いです。