1. まとめトップ

ツイッターも口コミもメールも…ビックデータや解析でネットでのあなたの動向は丸裸?

今やビック・データの分析の向上で、ネットを利用すれば情報だけではなく、その動向や嗜好さえも分析や解析され丸裸にされてしまいます。されどネット社会だけに利用しないわけにはいかなく、ある程度のリスクを背負う覚悟を持って使うしかないか、または使わないか。

更新日: 2015年08月21日

0 お気に入り 1391 view
お気に入り追加

この記事は私がまとめました

egawomsieteさん

■ネット上の言葉で景気判断=新指標開発へ-経産省

経済産業省は20日、インターネット交流サイト(SNS)を通じて発信された言葉から、景気の動向を判断する指標を開発する方針を明らかにした。1週間程度の短期間で集めたデータを指標化して2~3日後に公表し、景気判断に活用するのが目的。2016年度予算の概算要求に関連予算を盛り込み、同年度中の公表開始を目指す。
 ツイッターなどのSNSには、毎日大量の言葉が書き込まれている。同省はサイトの運営事業者から、こうした言葉を集積したデータの提供を受ける。景気の改善・悪化局面で特徴的に使われる言葉を分析して指標化の方法を確立する。データ収集では、個人情報保護に十分配慮する。

■ツイッター分析で驚きの事実発覚?

ツイッターは8月27日、投稿したツイートにどんな反応があったかを知ることができる「ダッシュボード」というページを公開。これまでは、認証済みアカウント(ツイッター社が本人だと認めた有名人のアカウント)や広告主のみに提供されていたが、一般ユーザーも利用できるようになった。

「ダッシュボード」では、各アカウントのツイッター上の影響力を分析する「アナリティクス」という機能を利用することができる。アナリティクスでは、過去4週間に投稿した各ツイートの閲覧数、ツイート内URLのクリック回数などが表示されるほか、フォロワー数の推移やフォロワーの性別や興味分野などの傾向を知ることができる。

つまり、自分のツイッターアカウントがどんなユーザーに支持され、どんなツイートが人気であるかを分析してくれるのだ(分析結果を見るには、ツイッターのログインした状態で「ダッシュボード」のページにアクセスするだけでOK)。

これまで知ることができなかった、自分のアカウントの現状を知ることができる機能なわけだが、ツイッターユーザーの反応を見てみると、

「触れてみてちょっと面白いけど良く判らん」(原文ママ)
「何か面白そうだけど、イマイチ意味解ってないw」

と、まだまだ上手に使いこなせていないユーザーも多い模様。ただ一方では、

「こわい。Twitterのクリック数がわかる(中略)ダッシュボードとか見たら純粋にTweetできなくなりそう」
「インプレッション数ていうのが0件だったよ(;´∀`)」
「0がいっぱい並んでた。うん、まぁ。泣いてないよ。へぅっ」
「ひとりでぶつぶつ呟いてるだけなのがバレちゃう!」

など、インプレッション数(=ツイートの表示回数)が少ない現実を目の当たりにするのが怖いというユーザーや、実際に少なかったインプレッション数にショックを受けるユーザーも多かった。

さらに、フォロワーの性別の分析結果について、

「フォロワーの91%が男性になっててやっぱりTwitterにはおっさんしかいないのねーって思いました」
「Twitterのダッシュボードが一般公開ということで見てみたら95%が男性だった。見なければ良かった」

など、男性比率が多かったことに驚きを感じるユーザーが続出。ツイッターのまとめサイト「Togetter」でも「Twitterがアナリティクス・ダッシュボードを公開。フォロワーの圧倒的多数が男性と知って阿鼻叫喚のTL」としてまとめられている。

とはいえ、ツイッターのプロフィール設定に性別の項目はなく、投稿の内容、あるいはアイコンの画像などによって推定しているものと思われる。実際、「ダッシュボード」のページ内には「本ページに表示されているデータは予測に基づくものであり、最終的な請求内容とは異なる点をご注意ください」との注意書きもあり、性別に関しての分析については少々微妙なものといえそうだ。

■深夜ツイートは攻撃的、データ証明

Yahoo!は、7月16日、ツイッターに投稿された文章を0~24時までの軸で解析し、各時間帯によくつぶやかれる言葉から、どの時間帯にどのような感情のこもった言葉が投稿されやすいのかを発表した。

この発表は、Yahoo! JAPANのビッグデータレポートチームが「Yahoo!検索(リアルタイム)」データを解析したもの。レポートチームが独自に作成した“気分”ワードリストから、時間帯ごとにツイートを検証したところ、特にツイートされる割合が高かった上位3つは以下のとおりとなったという(レポートより抜粋)。

〈朝〉
6時台…「明るい」「眠い」「健康的」
7時台…「痛い」「えへへ」「がんばろう」
〈昼〉
12時台…「お腹すいた」「もぐもぐ」「うきうき」
13時台…「満腹」「あったかい」「おそい」
〈夕方〉
17時台…「帰ろう」「疲れた」「終わり」
18時台…「暗く」「お疲れ様です」「近い」
〈夜〉
22時台…「えっ!?」「うらやましい」「いいよ」
23時台…「一日お疲れ」「ごめん」「確かに」
〈深夜〉
1時「間違いない」「こわい」「悔しい」
2時「怖い」「エロい」「やかましい」
〈早朝〉
4時「死ね」「変な」「どうして」
5時「暗い」「大切」「愛して」

6時台の「眠い」や、12時台の「お腹すいた」などは、当該時間帯によくツイートされる言葉として納得できるものの、7時台の「えへへ」、23時台の「うらやましい」など、なぜこの時間帯に多いのか謎なワードもある。

また、このレポートでは、「感覚」や「気分」に関するワードに注目し、1日の推移も検証。それによると、「もうだめ」「ダメだ」などの精神的な苦痛を表現するような“ネガティブ系ワード”は2~4時台にピークとなる傾向が多い一方、肉体的な苦痛を表す言葉は別の時間帯に多いことも発表している。

たとえば、「腰が痛い」は8~9時台、「頭が痛い」は16~17時台、「足が痛い」は17~18時台といったところだ。おそらく、仕事や学校など、活動の前後と関係しているのだろう。さらに、「(笑)」や「エロい」など、プライベートでよく使われそうな言葉についても分析、「(笑)」は23時台、「エロい」は2時台でピークという結果になっている。

■「ツイート数と視聴率はあまり連動しない」とテレビ局関係者

ツイッター上のつぶやき数と視聴率は連動するものなのか。昨年12月10日、ビデオリサーチがアメリカのツイッターと協業し、ツイッター上でのテレビ番組の反応を測る「ツイッターテレビ指標」を提供すると発表した。今年6月から開始される。

 この指標は、ツイートの投稿数やユーザー数、インプレッション(表示)数、インプレッションユーザーを中心に構成されるという。

 昔と比べ、リアルタイムでテレビを観る習慣が減ってきており、テレビの視聴率は全体的に落ちている。そうしたなかで、視聴率を発表しているビデオリサーチが新たな策を打ち出してきたわけだ。だが、テレビ局関係者はツイッターを指標とすることに疑問を呈する。

「正直な話、ツイッターと視聴率にはあまり相関関係があるとはいえません。時間帯にもよりますが、番組内で話題になった言葉がツイッターのホットワードに10個中5個入っているような番組でも、視聴率が1%台ということもあります。深夜帯ですけど、それにしても1%は低いですからね。

 他にも、野球中継のときにホットワードに2、3個並ぶこともありますが、視聴率にすると、2ケタに乗るかどうかといったところ。視聴率20%を超える番組はツイート数も多いですが、ツイート数が多いからといって視聴率が高いとは限らない、ということです。

 番組を観ながら、思ったことをつぶやくという点において、ツイッターとテレビ相性が良いのは間違いないと思いますが、視聴率と同じような指標にする域には達していない。『ツイッターテレビ指標』と『視聴率』には、間違いなく乖離が起こるはずです」

となれば、現場は混乱するはずだ。テレビ局関係者が続ける。 「現在のテレビは40、50代向けに制作されている番組が多い。しかし、彼らのツイッター利用率は低い。『ツイッターテレビ指標』が開始されると、現場はどちらを信じるべきか迷いが出るでしょうね。おそらく、視聴率を優先すると思いますが……。

 それでもスタッフとしては、『視聴率は悪いけど、ツイッター指標はいい』という逃げ道として使えます。実際、視聴率という指標は今の時代に合っていない側面もありますから、『ツイッターテレビ指標』は1つの見方にはなると思います。

 ただ、繰り返しになりますが、2つの指標が大きくかけ離れる番組はたくさん出てくると思います。現時点で、そういう番組は山のようにありますから」(同前)

この指標が取り入れられるからには、ツイッターのアクティブユーザー(実際に今でも使っているユーザーのこと)数の動向も重要になってくる。一時期と比べ、熱が冷め始めているともいわれるツイッター。今年6月の時点では、どうなっているのだろうか。

「その点も、注目されています。たとえば、以前はミクシィが国内最大手のSNSでしたが、いまやフェイスブックやツイッターに取って代わられている。同じことが今後ツイッターに起きても、不思議ではないですからね」

■グーグルが「Gmail」を解析して犯罪を通報「プライバシーの侵害」ではないのか?

グーグルが、ユーザーのメールを勝手にチェックして警察に情報提供し、それによって米テキサス州の男性が逮捕されたことが、世界を賑わせている。

報道によると、事件が発覚したきっかけは、グーグルが男性の「Gmail」から3枚の児童ポルノ画像を見つけたことだった。グーグルはこの男性のユーザー情報を、NPO団体に通報。警察がその情報に基づいて捜査したところ、容疑者宅から児童ポルノ画像が見つかったため、逮捕に至ったのだという。

グーグルは今年4月に利用規約を更新し、Gmailを含むユーザーコンテンツを分析すると告知している。また、Gmailの利用規約でも、児童の性的虐待画像のようなコンテンツを発見した場合、「適切な機関に報告する」としている。

児童の性的虐待画像が許されないのはわかるが、それを発見するために、他の関係ないやり取りまでグーグルに見られるのはどうも落ち着かない。メール内容は「通信の秘密」として、保護されないものなのだろうか。プライバシー問題にくわしい福本洋一弁護士に聞いた。

グーグルに「日本の法律は適用されない」?

「日本国内では、電気通信事業者は、通信の秘密を侵害してはならないと法律で定められています。違反者は刑事罰を受けることになります」

福本弁護士はこう切り出した。電気通信事業者が勝手に通信内容をチェックすることはできないということだ。ということは、グーグルが日本で同じことをしたら違法行為になる?

「ところが、そういうわけではないのです。グーグルは、米国の企業であり、Gmailのサーバを日本国外に設置していることから、『日本の法律は適用されない』として、電気通信事業者としての届出をしていません。

つまり、グーグルは、自社が日本向けに提供しているサービスについても、『通信の秘密に関する規制が及ばない』という立場をとっているのです。

過去にも、Yahoo!メールがメールの内容に応じた広告を表示する機能を導入しようとした際に、国内事業者であるヤフーについては『通信の秘密』への抵触が問題視されたのに、先行していたGmailは問題とされなかった、ということもありました。

したがって、日本でも米国と同様に、グーグルによる監視が行われるおそれはあるでしょう」

●プライバシーを守る法整備が必要

日本の法律が不十分ということだろうか?

「そうですね。個々の利用者がプライバシー侵害を理由として、自己の情報の監視に対する差止めを求めることは考えられますが、費用対効果の観点から現実的ではありませんし、利用規約で監視に同意しているとして否定される可能性もあります。現状では、十分なプライバシー保護ができていない状況です。

個人情報保護法の改正の議論でもグローバル化への対応が求められていますが、日本国外から日本国内向けに提供されるサービスに対しても、事前にプライバシーの侵害を規制するような法制度の整備が求められるでしょう」

現状で、個人はどう対処すべきだろうか?


「現状においては、利用者自身がサービス提供事業者のサービス内容を検討したうえで、自己の情報を利用されたくないなら使わない、という選択をするしかないでしょう」

福本弁護士はこのように結論付けていた。

1 2