1. まとめトップ

ビッグデータを活用!Twitterによる株価予測手法

NTTデータがTwitterから得られるビッグデータを使った株価予測手法を開発しました。Twitterから得られるビッグデータとは?Twitterと株価にはどんな関係が?などまとめました。

更新日: 2014年09月15日

4 お気に入り 11531 view
お気に入り追加

まず、ビッグデータってなんだっけ??

容量が大きいデータのこと??たしかにハードディスクも大容量化してるし…

「ビッグデータ」とは何なのでしょうか。残念ながら共通定義はまだ定まってはいません

ということなので、ビッグデータの特徴を示しておきます

従来のデータベース管理システムなどでは記録や保管、解析が難しいような巨大なデータ群

引用の紹介コメントを入いまいち理解し難いような気がしますね。巨大とはデータ量的なことでしょうか?力

どの程度のデータ規模かという量的側面だけでなく、どのようなデータから構成されるか、あるいはそのデータがどのように利用されるかという質的側面において、従来のシステムとは違いがある

引用の紹介コ様々な構成データであることやデータの利用目的を考慮することなどが従来との違いのようですね。メントを入力

ビッグデータの特徴は、量だけでなく、扱うデータの種類が多いこと

データの種類が多様ということは、データを整列(ソート)するのも一苦労、分類はもっと大変かもしれませんね。

Twitterから得られるビッグデータって?

主に大量の不特定多数の発言

なるほど。ただ、これだけではまだ有用な情報とはなりえませんよね。

ビッグデータを活用するためには、「データを集めて蓄積する仕組み」と「データを分析する手法」が重要

Twitterで言うと、ツイートを保存し、そこから有用な情報を得るために分析することが重要ということですね。つまり、ただ単にツイートを収集するだけでは全く意味が無いということになります。

Twitterを使った株価予測手法とは?

「Twitterセンチメント指標」と金融指標値との関連性を評価

『センチメント』とは市場心理のことで、『Twitterセンチメント指標』とは、全ツイートのなかから抽出したセンチメントを指標化したもののことだそうです。『金融指標値』とは、株価や為替相場などの変動を表す(定量化した)指標のことで、今回の実験では日経平均VIというものを使ったそうです。

つぶやきの数を詳しく見ていくことで、株価を下げる出来事があったときに、その余韻の大きさなどをみる手がかりになり得る

簡単に言うと、つぶやき数と株価の関係を調べるということですかね。

本指標が実際の金融取引における有効な判断指標となる可能性があることを実証

Twitterから得たビッグデータを分析して作った指標が、新たな金融指標値となる可能性があるということですね。つまり、Twitterから市場の動向、つまり株価の動きを知ることができるかもしれないということです。すごいですね。

特定の銘柄の株価を予測したわけではありません。日経VIという、日経株価の変動率を予測して指標化した金融指標に追従した指標を作り出すことで、株価の予測をしたことと等価であると言っていることになります(少し強引ですが)。

個別銘柄の上がり下がりについてはその読みが弱くなるのでは

たしかに、いくつかの銘柄から算出される指標への追従を強めるとその可能性はありますね。

市場関係者から意見を聴いて、提供するサービスの形態を検討している

どのような商品・サービスにしていくかはまだまだこれから考えるということですね。

アメリカでもすでに研究され始めていて…

“Twitter mood predicts the stock market”(twitterの機嫌が株式市場を予測する)という論文

上のNTTデータの手法に似ていて、感情を表すワードを含むツイートを抽出し、そのツイート数から株価の動向を予測する手法です。

最終的にダウ平均株価の動きを87.6%説明する事に成功

この手法は機械学習(人工知能)も利用しているようです。

疑問として挙がったのが、「Twitterの感情と株価は本当に連動するのか?」

これは検討の余地がありそうですね。市場関係者(投資家など)が、感情を表すワードを含むツイートの大部分に関係しているとは考えづらく、もっといえばほとんど関係ない人々のツイートであるように思えるからです。

ちなみに、ビッグデータ以外にも株価予測手法はありまして…

ニューラルネットワークとは生物の脳を模倣した数理モデルで、人間と同様に学習して使います。株価予測では、過去の株価の推移を使って学習して、未来の株価を予測するように使うことが多いようです。実際のところ、学習に使うデータの選び方や、急な変動に対応できないなど、あまりうまくいっていないようです。

カオスとは、入力と出力の関係が決定論的に決まるにもかかわらず、長期的予測が極めて困難な振る舞いを持つ現象のことです。カオスはミクロ(粒子)とマクロ(流れ)を結びつける物理から始まった理論で、これを株価に当てはめて考えると、粒子→投資家、流れ→株価と置き換えることで株価予測モデルを構築できると考えられます。まだまだ研究途上のようです。

データマイニングとは、大量のデータの中から有益な情報を取り出す手法のことで、クラスタリングや分類なども含まれる。これはビッグデータを用いた株価予測とほぼ同様である。ただし、ツイート以外の多くの情報を対象として、そのなかから株価の動向に関係するデータのみを取り出し、モデルを構築することもある。

結局どれを使えばいいの?株価予測はできるの?

ぴったり正確に、というのは無理だとしても、株価指標であれば可能かもしれないですね。結局、まだ研究途上ではっきりとはわからないということですね。また、ほとんどの研究はなんらかのデータを使って、株価推移の予測モデルを作ることを本質としているため、似た結果になっているのかもしれませんね。


ただ、こんなニュースも・・・↓

株価の値動きは短期ウインドウで予測可能である証拠が見つかった

条件が揃ったとき、短期的なら予測可能だそうです。ただやはり、中長期的な予測は難しいようです。

1 2





doublezoomkitさん



  • 話題の動画をまとめよう