【プロジェクト紹介】株価の予測を機械学習で 中間報告会

スポンサードリンク

こんにちは。ふぁんたです。

 

今日は、長いこと趣味でやってる株×機械学習のプロジェクトの中間報告をします。

 

名前

ぜかましプロジェクト

 

意味

ぜ:ぜんじどうで

か:かせいでくれる

ま:ま

し:しーん

 

概要

1.株のデータをダウンロードしてくる

2.機械学習で株価の上昇・下降を予想して売り買い

3.お金がふえる!

 

ちゃんとした概要

株のデータをダウンロードして、そのデータから株価が上がる・下がると考えられる特徴量を計算して学習させれば、もしかしたら株価の予測ができるような特徴量が発見できるんじゃないだろうか?それに伴って機械学習周りの知識もついて、お金も増えて、最高の最高なのでは?

 

途中経過

対象:証券コードが割り当てられている日本株ぜんぶ

データ量:2019年2月現在、アバウト700日分ぐらい(増えていく)

検証方法1:対象銘柄1つに対して10万円/100万円を持たせ、予め決めたルール(特徴量を考慮して決める)に従って、全力で売り買いを行う。

検証方法2:データを日付順はそのままに4:1に分割し、4側で最適化した売り買いデータをもとに良い戦略を編み出し、勝率100%を目指す。

 

今現在の結果(途中の成果)

検証方法1:勝率73%を記録。しかし、高すぎてそもそも買えない銘柄や、勝率を計算するタイミングで株を所持しており、勝ちとも負けとも言いづらい状態の株も存在するので、この73%は本当に73%なのか…?という状態。

100万持たせて売買させ、8000万を超える金を持って帰ってきたすごい銘柄もあれば、2万6千円しか持って帰ってこなかったぁ…みたいな銘柄もある。

全体での収益は年利2%ぐらいでしょうか。このへんは再確認が必要です。

 

検証方法2:勝率63%ぐらいでした。学習っぽいことをさせているので、これで検証方法1の勝率を上回ることができたら万々歳だなあという気持ちで手を出していたのですが、そうは問屋が卸してくれませんでした。

 

 

検証結果を受けて

せめて、73%を上回りたいなという思いが捨てきれませんので、機械学習を更に勉強するという目標も掲げつつ、たくさんの特徴量を用意してぶち込んで、LSTMでも多クラス分類でも決定木でもランダムフォレストでも深層学習でもパーセプトロンでも手を出してやろうかとおもいます。

現在いろんな特徴量を用意しているところなので、実験は行えていませんが、このプロジェクトをぜかましプロジェクトに続く「ぜかまし改」と名付け、ごちゃごちゃと数字をこねくり回していこうかなと思っております。

 

 

たぶん、似たようなことを考えて実装してる人、もういると思うんだけどなあ…

スポンサードリンク