AIトレーディング用にGMOクリック証券の口座を開設した。
モデルの完成は8合目くらいまではきている。ということで、最近、会社から家にかえるのが楽しみで仕方がない。電車の中で、まずはあれを確認して、このプログラミングを作成して、それから・・ということばかり考えている。おそらく9月には運用開始できると思う。
その前に、あらたに証券口座を開設することにした。僕は個人でも、日本株・外国株・投資信託・FXなどの投資経験があり、別の口座でそれらの金融商品は保持しているが、AIトレーディングだけで、どのくらいの収益が出ているのかを簡単に管理したいので、別口座を作ることにしたのだ。
この証券会社にしたのは、名前も聞いたことがあり、手数料が安いというのが理由だ。頻繁に取引することを考えて特定口座の源泉徴収なしを選択した。2つの証券口座をもつのはめんどくさいし、確定申告の書類も増える事になるが、億超えトレーダーを目指しているので、そんなことも言ってられない。
ということで、近日中に運用開始します。笑
記事になっているAIプロジェクトのほとんどはうまくいってないと思う
AI(人工知能)に関する記事を見ない日はありません。ただ、それらを読むと、殆どの場合、流行に乗りたい企業を取材した認識不足の記者の記事という気がしてなりません。もちろん、ちゃんとした技術のちゃんとした記事もありますが、残念ながら少数派です。
取材される側の大企業のデータ分析担当者の雰囲気はだいたい察しが付きます。
「なんか、わかってない偉い人がノリノリで、今度取材うけるんだけど、ほんとにこんなの記事になっていいのかなあ。まだ、入手できる適当なデータをニューラルネットかまして答えだしてるだけだから、実用段階でもないし、ちゃんとした検証さえもできないんだけど。。」
AIとかFintechとかの流行があると、サラリーマンは殆どの人は、以下の4パターンに分類されます。
- とにかく新しく目立つことやりたいバイタリティーある無知な管理者
- そんなことやっても意味ないんだけどなーっていうネクラな技術者
- なんかすげーことできるらしいと想像だけするだけの若いの実務者
- どうせ無理でしょと変化を拒む頑なで歳食った実務者
①のえらい人が、話をでかくして、あとはよろしくと言って部下に丸投げ。②の技術者は黙々と言われたことをやるけど、そんな簡単にうまくいかない。③はただワクワクしながら見てるだけ。④は協力しないか邪魔をして、うまくいかなかったらほくそ笑む。
という感じでほとんどのプロジェクトはうまくいきません。トップダウンで洗脳して推し進められる効率的な組織でないかぎり、なかなか新しいことって進まないですよね。
AIにかぎらずデータ分析で重要なのはデータそのものです。それが新しくやるにふさわしいほどの画期的なデータで、実務にも理解のあるちゃんとした技術者がいて、協力的な管理者や実務者がいるというのは、ごく限られたケースです。
もちろん、そういう企業もあるのでしょうが、僕はそういう企業を探すよりも、ひとりでできることをやることに決めました。ということで、ひとりFintech応援してもらえるとうれしいです。笑
株価の過去データをダウンロードする
株を分析にするにあたってもっとも重要なデータは、過去の株価のヒストリカルデータです。これをどこから取るかは、そんなに簡単な問題ではありませんでした。証券会社で働いてたときならBloombergからダウンロードすればいい話でしたが、個人でやるとなると高いのでそういうわけにも行きません。
いろいろ調べて、候補はYahoo!ファイナンスか株価データサイト(個人運営?)の2択に絞りました。
Yahoo!ファイナンスはスクレイピング禁止?
Yahoo!ファイナンスは基本的にスクレーピングが禁止されているようです。有料会員になれば、直接ダウンロードできるらしいですが。。禁止されていることをやるのも、有料会員になるもの気が引けたので、こちらのサイトを使うのは諦めました。
株価データサイトは合併分割が反映されていない
株価データサイトは無料でダウンロードできるのですが、合併・分割が反映されていないというのが難点です。会社は時々、株を合併分割されて単位株の価格が変更されます。
たとえば、1株100円の会社があったとしましょう。この株を半分に分割しますと会社が言ったとします。そうなると1株持っていた人は、2株になりますので、理論上株価はその半分の50円になります。もしこの通りなら株主は基本的に損得はありません。ただ1株100円が2株50円になっただけなので。
ただ、過去の株をデータ分析するには、この情報を考慮することはとても重要です。なぜなら、この場合、株価だけをみると一瞬にして半額になっているからです。ですので、合併分割があった場合にはその比率を掛け合わせるなどの調整が必要です。
Yahoo!ファイナンスには調整後の株価の情報がありますが、この株価データサイトにはありません。これは自分で対応するしかないのです。合併分割の情報はこちらから取得しました。
他のデータと組み合わせて、Pythonの分析パッケージに突っ込み、どの株を買えば儲かるのかを分析していこうと思います。
投資家さとし、Mensa合格しました。
公式サイトによると、MENSA(メンサ)とは、1946年にイギリスで創設された、全人口の内上位2%のIQ(知能指数)の持ち主であれば、誰でも入れる国際グループだそうです。
テレビでなんどか取材されていたので、僕も以前から名前だけは知っていました。有名人では、脳科学者の茂木健一郎氏、お笑い芸人のロザン宇治原史規氏、タレントのパックン氏等が会員になっているそうです。
自分が受けたらうかるのかな、となんとなく思っていたのをふと思い出し、実際に受けてみることにしました。試験内容については教えてはいけないそうなので、ここでは言及しませんが、もしかすると最大の難関は試験を申込みできるかどうか、かもしれません。なにしろ、すぐに会場が埋まってしまうので。笑
ここでAIトレーディングのために勉強したPythonが役に立ちました。ちょっとしたプログラミングで"このページのこの部分がこうなったら自分のケイタイにメールする"というを定期的に自動実行できるようになりました。毎日、ホームページにアクセスしてチェックするのは時間のムダですからね。
ということで、無事、試験の予約をし、めでたく合格となりました。今後からMensa会員を名乗ることにします。実生活では全く役に立ちそうもありませんが、投資家ブログだったらちょっと泊がつくかもしれないので。笑
AWSのEC2のインスタンスはこまめに停止しよう
先日、AWSのEC2のインスタンスを削除して、現在一から構築し直してます。そのときにインスタンスをt2.micro(期間中無料)からt2.2xlarege(一時間50円程度)のものに変えました。
investor-satoshi.hatenablog.com
さて、料金はどうなっているのかな、と翌日に確認してみたところ一気に1500円ほどになってました。。
え、俺そんなに使ってないぞ。と思い調べてみると使おうが使わまいが、インスタンスが起動している間は課金されているみたいです。ですので、寝ている間にも1時間あたり50円以上のお金を失っていました。。インスタンスはこまめに停止するように気をつけましょう。
僕は、AWSのインフラを使ってデータ分析し、トレーディングシステムを構築して自動的にお金が増える仕組みを作ろうと思っていました。が、やっていることは、自動的にお金を失う仕組みでした。。水の出しっぱなし、空調のつけっぱなし、電気のつけっぱなしもダメですが、今後はそれにAWSのEC2インスタンスのつけっぱなしも付け加えようと思います。
不幸中の幸いは翌日に気づいたことです。これが一月放置してたら損失は3万以上でした。。あぶないあぶない。
今まで作ったAWSのインスタンスを削除して一から作り直した
甘く見すぎていて、早くも壁にぶち当たってしまいました。調べてみるとAWSの無料サービスってかなりのロースペックでした。できるところまでは、無料のまま続けたかったのですが、さすがに無理でした。
investor-satoshi.hatenablog.com
まず、データ分析でストレージ5Gっていうのはちょっと無理でしたね。それにUnix環境の中にDockerで仮想Unix環境をつくるというリソースの無駄遣いをしていたのもあって途中から空き容量が足りないエラーが連発しました。。
また、無料枠で使えるEC2ですが、t2.micro インスタンスは1 GiB メモリしかないので、どうしたって大量のデータを使う分析は不可能です。
これはいけないと思い、無料枠を続けることは諦めて、ハードディスクを拡張しようと思ったんですが、ハマりにハマりまくって、結局、こんなもん一から作ったほうが早いわ、ってことになりスクラップあんどビルドにしました。
あたらしくt2.txlarge(32GiBメモリ)のインスタンスと100Gのディスクを用意して一から作り直してます。こんなに早く壁にぶつかるとは思っても見なかったです。勉強になりました。笑
株式売買モデルを構築するために僕がやろうとしている手順
ここで僕がやろうとしていることを一応まとめておく。
- AWSのクラウド環境(EC2)で分析環境(Unix)をたちあげる
- Dockerを通じて必要な分析アプリ・パッケージをインストールする
- Pythonのスクレイピングにより必要なデータを取得する
- Rで分析用にデータを加工する
- データをPythonのパッケージで分析し株価モデルを構築する(パラメータを推定する)
- データを自動取得・自動処理し、パラメータから株価売買決定モデルを作成する
- 最初は自分にメール配信し、手動で売買する
- なれてきたらスクレイピングを利用し株の自動売買システムを構築する
- 儲かってお金持ちになる
だが、僕はもう2の段階で躓いている。。データ処理のためのRのパッケージインストールするのは問題なくできたが、分析のためのXGboostとかTensorflowをインストールするのに戸惑っている。世の中そんに甘くない。。
とりあえず、別のことを進めながら最悪の場合はsklearnのツールだけで分析するかもしれない。でも、XGboostとTensorflowとインストールであきらめるのなかなか情けないことだから、もう少し頑張ろうと思う。