【機械学習で競馬予想②】JRADATALABで分析するデータを準備する
競馬のデータを取得するのに苦労する話
前準備として、データを準備しないといけない。
前回書いたようにJRAのソフトを使って集めてみた。
競馬データを集める
競馬に関する過去データはJRAのソフトからCSV形式で集めることができると書いてある。
とりあえず、無料トライアルが申し込めたので申し込んでみた
久々にDVDの起動を行ってソフトをインストールした。
DVDには5本のソフトが入っていて、どれ使っていいのかよくわからないものの
一番右上にあったTarget というものを入れてみた。
Target
公式サイトはこちら
見事当たりだったみたいで、成績のCSVを出力することができた。
このソフトのデータ量ほんとに半端なくて、過去数十年間の競馬データが全部出力できる。
いろいろエクスポートしてはまったことを書く
1.エクスポートデータに項目名が書いていない
項目名は別で載せているらしい
http://faqnavi13a.csview.jp/faq2/userqa.do?user=jravan&faq=faq01_target&id=285&parent=20
2.とりあえず全項目をエクスポート
項目の意味がマニアックすぎて競馬知っている人でもよくわからないから使えない
3.基本データエクスポート
データが途中入っていない列があって、フル+オッズを選ばないといけないっぽい
とりあえず、10年分のデータをエクスポートして、今日は終了。
インストールに3時間、エクスポートに2時間くらい費やしました。