データラーニングギルド1周年LTでの発表資料です
データラーニングギルドでの活動と今後れごん@データラーニングギルド1周年LT2020/07/23
View Slide
自己紹介• れごん• @regonn_haizine• 島根のフリーランス• データサイエンス系のポッドキャストRegonn&Curry.fm やってます
ギルドでの活動• Kaggleに取り組むチームを募集してみた• IEEEコンペ• 銀メダル• 2019 Data Science Bowlコンペ• 銅メダル• M5コンペ• 銅メダル• 結果としては悪くない
見えてきた課題• チームメンバーの成長につながっているのか?• 自分も含めて成長しているのかが見えにくい• 質の良いコードが書けていない• タイムリミットがあるコンペだと雑なコードで終わる場合も多いし、コードレビューをするわけではないので、オレオレPythonコードになりやすい• コードも公開しにくい• データに制限があるので書いたコードも共有しにくくアウトプットが難しい
今後していきたいことマイプロジェクトモブプロ会
マイプロジェクト? 向いているプロジェクトの性質半永久的に続く•コンペと違って長い間取り組める•知見がたまる•新しいツールやライブラリを試す指標になるデータがオープン•他の人と議論したりコードの公開がやりやすい多少でも儲かる•儲けが出ると、GPUインスタンスとか試せる•儲けが指標になるので成長等も実感しやすいKaggle等のコンペサイト以外での機械学習プロジェクトを持つ
自分が進めているマイプロジェクト•データサイエンスティストが協力して動かすヘッジファウンド•Kaggleみたいにデータを渡されて、予測を提出して仮想通貨トークンをステーキングすると、貢献度に応じて報酬がもらえるNumerai•ボートレース•距離や船の数が一定なので、機械学習しやすい競艇予測•自分はリアルタイムでの取引よりも、次の日の予測の方が精神的にも安定していた自動売買(システムトレード)
モブプロ会?• モブプログラミングという複数人でコードを書くスタイル• 複数人の知見が共有される• コードの書き方について議論できる• 質の高いコードが出来上がりやすい• 他の輪読会等に比べて参加者は事前準備はほぼ必要無い
自分が開催しているモブプロ会強化学習• 現在4x4オセロを実装中Tellus衛星データ• 衛星データを利用した機械学習処理はむとれ• 仮想通貨自動売買ツール
Kaggleや仕事以外の機械学習プロジェクトをやってみよう