Slide 1

Slide 1 text

データラーニングギルド での活動と今後 れごん@データラーニングギルド1周年LT 2020/07/23

Slide 2

Slide 2 text

自己紹介 • れごん • @regonn_haizine • 島根のフリーランス • データサイエンス系のポッドキャスト Regonn&Curry.fm やってます

Slide 3

Slide 3 text

ギルドでの活動 • Kaggleに取り組むチームを募集してみた • IEEEコンペ • 銀メダル • 2019 Data Science Bowlコンペ • 銅メダル • M5コンペ • 銅メダル • 結果としては悪くない

Slide 4

Slide 4 text

見えてきた課題 • チームメンバーの成長につながって いるのか? • 自分も含めて成長しているのか が見えにくい • 質の良いコードが書けていない • タイムリミットがあるコンペだ と雑なコードで終わる場合も多 いし、コードレビューをするわ けではないので、オレオレ Pythonコードになりやすい • コードも公開しにくい • データに制限があるので書いた コードも共有しにくくアウト プットが難しい

Slide 5

Slide 5 text

今後していき たいこと マイプロジェクト モブプロ会

Slide 6

Slide 6 text

マイプロジェクト? 向いているプロジェクトの性質 半永久的に続く •コンペと違って 長い間取り組め る •知見がたまる •新しいツールや ライブラリを試 す指標になる データがオープン •他の人と議論し たりコードの公 開がやりやすい 多少でも儲かる •儲けが出ると、 GPUインスタンス とか試せる •儲けが指標にな るので成長等も 実感しやすい Kaggle等のコンペサイト以外での 機械学習プロジェクトを持つ

Slide 7

Slide 7 text

自分が進めて いるマイプロ ジェクト •データサイエンスティストが協力して動かす ヘッジファウンド •Kaggleみたいにデータを渡されて、予測を提出し て仮想通貨トークンをステーキングすると、貢 献度に応じて報酬がもらえる Numerai •ボートレース •距離や船の数が一定なので、機械学習しやすい 競艇予測 •自分はリアルタイムでの取引よりも、次の日の 予測の方が精神的にも安定していた 自動売買(システムトレード)

Slide 8

Slide 8 text

モブプロ会? • モブプログラミングという複数人で コードを書くスタイル • 複数人の知見が共有される • コードの書き方について議論で きる • 質の高いコードが出来上がりや すい • 他の輪読会等に比べて参加者は 事前準備はほぼ必要無い

Slide 9

Slide 9 text

自分が 開催している モブプロ会 強化学習 • 現在4x4オセロを実装中 Tellus衛星データ • 衛星データを利用した機械学習処理 はむとれ • 仮想通貨自動売買ツール

Slide 10

Slide 10 text

Kaggleや仕事以外の 機械学習プロジェクトを やってみよう