$30 off During Our Annual Pro Sale. View Details »

データラーニングギルド での活動と今後

データラーニングギルド での活動と今後

データラーニングギルド1周年LTでの発表資料です

regonn

July 23, 2020
Tweet

More Decks by regonn

Other Decks in Technology

Transcript

  1. データラーニングギルド
    での活動と今後
    れごん@データラーニングギルド1周年LT
    2020/07/23

    View Slide

  2. 自己紹介
    • れごん
    • @regonn_haizine
    • 島根のフリーランス
    • データサイエンス系のポッドキャスト
    Regonn&Curry.fm やってます

    View Slide

  3. ギルドでの活動
    • Kaggleに取り組むチームを募集してみた
    • IEEEコンペ
    • 銀メダル
    • 2019 Data Science Bowlコンペ
    • 銅メダル
    • M5コンペ
    • 銅メダル
    • 結果としては悪くない

    View Slide

  4. 見えてきた課題
    • チームメンバーの成長につながって
    いるのか?
    • 自分も含めて成長しているのか
    が見えにくい
    • 質の良いコードが書けていない
    • タイムリミットがあるコンペだ
    と雑なコードで終わる場合も多
    いし、コードレビューをするわ
    けではないので、オレオレ
    Pythonコードになりやすい
    • コードも公開しにくい
    • データに制限があるので書いた
    コードも共有しにくくアウト
    プットが難しい

    View Slide

  5. 今後していき
    たいこと
    マイプロジェクト
    モブプロ会

    View Slide

  6. マイプロジェクト? 向いているプロジェクトの性質
    半永久的に続く
    •コンペと違って
    長い間取り組め

    •知見がたまる
    •新しいツールや
    ライブラリを試
    す指標になる
    データがオープン
    •他の人と議論し
    たりコードの公
    開がやりやすい
    多少でも儲かる
    •儲けが出ると、
    GPUインスタンス
    とか試せる
    •儲けが指標にな
    るので成長等も
    実感しやすい
    Kaggle等のコンペサイト以外での
    機械学習プロジェクトを持つ

    View Slide

  7. 自分が進めて
    いるマイプロ
    ジェクト
    •データサイエンスティストが協力して動かす
    ヘッジファウンド
    •Kaggleみたいにデータを渡されて、予測を提出し
    て仮想通貨トークンをステーキングすると、貢
    献度に応じて報酬がもらえる
    Numerai
    •ボートレース
    •距離や船の数が一定なので、機械学習しやすい
    競艇予測
    •自分はリアルタイムでの取引よりも、次の日の
    予測の方が精神的にも安定していた
    自動売買(システムトレード)

    View Slide

  8. モブプロ会?
    • モブプログラミングという複数人で
    コードを書くスタイル
    • 複数人の知見が共有される
    • コードの書き方について議論で
    きる
    • 質の高いコードが出来上がりや
    すい
    • 他の輪読会等に比べて参加者は
    事前準備はほぼ必要無い

    View Slide

  9. 自分が
    開催している
    モブプロ会
    強化学習
    • 現在4x4オセロを実装中
    Tellus衛星データ
    • 衛星データを利用した機械学習処理
    はむとれ
    • 仮想通貨自動売買ツール

    View Slide

  10. Kaggleや仕事以外の
    機械学習プロジェクトを
    やってみよう

    View Slide