Upgrade to Pro — share decks privately, control downloads, hide ads and more …

古参Numerai参加者の戯言

regonn
December 18, 2021

 古参Numerai参加者の戯言

@Numerai Meetup JAPAN2021
2021/12/18

regonn

December 18, 2021
Tweet

More Decks by regonn

Other Decks in Technology

Transcript

  1. 古参Numerai
    参加者の戯言
    れごん@Numerai
    Meetup JAPAN2021
    2021/12/18

    View Slide

  2. 自己紹介
    • れごん
    • @regonn_haizine
    • 島根のフリーランス
    • データサイエンス系のポッドキャスト
    Regonn&Curry.fm やってます

    View Slide

  3. Numeraiの活動
    • 2017年2月からやっているらしい
    • 当時はLoglossとOriginarityという指標
    だった
    • Julia とかで挑んでいた記録が残ってた
    • Juliaで並列計算を試す
    • https://blog.regonn.tokyo/data-science/2017-
    10-24-julia-numerai-multi/

    View Slide

  4. • このまま昔話をしていると
    某HUNTER漫画の新人つぶし
    の人みたいになってしまう
    自主規制

    View Slide

  5. Numeraiの
    すゝめ
    • Numeraiの個人的に気に入っている部分を話
    していきます
    • データサイエンスをこれから触っていきた
    いor学んでいきたい人にはオススメの題材
    だと思う
    • ブロックチェーン(仮想通貨)の知識も必要
    だけど 、ブロックチェーンの活用の広がり
    をみると触っといていいのではぐらいの感

    View Slide

  6. なぜNumeraiがオススメなのか?
    • Kaggle等のデータサイエンスコンペサイト等で実力を磨く
    のも大事だけど次の実践的な観点が育ちにくい
    • データを自分で取得して、利用したい形に整形する
    • 継続して長期間同じデータに触る(予測対象が変化する)
    • コードに関する他の人とのディスカッション
    • データサイエンスの観点というより、ベターなコー
    ドの書き方等

    View Slide

  7. 理想的な
    プロジェクト
    • 半永久的に続く
    • コンペと違って長い間取り組める
    • 知見がたまる
    • 新しいツールやライブラリを試す指標になる
    • データがオープン
    • 他の人と議論したりコードの公開をしても許さ
    れる(PrivateShareという概念は無いが、MMCが
    下がるので共同で書いたコード等は注意)
    • 多少でも儲かる
    • 儲けが出ると、GPUインスタンスとか試せる
    • 儲けが指標になるので成長等も実感しやすい
    向いているプロジェクトの性質

    View Slide

  8. データサイエンス
    の趣味プロダクト
    でお金を稼ぐ例
    Numerai
    • データが揃っている状態(Tournament)から始められ、自分でデータの取
    得や管理もできる(Signals)
    • データ分析環境さえあれば一通り完結する
    • 税金の計算が面倒
    競馬や競艇等の公営ギャンブル予測
    • 自分でデータを収集する必要がある
    • 賭ける場合もAPIを叩くためのインフラ構築が必要(競輪とかはAPIも現
    状無いはず)
    • 税金の計算が面倒
    自動売買(システムトレード)
    • BOTを動かすためのインフラ構築が必要
    • まだ、仮想通貨系はいいけど、株取引とかでAPIでの取引環境は大変
    なイメージ
    • データを自分で用意する必要がある
    • 税金の計算が面倒(株取引やFXは楽かも)

    View Slide

  9. モブプロ会
    • モブプログラミングという複数人でコード
    を書くスタイル
    • 複数人の知見が共有される
    • コードの書き方について議論できる
    • 質の高いコードが出来上がりやすい
    • 他の輪読会等に比べて参加者は事前準備
    はほぼ必要無い

    View Slide

  10. 一時期モブプロもやってました

    View Slide

  11. Kaggleや仕事以外の
    機械学習プロジェクトを
    Numeraiでやってみよう

    View Slide