@Numerai Meetup JAPAN2021 2021/12/18
古参Numerai参加者の戯言れごん@NumeraiMeetup JAPAN20212021/12/18
View Slide
自己紹介• れごん• @regonn_haizine• 島根のフリーランス• データサイエンス系のポッドキャストRegonn&Curry.fm やってます
Numeraiの活動• 2017年2月からやっているらしい• 当時はLoglossとOriginarityという指標だった• Julia とかで挑んでいた記録が残ってた• Juliaで並列計算を試す• https://blog.regonn.tokyo/data-science/2017-10-24-julia-numerai-multi/
• このまま昔話をしていると某HUNTER漫画の新人つぶしの人みたいになってしまう自主規制
Numeraiのすゝめ• Numeraiの個人的に気に入っている部分を話していきます• データサイエンスをこれから触っていきたいor学んでいきたい人にはオススメの題材だと思う• ブロックチェーン(仮想通貨)の知識も必要だけど 、ブロックチェーンの活用の広がりをみると触っといていいのではぐらいの感触
なぜNumeraiがオススメなのか?• Kaggle等のデータサイエンスコンペサイト等で実力を磨くのも大事だけど次の実践的な観点が育ちにくい• データを自分で取得して、利用したい形に整形する• 継続して長期間同じデータに触る(予測対象が変化する)• コードに関する他の人とのディスカッション• データサイエンスの観点というより、ベターなコードの書き方等
理想的なプロジェクト• 半永久的に続く• コンペと違って長い間取り組める• 知見がたまる• 新しいツールやライブラリを試す指標になる• データがオープン• 他の人と議論したりコードの公開をしても許される(PrivateShareという概念は無いが、MMCが下がるので共同で書いたコード等は注意)• 多少でも儲かる• 儲けが出ると、GPUインスタンスとか試せる• 儲けが指標になるので成長等も実感しやすい向いているプロジェクトの性質
データサイエンスの趣味プロダクトでお金を稼ぐ例Numerai• データが揃っている状態(Tournament)から始められ、自分でデータの取得や管理もできる(Signals)• データ分析環境さえあれば一通り完結する• 税金の計算が面倒競馬や競艇等の公営ギャンブル予測• 自分でデータを収集する必要がある• 賭ける場合もAPIを叩くためのインフラ構築が必要(競輪とかはAPIも現状無いはず)• 税金の計算が面倒自動売買(システムトレード)• BOTを動かすためのインフラ構築が必要• まだ、仮想通貨系はいいけど、株取引とかでAPIでの取引環境は大変なイメージ• データを自分で用意する必要がある• 税金の計算が面倒(株取引やFXは楽かも)
モブプロ会• モブプログラミングという複数人でコードを書くスタイル• 複数人の知見が共有される• コードの書き方について議論できる• 質の高いコードが出来上がりやすい• 他の輪読会等に比べて参加者は事前準備はほぼ必要無い
一時期モブプロもやってました
Kaggleや仕事以外の機械学習プロジェクトをNumeraiでやってみよう