Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
古参Numerai参加者の戯言
Search
regonn
December 18, 2021
Technology
1
2.3k
古参Numerai参加者の戯言
@Numerai Meetup JAPAN2021
2021/12/18
regonn
December 18, 2021
Tweet
Share
More Decks by regonn
See All by regonn
Submission with Numerai Compute using GCP Batch
regonn
0
330
HelloMoon x Orca=HelloOrca
regonn
0
91
The Challenge of Automatically Configuring Numerai Compute Environment
regonn
0
57
Federated Learning 連合学習
regonn
4
1.5k
PLATEAUをデータベースに取り込んでみた
regonn
0
1.7k
Nim + Cloud Run + TerraformでGCPにNimのサーバーレス環境を作る
regonn
1
590
S+ Camera Basicと似た環境をラズパイから構築してみる
regonn
0
460
衛星画像のゴルフ場写り込み判定AIモデルを作る
regonn
0
660
データラーニングギルド での活動と今後
regonn
0
120
Other Decks in Technology
See All in Technology
日経ビジュアルデータにおける スクロールテリングと地図/nikkei-tech-talk-26
nikkei_engineer_recruiting
0
160
入門『状態』#kaigionrails / "state" for beginners with Rails
shinkufencer
2
810
Comparing Apache Flink and Spark for Modern Stream Data Processing
sharonx
0
180
よくわからんサービスについての問い合わせが来たときの強い味方 Amazon Q について
kazzpapa3
0
140
品質の高い機能を”早く”提供するために技術的な面でチームでやったこと、やりたいこと
sansantech
PRO
2
230
What's in a Postgres major release? An analysis of contributions in the v17 timeframe | Claire Giordano | PGConf EU 2024
clairegiordano
1
680
Trusted Types API と Vue.js
lycorptech_jp
PRO
1
300
顧客が本当に必要だったもの - パフォーマンス改善編 / Make what is needed
soudai
21
5.8k
GitHub Universe: Evaluating RAG apps in GitHub Actions
pamelafox
0
130
Databricksで構築する初めての複合AIシステム - ML15min
taka_aki
2
1.3k
分布で見る効果検証入門 / ai-distributional-effect
cyberagentdevelopers
PRO
2
550
30万人が利用するチャットをFirebase Realtime DatabaseからActionCableへ移行する方法
ryosk7
2
300
Featured
See All Featured
Keith and Marios Guide to Fast Websites
keithpitt
408
22k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
106
49k
GraphQLの誤解/rethinking-graphql
sonatard
66
9.9k
StorybookのUI Testing Handbookを読んだ
zakiyama
26
5.2k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
41
9.2k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.2k
Designing Experiences People Love
moore
138
23k
How STYLIGHT went responsive
nonsquared
95
5.1k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
26
2k
Six Lessons from altMBA
skipperchong
26
3.4k
Happy Clients
brianwarren
97
6.7k
GitHub's CSS Performance
jonrohan
1030
460k
Transcript
古参Numerai 参加者の戯言 れごん@Numerai Meetup JAPAN2021 2021/12/18
自己紹介 • れごん • @regonn_haizine • 島根のフリーランス • データサイエンス系のポッドキャスト Regonn&Curry.fm
やってます
Numeraiの活動 • 2017年2月からやっているらしい • 当時はLoglossとOriginarityという指標 だった • Julia とかで挑んでいた記録が残ってた •
Juliaで並列計算を試す • https://blog.regonn.tokyo/data-science/2017- 10-24-julia-numerai-multi/
• このまま昔話をしていると 某HUNTER漫画の新人つぶし の人みたいになってしまう 自主規制
Numeraiの すゝめ • Numeraiの個人的に気に入っている部分を話 していきます • データサイエンスをこれから触っていきた いor学んでいきたい人にはオススメの題材 だと思う •
ブロックチェーン(仮想通貨)の知識も必要 だけど 、ブロックチェーンの活用の広がり をみると触っといていいのではぐらいの感 触
なぜNumeraiがオススメなのか? • Kaggle等のデータサイエンスコンペサイト等で実力を磨く のも大事だけど次の実践的な観点が育ちにくい • データを自分で取得して、利用したい形に整形する • 継続して長期間同じデータに触る(予測対象が変化する) • コードに関する他の人とのディスカッション
• データサイエンスの観点というより、ベターなコー ドの書き方等
理想的な プロジェクト • 半永久的に続く • コンペと違って長い間取り組める • 知見がたまる • 新しいツールやライブラリを試す指標になる
• データがオープン • 他の人と議論したりコードの公開をしても許さ れる(PrivateShareという概念は無いが、MMCが 下がるので共同で書いたコード等は注意) • 多少でも儲かる • 儲けが出ると、GPUインスタンスとか試せる • 儲けが指標になるので成長等も実感しやすい 向いているプロジェクトの性質
データサイエンス の趣味プロダクト でお金を稼ぐ例 Numerai • データが揃っている状態(Tournament)から始められ、自分でデータの取 得や管理もできる(Signals) • データ分析環境さえあれば一通り完結する •
税金の計算が面倒 競馬や競艇等の公営ギャンブル予測 • 自分でデータを収集する必要がある • 賭ける場合もAPIを叩くためのインフラ構築が必要(競輪とかはAPIも現 状無いはず) • 税金の計算が面倒 自動売買(システムトレード) • BOTを動かすためのインフラ構築が必要 • まだ、仮想通貨系はいいけど、株取引とかでAPIでの取引環境は大変 なイメージ • データを自分で用意する必要がある • 税金の計算が面倒(株取引やFXは楽かも)
モブプロ会 • モブプログラミングという複数人でコード を書くスタイル • 複数人の知見が共有される • コードの書き方について議論できる • 質の高いコードが出来上がりやすい
• 他の輪読会等に比べて参加者は事前準備 はほぼ必要無い
一時期モブプロもやってました
Kaggleや仕事以外の 機械学習プロジェクトを Numeraiでやってみよう