Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
古参Numerai参加者の戯言
Search
regonn
December 18, 2021
Technology
1
2.5k
古参Numerai参加者の戯言
@Numerai Meetup JAPAN2021
2021/12/18
regonn
December 18, 2021
Tweet
Share
More Decks by regonn
See All by regonn
Submission with Numerai Compute using GCP Batch
regonn
0
580
HelloMoon x Orca=HelloOrca
regonn
0
140
The Challenge of Automatically Configuring Numerai Compute Environment
regonn
0
97
Federated Learning 連合学習
regonn
4
1.7k
PLATEAUをデータベースに取り込んでみた
regonn
0
1.8k
Nim + Cloud Run + TerraformでGCPにNimのサーバーレス環境を作る
regonn
1
660
S+ Camera Basicと似た環境をラズパイから構築してみる
regonn
0
520
衛星画像のゴルフ場写り込み判定AIモデルを作る
regonn
0
790
データラーニングギルド での活動と今後
regonn
0
170
Other Decks in Technology
See All in Technology
SREのキャリアから経営に近づく - Enterprise Risk Managementを基に -
shonansurvivors
0
250
猫でもわかるAmazon Q Developer CLI 解体新書
kentapapa
1
140
書籍『実践 Apache Iceberg』の歩き方
ishikawa_satoru
0
230
個人でデジタル庁の デザインシステムをVue.jsで 作っている話
nishiharatsubasa
3
5.2k
JAWS UG AI/ML #32 Amazon BedrockモデルのライフサイクルとEOL対応/How Amazon Bedrock Model Lifecycle Works
quiver
1
110
QA業務を変える(!?)AIを併用した不具合分析の実践
ma2ri
0
160
会社を支える Pythonという言語戦略 ~なぜPythonを主要言語にしているのか?~
curekoshimizu
4
900
serverless team topology
_kensh
3
240
もう外には出ない。より快適なフルリモート環境を目指して
mottyzzz
14
11k
dbtとAIエージェントを組み合わせて見えたデータ調査の新しい形
10xinc
7
1.4k
What's new in OpenShift 4.20
redhatlivestreaming
0
370
生成AI時代のPythonセキュリティとガバナンス
abenben
0
150
Featured
See All Featured
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
285
14k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
37
2.6k
A Modern Web Designer's Workflow
chriscoyier
697
190k
Building Applications with DynamoDB
mza
96
6.7k
GitHub's CSS Performance
jonrohan
1032
470k
Speed Design
sergeychernyshev
32
1.2k
Documentation Writing (for coders)
carmenintech
75
5.1k
What’s in a name? Adding method to the madness
productmarketing
PRO
24
3.7k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
How to Ace a Technical Interview
jacobian
280
24k
The Cult of Friendly URLs
andyhume
79
6.6k
Transcript
古参Numerai 参加者の戯言 れごん@Numerai Meetup JAPAN2021 2021/12/18
自己紹介 • れごん • @regonn_haizine • 島根のフリーランス • データサイエンス系のポッドキャスト Regonn&Curry.fm
やってます
Numeraiの活動 • 2017年2月からやっているらしい • 当時はLoglossとOriginarityという指標 だった • Julia とかで挑んでいた記録が残ってた •
Juliaで並列計算を試す • https://blog.regonn.tokyo/data-science/2017- 10-24-julia-numerai-multi/
• このまま昔話をしていると 某HUNTER漫画の新人つぶし の人みたいになってしまう 自主規制
Numeraiの すゝめ • Numeraiの個人的に気に入っている部分を話 していきます • データサイエンスをこれから触っていきた いor学んでいきたい人にはオススメの題材 だと思う •
ブロックチェーン(仮想通貨)の知識も必要 だけど 、ブロックチェーンの活用の広がり をみると触っといていいのではぐらいの感 触
なぜNumeraiがオススメなのか? • Kaggle等のデータサイエンスコンペサイト等で実力を磨く のも大事だけど次の実践的な観点が育ちにくい • データを自分で取得して、利用したい形に整形する • 継続して長期間同じデータに触る(予測対象が変化する) • コードに関する他の人とのディスカッション
• データサイエンスの観点というより、ベターなコー ドの書き方等
理想的な プロジェクト • 半永久的に続く • コンペと違って長い間取り組める • 知見がたまる • 新しいツールやライブラリを試す指標になる
• データがオープン • 他の人と議論したりコードの公開をしても許さ れる(PrivateShareという概念は無いが、MMCが 下がるので共同で書いたコード等は注意) • 多少でも儲かる • 儲けが出ると、GPUインスタンスとか試せる • 儲けが指標になるので成長等も実感しやすい 向いているプロジェクトの性質
データサイエンス の趣味プロダクト でお金を稼ぐ例 Numerai • データが揃っている状態(Tournament)から始められ、自分でデータの取 得や管理もできる(Signals) • データ分析環境さえあれば一通り完結する •
税金の計算が面倒 競馬や競艇等の公営ギャンブル予測 • 自分でデータを収集する必要がある • 賭ける場合もAPIを叩くためのインフラ構築が必要(競輪とかはAPIも現 状無いはず) • 税金の計算が面倒 自動売買(システムトレード) • BOTを動かすためのインフラ構築が必要 • まだ、仮想通貨系はいいけど、株取引とかでAPIでの取引環境は大変 なイメージ • データを自分で用意する必要がある • 税金の計算が面倒(株取引やFXは楽かも)
モブプロ会 • モブプログラミングという複数人でコード を書くスタイル • 複数人の知見が共有される • コードの書き方について議論できる • 質の高いコードが出来上がりやすい
• 他の輪読会等に比べて参加者は事前準備 はほぼ必要無い
一時期モブプロもやってました
Kaggleや仕事以外の 機械学習プロジェクトを Numeraiでやってみよう