Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
古参Numerai参加者の戯言
Search
regonn
December 18, 2021
Technology
1
2.1k
古参Numerai参加者の戯言
@Numerai Meetup JAPAN2021
2021/12/18
regonn
December 18, 2021
Tweet
Share
More Decks by regonn
See All by regonn
HelloMoon x Orca=HelloOrca
regonn
0
84
The Challenge of Automatically Configuring Numerai Compute Environment
regonn
0
44
Federated Learning 連合学習
regonn
4
1.3k
PLATEAUをデータベースに取り込んでみた
regonn
0
1.6k
Nim + Cloud Run + TerraformでGCPにNimのサーバーレス環境を作る
regonn
1
550
S+ Camera Basicと似た環境をラズパイから構築してみる
regonn
0
430
衛星画像のゴルフ場写り込み判定AIモデルを作る
regonn
0
560
データラーニングギルド での活動と今後
regonn
0
92
伝説の生き物を飼ってみた
regonn
0
140
Other Decks in Technology
See All in Technology
PHP"オレ"カンファレンスの告知
ysknsid25
0
330
2024/4/26 コンピュータ歴史博物館解説告知
toshi_atsumi
0
190
Signals Unleashed: The Full Guide
rainerhahnekamp
0
360
[PlatformCon 24] Platform Orchestrators: The Missing Middle of Internal Developer Platforms?
danielbryantuk
0
170
「ふりかえりのふりかえり」をふりかえり、実のあるふりかえりにする
naitosatoshi
0
220
ユーザーストーリーのレビューを自動化したみたの
bun913
1
300
LLM とプロンプトエンジニアリング/チューターをビルドする / LLM and Prompt Engineering and Building Tutors
ks91
PRO
0
220
自動生成を活用した、運用保守コストを抑える Error/Alert/Runbook の一元集約管理 / Centralized management of Error/Alert/Runbook to minimize operational costs using automated code generation
biwashi
9
2.1k
NLP2024 参加報告LT ~RAGの生成評価と懇親戦略~ / nlp2024_attendee_presentation_LT_masuda
taro_masuda
1
190
コンパウンドスタートアップのためのスケーラブルでセキュアなInfrastructure as Codeパイプラインを考える / Scalable and Secure Infrastructure as Code Pipeline for a Compound Startup
yuyatakeyama
3
1.9k
Data and AI Governance: Existing Challenges and Emerging Trends
scotthsieh825
0
140
Databricksを活用してDELISH KITCHENのレシピレコメンドを開発した話
furu8
0
250
Featured
See All Featured
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
1
3.4k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
29
6k
Gamification - CAS2011
davidbonilla
76
4.6k
Building Better People: How to give real-time feedback that sticks.
wjessup
353
18k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
226
16k
Navigating Team Friction
lara
177
13k
KATA
mclloyd
14
12k
Rails Girls Zürich Keynote
gr2m
91
13k
The Art of Programming - Codeland 2020
erikaheidi
41
12k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
501
140k
Statistics for Hackers
jakevdp
789
220k
Thoughts on Productivity
jonyablonski
57
3.8k
Transcript
古参Numerai 参加者の戯言 れごん@Numerai Meetup JAPAN2021 2021/12/18
自己紹介 • れごん • @regonn_haizine • 島根のフリーランス • データサイエンス系のポッドキャスト Regonn&Curry.fm
やってます
Numeraiの活動 • 2017年2月からやっているらしい • 当時はLoglossとOriginarityという指標 だった • Julia とかで挑んでいた記録が残ってた •
Juliaで並列計算を試す • https://blog.regonn.tokyo/data-science/2017- 10-24-julia-numerai-multi/
• このまま昔話をしていると 某HUNTER漫画の新人つぶし の人みたいになってしまう 自主規制
Numeraiの すゝめ • Numeraiの個人的に気に入っている部分を話 していきます • データサイエンスをこれから触っていきた いor学んでいきたい人にはオススメの題材 だと思う •
ブロックチェーン(仮想通貨)の知識も必要 だけど 、ブロックチェーンの活用の広がり をみると触っといていいのではぐらいの感 触
なぜNumeraiがオススメなのか? • Kaggle等のデータサイエンスコンペサイト等で実力を磨く のも大事だけど次の実践的な観点が育ちにくい • データを自分で取得して、利用したい形に整形する • 継続して長期間同じデータに触る(予測対象が変化する) • コードに関する他の人とのディスカッション
• データサイエンスの観点というより、ベターなコー ドの書き方等
理想的な プロジェクト • 半永久的に続く • コンペと違って長い間取り組める • 知見がたまる • 新しいツールやライブラリを試す指標になる
• データがオープン • 他の人と議論したりコードの公開をしても許さ れる(PrivateShareという概念は無いが、MMCが 下がるので共同で書いたコード等は注意) • 多少でも儲かる • 儲けが出ると、GPUインスタンスとか試せる • 儲けが指標になるので成長等も実感しやすい 向いているプロジェクトの性質
データサイエンス の趣味プロダクト でお金を稼ぐ例 Numerai • データが揃っている状態(Tournament)から始められ、自分でデータの取 得や管理もできる(Signals) • データ分析環境さえあれば一通り完結する •
税金の計算が面倒 競馬や競艇等の公営ギャンブル予測 • 自分でデータを収集する必要がある • 賭ける場合もAPIを叩くためのインフラ構築が必要(競輪とかはAPIも現 状無いはず) • 税金の計算が面倒 自動売買(システムトレード) • BOTを動かすためのインフラ構築が必要 • まだ、仮想通貨系はいいけど、株取引とかでAPIでの取引環境は大変 なイメージ • データを自分で用意する必要がある • 税金の計算が面倒(株取引やFXは楽かも)
モブプロ会 • モブプログラミングという複数人でコード を書くスタイル • 複数人の知見が共有される • コードの書き方について議論できる • 質の高いコードが出来上がりやすい
• 他の輪読会等に比べて参加者は事前準備 はほぼ必要無い
一時期モブプロもやってました
Kaggleや仕事以外の 機械学習プロジェクトを Numeraiでやってみよう