Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
古参Numerai参加者の戯言
Search
regonn
December 18, 2021
Technology
1
2.4k
古参Numerai参加者の戯言
@Numerai Meetup JAPAN2021
2021/12/18
regonn
December 18, 2021
Tweet
Share
More Decks by regonn
See All by regonn
Submission with Numerai Compute using GCP Batch
regonn
0
480
HelloMoon x Orca=HelloOrca
regonn
0
110
The Challenge of Automatically Configuring Numerai Compute Environment
regonn
0
77
Federated Learning 連合学習
regonn
4
1.6k
PLATEAUをデータベースに取り込んでみた
regonn
0
1.7k
Nim + Cloud Run + TerraformでGCPにNimのサーバーレス環境を作る
regonn
1
620
S+ Camera Basicと似た環境をラズパイから構築してみる
regonn
0
500
衛星画像のゴルフ場写り込み判定AIモデルを作る
regonn
0
720
データラーニングギルド での活動と今後
regonn
0
150
Other Decks in Technology
See All in Technology
3月のAWSアップデートを5分間でざっくりと!
kubomasataka
0
110
От ручной разметки к LLM: как мы создавали облако тегов в Lamoda. Анастасия Ангелова, Data Scientist, Lamoda Tech
lamodatech
0
680
さくらの夕べ Debianナイト - さくらのVPS編
dictoss
0
200
開発視点でAWS Signerを考えてみよう!! ~コード署名のその先へ~
masakiokuda
3
160
Goの組織でバックエンドTypeScriptを採用してどうだったか / How was adopting backend TypeScript in a Golang company
kaminashi
3
1k
Amazon CloudWatchで始める エンドユーザー体験のモニタリング
o11yfes2023
0
160
AWS Control Towerを 数年運用してきての気づきとこれから/aws-controltower-ops-tips
tadayukinakamura
0
120
All You Need Is Kusa 〜Slackデータで始めるデータドリブン〜
jonnojun
0
150
Amazon S3 Tables + Amazon Athena / Apache Iceberg
okaru
0
260
技術者はかっこいいものだ!!~キルラキルから学んだエンジニアの生き方~
masakiokuda
2
250
20250413_湘南kaggler会_音声認識で使うのってメルス・・・なんだっけ?
sugupoko
1
460
Creating Awesome Change in SmartNews
martin_lover
1
260
Featured
See All Featured
The MySQL Ecosystem @ GitHub 2015
samlambert
251
12k
Agile that works and the tools we love
rasmusluckow
328
21k
Facilitating Awesome Meetings
lara
54
6.3k
Building Applications with DynamoDB
mza
94
6.3k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
13
1.4k
GitHub's CSS Performance
jonrohan
1030
460k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
30
2k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
8
660
Embracing the Ebb and Flow
colly
85
4.6k
StorybookのUI Testing Handbookを読んだ
zakiyama
29
5.6k
Documentation Writing (for coders)
carmenintech
69
4.7k
The Power of CSS Pseudo Elements
geoffreycrofte
75
5.8k
Transcript
古参Numerai 参加者の戯言 れごん@Numerai Meetup JAPAN2021 2021/12/18
自己紹介 • れごん • @regonn_haizine • 島根のフリーランス • データサイエンス系のポッドキャスト Regonn&Curry.fm
やってます
Numeraiの活動 • 2017年2月からやっているらしい • 当時はLoglossとOriginarityという指標 だった • Julia とかで挑んでいた記録が残ってた •
Juliaで並列計算を試す • https://blog.regonn.tokyo/data-science/2017- 10-24-julia-numerai-multi/
• このまま昔話をしていると 某HUNTER漫画の新人つぶし の人みたいになってしまう 自主規制
Numeraiの すゝめ • Numeraiの個人的に気に入っている部分を話 していきます • データサイエンスをこれから触っていきた いor学んでいきたい人にはオススメの題材 だと思う •
ブロックチェーン(仮想通貨)の知識も必要 だけど 、ブロックチェーンの活用の広がり をみると触っといていいのではぐらいの感 触
なぜNumeraiがオススメなのか? • Kaggle等のデータサイエンスコンペサイト等で実力を磨く のも大事だけど次の実践的な観点が育ちにくい • データを自分で取得して、利用したい形に整形する • 継続して長期間同じデータに触る(予測対象が変化する) • コードに関する他の人とのディスカッション
• データサイエンスの観点というより、ベターなコー ドの書き方等
理想的な プロジェクト • 半永久的に続く • コンペと違って長い間取り組める • 知見がたまる • 新しいツールやライブラリを試す指標になる
• データがオープン • 他の人と議論したりコードの公開をしても許さ れる(PrivateShareという概念は無いが、MMCが 下がるので共同で書いたコード等は注意) • 多少でも儲かる • 儲けが出ると、GPUインスタンスとか試せる • 儲けが指標になるので成長等も実感しやすい 向いているプロジェクトの性質
データサイエンス の趣味プロダクト でお金を稼ぐ例 Numerai • データが揃っている状態(Tournament)から始められ、自分でデータの取 得や管理もできる(Signals) • データ分析環境さえあれば一通り完結する •
税金の計算が面倒 競馬や競艇等の公営ギャンブル予測 • 自分でデータを収集する必要がある • 賭ける場合もAPIを叩くためのインフラ構築が必要(競輪とかはAPIも現 状無いはず) • 税金の計算が面倒 自動売買(システムトレード) • BOTを動かすためのインフラ構築が必要 • まだ、仮想通貨系はいいけど、株取引とかでAPIでの取引環境は大変 なイメージ • データを自分で用意する必要がある • 税金の計算が面倒(株取引やFXは楽かも)
モブプロ会 • モブプログラミングという複数人でコード を書くスタイル • 複数人の知見が共有される • コードの書き方について議論できる • 質の高いコードが出来上がりやすい
• 他の輪読会等に比べて参加者は事前準備 はほぼ必要無い
一時期モブプロもやってました
Kaggleや仕事以外の 機械学習プロジェクトを Numeraiでやってみよう