Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Meta Kaggleを覗いてみた
Search
Yuko Ishizaki
November 05, 2019
Research
3
2.9k
Meta Kaggleを覗いてみた
Yuko Ishizaki
November 05, 2019
Tweet
Share
More Decks by Yuko Ishizaki
See All by Yuko Ishizaki
The Web Conference 2020 Report -多目的最適化における確率的ラベル集約-
ishizaki_yuko
1
1.4k
雲コンペで反省したノイズ除去
ishizaki_yuko
1
420
Hybrid Reward Architecture for Reinforcement Learning
ishizaki_yuko
0
140
Modeling Relational Data with Graph Convolutional Networks
ishizaki_yuko
0
200
Other Decks in Research
See All in Research
大規模言語モデルにおけるData-Centric AIと合成データの活用 / Data-Centric AI and Synthetic Data in Large Language Models
tsurubee
1
470
AIスパコン「さくらONE」のLLM学習ベンチマークによる性能評価 / SAKURAONE LLM Training Benchmarking
yuukit
2
930
When Learned Data Structures Meet Computer Vision
matsui_528
1
2k
Nullspace MPC
mizuhoaoki
1
580
Panopticon: Advancing Any-Sensor Foundation Models for Earth Observation
satai
3
560
CoRL2025速報
rpc
4
3.8k
An Open and Reproducible Deep Research Agent for Long-Form Question Answering
ikuyamada
0
170
Attaques quantiques sur Bitcoin : comment se protéger ?
rlifchitz
0
130
"主観で終わらせない"定性データ活用 ― プロダクトディスカバリーを加速させるインサイトマネジメント / Utilizing qualitative data that "doesn't end with subjectivity" - Insight management that accelerates product discovery
kaminashi
15
18k
EarthDial: Turning Multi-sensory Earth Observations to Interactive Dialogues
satai
3
550
Can AI Generated Ambrotype Chain the Aura of Alternative Process? In SIGGRAPH Asia 2024 Art Papers
toremolo72
0
120
A History of Approximate Nearest Neighbor Search from an Applications Perspective
matsui_528
1
130
Featured
See All Featured
Game over? The fight for quality and originality in the time of robots
wayneb77
1
74
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
1.9k
Mobile First: as difficult as doing things right
swwweet
225
10k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
61k
Building the Perfect Custom Keyboard
takai
2
670
More Than Pixels: Becoming A User Experience Designer
marktimemedia
2
280
Prompt Engineering for Job Search
mfonobong
0
140
KATA
mclloyd
PRO
33
15k
What's in a price? How to price your products and services
michaelherold
246
13k
End of SEO as We Know It (SMX Advanced Version)
ipullrank
2
3.8k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.8k
Build your cross-platform service in a week with App Engine
jlugia
234
18k
Transcript
Meta Kaggleを覗いてみた Connehito Marché vol.6 機械学習・データ分析市 2019 / 11 /
5 石崎 裕子
初めまして 最近、Kaggleにはまっている人です
概要 Kaggle(データ分析コンペ)が公開している Meta Kaggle を覗いて、以下のこ とを考察してみた LT 5分だから ざっくりね! 1.
Kaggleって本当に流行ってるの? 2. コンペの傾向って年々変わってるの?
Meta Kaggle Kaggle が公開している CSV 形式のデータセットで、ユーザや Competition 、Discussion や Kernel
に関する情報が見れる https://www.kaggle.com/kaggle/meta-kaggle
1. Kaggleって本当に流行ってるの? 毎月の Kaggle の新規ユーザー数を Users.csv から調べた。 新規ユーザー数が右肩上がりであれば、流行っていると言えるはず! すんごい増えてる!!!
1. Kaggleって本当に流行ってるの? Users.csvのデータ数、多すぎません? アカウントを作っただけでコンペに参加していない人がほとんど!
1. Kaggleって本当に流行ってるの? コンペの開催期間中に一度でもSubmit して成功した人に対象を絞って、 毎月の新規ユーザー数を確認してみた Submission.csvはPrivate Scoreを含むため 開催中のコンペ情報は拾えない 若干、鈍化・・・ (コンペはFeatured,
Research が対象)
2.コンペの傾向って変わってるの? コンペのタグを確認して、どんなタグがついているコンペが年々増えて いるのかを確認 (2014年以降、タグがつけられている) これ
2.コンペの傾向って変わってるの? • コンペの種類は Featured, Research が対象 • もっとも多く使われているタグ Top10 をまず確認
tabular dataと image dataと text dataに絞るか
2.コンペの傾向って変わってるの? 半年ごとのテーブルデータ、画像データ、テキストデータのタグがついて いるコンペ数の変化 (複数タグついている場合、それぞれ1カウント) 2016 ~ 2017 年あたりで変化 image data
tabular data text data
まとめ • Kaggle の注目度は上がっている • コンペに取り組む新規ユーザの伸びは鈍化 • 画像コンペが多くなった • Meta
Kaggle の分析も面白い 予想通り!! って感じでしたかね ソースコードは Kaggle の kernel で公開してます https://www.kaggle.com/pridegoodmusic/meta-kaggle-analysis 沼にはまろう