Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Meta Kaggleを覗いてみた
Search
Yuko Ishizaki
November 05, 2019
Research
3
2.9k
Meta Kaggleを覗いてみた
Yuko Ishizaki
November 05, 2019
Tweet
Share
More Decks by Yuko Ishizaki
See All by Yuko Ishizaki
The Web Conference 2020 Report -多目的最適化における確率的ラベル集約-
ishizaki_yuko
1
1.4k
雲コンペで反省したノイズ除去
ishizaki_yuko
1
410
Hybrid Reward Architecture for Reinforcement Learning
ishizaki_yuko
0
130
Modeling Relational Data with Graph Convolutional Networks
ishizaki_yuko
0
190
Other Decks in Research
See All in Research
Adaptive Experimental Design for Efficient Average Treatment Effect Estimation and Treatment Choice
masakat0
0
160
[RSJ25] Enhancing VLA Performance in Understanding and Executing Free-form Instructions via Visual Prompt-based Paraphrasing
keio_smilab
PRO
0
110
Google Agent Development Kit (ADK) 入門 🚀
mickey_kubo
2
1.8k
機械学習と数理最適化の融合 (MOAI) による革新
mickey_kubo
1
320
EarthSynth: Generating Informative Earth Observation with Diffusion Models
satai
3
270
SNLP2025:Can Language Models Reason about Individualistic Human Values and Preferences?
yukizenimoto
0
120
SSII2025 [TS3] 医工連携における画像情報学研究
ssii
PRO
2
1.3k
スキマバイトサービスにおける現場起点でのデザインアプローチ
yoshioshingyouji
0
230
多言語カスタマーインタビューの“壁”を越える~PMと生成AIの共創~ 株式会社ジグザグ 松野 亘
watarumatsuno
0
120
利用シーンを意識した推薦システム〜SpotifyとAmazonの事例から〜
kuri8ive
1
250
Language Models Are Implicitly Continuous
eumesy
PRO
0
230
診断前の病歴テキストを対象としたLLMによるエンティティリンキング精度検証
hagino3000
1
130
Featured
See All Featured
What’s in a name? Adding method to the madness
productmarketing
PRO
23
3.7k
Balancing Empowerment & Direction
lara
3
620
Faster Mobile Websites
deanohume
309
31k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
15k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
Producing Creativity
orderedlist
PRO
347
40k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
53
2.9k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
358
30k
Designing Experiences People Love
moore
142
24k
Done Done
chrislema
185
16k
Transcript
Meta Kaggleを覗いてみた Connehito Marché vol.6 機械学習・データ分析市 2019 / 11 /
5 石崎 裕子
初めまして 最近、Kaggleにはまっている人です
概要 Kaggle(データ分析コンペ)が公開している Meta Kaggle を覗いて、以下のこ とを考察してみた LT 5分だから ざっくりね! 1.
Kaggleって本当に流行ってるの? 2. コンペの傾向って年々変わってるの?
Meta Kaggle Kaggle が公開している CSV 形式のデータセットで、ユーザや Competition 、Discussion や Kernel
に関する情報が見れる https://www.kaggle.com/kaggle/meta-kaggle
1. Kaggleって本当に流行ってるの? 毎月の Kaggle の新規ユーザー数を Users.csv から調べた。 新規ユーザー数が右肩上がりであれば、流行っていると言えるはず! すんごい増えてる!!!
1. Kaggleって本当に流行ってるの? Users.csvのデータ数、多すぎません? アカウントを作っただけでコンペに参加していない人がほとんど!
1. Kaggleって本当に流行ってるの? コンペの開催期間中に一度でもSubmit して成功した人に対象を絞って、 毎月の新規ユーザー数を確認してみた Submission.csvはPrivate Scoreを含むため 開催中のコンペ情報は拾えない 若干、鈍化・・・ (コンペはFeatured,
Research が対象)
2.コンペの傾向って変わってるの? コンペのタグを確認して、どんなタグがついているコンペが年々増えて いるのかを確認 (2014年以降、タグがつけられている) これ
2.コンペの傾向って変わってるの? • コンペの種類は Featured, Research が対象 • もっとも多く使われているタグ Top10 をまず確認
tabular dataと image dataと text dataに絞るか
2.コンペの傾向って変わってるの? 半年ごとのテーブルデータ、画像データ、テキストデータのタグがついて いるコンペ数の変化 (複数タグついている場合、それぞれ1カウント) 2016 ~ 2017 年あたりで変化 image data
tabular data text data
まとめ • Kaggle の注目度は上がっている • コンペに取り組む新規ユーザの伸びは鈍化 • 画像コンペが多くなった • Meta
Kaggle の分析も面白い 予想通り!! って感じでしたかね ソースコードは Kaggle の kernel で公開してます https://www.kaggle.com/pridegoodmusic/meta-kaggle-analysis 沼にはまろう