Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Meta Kaggleを覗いてみた
Search
Yuko Ishizaki
November 05, 2019
Research
3
2.4k
Meta Kaggleを覗いてみた
Yuko Ishizaki
November 05, 2019
Tweet
Share
More Decks by Yuko Ishizaki
See All by Yuko Ishizaki
The Web Conference 2020 Report -多目的最適化における確率的ラベル集約-
ishizaki_yuko
1
1.2k
雲コンペで反省したノイズ除去
ishizaki_yuko
1
380
Hybrid Reward Architecture for Reinforcement Learning
ishizaki_yuko
0
110
Modeling Relational Data with Graph Convolutional Networks
ishizaki_yuko
0
130
Other Decks in Research
See All in Research
Accurate Method and Variable Tracking in Commit History
tsantalis
0
250
People Driven Transformation / 人が起点の、社会の変え方
dmattsun
0
150
クロスモーダル表現学習の研究動向: 音声関連を中心として
ryomasumura
3
590
CASCON 2023 Most Influential Paper Award Talk
tsantalis
0
120
リサーチに組織を巻き込むための「準備8割」の話
terasho
0
470
My Journey as a UX Researcher
aranciap
0
1.1k
自己教師あり学習による事前学習(CVIMチュートリアル)
naok615
2
1.4k
Introduction of NII S. Koyama's Lab (AY2024)
skoyamalab
0
110
インタビューだけじゃない!ユーザーに共感しユーザーの目👀を手に入れるためのインプット
moco1013
0
240
Ground Metric Learning with applications in genomics
gpeyre
0
360
動物倫理学ことはじめ:人間以外の動物との倫理的な付き合い方を考える
takeshit_m
0
290
方策の長期性能に対する効率的なオフライン評価・学習 (Long-term Off-Policy Evaluation and Learning)
usaito
PRO
2
180
Featured
See All Featured
Design by the Numbers
sachag
274
18k
YesSQL, Process and Tooling at Scale
rocio
164
13k
Scaling GitHub
holman
457
140k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
244
20k
The Invisible Customer
myddelton
114
12k
Done Done
chrislema
178
15k
Navigating Team Friction
lara
178
13k
Build your cross-platform service in a week with App Engine
jlugia
225
17k
In The Pink: A Labor of Love
frogandcode
138
21k
Why Our Code Smells
bkeepers
PRO
331
56k
Writing Fast Ruby
sferik
621
60k
Gamification - CAS2011
davidbonilla
76
4.6k
Transcript
Meta Kaggleを覗いてみた Connehito Marché vol.6 機械学習・データ分析市 2019 / 11 /
5 石崎 裕子
初めまして 最近、Kaggleにはまっている人です
概要 Kaggle(データ分析コンペ)が公開している Meta Kaggle を覗いて、以下のこ とを考察してみた LT 5分だから ざっくりね! 1.
Kaggleって本当に流行ってるの? 2. コンペの傾向って年々変わってるの?
Meta Kaggle Kaggle が公開している CSV 形式のデータセットで、ユーザや Competition 、Discussion や Kernel
に関する情報が見れる https://www.kaggle.com/kaggle/meta-kaggle
1. Kaggleって本当に流行ってるの? 毎月の Kaggle の新規ユーザー数を Users.csv から調べた。 新規ユーザー数が右肩上がりであれば、流行っていると言えるはず! すんごい増えてる!!!
1. Kaggleって本当に流行ってるの? Users.csvのデータ数、多すぎません? アカウントを作っただけでコンペに参加していない人がほとんど!
1. Kaggleって本当に流行ってるの? コンペの開催期間中に一度でもSubmit して成功した人に対象を絞って、 毎月の新規ユーザー数を確認してみた Submission.csvはPrivate Scoreを含むため 開催中のコンペ情報は拾えない 若干、鈍化・・・ (コンペはFeatured,
Research が対象)
2.コンペの傾向って変わってるの? コンペのタグを確認して、どんなタグがついているコンペが年々増えて いるのかを確認 (2014年以降、タグがつけられている) これ
2.コンペの傾向って変わってるの? • コンペの種類は Featured, Research が対象 • もっとも多く使われているタグ Top10 をまず確認
tabular dataと image dataと text dataに絞るか
2.コンペの傾向って変わってるの? 半年ごとのテーブルデータ、画像データ、テキストデータのタグがついて いるコンペ数の変化 (複数タグついている場合、それぞれ1カウント) 2016 ~ 2017 年あたりで変化 image data
tabular data text data
まとめ • Kaggle の注目度は上がっている • コンペに取り組む新規ユーザの伸びは鈍化 • 画像コンペが多くなった • Meta
Kaggle の分析も面白い 予想通り!! って感じでしたかね ソースコードは Kaggle の kernel で公開してます https://www.kaggle.com/pridegoodmusic/meta-kaggle-analysis 沼にはまろう