Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Meta Kaggleを覗いてみた
Search
Yuko Ishizaki
November 05, 2019
Research
3
2.8k
Meta Kaggleを覗いてみた
Yuko Ishizaki
November 05, 2019
Tweet
Share
More Decks by Yuko Ishizaki
See All by Yuko Ishizaki
The Web Conference 2020 Report -多目的最適化における確率的ラベル集約-
ishizaki_yuko
1
1.3k
雲コンペで反省したノイズ除去
ishizaki_yuko
1
410
Hybrid Reward Architecture for Reinforcement Learning
ishizaki_yuko
0
130
Modeling Relational Data with Graph Convolutional Networks
ishizaki_yuko
0
180
Other Decks in Research
See All in Research
Mathematics in the Age of AI and the 4 Generation University
hachama
0
160
SkySense : A Multi-Modal Remote Sensing Foundation Model Towards Universal Interpretation for Earth Observation Imagery
satai
3
220
Large Language Model Agent: A Survey on Methodology, Applications and Challenges
shunk031
11
7.8k
EarthMarker: A Visual Prompting Multimodal Large Language Model for Remote Sensing
satai
3
280
AIによる画像認識技術の進化 -25年の技術変遷を振り返る-
hf149
6
3.2k
Pix2Poly: A Sequence Prediction Method for End-to-end Polygonal Building Footprint Extraction from Remote Sensing Imagery
satai
3
410
ことばの意味を計算するしくみ
verypluming
11
2.6k
コーパスを丸呑みしたモデルから言語の何がわかるか
eumesy
PRO
12
3.7k
最適決定木を用いた処方的価格最適化
mickey_kubo
4
1.6k
Scale-Aware Recognition in Satellite images Under Resource Constraints
satai
3
280
20250605_新交通システム推進議連_熊本都市圏「車1割削減、渋滞半減、公共交通2倍」から考える地方都市交通政策
trafficbrain
0
240
Adaptive fusion of multi-modal remote sensing data for optimal sub-field crop yield prediction
satai
3
210
Featured
See All Featured
The Invisible Side of Design
smashingmag
299
51k
The Straight Up "How To Draw Better" Workshop
denniskardys
233
140k
Faster Mobile Websites
deanohume
307
31k
Being A Developer After 40
akosma
90
590k
Rails Girls Zürich Keynote
gr2m
94
14k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
43
2.4k
A better future with KSS
kneath
239
17k
Why Our Code Smells
bkeepers
PRO
337
57k
How STYLIGHT went responsive
nonsquared
100
5.6k
Git: the NoSQL Database
bkeepers
PRO
430
65k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
32
2.3k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
20
1.3k
Transcript
Meta Kaggleを覗いてみた Connehito Marché vol.6 機械学習・データ分析市 2019 / 11 /
5 石崎 裕子
初めまして 最近、Kaggleにはまっている人です
概要 Kaggle(データ分析コンペ)が公開している Meta Kaggle を覗いて、以下のこ とを考察してみた LT 5分だから ざっくりね! 1.
Kaggleって本当に流行ってるの? 2. コンペの傾向って年々変わってるの?
Meta Kaggle Kaggle が公開している CSV 形式のデータセットで、ユーザや Competition 、Discussion や Kernel
に関する情報が見れる https://www.kaggle.com/kaggle/meta-kaggle
1. Kaggleって本当に流行ってるの? 毎月の Kaggle の新規ユーザー数を Users.csv から調べた。 新規ユーザー数が右肩上がりであれば、流行っていると言えるはず! すんごい増えてる!!!
1. Kaggleって本当に流行ってるの? Users.csvのデータ数、多すぎません? アカウントを作っただけでコンペに参加していない人がほとんど!
1. Kaggleって本当に流行ってるの? コンペの開催期間中に一度でもSubmit して成功した人に対象を絞って、 毎月の新規ユーザー数を確認してみた Submission.csvはPrivate Scoreを含むため 開催中のコンペ情報は拾えない 若干、鈍化・・・ (コンペはFeatured,
Research が対象)
2.コンペの傾向って変わってるの? コンペのタグを確認して、どんなタグがついているコンペが年々増えて いるのかを確認 (2014年以降、タグがつけられている) これ
2.コンペの傾向って変わってるの? • コンペの種類は Featured, Research が対象 • もっとも多く使われているタグ Top10 をまず確認
tabular dataと image dataと text dataに絞るか
2.コンペの傾向って変わってるの? 半年ごとのテーブルデータ、画像データ、テキストデータのタグがついて いるコンペ数の変化 (複数タグついている場合、それぞれ1カウント) 2016 ~ 2017 年あたりで変化 image data
tabular data text data
まとめ • Kaggle の注目度は上がっている • コンペに取り組む新規ユーザの伸びは鈍化 • 画像コンペが多くなった • Meta
Kaggle の分析も面白い 予想通り!! って感じでしたかね ソースコードは Kaggle の kernel で公開してます https://www.kaggle.com/pridegoodmusic/meta-kaggle-analysis 沼にはまろう