Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Meta Kaggleを覗いてみた
Search
Yuko Ishizaki
November 05, 2019
Research
3
2.8k
Meta Kaggleを覗いてみた
Yuko Ishizaki
November 05, 2019
Tweet
Share
More Decks by Yuko Ishizaki
See All by Yuko Ishizaki
The Web Conference 2020 Report -多目的最適化における確率的ラベル集約-
ishizaki_yuko
1
1.4k
雲コンペで反省したノイズ除去
ishizaki_yuko
1
410
Hybrid Reward Architecture for Reinforcement Learning
ishizaki_yuko
0
130
Modeling Relational Data with Graph Convolutional Networks
ishizaki_yuko
0
180
Other Decks in Research
See All in Research
【緊急警告】日本の未来設計図 ~沈没か、再生か。国民と断行するラストチャンス~
yuutakasan
0
130
Looking for Escorts in Sydney?
lunsophia
1
120
ストレス計測方法の確立に向けたマルチモーダルデータの活用
yurikomium
0
680
電力システム最適化入門
mickey_kubo
1
680
Adaptive fusion of multi-modal remote sensing data for optimal sub-field crop yield prediction
satai
3
220
SSII2025 [TS1] 光学・物理原理に基づく深層画像生成
ssii
PRO
4
3.7k
Creation and environmental applications of 15-year daily inundation and vegetation maps for Siberia by integrating satellite and meteorological datasets
satai
3
120
AIによる画像認識技術の進化 -25年の技術変遷を振り返る-
hf149
6
3.5k
SSII2025 [SS1] レンズレスカメラ
ssii
PRO
2
970
Trust No Bot? Forging Confidence in AI for Software Engineering
tomzimmermann
1
240
Towards a More Efficient Reasoning LLM: AIMO2 Solution Summary and Introduction to Fast-Math Models
analokmaus
2
230
公立高校入試等に対する受入保留アルゴリズム(DA)導入の提言
shunyanoda
0
5.9k
Featured
See All Featured
Building a Modern Day E-commerce SEO Strategy
aleyda
42
7.4k
Bootstrapping a Software Product
garrettdimon
PRO
307
110k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
48
5.4k
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
Speed Design
sergeychernyshev
32
1k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
45
7.5k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
32
2.4k
Java REST API Framework Comparison - PWX 2021
mraible
31
8.7k
A Modern Web Designer's Workflow
chriscoyier
694
190k
The Cult of Friendly URLs
andyhume
79
6.5k
Docker and Python
trallard
44
3.5k
GitHub's CSS Performance
jonrohan
1031
460k
Transcript
Meta Kaggleを覗いてみた Connehito Marché vol.6 機械学習・データ分析市 2019 / 11 /
5 石崎 裕子
初めまして 最近、Kaggleにはまっている人です
概要 Kaggle(データ分析コンペ)が公開している Meta Kaggle を覗いて、以下のこ とを考察してみた LT 5分だから ざっくりね! 1.
Kaggleって本当に流行ってるの? 2. コンペの傾向って年々変わってるの?
Meta Kaggle Kaggle が公開している CSV 形式のデータセットで、ユーザや Competition 、Discussion や Kernel
に関する情報が見れる https://www.kaggle.com/kaggle/meta-kaggle
1. Kaggleって本当に流行ってるの? 毎月の Kaggle の新規ユーザー数を Users.csv から調べた。 新規ユーザー数が右肩上がりであれば、流行っていると言えるはず! すんごい増えてる!!!
1. Kaggleって本当に流行ってるの? Users.csvのデータ数、多すぎません? アカウントを作っただけでコンペに参加していない人がほとんど!
1. Kaggleって本当に流行ってるの? コンペの開催期間中に一度でもSubmit して成功した人に対象を絞って、 毎月の新規ユーザー数を確認してみた Submission.csvはPrivate Scoreを含むため 開催中のコンペ情報は拾えない 若干、鈍化・・・ (コンペはFeatured,
Research が対象)
2.コンペの傾向って変わってるの? コンペのタグを確認して、どんなタグがついているコンペが年々増えて いるのかを確認 (2014年以降、タグがつけられている) これ
2.コンペの傾向って変わってるの? • コンペの種類は Featured, Research が対象 • もっとも多く使われているタグ Top10 をまず確認
tabular dataと image dataと text dataに絞るか
2.コンペの傾向って変わってるの? 半年ごとのテーブルデータ、画像データ、テキストデータのタグがついて いるコンペ数の変化 (複数タグついている場合、それぞれ1カウント) 2016 ~ 2017 年あたりで変化 image data
tabular data text data
まとめ • Kaggle の注目度は上がっている • コンペに取り組む新規ユーザの伸びは鈍化 • 画像コンペが多くなった • Meta
Kaggle の分析も面白い 予想通り!! って感じでしたかね ソースコードは Kaggle の kernel で公開してます https://www.kaggle.com/pridegoodmusic/meta-kaggle-analysis 沼にはまろう