Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Meta Kaggleを覗いてみた
Search
Yuko Ishizaki
November 05, 2019
Research
3
2.6k
Meta Kaggleを覗いてみた
Yuko Ishizaki
November 05, 2019
Tweet
Share
More Decks by Yuko Ishizaki
See All by Yuko Ishizaki
The Web Conference 2020 Report -多目的最適化における確率的ラベル集約-
ishizaki_yuko
1
1.3k
雲コンペで反省したノイズ除去
ishizaki_yuko
1
400
Hybrid Reward Architecture for Reinforcement Learning
ishizaki_yuko
0
120
Modeling Relational Data with Graph Convolutional Networks
ishizaki_yuko
0
160
Other Decks in Research
See All in Research
Tietovuoto Social Design Agency (SDA) -trollitehtaasta
hponka
0
2.5k
メールからの名刺情報抽出におけるLLM活用 / Use of LLM in extracting business card information from e-mails
sansan_randd
2
140
論文読み会 SNLP2024 Instruction-tuned Language Models are Better Knowledge Learners. In: ACL 2024
s_mizuki_nlp
1
360
Embers of Autoregression: Understanding Large Language Models Through the Problem They are Trained to Solve
eumesy
PRO
7
1.2k
FOSS4G 山陰 Meetup 2024@砂丘 はじめの挨拶
wata909
1
110
Matching 2D Images in 3D: Metric Relative Pose from Metric Correspondences
sgk
1
320
KDD論文読み会2024: False Positive in A/B Tests
ryotoitoi
0
200
marukotenant01/tenant-20240916
marketing2024
0
510
Physics of Language Models: Part 3.1, Knowledge Storage and Extraction
sosk
1
950
秘伝:脆弱性診断をうまく活用してセキュリティを確保するには
okdt
PRO
3
740
[依頼講演] 適応的実験計画法に基づく効率的無線システム設計
k_sato
0
130
MIRU2024チュートリアル「様々なセンサやモダリティを用いたシーン状態推定」
miso2024
4
2.2k
Featured
See All Featured
Mobile First: as difficult as doing things right
swwweet
222
8.9k
How to Ace a Technical Interview
jacobian
276
23k
Product Roadmaps are Hard
iamctodd
PRO
49
11k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
28
2k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
25
1.8k
A Tale of Four Properties
chriscoyier
156
23k
Intergalactic Javascript Robots from Outer Space
tanoku
269
27k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
33
1.9k
Code Reviewing Like a Champion
maltzj
520
39k
GraphQLの誤解/rethinking-graphql
sonatard
67
10k
Faster Mobile Websites
deanohume
305
30k
The MySQL Ecosystem @ GitHub 2015
samlambert
250
12k
Transcript
Meta Kaggleを覗いてみた Connehito Marché vol.6 機械学習・データ分析市 2019 / 11 /
5 石崎 裕子
初めまして 最近、Kaggleにはまっている人です
概要 Kaggle(データ分析コンペ)が公開している Meta Kaggle を覗いて、以下のこ とを考察してみた LT 5分だから ざっくりね! 1.
Kaggleって本当に流行ってるの? 2. コンペの傾向って年々変わってるの?
Meta Kaggle Kaggle が公開している CSV 形式のデータセットで、ユーザや Competition 、Discussion や Kernel
に関する情報が見れる https://www.kaggle.com/kaggle/meta-kaggle
1. Kaggleって本当に流行ってるの? 毎月の Kaggle の新規ユーザー数を Users.csv から調べた。 新規ユーザー数が右肩上がりであれば、流行っていると言えるはず! すんごい増えてる!!!
1. Kaggleって本当に流行ってるの? Users.csvのデータ数、多すぎません? アカウントを作っただけでコンペに参加していない人がほとんど!
1. Kaggleって本当に流行ってるの? コンペの開催期間中に一度でもSubmit して成功した人に対象を絞って、 毎月の新規ユーザー数を確認してみた Submission.csvはPrivate Scoreを含むため 開催中のコンペ情報は拾えない 若干、鈍化・・・ (コンペはFeatured,
Research が対象)
2.コンペの傾向って変わってるの? コンペのタグを確認して、どんなタグがついているコンペが年々増えて いるのかを確認 (2014年以降、タグがつけられている) これ
2.コンペの傾向って変わってるの? • コンペの種類は Featured, Research が対象 • もっとも多く使われているタグ Top10 をまず確認
tabular dataと image dataと text dataに絞るか
2.コンペの傾向って変わってるの? 半年ごとのテーブルデータ、画像データ、テキストデータのタグがついて いるコンペ数の変化 (複数タグついている場合、それぞれ1カウント) 2016 ~ 2017 年あたりで変化 image data
tabular data text data
まとめ • Kaggle の注目度は上がっている • コンペに取り組む新規ユーザの伸びは鈍化 • 画像コンペが多くなった • Meta
Kaggle の分析も面白い 予想通り!! って感じでしたかね ソースコードは Kaggle の kernel で公開してます https://www.kaggle.com/pridegoodmusic/meta-kaggle-analysis 沼にはまろう