Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Kaggleに置かれているデータを 可視化する
Search
ksnt
December 09, 2020
Programming
430
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Kaggleに置かれているデータを 可視化する
ksnt
December 09, 2020
More Decks by ksnt
See All by ksnt
AutoGenを触ってみた
ksnt
0
350
データ分析者にとってのDjango: StreamlitやDashとの比較
ksnt
1
2k
データ分析で切り拓け! エンジニアとしてのデータ分析職キャリア戦略
ksnt
0
1.1k
勉強会で発表してみよう!
ksnt
0
340
CourseraのDigital Transformationというコースを受けてみた
ksnt
2
720
Pythonで挑む計算社会科学
ksnt
0
1.5k
turtleであそぼう!
ksnt
0
310
データ分析と競技プログラミングに使えるPython標準ライブラリ入門
ksnt
1
670
DashユーザーがStreamlitを使ってアプリケーションをつくってみた
ksnt
0
2.2k
Other Decks in Programming
See All in Programming
A2UI という光を覗いてみる
satohjohn
1
160
正しくソフトウェアを作る、前提を疑うための認知の視点 / doubt-premise
minodriven
21
7k
「AIで開発し、AIを届ける」をEvalでつなぐ 〜AIネイティブに始めるプロダクト開発の実践〜 / Connecting "Develop with AI, deliver AI" with Eval
rkaga
4
5.4k
Developing with AI Agents — Codex, Claude Code & Cowork Practical Guide
x5gtrn
PRO
0
1.3k
Signal Forms: Details & Live Coding @enterJS 2026 in Mannheim
manfredsteyer
PRO
0
190
The NotImplementedError Problem in Ruby
koic
1
940
軽量Java基盤の設計 DIコンテナに頼らない、長期保守と1秒起動の実現 JJUG CCC 2026 Spring
macha64
0
580
メソッドのジェネリクスでGoの夢は広がるか? / Kyoto.go #65
utgwkk
3
950
Hunting Vulnerabilities in Symfony with LLMs
vinceamstoutz
0
560
ローカルLLMを使ってB2Bサービスを作っていての学び
yaotti
0
210
並列実装の現場、2ヶ月間実務でAIを使い倒したAIもPCも私も限界が近い
ming_ayami
0
130
Mujeres en SEO Summit 2026 - Greatest Disaster Hits en Web Performance
guaca
0
200
Featured
See All Featured
New Earth Scene 8
popppiees
3
2.4k
jQuery: Nuts, Bolts and Bling
dougneiner
66
8.5k
What's in a price? How to price your products and services
michaelherold
247
13k
Context Engineering - Making Every Token Count
addyosmani
9
980
Navigating the moral maze — ethical principles for Al-driven product design
skipperchong
2
400
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
2
580
Heart Work Chapter 1 - Part 1
lfama
PRO
8
36k
RailsConf 2023
tenderlove
30
1.5k
SEO in 2025: How to Prepare for the Future of Search
ipullrank
3
3.5k
Beyond borders and beyond the search box: How to win the global "messy middle" with AI-driven SEO
davidcarrasco
3
170
Everyday Curiosity
cassininazir
0
240
Navigating Team Friction
lara
192
16k
Transcript
Kaggleに置かれているデ置かれているデーかれているデータをデータをを 可視化するするデータを ksnt
自己紹介 • PyCon mini Hiroshima スタをッフ • はんなりPython 運営
kaggleとは? • 2010年に米国でスターに置かれているデ米国でスタートしたでスタートしたデスタをートしたデータサイしたデータサイエンデータをサイエンスコン ペティションサイトしたデータサイ • 2020年に米国でスター5月時点で登録者数ベーでスタートしたデ登録者数ベースでベースでスタートしたデ10万人以上 のデータサイエンデータをサイエンティストしたデータサイが参加参加 • 実際のデータ・課題のデータサイエンデータを・課題に対して、課題に対して、様々に置かれているデ対して、様々なデして、様々なデータサ様々なデータサイエなデータをサイエン ティストしたデータサイが参加オンライン上でスタートしたデ意見をかわしながらをかわしなが参加らそのデータサイエン結
果が即時に採点さが参加即時に置かれているデ採点で登録者数ベーされ競い合うことがでい合うことができるうことが参加でスタートしたデきるデータを
Compete, Data, Notebooks, Communities • Compete – 開催されているコンされているデータをコンペが参加表示 • Data
– データをが参加たデータサイエンくさん置かれているデーかれているデータを • Notebooks – ノートしたデータサイブックがたくさん置かが参加たデータサイエンくさん置かれているデーかれて いるデータを • Communities - ディスカッションが参加行われていわれてい るデータを
コンペのデータサイエン種類 • Predictコンペ ▪ もっともスタをンダードなコンペなコンペ ▪ データををDLしてきて任意のデータサイエン環境で分析 でスタートしたデ分析 or Kaggle上でスタートしたデ分析
▪ 複雑なアンサンブルなアンサンブルモデルが参加上位にくることもあに置かれているデくるデータをこともあり上位にくることもあソリューションは実務に活用しづらいに置かれているデ活用しづらいものにしづらいものデータサイエンに置かれているデな るデータをこともあるデータを(らしい) • Codeコンペ ▪ Kaggleのデータサイエンオンライン環境で分析 でスタートしたデ分析するデータをことが参加条件 ▪ 処理時間の制限があったのデータサイエン制限があったりしてが参加あったデータサイエンりして過度に複雑な処理なに置かれているデ複雑なアンサンブルな処理などは制限があったりしてされるデータを • 最適化するコンペ ▪ 最適解をいかに早く見をいかに置かれているデ早く見つけるかをく見をかわしながらつけるデータをかを競い合うことがでう ▪ 「サンタをコンペ」 • Simulationコンペ ▪ ゲームなどにおいて高などに置かれているデおいて高得点で登録者数ベーを取得するデータをたデータサイエンめのデータサイエン自動で動くプログラでスタートしたデ動で動くプログラくプログラムなどにおいて高を作成するするデータを • 可視化するコンペ
Los Angeles Traffic Collision Data • Libraries folium (Lealet.jsのデータサイエンPythonラッパー) •
Data https://www.kaggle.com/cityofLA/los-angeles-traffic-c ollision-data • Notebook https://www.kaggle.com/ksn0215/introduction-to- geospatial-analysis-with-leaflet
Data Science for Good: Center for Policing Equity How do
you measure justice? • Libraries plotly • Data https://www.kaggle.com/center-for-policing-equity/data-science-for- good • Notebook https://www.kaggle.com/ksn0215/measurement-of-justice-in-boston
Global Terrorism Database More than 180,000 terrorist attacks worldwide, 1970-2017
• Libraries plotly/Dash • Data https://www.kaggle.com/START-UMD/gtd • Video https://drive.google.com/file/d/1428V6qrFP- JvWYHYe7kc6V54apw0Yvde/view
まとめ • KaggleのデータサイエンページからデータをからデータををDLしてきて可視化するし てみるデータをととても勉強になるに置かれているデなるデータを • 場合うことができるに置かれているデよってはメダルが参加もらえるデータをかも • Kaggleのデータサイエンデータをは実データをに置かれているデ比べると使いやすべるデータをと使いやすいいやすい ものデータサイエンが参加多い印象なのでよい印象なのでよい練習なのデータサイエンでスタートしたデよい練習になるに置かれているデなるデータを
おまけ - おすすめ書籍
Let’s get started!