Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Python入門_PyLadiesTokyo2021/08/29
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
kanan
August 29, 2021
Programming
420
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Python入門_PyLadiesTokyo2021/08/29
kanan
August 29, 2021
More Decks by kanan
See All by kanan
Pythonデータ分析コトハジメinFukuoka
kanan
0
130
Pythonデータ分析コトハジメin静岡
kanan
0
130
Python超入門データ分析編-PyLadiesCaravan広島2nd-
kanan
0
140
PyLadiesCaravan_in_苫小牧
kanan
0
150
Python超入門_データ分析編in青森
kanan
0
220
Pythonデータ分析コトハジメin愛知3rd
kanan
1
170
PyLadiesCaravan in 大阪
kanan
0
320
PyLadiesCaravan in 名古屋Returns
kanan
0
210
PyLadiesCaravan in 愛媛(Python入門データ分析編)
kanan
0
370
Other Decks in Programming
See All in Programming
Agentic UI
manfredsteyer
PRO
0
110
Signal Forms: Beyond the Basics @ngBaguette 2026 in Paris
manfredsteyer
PRO
0
230
CLIであることを活かしたGitHub Copilot CLI活用術 / GitHub Copilot CLI Pro Tips & Tricks
nao_mk2
1
1.2k
GitHub Copilot CLIのいいところ
htkym
2
1.3k
RTSPクライアントを自作してみた話
simotin13
0
510
AI時代のUIはどこへ行く?その2!
yusukebe
19
6.8k
A2UI という光を覗いてみる
satohjohn
1
110
AIエージェントと協働するCLI開発 — BunとOpenClawで学んだこと
yoshikouki
1
240
Make SRE Operations Easier with Azure SRE Agent
kkamegawa
0
4.5k
Spring Security 実践 ─ GraphQL APIで実務に役立つ 認証・認可 を学ぶ
wagyu
0
180
TAKTでAI駆動開発の品質を設計する
j5ik2o
6
1k
Technical Debt: Understanding it Rightly, Engaging it Rightly #LaravelLiveJP
shogogg
0
200
Featured
See All Featured
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
390
Skip the Path - Find Your Career Trail
mkilby
1
140
Ruling the World: When Life Gets Gamed
codingconduct
0
250
The SEO Collaboration Effect
kristinabergwall1
1
480
Done Done
chrislema
186
16k
Making the Leap to Tech Lead
cromwellryan
135
9.9k
Gemini Prompt Engineering: Practical Techniques for Tangible AI Outcomes
mfonobong
2
430
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
290
Tell your own story through comics
letsgokoyo
1
950
How to Ace a Technical Interview
jacobian
281
24k
Imperfection Machines: The Place of Print at Facebook
scottboms
270
14k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
49
10k
Transcript
大人のためのPython入門 PyLadies Caravan in Tokyo データ分析編
▪自己紹介▪ ▶ PyLadies Caravan STAFF ▶ お仕事は分析屋さん ▶ お酒が好き、あと焼き鳥も好き ▶
今年の趣味は海と山のダブルコンボ かなん @Addition_quince 福岡出身/東京在住
※ 今日やること ※ ▪Pythonってどんな言語? ▪jupyter notebookを使ってみよう ▪データ分析のことはじめ +データの読み込み +データの形式を把握 +要約統計量の算出
+データの可視化
はじめようPython de データ分析★
Pythonって、どんな言語? Python とは 汎用プログラミング言語で、その特徴はこんなかんじ。 • オープンソースである • 文法がシンプルであり、コードが少量で済む • Web開発、データ解析(AI)、ゲームといった幅広い分野で使用
• 多彩なライブラリサポートで高度な計算も容易 『 Youtube 』 『 EverNote 』 『 Instagram 』に利用されています。
Pythonって、どんな言語? Python の起源 1991年 オランダ人のグイド・ヴァン・ロッサム氏によって開発 イギリスの大ヒットコメディ番組「空飛ぶモンティ・パイソン」からきているとされる。 グイド・ヴァン・ロッサム (出典「wikipedia」) 6年以上前の1989年12月、私はクリスマス前後の週の暇つぶしのため「趣味」のプログ ラミングプロジェクトを探していた。オフィスは閉まっているが、自宅にはホームコン
ピュータがあるし、他にすることがなかった。私は最近考えていた新しいスクリプト言語 のインタプリタを書くことにした。それは、ABCからの派生であり、Unix/Cハッカーの注 意をひきつけるかもしれないと考えた。ちょっとしたいたずら心から(『空飛ぶモンティ・パ イソン』の熱烈なファンだったというのも理由の1つ)、プロジェクトの仮称をPythonにし た。 — グイド・ヴァンロッサム、「Programming Python」の序文
Python特徴①:シンプルな文法! Python の文法の特徴的な構文ルール「インデント」 • インデントは、行頭に空白を入れて文字を入れて字下げを行う事 • 同じインデントのまとまりを1つのブロックと識別 Def hikaku(x): f
x < 10: print(‘少ない’) else: print(‘たくさん’) 1インデントは空白4 つで表されることが 多い
Python特徴②:ライブラリが豊富! ライブラリとは、 多彩な計算やデータ加工を可能とする、モジュール(Pythonプログラ ム)群。 <例> ▶ datetime :日付時間処理 ▶ math
:数学計算 ▶ numpy :行列演算 ▶ Pandas :データ加工 ▶ Matplotlib :グラフ描画 ▶ scikit-learn :機械学習 ▶ Chainer :深層学習
Pythonのバージョン: ▶ Python2(2系)とPython3(3系) ▶ Python2は既(2020年)にサポート終了 ▶ Python3を使いましょう ▶ 最新バージョンは Python3.9.6
Jupyter Notebookを使って データ分析をやってみよう!
(参考)エディタ ▶ 実際にPythonでプログラムを書くときは、エディタと呼ばれるソ フトウェアを使うことが多い ▶ みんな自分の好みのエディタをメインで使っています。 ▶ Visual Studio Code (ビジュアルスタジオコード)
▶ PyCharm (パイチャーム) ▶ Atom (アトム) ▶ Notepad++ (ノートパッドプラスプラス) ▶ Sublime (サブライム) ▶ Jupyter Notebook (ジュピターノートブック)
(参考)エディタ ▶ PyCharm
今回はJupyter Notebookを使用します Jupyter Notebookとは、 ブラウザ形式のテキストエディタ。 ノートブックと呼ばれる形式でプログラムを作成でき、 実行結果を確認しながら作業を進めるためのツールです。 <実行画面> 結果表示 処理記載
データ分析で大事なこと データ分析っていうと、 多変量解析とか機械学習とかってすぐやりたくなる でもとても大事なのはデータを理解すること。 そのデータがどんな姿をしているのかを 数値化とグラフ化で泥臭く地道に 解き明かす過程がデータ分析の大半を占めたりする
(参考)describe:要約統計量 count :件数 mean :平均 std :標準偏差 min :最小値 25%
:25%点(第1四分位数) 50% :50%点(第2四分位数、中央値) 75% :75%点(第3四分位数) max :最大値
(参考)平均と中央値(50%点) ・平均は少数の外れ値(異常値)に大きな影響を受ける統計量!! ・平均は全体の中心を表す統計量としてよく利用されるけど、 外れ値を含んだデータでは、外れ値に影響を受けやすいので 注意が必要。 ユーザー スマホゲーム月課金額 A 200円 B
50円 C 300円 D 250円 E 600円 F 5,000円 平均 :1,067円 中央値: 275円
(参考)パーセンタイル値 10g 50g 180g 85g 200g 800g 1,000g 2,000g 5,000g
重さ 25%値 50%値 75%値 パーセンタイル値とは、データを昇順に並べた時の位置を表します。 ※百分位で位置を表す場合にパーセンタイル値となる。 データを昇順に並べ等分した時の位置を分位数(quantile)という。 よく使われるのは4等分する四分位数(quartile)である。 【四分位数】 25%値:全データの25%が入る値 第1四分位点(Q1) 50%値:全データの50%が入る値 第2四分位点(中央値)(Q2) 75%値:全データの75%が入る値 第3四分位点(Q3) 30g 中央値:190.0g/平均値:935.5g
(参考)箱ひげ図 Ω 25%の データ 25%の データ 25%の データ 25%の データ
最大値 第3四分位 75%点 中央値 50%点 第1四分位 25%点 最小値
10g 50g 180g 85g 200g 800g 1,000g 2,000g 5,000g 重さ
25% 50% 75% 30g おさらい 代表値 count 10 mean 935.5 std 1,482.2 min 10 25% 50 50% 190 75% 1,000 max 5,000 ヒストグラム 箱ひげ図 min max mean
本日のLET'S TRY
sample_data.csv 項目名 数値/カテゴリ 内容 No 数値 通し番号 地方 カテゴリ 8地方名(漢字)
chihou カテゴリ 8地方名(アルファベット) 都道府県 カテゴリ 都道府県(漢字) todouhuken カテゴリ 都道府県(アルファベット) area_km2 数値 面積(単位:㎢) population_k 数値 人口(単位:千人) female_k 数値 女性人口(単位:千人) ramen_shop 数値 ラーメン店舗数(単位:軒) sake_l 数値 総アルコール消費量(単位:㍑) sake_l_person 数値 20歳以上1人あたりアルコール消費量(単位:㍑) mcdnald_shop 数値 マクドナルド店舗数(単位:軒) name_sato 数値 苗字が「佐藤」さんの人数(単位:人) source_ml 数値 2人以上の世帯の年間ソース消費量(単位: ml)
challenge 問題1: name_satoは、佐藤さんの人数です。その都道府県にどのくらい佐藤さんの 割合が多いのかを確認してみよう。 ※注意:都道府県の人口(population_k)は千人単位です。 問題2: 佐藤さん比率が多ければ多いほど、ラーメン店の数は多くなるのか検証し みよう! 問題3: 自分の出身(もしくは縁のある)都道府県について、データから得られる知見
を探してみましょう。
はじめようPython Life★