Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Python入門_PyLadiesTokyo2021/08/29

kanan
August 29, 2021

 Python入門_PyLadiesTokyo2021/08/29

kanan

August 29, 2021
Tweet

More Decks by kanan

Other Decks in Programming

Transcript

  1. ▪自己紹介▪ ▶ PyLadies Caravan STAFF ▶ お仕事は分析屋さん ▶ お酒が好き、あと焼き鳥も好き ▶

    今年の趣味は海と山のダブルコンボ かなん  @Addition_quince 福岡出身/東京在住
  2. Pythonって、どんな言語? Python の起源 1991年 オランダ人のグイド・ヴァン・ロッサム氏によって開発 イギリスの大ヒットコメディ番組「空飛ぶモンティ・パイソン」からきているとされる。  グイド・ヴァン・ロッサム (出典「wikipedia」)  6年以上前の1989年12月、私はクリスマス前後の週の暇つぶしのため「趣味」のプログ ラミングプロジェクトを探していた。オフィスは閉まっているが、自宅にはホームコン

    ピュータがあるし、他にすることがなかった。私は最近考えていた新しいスクリプト言語 のインタプリタを書くことにした。それは、ABCからの派生であり、Unix/Cハッカーの注 意をひきつけるかもしれないと考えた。ちょっとしたいたずら心から(『空飛ぶモンティ・パ イソン』の熱烈なファンだったというのも理由の1つ)、プロジェクトの仮称をPythonにし た。 — グイド・ヴァンロッサム、「Programming Python」の序文
  3. Python特徴②:ライブラリが豊富! ライブラリとは、 多彩な計算やデータ加工を可能とする、モジュール(Pythonプログラ ム)群。 <例> ▶ datetime :日付時間処理 ▶ math

    :数学計算 ▶ numpy :行列演算 ▶ Pandas :データ加工 ▶ Matplotlib :グラフ描画 ▶ scikit-learn :機械学習 ▶ Chainer :深層学習
  4. (参考)エディタ ▶ 実際にPythonでプログラムを書くときは、エディタと呼ばれるソ フトウェアを使うことが多い ▶ みんな自分の好みのエディタをメインで使っています。 ▶ Visual Studio Code (ビジュアルスタジオコード)

    ▶ PyCharm (パイチャーム) ▶ Atom (アトム) ▶ Notepad++ (ノートパッドプラスプラス) ▶ Sublime (サブライム) ▶ Jupyter Notebook (ジュピターノートブック)
  5. (参考)describe:要約統計量 count :件数 mean :平均 std :標準偏差 min :最小値 25%

    :25%点(第1四分位数) 50% :50%点(第2四分位数、中央値) 75% :75%点(第3四分位数) max :最大値
  6. (参考)パーセンタイル値 10g 50g 180g 85g 200g 800g 1,000g 2,000g 5,000g

    重さ 25%値 50%値 75%値 パーセンタイル値とは、データを昇順に並べた時の位置を表します。 ※百分位で位置を表す場合にパーセンタイル値となる。  データを昇順に並べ等分した時の位置を分位数(quantile)という。  よく使われるのは4等分する四分位数(quartile)である。 【四分位数】 25%値:全データの25%が入る値 第1四分位点(Q1) 50%値:全データの50%が入る値 第2四分位点(中央値)(Q2) 75%値:全データの75%が入る値 第3四分位点(Q3) 30g 中央値:190.0g/平均値:935.5g
  7. (参考)箱ひげ図 Ω 25%の データ 25%の データ 25%の データ 25%の データ

    最大値 第3四分位 75%点 中央値 50%点 第1四分位 25%点 最小値
  8. 10g 50g 180g 85g 200g 800g 1,000g 2,000g 5,000g 重さ

    25% 50% 75% 30g おさらい 代表値 count 10 mean 935.5 std 1,482.2 min 10 25% 50 50% 190 75% 1,000 max 5,000 ヒストグラム 箱ひげ図 min max mean
  9. sample_data.csv 項目名 数値/カテゴリ 内容 No 数値 通し番号 地方 カテゴリ 8地方名(漢字)

    chihou カテゴリ 8地方名(アルファベット) 都道府県 カテゴリ 都道府県(漢字) todouhuken カテゴリ 都道府県(アルファベット) area_km2 数値 面積(単位:㎢) population_k 数値 人口(単位:千人) female_k 数値 女性人口(単位:千人) ramen_shop 数値 ラーメン店舗数(単位:軒) sake_l 数値 総アルコール消費量(単位:㍑) sake_l_person 数値 20歳以上1人あたりアルコール消費量(単位:㍑) mcdnald_shop 数値 マクドナルド店舗数(単位:軒) name_sato 数値 苗字が「佐藤」さんの人数(単位:人) source_ml 数値 2人以上の世帯の年間ソース消費量(単位: ml)