Upgrade to Pro — share decks privately, control downloads, hide ads and more …

PyLadiesCaravan in 愛媛(Python入門データ分析編)

Avatar for kanan kanan
August 06, 2022

PyLadiesCaravan in 愛媛(Python入門データ分析編)

Avatar for kanan

kanan

August 06, 2022
Tweet

More Decks by kanan

Other Decks in Technology

Transcript

  1. ▪自己紹介▪ ▶ PyLadies Caravan STAFF ▶ お仕事は分析屋さん ▶ お酒が好き、あと焼き鳥も好き ▶

    今年の趣味は海と山のダブルコンボ かなん  @Addition_quince 福岡出身/東京在住
  2. (参考)describe:要約統計量 count :件数 mean :平均 std :標準偏差 min :最小値 25%

    :25%点(第1四分位数) 50% :50%点(第2四分位数、中央値) 75% :75%点(第3四分位数) max :最大値
  3. (参考)パーセンタイル値 10g 50g 180g 85g 200g 800g 1,000g 2,000g 5,000g

    重さ 25%値 50%値 75%値 パーセンタイル値とは、データを昇順に並べた時の位置を表します。 ※百分位で位置を表す場合にパーセンタイル値となる。  データを昇順に並べ等分した時の位置を分位数(quantile)という。  よく使われるのは4等分する四分位数(quartile)である。 【四分位数】 25%値:全データの25%が入る値 第1四分位点(Q1) 50%値:全データの50%が入る値 第2四分位点(中央値)(Q2) 75%値:全データの75%が入る値 第3四分位点(Q3) 30g 中央値:190.0g/平均値:935.5g
  4. (参考)箱ひげ図 Ω 25%の データ 25%の データ 25%の データ 25%の データ

    最大値 第3四分位 75%点 中央値 50%点 第1四分位 25%点 最小値
  5. 10g 50g 180g 85g 200g 800g 1,000g 2,000g 5,000g 重さ

    25% 50% 75% 30g おさらい 代表値 count 10 mean 935.5 std 1,482.2 min 10 25% 50 50% 190 75% 1,000 max 5,000 ヒストグラム 箱ひげ図 min max mean
  6. sample_data.csv 項目名 数値/カテゴリ 内容 No 数値 通し番号 地方 カテゴリ 8地方名(漢字)

    chihou カテゴリ 8地方名(アルファベット) 都道府県 カテゴリ 都道府県(漢字) todouhuken カテゴリ 都道府県(アルファベット) area_km2 数値 面積(単位:㎢) population_k 数値 人口(単位:千人) female_k 数値 女性人口(単位:千人) ramen_shop 数値 ラーメン店舗数(単位:軒) sake_l 数値 総アルコール消費量(単位:㍑) sake_l_person 数値 20歳以上1人あたりアルコール消費量(単位:㍑) mcdnald_shop 数値 マクドナルド店舗数(単位:軒) yakitori_shop 数値 焼き鳥屋店舗数(単位:軒) name_sato 数値 苗字が「佐藤」さんの人数(単位:人) source_ml 数値 2人以上の世帯の年間ソース消費量(単位: ml) mikan_g 数値 2人以上の世帯の年間みかん消費量(単位: g) orange_g 数値 2人以上の世帯の年間オレンジ消費量(単位: g)