Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Nsihika 中古マンション価格予測 2022春 Solution 共有会

kazuki-komori
September 12, 2022
270

Nsihika 中古マンション価格予測 2022春 Solution 共有会

kazuki-komori

September 12, 2022
Tweet

Transcript

  1. Speaker kazuyan (@D_kazuyan) フロントエンドエンジニア / 機械学習 Vue.js / React /

    Golang / Python (最近はRust を勉強中) Presented by kazuyan 2
  2. 特徴量エンジニアリング 各属性の要約統計量(最小値・最大値・平均・分散) Label Encoding Count Encoding Target Encoding (CV: 5

    ) 市区町村名を用いてgroup 化し,カウント 物件の所在地情報から緯度,経度を算出 緯度・経度からL1 距離とL2 距離を算出 Presented by kazuyan 17
  3. Label Encoding 質的なデータ(カテゴリカル・データ)を数値に置き換える 男 => 0 ,女 => 1 数値的な意味は持たない

    Count Encoding 質的データの出現回数を数値として置き換える ex: 男が 2 人,女が 4 人のデータの場合 男 => 2 ,女 => 4 Label Encoding と比較して数値的な意味がある Presented by kazuyan 18
  4. モデル構築 交差検証 Cross Validation (CV ) 学習データと検証データのセットを複数作成 過学習を防ぐ 今回は CV

    = 5 Strasified KFold (特定の要素を均等に分類)で市区町村とした Presented by kazuyan 22