Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20250508_空間データと回帰分析
Search
t_akaike
May 01, 2025
0
170
20250508_空間データと回帰分析
t_akaike
May 01, 2025
Tweet
Share
More Decks by t_akaike
See All by t_akaike
tidyterraを使ってみる
t_akaike
0
620
Featured
See All Featured
The Illustrated Children's Guide to Kubernetes
chrisshort
48
50k
Designing for humans not robots
tammielis
253
25k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
126
53k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
Making the Leap to Tech Lead
cromwellryan
134
9.4k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
For a Future-Friendly Web
brad_frost
179
9.8k
A Modern Web Designer's Workflow
chriscoyier
695
190k
How to train your dragon (web standard)
notwaldorf
96
6.1k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
35
2.5k
Rails Girls Zürich Keynote
gr2m
95
14k
KATA
mclloyd
30
14k
Transcript
AI 2025.05.08 AI技術開発部 分析グループ / 赤池 嵩文 GO株式会社 空間データと回帰分析
© GO Inc. 2 ⾃⼰紹介 【経歴】 ERPパッケージのベンダーにてシステム開発を経験した後、企業の信 ⽤調査会社へ⼊社しデータ分析業務を開始。 それ以後、AIベンダー、HR系ベンチャー、薬局系スタートアップに て分析業務を担当し、2024年6⽉にGO株式会社に⼊社した。
@takaike12 GO株式会社 AI技術開発部 分析グループ / ⾚池 嵩⽂
AI 3 目次 01|はじめに 02|空間計量経済学と回帰分析 03|地球統計学と回帰分析 04|まとめ 02|空間的自己相関と空間的異質性
AI 4 01 はじめに
AI 【この資料の目的】 ▪ 短時間で空間データを用いた回帰分析の全体像をざっと掴むこと → 応用的な内容は扱いません 【資料の流れ】 ▪ 自分が学習する中で疑問に思ったことを中心に、Q&A形式で進めていきます 5
はじめに
AI 6 02 空間的自己相関と空間的異質性
AI 空間データの特徴 7 ▪ A. 目的変数が近くの値と似ている(似ていない)傾向や、場所そのものによ る目的変数の値の違いが考慮されないため、そういった要素が推定誤差に残っ てしまう Q. 空間データで単回帰・重回帰分析を行うと何か困るの?
空間的自己相関 場所による値の違いのこと → 目的変数が大きい「領域」なのか、近隣の 値が大きい場所につられて他の場所より大き い(空間的自己相関)のかを区別するのが難 しい 説明 空間的異質性 「統計ライブラリー 空間統計学 ―自然科学から人文・社会 科学まで―」P.21より引用 距離が近いほど値が似ている or 似ていない こと
AI ▪ A. 距離が近いほど値が似ている(似ていない)傾向のこと ▪ 近いほど似ている = 正の空間的自己相関 ▪ 近いほど似てない
= 負の空間的自己相関 8 Q. 「空間的自己相関」って何? 正の空間的自己相関の 例 負の空間的自己相関の 例
AI ▪ A. 空間全域の傾向把握のためのGISA、空間の中でのホットスポット・コール ドスポットの把握のためのLISAに大別される LISA (Local indicators of spatial
association) 9 Q. 空間的自己相関の指標にはどんなものがある? やりたいこと 空間全域の傾向把握 モランのI統計量、ギアリーのC統計量 確認する指標 ローカル・モラン統計量、 Gi, Gi*統計量 空間の中で正・負の相 関が大きい場所の把握 指標の総称 GISA (Global indicators of spatial association)
AI ▪ A. 各種統計量の値の比較だけでなく、検定によって確かめることもできる ▪ 検定の例: モランのI統計量 10 Q. 「空間的自己相関」の有無をどうやって確認する?
指標に漸近正規性を仮定し、 Z統計量を算出 & 検定!
AI 「普遍型クリギング」などの手法を用いる ※ 「空間的自己相関」「空間的異質性」は、目的 変数間の距離などで定義されるバリオグラムで 表現 ▪ A. 空間計量経済学と地球統計学のいずれの方法を使うかによって、方向性が 異なる
11 Q. 「空間的自己相関」「空間的異質性」を考慮したモデルって? 分野 空間計量経済学 空間ラグモデル、空間誤差モデル など 手法 普遍型クリギングなど 地球統計学 方向性 回帰モデルに対し、空間の隣接性を表す 「空間重み行列」を組み込む
AI 12 03 空間計量経済学と回帰分析
AI 1 2 4 ▪ A. 行政区やポリゴンなどの領域ごとに、「隣」を1、そうでない領域を0とし た行列のことで、基準化して使われることが非常に多い ▪ 「隣」
= 接している領域だけを隣とみなすのではなく、距離がある閾値以下や最 近傍など、分析時に検討の余地あり 13 Q. 「空間重み行列」って何? 領域の例 空間重み行列 (隣接行列) 空間重み行列 (基準化) 3
AI 14 Q. 空間重み行列をどうやってモデルに組み込む? ▪ A. モデルの変数に掛ける ▪ 空間的自己相関が何と関連しているか?という仮定次第で、空間重み行 列がどこに掛かるかが変わる
モデル 空間ラグモデル (SLM) 式 空間誤差モデル (SEM) 備考 ARモデルのような形で空間的自己相関が目 的変数に影響するモデル。 一般的な手法。 空間Durbinモデ ル (SDM) 空間的自己相関が、誤差を通じて目的変数 に影響するモデル。 一般的な手法。 空間ラグモデルに対し、説明変数の空間的 自己相関を組み込んだモデル。
AI 15 04 地球統計学と回帰分析
AI 「空間的自己相関」「空間的異質性」の扱い ▪ A. データの粒度、「空間的自己相関」や「空間的異質性」の扱い、興味の 対象が異なる 16 Q. 空間計量経済学のモデルと何が違うの? 地点
(空間的領域 = 連続) 分野 空間計量経済学 説明 予測(※) (空間的内挿) 興味の対象 地球統計学 データの粒度 地域 (空間的領域 = 離散) バリオグラムや共分散関数で表現 → ある条件のもとでの、 2点間の距離の みで定義される値の差分の分散や、 2点 の値の共分散 空間重み行列を活用 ※ 「クリギング」という手法は、元々は鉱山技術者のダニー・クリーグが鉱物の総量を予測する方法として開発
AI Q. 地球統計学の回帰モデルってどんな形? ▪ A. 空間過程 Y(s) を以下の形で表現したモデル(普遍型クリギング) ▪ 17
大域的なトレンド成分 局所的な変動成分 (観測値の間隔よりも短い範囲での変 動) 誤差 変数の内容 変数 トレンド成分を既知変数の線型結合で表現 (位置座標の関数以外の変数も含められ、 その場合「回帰クリギング」とも呼ばれる) 普遍型クリギングの空間過程の導出 平滑成分 (共分散関数、バリオグラムによる空間 的自己相関の成分) ここで とすると
AI 18 05 まとめ
AI 【空間的自己相関と空間的異質性】 ▪ 空間データに単回帰分析や重回帰分析を行うと、周辺との類似(空間的自己相関)や地点による 違い(空間的異質性)といった空間データの特性が推定誤差に乗ってしまう ▪ 空間統計学には空間計量経済学や地球統計学などの分野が存在し、分野ごとにモデルへの「空間的 自己相関」や「空間的異質性」の表現が異なる 【空間計量経済学】 ▪
対象とする全ての領域に対して、各領域と隣り合っているかどうかを総当たりで判定した行列を 「空間重み行列」という ▪ 一般的な手法として「空間ラグモデル」や「空間誤差モデル」がある 【地球統計学】 ▪ 空間計量経済学のモデルとは、データの粒度や「空間的自己相関」「空間的異質性」の扱い、 興味の対象が異なる ▪ 「回帰」に限定すると、説明変数を組み込んだ「普遍型クリギング」というモデルがある 19 まとめ
AI ▪ 瀬谷 創, 堤 盛人「統計ライブラリー 空間統計学 ―自然科学から人文・社会科学まで―」, 朝倉書店, 2014年3月
▪ ジュセッペ・アルビア (著), 堤 盛人 (監修)「Rで学ぶ空間計量経済学入門」, 勁草書房, 2016年9月 ▪ 持橋 大地, 大羽 成征「ガウス過程と機械学習 (機械学習プロフェッショナルシリーズ)」, 講談社, 2019年3月 20 Reference