Slide 1

Slide 1 text

地図の上に現れる滋賀県における 旅客データの可視化と分析 滋賀県立大学工学部 地域ひと・モノ・未来情報研究センター 酒井 道 宮城 茂幸*

Slide 2

Slide 2 text

発表内容  宿泊旅行データ分析(リクルートライフスタイル様ご提供)  担当:酒井  相関性ネットワークによる地域クラスター分析  タクシー走行データ分析(近江タクシー様ご提供)  担当:酒井、宮城  GPS位置情報の可視化  非負値行列因子分解による分析

Slide 3

Slide 3 text

統計情報から抽出する地域クラスター ~宿泊旅行データより~ リクルートライフスタイル様ご提供 データ(概要) 期間: 2017年4月~2020年3月まで1月ごと (2019年12月までは、新型コロナウイルスの影響無し) ☆今回は、新型コロナウイルスの影響を評価せず 対象地域: 滋賀県全体のデータに加えて、以下の各地域 大津、湖西(高島)、雄琴・堅田、甲賀・信楽、草津・守山・近江八幡、 彦根・長浜 データ種: 取扱額、宿泊実行件数、人泊数 その他のデータ (補助的に使用したオープンデータ) 滋賀県観光入込客統計調査書(滋賀県商工観光労働部観光交流局) 期間: 平成29年、平成30年 (2017年1月~2018年12月まで1月ごと等) 京都府観光入込客調査報告書(京都府商工労働観光部) 期間: 平成29年、平成30年 (2017年1月~2018年12月まで1月ごと等)

Slide 4

Slide 4 text

統計情報から抽出する地域クラスター ~宿泊旅行データより~ 分析対象区間における推移 (2017年4月~2018年12月) 以下、リクルートライフスタイル様の人泊数データと 滋賀県・京都府の入込客数データを使用 京都府内のデータの推移には、かなりばらつきがある。滋賀県と京都府の各都市間 でも、共通の傾向はあまり見られない。 滋賀県の各地域および京都府内の各 地域の入込客数の変動をプロットし た結果

Slide 5

Slide 5 text

統計情報から抽出する地域クラスター ~宿泊旅行データより~ 分析対象の相関性ネットワークによる分析 分析過程の可視化(総当たりで相関係数を出し、相互の関係性を閾値により 2レベル分類) 例1:相関が強い (大津と湖北 相関係数:0.91) 同じクラスター 例2:相関が無い (湖南と京都 相関係数:-0.15) 異なるクラスター 分析対象の地域のデータを縦 横に置き、相互の相関係数を 計算した結果 右上半分に相関係数が、左下 半分にそのときの分布図が描 かれている。

Slide 6

Slide 6 text

統計情報から抽出する地域クラスター ~宿泊旅行データより~ 分析対象の相関性ネットワークによる分析 滋賀県+京都府内のネットワークの可視化 「相関係数 > 0.7」で形成したネットワーク 滋賀県内で、エリア間の結びつきの強弱有り 甲賀・信楽(リクルート) 東近江 (滋賀県) 湖南、甲賀 (滋賀県) 他の滋賀県内 のエリア 相関係数の大きさに基づき、お互いに強い相関係数 を持つ地域どうしをエッジで接続し生成したネット ワーク 右図をわかりやすくクラスターとして表 示した結果

Slide 7

Slide 7 text

統計情報から抽出する地域クラスター ~宿泊旅行データより~ 分析対象の相関性ネットワークによる分析 滋賀県内の地域クラスター (リクルートライフスタイル様データ 2017年4月~2020年3月) ◎ネットワーク表現での可視化 (相関係数(>0.97)の場合に接続) ↓ ・相関係数はいずれも0.85以上で強い ・強い中でも、グルーピングが可能。 ①共通してグループを構成するエリア: 大津、雄琴・堅田、高島 ②異なる傾向を示すエリア: 甲賀・信楽) ③中間的なエリア: 草津・守山・近江八幡、彦根・長浜 ・人泊数、宿泊実行件数、取扱額の違い で多少の差異が存在 日帰り、1泊・連泊の違い等を反映? 差別化ができている地域とそうでない地域? 宿泊実行件数 取扱額 人泊数

Slide 8

Slide 8 text

小型商用車輌が描くパターンとネットワーク ~タクシー走行データより~ 近江タクシー様ご提供データ (概要) 期間: 2020年8月1日~8月31日について、秒単位のデータ 対象地域・タクシー台数: 彦根地域、近江八幡地域、草津地域について、 それぞれ6~10台 データ種: 以下のデータが、日・時・分・秒ごとに 状態(空車、配車、賃走、支払 等)、 大まかな地区、 GPSデータ(緯度、経度)、 速度(停止、低速、中速、高速)、 方角

Slide 9

Slide 9 text

小型商用車輌が描くパターンとネットワーク ~タクシー走行データより~ 各タクシーのGPS位置情報の分析方法 各タクシーが下記の対象領域のどこに位置したか、空間メッシュで表現 時刻(日・時・分・秒) ごとにメッシュ1つが対応 地理院地図(電子国土Web)(https://maps.gsi.go.jp/)に加筆 この領域を200x200の 空間メッシュに分割 (北緯34.945度、東経135.69度) (北緯35.417度、東経136.38度) 以下の2点が基礎データ ・メッシュごとのタクシー の走行位置の累積度数 ・各メッシュから次にどの メッシュに移動したかと いう移動数の累積度数 (遷移確率)

Slide 10

Slide 10 text

小型商用車輌が描くパターンとネットワーク ~タクシー走行データより~ 各タクシーのGPS位置情報データの可視化 各タクシーの走行位置の累積度数分布 鉄道の駅を中心として、病院 や工場近辺等の値が高い。 表示位置 (9台分) 各タクシー毎に移動位置を積算し、 最大累積数により正規化して表示。 頻度の高い場所は赤で、少ない場所 は青で表示している。

Slide 11

Slide 11 text

ヒートマップによる乗降場所の 可視化  彦根市周辺の乗降場所  彦根駅を中心に東西20km、南北40kmの範囲を1kmごとにメッ シュで分割し 集計した結果  乗降客数2633名、降車客数2631名(集計エリア外2名) 左図:乗車数を積算し地図上へ表現、右図:降車数を積算し地図上へ表現。最 大乗車数で正規化し、大きい値を赤で、小さい値を青で表示。

Slide 12

Slide 12 text

可視化だけでは不十分?  移動に関係するパターン  どこからどこへ移動するパターンが多いか分かりづらい。  意外な移動パターンを見つけたい。  時間に関係するパターン  どのように時間帯を設定するべきか?  1時間ごとに参照するのか、午前午後で区切るのが適切か?  どこの時間帯で関連性が強そうか?

Slide 13

Slide 13 text

行列(テンソル)の非負値分解  もとの行列の行や列は何らかの属性に対応する。  データからそれぞれの属性に対応する数を数える。  タクシーのGPSデータをもとに乗車位置と降車位置を数える。  少数の因子が存在すると仮定し、行列を分解する。  ある因子がもたらす属性を調べる。

Slide 14

Slide 14 text

彦根市周辺における乗車と降車の 分析結果 因子1における乗車と 降車のパターン 因子数6個のうち3個のみ表示 乗車 降車 因子2における乗車と 降車のパターン 因子0における乗車と 降車のパターン

Slide 15

Slide 15 text

彦根市周辺における乗車と降 車の分析結果  因子1 > 因子2 > 因子0(乗車数)  因子1  南彦根駅およびその周辺からの乗車が多い。  県立盲学校あるいは福祉センター付近での降車が多い。  因子2  京橋および芹橋周辺からの乗車が多い。  彦根駅での降車が多い。  長浜方面への移動も少数だがある。  因子0  南彦根駅近辺の乗車が多い。  市立病院および彦根市地域総合センター近辺の降車が多い。

Slide 16

Slide 16 text

タクシー走行データ分析まとめ  彦根市周辺を中心に分析を行った。  GPSデータの可視化  鉄道、病院、工場などを拠点とした移動の明示  可視化だけでは把握できない分析  南彦根駅周辺から発車する移動パターン  彦根市街地(京橋、芹橋付近)から発車する移動パターン