Upgrade to Pro — share decks privately, control downloads, hide ads and more …

遺跡存在を確率的に考える〜「隣接地」概念の再検討

 遺跡存在を確率的に考える〜「隣接地」概念の再検討

2023年5月27日〜28日開催の第89回日本考古学協会のセッション6「デジタル化時代の遺跡・埋蔵文化財包蔵地・遺跡地図を考える」の発表資料です。

遺跡は「ある・ない」の二値的な性質ではなく、既知の遺跡や地形等によって規定される確率的な性質であることが前提となっている。遺跡立地に影響する環境要因を説明変数とし、遺跡の有無を目的変数とすることで、「隣接地」概念を確率的存在として可視化する手法について検討した。

石井淳平

May 30, 2023
Tweet

More Decks by 石井淳平

Other Decks in Science

Transcript

  1. 遺跡存在を
    確率的に考える
    〜『隣接地』概念の再検討〜
    石井淳平(あっさぶ文化遺産調査プロジェクト)

    View Slide

  2. 不可視の文化財
    埋蔵文化財の本質は、不可視であること
    民法241
    条による埋蔵物と同義
    土地その他の中に外部からは容易に目撃できない
    ような状態に置かれ、しかも現在何人の所有であ
    るか判りにくい物
    周知という確定性にかける実態によって保護制度の
    対象となっている。
    「伝説、口伝等により、その地域社会において埋
    蔵文化財を包蔵する土地として広く認められてい
    る土地」(s29
    改正法施行通知)

    View Slide

  3. 平成10
    年通知
    平成10
    年通知による「周知の包蔵地」の行政的基
    準の提示
    確定性にかける実態からの脱却
    埋蔵文化財包蔵地確定の手続きと周知の方法
    遺跡地図、遺跡台帳への搭載
    コンピュータによるデータベース化
    範囲の実線表示→擬制的な指定制度

    View Slide

  4. 残る不確定性としての「隣接地」
    しかしながら、埋蔵文化財のもつ本質的な不可視性
    を制度に取り込んだ「隣接地」概念が残される。
    予見不可能性を前提とした制度的概念

    View Slide

  5. 福岡市

    View Slide

  6. 東京都目黒区

    View Slide

  7. 「可能性地図」としての遺跡地図
    遺跡地図には遺跡存在の可能性地図としての側面が
    あり、そのような運用がなされている。
    埋蔵文化財保護行政の現場では、遺跡予測が日常的
    に行われている。
    「隣接地」概念は一種の遺跡予測
    考古学者は異なる段丘面を「隣接地」として扱う
    か?

    View Slide

  8. 「隣接地」を定量的に扱いたい
    考古学者の「カン」と「経験」にどこまで神通力を
    持たせられるのか?
    「不可視」であることに甘えていないか?
    「不可視」でも「不可知」でもなく、確率的な存在
    として遺跡を捉えたい。

    View Slide

  9. 遺跡予測の手法
    傾向面分析=空間補完
    重回帰分析
    ロジスティック回帰分析
    MaxEnt

    決定木
    人工ニューラルネットワーク
    サポートベクターマシン

    View Slide

  10. 遺跡予測の手順
    1.
    サンプリング領域の選定
    2.
    地形指標の作成
    3.
    地形指標と遺跡有無の関係
    4.
    地形指標選択
    5.
    分析手法決定
    6.
    モデル作成
    7.
    テストデータを利用した予測地図の作成と評価

    View Slide

  11. 訓練データの
    作 成
    予測器作成のための訓練データを準備する

    View Slide

  12. サンプリング領域の選定

    View Slide

  13. QGIS
    グラフィカルモデラーによる地形指標生成

    View Slide

  14. 遺跡予測のための地形指標

    View Slide

  15. 遺跡分布図とランダム点群

    View Slide

  16. 遺跡ポイントに地形指標を付値
    ランダム点群に地形指標を付値
    #
    リストに格納されているベクタポイントにラスタを付値
    for(i in 1:length(site_crop)){
    terra::extract(
    x = raster_list_stack[[i]], #
    ラスタを格納したリスト
    y = site_crop[[i]] #
    ベクタポイントを格納したリスト
    ) -> site_crop_ext[[i]] #
    それぞれの結果はデータフレームに格納されるの
    }
    # bg
    はリスト化されたラスタ群ごとにサンプリングした
    SpatVector
    のリスト
    bg <-
    map(
    raster_list_stack, #
    ラスタを格納したリスト
    terra::spatSample, # Take a spatial sample
    size = 100, # The sample size
    na.rm = TRUE
    )

    View Slide

  17. 地形指標を付与された点群
    Asp Elv Irra SVF Slope TRI WI P
    South 143.54 7.66 0.99 5.51 2.44 9.31
    North 33.20 7.60 0.99 0.84 0.39 11.99
    North 28.80 7.59 1.00 1.36 0.60 13.74
    South 7.87 7.60 1.00 0.28 0.13 16.43
    South 253.85 7.56 0.97 17.74 8.01 5.47
    West 115.58 7.63 0.99 10.31 4.58 6.06

    View Slide

  18. 訓練データ
    遺跡在   652
    遺跡不在  900
    合計   1,552

    View Slide

  19. 予測モデルで使うべき地形指標
    決定要因と直結する指標を使用する
    多くの場合、標高の高いところは遺跡が分布が少
    ないが、標高そのものが決定要因と言えるのか?
    指標の選択には分析領域のスケールも影響するこ
    とに注意が必要
    標高の高い長野県は遺跡が少ないとは誰も言わ
    ないだろう。

    View Slide

  20. 予測モデルで使うべき地形指標
    相関の高い変数を避ける
    複数の説明変数が互いに高い相関を持つ場合、回
    帰モデルの係数を推定する際にどちらの変数が目
    的変数に影響を与えているかを特定することが難
    しい。
    モデルの推定値が不安定となるなどの問題が生じ
    る。

    View Slide

  21. 地形指標の
    検 討
    地形指標と在ー不在との関係を検討する

    View Slide

  22. 傾斜方位と在ー不在

    View Slide

  23. 標高と在ー不在

    View Slide

  24. 日射量と在ー不在

    View Slide

  25. 天空率と在ー不在

    View Slide

  26. 土地傾斜と在ー不在

    View Slide

  27. 土地起伏指標(TRI
    )と在ー不在

    View Slide

  28. 湿潤指標と在ー不在

    View Slide

  29. 湿潤指標と在ー不在

    View Slide

  30. 変数間の
    相関構造
    ペアプロットによる相関構造の確認
    irradiation vs sky view factor
    irradiation vs slope
    sky view factor vs TRI etc...

    View Slide

  31. ペアプロットによる相関の確認

    View Slide

  32. 相関係数行列
    Elv Irra SVF Slope TRI WI
    Elv 1.00 -0.35 -0.54 0.57 0.56 -0.48
    Irra -0.35 1.00 0.80 -0.78 -0.79 0.45
    SVF -0.54 0.80 1.00 -0.87 -0.88 0.50
    Slope 0.57 -0.78 -0.87 1.00 0.99 -0.74
    TRI 0.56 -0.79 -0.88 0.99 1.00 -0.73
    WI -0.48 0.45 0.50 -0.74 -0.73 1.00
    r > 0.80

    View Slide

  33. VIF
    値(変数間の線形相関構造の検出)
    Variables VIF
    Elv 1.63
    Irra 3.26
    SVF 6.62
    Slope 111.29
    TRI 120.18
    WI 2.85
     VIF >10.00
    → 致命的な多重共線性

    View Slide

  34. SLOPE
    とTRI
    を外す
    Variables VIF
    Elv 1.60
    Irra 2.92
    SVF 3.56
    WI 1.49
    VIF
    値は5
    以下に収まった。

    View Slide

  35. 日射量と天空率に線形関係

    View Slide

  36. ELV
    、SVF
    、WI
    を残す
    Variables VIF
    Elv 1.54
    SVF 1.58
    WI 1.46
    VIF
    値は極めて低い

    View Slide

  37. 予測モデル
    作 成
    ロジスティック回帰
    MaxEnt
    決定木
    人工ニューラルネットワーク

    View Slide

  38. ロジスティック回帰分析
    在ー不在のような二値データの確率を予測する
    ## DEM

    wetness_index

    2
    次式で回帰
    glm2 <- glm(
    presence ~ poly(DEM, 2) + poly(sky_view_factor, 1) + poly(wetne
    data = data_train,
    family = "binomial"
    )

    View Slide

  39. 予測式のEFFECT PLOT

    View Slide

  40. 予測地図の作成
    予測式に地形指標を代入して、予測値を計算する
    #
    予測地図を出力
    pre <- predict(
    glm2, #
    予測モデル
    newdata = ras_df %>%
    dplyr::select(DEM, sky_view_factor, wetness_index), #
    地形指標を選
    type = "response" # type = "response"
    は二項分布の場合確率を返す
    )
    #
    予測値のデータをラスタに付値する
    pre_ras <-
    ras_stack[[1]] #
    元のデータの一部を代入
    pre_ras[] <- NA #
    データを一旦空にする
    pre_ras[ras_df$n] <- pre[,2] #
    予測値を代入する
    2
    列目が在確率

    View Slide

  41. 予測地図(北海道厚沢部町)

    View Slide

  42. 一次式で回帰したEFFECT PLOT

    View Slide

  43. MAX ENTROPY

    予測モデルの確率分布推定に「最大エントロピー原
    理」を利用する。
    在データのみの場合や小規模なデータセットでも適
    用可能と言われている。
    ##### Maxent
    による予測モデル
    mod <- maxnet(
    p = data_train %>%
    use_series(presence), # P

    1

    0
    のベクターデータ
    use_series()

    data = data_train %>%
    dplyr::select(DEM, sky_view_factor, wetness_index)) #
    プレ

    View Slide

  44. MAX ENTROPY
    法によるEFFECT PLOT

    View Slide

  45. MAX ENTROPY
    法による予測地図

    View Slide

  46. 決定木
    特徴量を分岐条件として利用するため、視覚的に表
    現しやすい。
    モデルの解釈性が高い。
    ##
    分類木の作成
    RP <-
    rpart(presence ~
    DEM + sky_view_factor + wetness_index,
    data = data_train,
    control = rpart.control(xval = 10), #
    交差検証の数、デフォルト
    method = "class") # method = "class"

    View Slide

  47. 決定木

    View Slide

  48. 決定木による予測地図

    View Slide

  49. 人工ニューラルネットワーク
    1.
    入力を何らかの形で変換する処理器を連結
    2.
    入力層→中間層→出力層と出力を伝播させることに
    より、適切な値を出力

    View Slide

  50. パラメーターチューニング
    以下の2
    つのパラメーターを最適化する
    size =
    隠れ層の数
    decay =
    重み付け
    # expand.grid()
    関数で
    size

    decay
    のパラメータを全て組み合わせて指定する
    tuneGrid <- expand.grid(size = 1:10, decay = seq(0.0, 1e-3, by =
    #
    チューニング
    tuned <-
    train(presence ~., #
    目的変数
    data = data_train_fct, #
    データ
    method = "nnet", #
    分析手法に
    nnet()
    関数指定
    tuneLength = 10,
    tuneGrid = tuneGrid, # size

    decay
    の組み合わせを指定
    trControl = trainControl(method = "cv", number = 10))

    View Slide

  51. 最適化されたSIZE
    とDECAY
    size decay
    86 8 8e-04

    View Slide

  52. ニューラルネットワークによるモデル作成
    #
    チューニングされた
    size

    decay
    を用いて、再度
    nnet
    関数の実行
    nnet.Init_tuned <-
    nnet(
    x = data_train %>%
    dplyr::select(DEM, sky_view_factor, wetness_index) %>
    rename(Elv = DEM, SVF = sky_view_factor, WI = wetness_
    y = data_train$presence, # y =
    従属変数
    size = 8, #
    隠れ層のユニット数
    decay = 8e-4, #
    最適化過程での過剰適合を調整する。デフォルト
    0
    maxit = 100 #
    最大順回数 デフォルト
    100
    )

    View Slide

  53. チューニング後のモデル構造

    View Slide

  54. 人工ニューラルネットワークによる予測地図

    View Slide

  55. 予測地図

    View Slide

  56. 予測地図(ロジスティック回帰2
    次式)

    View Slide

  57. 予測器を使って
    予測地図を作成する
    熊本県御船町
    富山市西部

    View Slide

  58. 熊本県御船町付近(GLM2

    View Slide

  59. 富山市西部(GLM2

    View Slide

  60. 予測手法と予測地図
    5
    つの予測手法は概ね似通った予測地図を出力する
    尾根と低湿地の評価に特徴が現れる。
    遺跡の性質によって立地選好は異なる。
    古墳や板碑など、トレーニングエリア(北海道)
    に存在しない種別の遺跡を予測しきれない。

    View Slide

  61. 説明力と予測力のバランス
    決定木やロジスティック回帰は説明力が高い。
    状況が複雑化するほど予測力は落ちると考えられ
    る。
    人工ニューラルネットワークはデータ量が増えるに
    つれて複雑な状況下でも予測力を保てると考えられ
    るが、説明力は極めて低い。
    説明力と予測力はトレードオフの関係

    View Slide

  62. 「空白の怖さ」からの脱却
    すべての遺跡が発見される日まで分布論を語ること
    は許されないのか?
    フィールドワークにおける調査頻度の偏在は当然
    在データのみでも高い予測精度→MaxEnt

    View Slide

  63. 保護行政と属人性
    行政指導の属人性をどこまで許容するか。
    説明が求められる時代
    専門性でマウントをとれる時代は終わった。
    リスク管理を属人性に委ねることは、ますます難し
    くなる。
    カンと経験と出たとこ勝負は通じない。

    View Slide

  64. 可能性地図としての遺跡地図
    時代や遺跡種別ごとの予測地図のレイヤー化
    時代・種別・過去の調査情報が整理された地理情
    報データベースが必要
    広く公開され、誰もが再利用できる遺跡地図
    専門家のみがアクセスできる情報であってはなら
    ない。
    北海道庁公開の埋蔵文化財包蔵地オープンデータ
    が必要にして十分

    View Slide

  65. View Slide