Upgrade to Pro — share decks privately, control downloads, hide ads and more …

館林石造物調査における分散データ編集をなんとかしてやりたい/code4lib-2021-lt

 館林石造物調査における分散データ編集をなんとかしてやりたい/code4lib-2021-lt

Code4Lib Japan 2021 2nd day lightning talk

Code for History

September 12, 2021
Tweet

More Decks by Code for History

Other Decks in Technology

Transcript

  1. 館林石造物調査における分散データ編集をなん
    とかしてやりたい
    大塚恒平 – Code for History
    1

    View Slide

  2. 館林石造物調査 2
     50年前の市内全域調査が存在
     刻銘が読み取られ、記録されている
     酸性雨などにさらされた50年の月日のため、今はもはや読み取れない石造物も
    多く、とても有用
     正確な位置や写真の情報がなく、追調査も行われていないため現況がわか
    らない
     せっかく有用な情報が記録されていても、どの石造物の話をしているのかわか
    らなくなってしまう危険性
     ぐんま史料ネット、館林市博物館学芸員などとも協力し再調査
     当初はExcelなどでデータを管理していた

    View Slide

  3. 館林石造物調査 3
     50年前の市内全域調査が存在
     刻銘が読み取られ、記録されている
     酸性雨などにさらされた50年の月日のため、今はもはや読み取れない石造物も
    多く、とても有用
     正確な位置や写真の情報がなく、追調査も行われていないため現況がわか
    らない
     せっかく有用な情報が記録されていても、どの石造物の話をしているのかわか
    らなくなってしまう危険性
     ぐんま史料ネット、館林市博物館学芸員などとも協力し再調査
     当初はExcelなどでデータを管理していた

    View Slide

  4. Excel管理の問題点と解決策 4
     位置情報の管理が難しい
    →経度緯度を直観的に指定、修正できない
     1対多、多対多の関係が管理難しい
    →テーブル構造では個々の石造物と、各文献との参照情報管理が困難
     複数人での調査
    →バラバラに行った変更をマージできない、各人の差分は分かるが融合は不

    View Slide

  5. Excel管理の問題点と解決策 5
     位置情報の管理が難しい
    →経度緯度を直観的に指定、修正できない
    →オープンソースGISソフトのQGISを利用
     1対多、多対多の関係が管理難しい
    →テーブル構造では個々の石造物と、各文献との参照情報管理が困難
     複数人での調査
    →バラバラに行った変更をマージできない、各人の差分は分かるが融合は不

    View Slide

  6. Excel管理の問題点と解決策 6
     位置情報の管理が難しい
    →経度緯度を直観的に指定、修正できない
    →オープンソースGISソフトのQGISを利用
     1対多、多対多の関係が管理難しい
    →テーブル構造では個々の石造物と、各文献との参照情報管理が困難
     複数人での調査
    →バラバラに行った変更をマージできない、各人の差分は分かるが融合は不

    View Slide

  7. Excel管理の問題点と解決策 7
     位置情報の管理が難しい
    →経度緯度を直観的に指定、修正できない
    →オープンソースGISソフトのQGISを利用
     1対多、多対多の関係が管理難しい
    →テーブル構造では個々の石造物と、各文献との参照情報管理が困難
    →あまり知られていないがQGISはテーブル間のリレーション設定可能
     複数人での調査
    →バラバラに行った変更をマージできない、各人の差分は分かるが融合は不

    View Slide

  8. Excel管理の問題点と解決策 8
     位置情報の管理が難しい
    →経度緯度を直観的に指定、修正できない
    →オープンソースGISソフトのQGISを利用
     1対多、多対多の関係が管理難しい
    →テーブル構造では個々の石造物と、各文献との参照情報管理が困難
    →あまり知られていないがQGISはテーブル間のリレーション設定可能
     複数人での調査
    →バラバラに行った変更をマージできない、各人の差分は分かるが融合は不

    View Slide

  9. Excel管理の問題点と解決策 9
     位置情報の管理が難しい
    →経度緯度を直観的に指定、修正できない
    →オープンソースGISソフトのQGISを利用
     1対多、多対多の関係が管理難しい
    →テーブル構造では個々の石造物と、各文献との参照情報管理が困難
    →あまり知られていないがQGISはテーブル間のリレーション設定可能
     複数人での調査
    →バラバラに行った変更をマージできない、各人の差分は分かるが融合は不

    →QGISデータをテキスト形式のGeoJSONで保存し、githubで差分管理

    View Slide

  10. Excel管理の問題点と解決策 10
     位置情報の管理が難しい
    →経度緯度を直観的に指定、修正できない
    →オープンソースGISソフトのQGISを利用
     1対多、多対多の関係が管理難しい
    →テーブル構造では個々の石造物と、各文献との参照情報管理が困難
    →あまり知られていないがQGISはテーブル間のリレーション設定可能
     複数人での調査
    →バラバラに行った変更をマージできない、各人の差分は分かるが融合は不

    →QGISデータをテキスト形式のGeoJSONで保存し、githubで差分管理

    View Slide

  11. 再調査の手順 11
     旧調査の全データをデジタル化、必要に応じ館林市史や館林双書など
    他リファレンス書物のデータも併せてデジタル化
     代替の位置情報は、50年前の住宅地図などを元に仮付与

    View Slide

  12. 再調査の手順 12
     旧調査の全データをデジタル化、必要に応じ館林市史や館林双書など
    他リファレンス書物のデータも併せてデジタル化
     代替の位置情報は、50年前の住宅地図などを元に仮付与

    View Slide

  13. 再調査の手順 13
     旧調査の全データをデジタル化、必要に応じ館林市史や館林双書など
    他リファレンス書物のデータも併せてデジタル化
     代替の位置情報は、50年前の住宅地図などを元に仮付与
     仮位置データをgithubに公開、githubページで周辺を現地調査
     仮位置周辺で発見し、メタデータの刻銘、形状などを元に特定

    View Slide

  14. 再調査の手順 14
     旧調査の全データをデジタル化、必要に応じ館林市史や館林双書など
    他リファレンス書物のデータも併せてデジタル化
     代替の位置情報は、50年前の住宅地図などを元に仮付与
     仮位置データをgithubに公開、githubページで周辺を現地調査
     仮位置周辺で発見し、メタデータの刻銘、形状などを元に特定

    View Slide

  15. 再調査の手順 15
     旧調査の全データをデジタル化、必要に応じ館林市史や館林双書など
    他リファレンス書物のデータも併せてデジタル化
     代替の位置情報は、50年前の住宅地図などを元に仮付与
     仮位置データをgithubに公開、githubページで周辺を現地調査
     仮位置周辺で発見し、メタデータの刻銘、形状などを元に特定
     調査後、判明した正確な位置と写真を付与してQGISデータを更新
     調査完了フラグと最終調査日時データを付与
     GeoJSONとして出力し、githubでオープンデータとして公開

    View Slide

  16. 再調査の手順 16
     旧調査の全データをデジタル化、必要に応じ館林市史や館林双書など
    他リファレンス書物のデータも併せてデジタル化
     代替の位置情報は、50年前の住宅地図などを元に仮付与
     仮位置データをgithubに公開、githubページで周辺を現地調査
     仮位置周辺で発見し、メタデータの刻銘、形状などを元に特定
     調査後、判明した正確な位置と写真を付与してQGISデータを更新
     調査完了フラグと最終調査日時データを付与
     GeoJSONとして出力し、githubでオープンデータとして公開

    View Slide

  17. 課題 17
     手順のとっつきやすさにまだ工夫の余地あり
     QGIS、Gitなど特殊な技術ツールが、非技術者になじみにくい
     ツールごとに出力フォーマットの改行位置やインデントなどが異なり、差
    分検出の目論見が絵に描いた餅に
     プログラムで整形すれば解決だが、非技術者に意識させないように実行できる
    ようにする仕組みの構築が必要
     Code4Lib 2021初日のアンカンファレンスでアイデアをいただく
     Google Spreadsheetが多人数同時編集に有用、APIなどもあるので意
    外に使える
     マンツーマンでペアを組んで手順を伝達する体制を作ることが大切、以前
    の生徒が次は教える側に回る正のサイクルが回せるように

    View Slide

  18. End
    User: kochizufan
    Github pages: https://code4history.dev/
    E-mail: [email protected]
    Slide: https://speakerdeck.com/kochizufan/code4lib-2021-lt 18

    View Slide