Upgrade to Pro — share decks privately, control downloads, hide ads and more …

館林石造物調査における分散データ編集をなんとかしてやりたい/code4lib-2021-lt

 館林石造物調査における分散データ編集をなんとかしてやりたい/code4lib-2021-lt

Code4Lib Japan 2021 2nd day lightning talk

Code for History

September 12, 2021
Tweet

More Decks by Code for History

Other Decks in Technology

Transcript

  1. 館林石造物調査における分散データ編集をなん とかしてやりたい 大塚恒平 – Code for History 1

  2. 館林石造物調査 2  50年前の市内全域調査が存在  刻銘が読み取られ、記録されている  酸性雨などにさらされた50年の月日のため、今はもはや読み取れない石造物も 多く、とても有用 

    正確な位置や写真の情報がなく、追調査も行われていないため現況がわか らない  せっかく有用な情報が記録されていても、どの石造物の話をしているのかわか らなくなってしまう危険性  ぐんま史料ネット、館林市博物館学芸員などとも協力し再調査  当初はExcelなどでデータを管理していた
  3. 館林石造物調査 3  50年前の市内全域調査が存在  刻銘が読み取られ、記録されている  酸性雨などにさらされた50年の月日のため、今はもはや読み取れない石造物も 多く、とても有用 

    正確な位置や写真の情報がなく、追調査も行われていないため現況がわか らない  せっかく有用な情報が記録されていても、どの石造物の話をしているのかわか らなくなってしまう危険性  ぐんま史料ネット、館林市博物館学芸員などとも協力し再調査  当初はExcelなどでデータを管理していた
  4. Excel管理の問題点と解決策 4  位置情報の管理が難しい →経度緯度を直観的に指定、修正できない  1対多、多対多の関係が管理難しい →テーブル構造では個々の石造物と、各文献との参照情報管理が困難  複数人での調査

    →バラバラに行った変更をマージできない、各人の差分は分かるが融合は不 可
  5. Excel管理の問題点と解決策 5  位置情報の管理が難しい →経度緯度を直観的に指定、修正できない →オープンソースGISソフトのQGISを利用  1対多、多対多の関係が管理難しい →テーブル構造では個々の石造物と、各文献との参照情報管理が困難 

    複数人での調査 →バラバラに行った変更をマージできない、各人の差分は分かるが融合は不 可
  6. Excel管理の問題点と解決策 6  位置情報の管理が難しい →経度緯度を直観的に指定、修正できない →オープンソースGISソフトのQGISを利用  1対多、多対多の関係が管理難しい →テーブル構造では個々の石造物と、各文献との参照情報管理が困難 

    複数人での調査 →バラバラに行った変更をマージできない、各人の差分は分かるが融合は不 可
  7. Excel管理の問題点と解決策 7  位置情報の管理が難しい →経度緯度を直観的に指定、修正できない →オープンソースGISソフトのQGISを利用  1対多、多対多の関係が管理難しい →テーブル構造では個々の石造物と、各文献との参照情報管理が困難 →あまり知られていないがQGISはテーブル間のリレーション設定可能

     複数人での調査 →バラバラに行った変更をマージできない、各人の差分は分かるが融合は不 可
  8. Excel管理の問題点と解決策 8  位置情報の管理が難しい →経度緯度を直観的に指定、修正できない →オープンソースGISソフトのQGISを利用  1対多、多対多の関係が管理難しい →テーブル構造では個々の石造物と、各文献との参照情報管理が困難 →あまり知られていないがQGISはテーブル間のリレーション設定可能

     複数人での調査 →バラバラに行った変更をマージできない、各人の差分は分かるが融合は不 可
  9. Excel管理の問題点と解決策 9  位置情報の管理が難しい →経度緯度を直観的に指定、修正できない →オープンソースGISソフトのQGISを利用  1対多、多対多の関係が管理難しい →テーブル構造では個々の石造物と、各文献との参照情報管理が困難 →あまり知られていないがQGISはテーブル間のリレーション設定可能

     複数人での調査 →バラバラに行った変更をマージできない、各人の差分は分かるが融合は不 可 →QGISデータをテキスト形式のGeoJSONで保存し、githubで差分管理
  10. Excel管理の問題点と解決策 10  位置情報の管理が難しい →経度緯度を直観的に指定、修正できない →オープンソースGISソフトのQGISを利用  1対多、多対多の関係が管理難しい →テーブル構造では個々の石造物と、各文献との参照情報管理が困難 →あまり知られていないがQGISはテーブル間のリレーション設定可能

     複数人での調査 →バラバラに行った変更をマージできない、各人の差分は分かるが融合は不 可 →QGISデータをテキスト形式のGeoJSONで保存し、githubで差分管理
  11. 再調査の手順 11  旧調査の全データをデジタル化、必要に応じ館林市史や館林双書など 他リファレンス書物のデータも併せてデジタル化  代替の位置情報は、50年前の住宅地図などを元に仮付与

  12. 再調査の手順 12  旧調査の全データをデジタル化、必要に応じ館林市史や館林双書など 他リファレンス書物のデータも併せてデジタル化  代替の位置情報は、50年前の住宅地図などを元に仮付与

  13. 再調査の手順 13  旧調査の全データをデジタル化、必要に応じ館林市史や館林双書など 他リファレンス書物のデータも併せてデジタル化  代替の位置情報は、50年前の住宅地図などを元に仮付与  仮位置データをgithubに公開、githubページで周辺を現地調査 

    仮位置周辺で発見し、メタデータの刻銘、形状などを元に特定
  14. 再調査の手順 14  旧調査の全データをデジタル化、必要に応じ館林市史や館林双書など 他リファレンス書物のデータも併せてデジタル化  代替の位置情報は、50年前の住宅地図などを元に仮付与  仮位置データをgithubに公開、githubページで周辺を現地調査 

    仮位置周辺で発見し、メタデータの刻銘、形状などを元に特定
  15. 再調査の手順 15  旧調査の全データをデジタル化、必要に応じ館林市史や館林双書など 他リファレンス書物のデータも併せてデジタル化  代替の位置情報は、50年前の住宅地図などを元に仮付与  仮位置データをgithubに公開、githubページで周辺を現地調査 

    仮位置周辺で発見し、メタデータの刻銘、形状などを元に特定  調査後、判明した正確な位置と写真を付与してQGISデータを更新  調査完了フラグと最終調査日時データを付与  GeoJSONとして出力し、githubでオープンデータとして公開
  16. 再調査の手順 16  旧調査の全データをデジタル化、必要に応じ館林市史や館林双書など 他リファレンス書物のデータも併せてデジタル化  代替の位置情報は、50年前の住宅地図などを元に仮付与  仮位置データをgithubに公開、githubページで周辺を現地調査 

    仮位置周辺で発見し、メタデータの刻銘、形状などを元に特定  調査後、判明した正確な位置と写真を付与してQGISデータを更新  調査完了フラグと最終調査日時データを付与  GeoJSONとして出力し、githubでオープンデータとして公開
  17. 課題 17  手順のとっつきやすさにまだ工夫の余地あり  QGIS、Gitなど特殊な技術ツールが、非技術者になじみにくい  ツールごとに出力フォーマットの改行位置やインデントなどが異なり、差 分検出の目論見が絵に描いた餅に 

    プログラムで整形すれば解決だが、非技術者に意識させないように実行できる ようにする仕組みの構築が必要  Code4Lib 2021初日のアンカンファレンスでアイデアをいただく  Google Spreadsheetが多人数同時編集に有用、APIなどもあるので意 外に使える  マンツーマンでペアを組んで手順を伝達する体制を作ることが大切、以前 の生徒が次は教える側に回る正のサイクルが回せるように
  18. End User: kochizufan Github pages: https://code4history.dev/ E-mail: kochizufan@code4history.dev Slide: https://speakerdeck.com/kochizufan/code4lib-2021-lt

    18