Code4Lib Japan 2021 2nd day lightning talk
館林石造物調査における分散データ編集をなんとかしてやりたい大塚恒平 – Code for History1
View Slide
館林石造物調査 2 50年前の市内全域調査が存在 刻銘が読み取られ、記録されている 酸性雨などにさらされた50年の月日のため、今はもはや読み取れない石造物も多く、とても有用 正確な位置や写真の情報がなく、追調査も行われていないため現況がわからない せっかく有用な情報が記録されていても、どの石造物の話をしているのかわからなくなってしまう危険性 ぐんま史料ネット、館林市博物館学芸員などとも協力し再調査 当初はExcelなどでデータを管理していた
館林石造物調査 3 50年前の市内全域調査が存在 刻銘が読み取られ、記録されている 酸性雨などにさらされた50年の月日のため、今はもはや読み取れない石造物も多く、とても有用 正確な位置や写真の情報がなく、追調査も行われていないため現況がわからない せっかく有用な情報が記録されていても、どの石造物の話をしているのかわからなくなってしまう危険性 ぐんま史料ネット、館林市博物館学芸員などとも協力し再調査 当初はExcelなどでデータを管理していた
Excel管理の問題点と解決策 4 位置情報の管理が難しい→経度緯度を直観的に指定、修正できない 1対多、多対多の関係が管理難しい→テーブル構造では個々の石造物と、各文献との参照情報管理が困難 複数人での調査→バラバラに行った変更をマージできない、各人の差分は分かるが融合は不可
Excel管理の問題点と解決策 5 位置情報の管理が難しい→経度緯度を直観的に指定、修正できない→オープンソースGISソフトのQGISを利用 1対多、多対多の関係が管理難しい→テーブル構造では個々の石造物と、各文献との参照情報管理が困難 複数人での調査→バラバラに行った変更をマージできない、各人の差分は分かるが融合は不可
Excel管理の問題点と解決策 6 位置情報の管理が難しい→経度緯度を直観的に指定、修正できない→オープンソースGISソフトのQGISを利用 1対多、多対多の関係が管理難しい→テーブル構造では個々の石造物と、各文献との参照情報管理が困難 複数人での調査→バラバラに行った変更をマージできない、各人の差分は分かるが融合は不可
Excel管理の問題点と解決策 7 位置情報の管理が難しい→経度緯度を直観的に指定、修正できない→オープンソースGISソフトのQGISを利用 1対多、多対多の関係が管理難しい→テーブル構造では個々の石造物と、各文献との参照情報管理が困難→あまり知られていないがQGISはテーブル間のリレーション設定可能 複数人での調査→バラバラに行った変更をマージできない、各人の差分は分かるが融合は不可
Excel管理の問題点と解決策 8 位置情報の管理が難しい→経度緯度を直観的に指定、修正できない→オープンソースGISソフトのQGISを利用 1対多、多対多の関係が管理難しい→テーブル構造では個々の石造物と、各文献との参照情報管理が困難→あまり知られていないがQGISはテーブル間のリレーション設定可能 複数人での調査→バラバラに行った変更をマージできない、各人の差分は分かるが融合は不可
Excel管理の問題点と解決策 9 位置情報の管理が難しい→経度緯度を直観的に指定、修正できない→オープンソースGISソフトのQGISを利用 1対多、多対多の関係が管理難しい→テーブル構造では個々の石造物と、各文献との参照情報管理が困難→あまり知られていないがQGISはテーブル間のリレーション設定可能 複数人での調査→バラバラに行った変更をマージできない、各人の差分は分かるが融合は不可→QGISデータをテキスト形式のGeoJSONで保存し、githubで差分管理
Excel管理の問題点と解決策 10 位置情報の管理が難しい→経度緯度を直観的に指定、修正できない→オープンソースGISソフトのQGISを利用 1対多、多対多の関係が管理難しい→テーブル構造では個々の石造物と、各文献との参照情報管理が困難→あまり知られていないがQGISはテーブル間のリレーション設定可能 複数人での調査→バラバラに行った変更をマージできない、各人の差分は分かるが融合は不可→QGISデータをテキスト形式のGeoJSONで保存し、githubで差分管理
再調査の手順 11 旧調査の全データをデジタル化、必要に応じ館林市史や館林双書など他リファレンス書物のデータも併せてデジタル化 代替の位置情報は、50年前の住宅地図などを元に仮付与
再調査の手順 12 旧調査の全データをデジタル化、必要に応じ館林市史や館林双書など他リファレンス書物のデータも併せてデジタル化 代替の位置情報は、50年前の住宅地図などを元に仮付与
再調査の手順 13 旧調査の全データをデジタル化、必要に応じ館林市史や館林双書など他リファレンス書物のデータも併せてデジタル化 代替の位置情報は、50年前の住宅地図などを元に仮付与 仮位置データをgithubに公開、githubページで周辺を現地調査 仮位置周辺で発見し、メタデータの刻銘、形状などを元に特定
再調査の手順 14 旧調査の全データをデジタル化、必要に応じ館林市史や館林双書など他リファレンス書物のデータも併せてデジタル化 代替の位置情報は、50年前の住宅地図などを元に仮付与 仮位置データをgithubに公開、githubページで周辺を現地調査 仮位置周辺で発見し、メタデータの刻銘、形状などを元に特定
再調査の手順 15 旧調査の全データをデジタル化、必要に応じ館林市史や館林双書など他リファレンス書物のデータも併せてデジタル化 代替の位置情報は、50年前の住宅地図などを元に仮付与 仮位置データをgithubに公開、githubページで周辺を現地調査 仮位置周辺で発見し、メタデータの刻銘、形状などを元に特定 調査後、判明した正確な位置と写真を付与してQGISデータを更新 調査完了フラグと最終調査日時データを付与 GeoJSONとして出力し、githubでオープンデータとして公開
再調査の手順 16 旧調査の全データをデジタル化、必要に応じ館林市史や館林双書など他リファレンス書物のデータも併せてデジタル化 代替の位置情報は、50年前の住宅地図などを元に仮付与 仮位置データをgithubに公開、githubページで周辺を現地調査 仮位置周辺で発見し、メタデータの刻銘、形状などを元に特定 調査後、判明した正確な位置と写真を付与してQGISデータを更新 調査完了フラグと最終調査日時データを付与 GeoJSONとして出力し、githubでオープンデータとして公開
課題 17 手順のとっつきやすさにまだ工夫の余地あり QGIS、Gitなど特殊な技術ツールが、非技術者になじみにくい ツールごとに出力フォーマットの改行位置やインデントなどが異なり、差分検出の目論見が絵に描いた餅に プログラムで整形すれば解決だが、非技術者に意識させないように実行できるようにする仕組みの構築が必要 Code4Lib 2021初日のアンカンファレンスでアイデアをいただく Google Spreadsheetが多人数同時編集に有用、APIなどもあるので意外に使える マンツーマンでペアを組んで手順を伝達する体制を作ることが大切、以前の生徒が次は教える側に回る正のサイクルが回せるように
EndUser: kochizufanGithub pages: https://code4history.dev/E-mail: [email protected]Slide: https://speakerdeck.com/kochizufan/code4lib-2021-lt 18