Slide 1

Slide 1 text

館林石造物調査における分散データ編集をなん とかしてやりたい 大塚恒平 – Code for History 1

Slide 2

Slide 2 text

館林石造物調査 2  50年前の市内全域調査が存在  刻銘が読み取られ、記録されている  酸性雨などにさらされた50年の月日のため、今はもはや読み取れない石造物も 多く、とても有用  正確な位置や写真の情報がなく、追調査も行われていないため現況がわか らない  せっかく有用な情報が記録されていても、どの石造物の話をしているのかわか らなくなってしまう危険性  ぐんま史料ネット、館林市博物館学芸員などとも協力し再調査  当初はExcelなどでデータを管理していた

Slide 3

Slide 3 text

館林石造物調査 3  50年前の市内全域調査が存在  刻銘が読み取られ、記録されている  酸性雨などにさらされた50年の月日のため、今はもはや読み取れない石造物も 多く、とても有用  正確な位置や写真の情報がなく、追調査も行われていないため現況がわか らない  せっかく有用な情報が記録されていても、どの石造物の話をしているのかわか らなくなってしまう危険性  ぐんま史料ネット、館林市博物館学芸員などとも協力し再調査  当初はExcelなどでデータを管理していた

Slide 4

Slide 4 text

Excel管理の問題点と解決策 4  位置情報の管理が難しい →経度緯度を直観的に指定、修正できない  1対多、多対多の関係が管理難しい →テーブル構造では個々の石造物と、各文献との参照情報管理が困難  複数人での調査 →バラバラに行った変更をマージできない、各人の差分は分かるが融合は不 可

Slide 5

Slide 5 text

Excel管理の問題点と解決策 5  位置情報の管理が難しい →経度緯度を直観的に指定、修正できない →オープンソースGISソフトのQGISを利用  1対多、多対多の関係が管理難しい →テーブル構造では個々の石造物と、各文献との参照情報管理が困難  複数人での調査 →バラバラに行った変更をマージできない、各人の差分は分かるが融合は不 可

Slide 6

Slide 6 text

Excel管理の問題点と解決策 6  位置情報の管理が難しい →経度緯度を直観的に指定、修正できない →オープンソースGISソフトのQGISを利用  1対多、多対多の関係が管理難しい →テーブル構造では個々の石造物と、各文献との参照情報管理が困難  複数人での調査 →バラバラに行った変更をマージできない、各人の差分は分かるが融合は不 可

Slide 7

Slide 7 text

Excel管理の問題点と解決策 7  位置情報の管理が難しい →経度緯度を直観的に指定、修正できない →オープンソースGISソフトのQGISを利用  1対多、多対多の関係が管理難しい →テーブル構造では個々の石造物と、各文献との参照情報管理が困難 →あまり知られていないがQGISはテーブル間のリレーション設定可能  複数人での調査 →バラバラに行った変更をマージできない、各人の差分は分かるが融合は不 可

Slide 8

Slide 8 text

Excel管理の問題点と解決策 8  位置情報の管理が難しい →経度緯度を直観的に指定、修正できない →オープンソースGISソフトのQGISを利用  1対多、多対多の関係が管理難しい →テーブル構造では個々の石造物と、各文献との参照情報管理が困難 →あまり知られていないがQGISはテーブル間のリレーション設定可能  複数人での調査 →バラバラに行った変更をマージできない、各人の差分は分かるが融合は不 可

Slide 9

Slide 9 text

Excel管理の問題点と解決策 9  位置情報の管理が難しい →経度緯度を直観的に指定、修正できない →オープンソースGISソフトのQGISを利用  1対多、多対多の関係が管理難しい →テーブル構造では個々の石造物と、各文献との参照情報管理が困難 →あまり知られていないがQGISはテーブル間のリレーション設定可能  複数人での調査 →バラバラに行った変更をマージできない、各人の差分は分かるが融合は不 可 →QGISデータをテキスト形式のGeoJSONで保存し、githubで差分管理

Slide 10

Slide 10 text

Excel管理の問題点と解決策 10  位置情報の管理が難しい →経度緯度を直観的に指定、修正できない →オープンソースGISソフトのQGISを利用  1対多、多対多の関係が管理難しい →テーブル構造では個々の石造物と、各文献との参照情報管理が困難 →あまり知られていないがQGISはテーブル間のリレーション設定可能  複数人での調査 →バラバラに行った変更をマージできない、各人の差分は分かるが融合は不 可 →QGISデータをテキスト形式のGeoJSONで保存し、githubで差分管理

Slide 11

Slide 11 text

再調査の手順 11  旧調査の全データをデジタル化、必要に応じ館林市史や館林双書など 他リファレンス書物のデータも併せてデジタル化  代替の位置情報は、50年前の住宅地図などを元に仮付与

Slide 12

Slide 12 text

再調査の手順 12  旧調査の全データをデジタル化、必要に応じ館林市史や館林双書など 他リファレンス書物のデータも併せてデジタル化  代替の位置情報は、50年前の住宅地図などを元に仮付与

Slide 13

Slide 13 text

再調査の手順 13  旧調査の全データをデジタル化、必要に応じ館林市史や館林双書など 他リファレンス書物のデータも併せてデジタル化  代替の位置情報は、50年前の住宅地図などを元に仮付与  仮位置データをgithubに公開、githubページで周辺を現地調査  仮位置周辺で発見し、メタデータの刻銘、形状などを元に特定

Slide 14

Slide 14 text

再調査の手順 14  旧調査の全データをデジタル化、必要に応じ館林市史や館林双書など 他リファレンス書物のデータも併せてデジタル化  代替の位置情報は、50年前の住宅地図などを元に仮付与  仮位置データをgithubに公開、githubページで周辺を現地調査  仮位置周辺で発見し、メタデータの刻銘、形状などを元に特定

Slide 15

Slide 15 text

再調査の手順 15  旧調査の全データをデジタル化、必要に応じ館林市史や館林双書など 他リファレンス書物のデータも併せてデジタル化  代替の位置情報は、50年前の住宅地図などを元に仮付与  仮位置データをgithubに公開、githubページで周辺を現地調査  仮位置周辺で発見し、メタデータの刻銘、形状などを元に特定  調査後、判明した正確な位置と写真を付与してQGISデータを更新  調査完了フラグと最終調査日時データを付与  GeoJSONとして出力し、githubでオープンデータとして公開

Slide 16

Slide 16 text

再調査の手順 16  旧調査の全データをデジタル化、必要に応じ館林市史や館林双書など 他リファレンス書物のデータも併せてデジタル化  代替の位置情報は、50年前の住宅地図などを元に仮付与  仮位置データをgithubに公開、githubページで周辺を現地調査  仮位置周辺で発見し、メタデータの刻銘、形状などを元に特定  調査後、判明した正確な位置と写真を付与してQGISデータを更新  調査完了フラグと最終調査日時データを付与  GeoJSONとして出力し、githubでオープンデータとして公開

Slide 17

Slide 17 text

課題 17  手順のとっつきやすさにまだ工夫の余地あり  QGIS、Gitなど特殊な技術ツールが、非技術者になじみにくい  ツールごとに出力フォーマットの改行位置やインデントなどが異なり、差 分検出の目論見が絵に描いた餅に  プログラムで整形すれば解決だが、非技術者に意識させないように実行できる ようにする仕組みの構築が必要  Code4Lib 2021初日のアンカンファレンスでアイデアをいただく  Google Spreadsheetが多人数同時編集に有用、APIなどもあるので意 外に使える  マンツーマンでペアを組んで手順を伝達する体制を作ることが大切、以前 の生徒が次は教える側に回る正のサイクルが回せるように

Slide 18

Slide 18 text

End User: kochizufan Github pages: https://code4history.dev/ E-mail: [email protected] Slide: https://speakerdeck.com/kochizufan/code4lib-2021-lt 18