Upgrade to Pro — share decks privately, control downloads, hide ads and more …

2022-11-16-lf2022-da

Yuka Egusa
November 15, 2022

 2022-11-16-lf2022-da

図書館総合展2022 イベント
【11/16】そのデジタルアーカイブ、続けられますか?~小規模図書館に必要十分なデジタルアーカイブについて一緒に考えます~
https://2020.libraryfair.jp/forum/2022/610

Yuka Egusa

November 15, 2022
Tweet

More Decks by Yuka Egusa

Other Decks in Technology

Transcript

  1. 小規模図書館における ずっと続けられるための “必要十分な”デジタルアーカイブの 構築について 国立教育政策研究所 研究企画開発部 教育研究情報推進室 総括研究官 江草由佳 2022年11月16日

    10:30〜 図書館総合展2022イベント (30分講演スライド資料)
  2. 自己紹介 • おもな業務:国立教育政策研究所教育図書館担当 の研究者として ✓教育図書館作成・提供のデジタルアーカイブのお手伝い (システム面) ✓教育図書館が作成・提供しているDBのブラッシュアップ やプロトタイプシステムの構築 ✓研究所の図書館システムの仕様策定委員 ✓もちろん研究もやってます

    最近は教科書LOD、学習指導要領LODなど • Project Next-L • Code4Lib JAPAN 共同代表 • saveMLAK • 鶴見大学で非常勤講師(情報サービス演習II)
  3. いただいたお題 •小規模図書館でずっと続けられるための”必要十 分な”デジタルアーカイブの構築について •このお題に答えられるようなという観点で話し ます。つまり ✓小規模な図書館,小規模なデジタル資料,必要十分 なをキーワードに話します

  4. デジタルアーカイブとは • 「博物館・美術館・公文書館などの所蔵資料や、自治 体・大学・研究機関などの公共性が高いデータを電子化 して管理・公開するシステム。絵画・彫刻・文書・写 真・音声・映像などを対象とし、インターネットを通じ て資料目録を検索したり、デジタル画像などを閲覧した りできる。デジタルアーカイブズ。」(『デジタル大辞 泉』より) •

    「有形・無形の文化財をデジタル情報として記録し,劣 化なく永久保存するとともに,ネットワークなどを用い て提供すること.最初からデジタル情報として生産され た文化財も対象となる.「デジタルアーカイブ」という 用語は1990年代半ばから使われ始めたが,指す範囲や対 象はさまざまである.主な担い手は,博物館や美術館, 図書館,文書館,研究機関などである」(『図書館情報 学用語辞典』より)
  5. (図書館が)デジタルアーカイブで 一番実現したいことは何か? 利用者が A) 来館せずに,本文画像*を閲覧できるように B) 許諾申請なしに,本文画像を再利用できるように →「ずっと続けられるサービス」 であることが大前提! (A)だけの時も多いが,A)+B)のことも増えてきた

    ) * 本来は画像だけでなく,映像,音声なども入るが今回は画像にフォーカスして話す
  6. ずっと続けられるサービスであるため には? •❌高機能≒移行・運用コストが高い → 移行・運用コストが捻出できず,サービスそ のものが維持できなくなる危険も高い •目指すべきは移行・運用コストの低さ ✓もちろん,最低限の機能は必要 •徹底的なスリム化・本当にやりたいこと(来館 せずに本文画像の閲覧可)に絞る

  7. まとめると • 一番やりたいこと:「来館せずに,本文画像*を閲覧で きるように」 → ずっと続けられることが必要(持続的なサービスであ り続ける) →移行・運用コスト捻出できない危険性を排除 → ❌高機能≒移行・運用コストが高い

    →低機能≒移行・運用コストが低い →徹底的な機能のスリム化 常に、一番やりたいことは何かに立ち戻り、サービス 継続しやすさを目指す、つまり、最低限の機能があれば いい!
  8. デジタルアーカイブで 一番実現したいことのためには 持続可能なサービスで,利用者が A) 来館せずに,本文画像を閲覧できるように B) 許諾申請なしに,本文画像を再利用できるように そのためには 1. 最低限の検索機能

    ✓カテゴリ検索 or/and キーワード検索 2. 資料の同定のためのメタデータ 3. よく知られた画像フォーマット:PDF/JPG/PNG 4. 最低限の画像閲覧機能 5. 資料のURLはパーマネントリンク or せめて「資料 ID」 6. 利用ライセンスの明示(オープンライセンス) B
  9. 1. 最低限の検索機能: カテゴリ検索も検索 • 貯めてるあるところから必要な 情報を見つけ出して、たどり着 ければ(持ってこれれば)なん でも検索! • キーワード検索

    ✓キーワード入力して、検索ボタンク リックして、検索結果一覧が表示さ れるような検索 • カテゴリ検索 ✓カテゴリをたどっていって資料にた どるつける→これも検索 • 小規模コレクションならキー ワード検索がなくてもいい!カ テゴリ検索だけでも良い • カテゴリ検索だけならノンシス テムで実現可能! https://www.nier.go.jp/library/rarebooks/
  10. 2.資料同定のためのメタデータ •それが何であるかわかるための~ •欲しいものかどうか判断できるための~ •似たものと区別できるための~ 資料の同定のための メタデータ (タイトル,ヨミ, 出版者,出版年,大 きさ,請求記号) 最低限あればよい

    何が最低限かはコレク ションによる
  11. 3. よく知られた画像フォーマット • 最大のポイントは、「将来にわたってずっと見れるよ うにする!」ために必要なこと • PDF, JPG, PNGなど •

    Webブラウザ標準の機能で閲覧・印刷できる ✓特別なプラグインのインストールが必要ない • 一般的なOSの標準アプリで閲覧・印刷できる ✓特別なアプリをインストールする必要がない • 画像フォーマットの仕様がオープンである • このような画像フォーマットであれば、プラグインや アプリが突然なくなって見れれなくなるということは ない
  12. 4. 最低限の画像閲覧機能(1) •画像が見える ✓(機能ではないが:十分な大きさ・解像度の画像を 提供している前提) •画像が拡大できる •一つの資料に複数の画像がある場合: ✓個々のサムネイルがある ✓サムネイル一覧がある ✓次の画像に行ける

    and/or 特定の画像に行ける •画像がダウンロードできる •画像が印刷できる ✓(ダウンロードできれば、印刷できなくても可)
  13. 4. 最低限の画像閲覧機能(2) 画像閲覧 拡大、 次のページへ、 ダウンロードなど サムネイルで 一覧表示 PDFダウンロード 余談:国立教育政策研究所教育図書館貴重資料デ

    ジタルコレクションでは、複数枚ある資料に対す る印刷とダウンロードの利便性のために、PDFを ダウンロードできるようにしました。 複数ページを一度に印刷するのやりやすいだろう という理由からです。 https://www.nier.go.jp/library/rarebooks/painting/370.98-314/
  14. 5.資料のURLはパーマネントリンク or せめて「資料ID」 •特定の資料ページにURLでアクセスできる ✓URLはパーマネントリンク ✓もしくは資料IDがわかればベースのURL部分だけを 一括変換するだけでよいようにしておく パーマネントリンク or せめて「資料ID」

  15. 6.利用ライセンスの明示 利用ライセンスの明 示(オープンライセ ンス) https://www.nier.go.jp/library/rarebooks/oraimono/K067-1/

  16. 移行・運用しやすい=お安く、簡単に画 像ファイルを公開する方法を検討する •3つの型が考えられる •OPAC添付型 ✓OPACの標準機能or安いオプションがあれば •OPAC+画像リンク型 ✓別のWebサーバに画像を置き、OPACの資料画面か らリンク •ノンシステム型 ✓静的なファイル+普通のWebサーバで完結(検索も

    ふくめ)
  17. OPAC添付型(1) •OPACシステムの標準機能に書誌レコードに 「添付ファイル機能」があればそれを使う ✓標準機能ではなくても安価なオプションでも ✓例:「情報館」の「デジタル資料公開機能」 ✓OPACがいらないってことはないだろうのでそこに 乗っかることで「続けられる」を確保する作戦。 ✓気を付けること:移行でベンダーロックにあわない ような対策をとる(画像ファイルと画像ファイルリ ストを手元で保存しておくなど)

    余談:国立教育政策研究所近代教科書デジタルアーカイブでは、 資料ID.pdf というファイル名にして、ファイル名とサーバ上の実 ファイルのありかの対応のリストを出力できるようにして対策し た(資料IDはシステムが変わっても維持する前提)
  18. OPACシステム OPAC添付型(2) •これでも十分デジタル アーカイブ 走れメロス 太宰治 筑摩書房 請求記号:913|タ 書誌詳細画面に 画像ファイルを

    添付できる機能 を利用 よく知られた画像 フォーマット (PDF) 資料の同定のための メタデータ 最低限の検索機能 (キーワード検索) 最低限の画像 閲覧機能 (PDFなので 十分) ※情報館では複数枚のjpgもできるそうです!
  19. OPAC添付型の例: BICライブラリ https://bicl.opac.jp/opac/Advanced_search 「日本機械産業」で検索

  20. OPAC+画像リンク型 •OPACの資料の画面から別のWebサーバーへ 置いた画像へリンクを貼る •画像部分はウェブサーバだけあれば公開で きるように ✓ウェブブラウザにビューアのプラグインなどは 必要なく ✓CMSなどは使わない ✓ウェブサーバーに、phpなどのインストールを 必要としない

    •=フォルダごとコピーするだけで別のウェ ブサーバに移行できるように •1資料 → 1フォルダ or 1ファイル •静的なファイル(HTML, CSS, Javascript, JPG, PDF, json など)だけで作る
  21. 別サーバに置く画像の置き方の様々 なパターン (下に行くほど複雑) 1. PDFをそのまま置く 2. HTMLとJPG/PDFだけで作る 3. 2 +

    Javascriptの画像ビューアを使う ✓例:画像ビューア:Viewer.js を使う デモサイト: https://fengyuanchen.github.io/viewerjs/ Javascriptで動く画像ビューア 4. 2 + IIIF Manifest のjsonファイルを使う (今回は、 4 の詳細な説明は省略します)
  22. OPACシステム OPAC+画像リンク型:PDF •これでも十分デジタルアー カイブ Webサーバー 走れメロス 太宰治 筑摩書房 請求記号:913|タ https://www.samp

    le.jp/hashire.pdf https://www.sample.jp/hashire.pdf 書誌詳細画面に PDFへのリンク Webサーバーに PDFを置くだけ よく知られた画像 フォーマット (PDF) 資料の同定のための メタデータ 最低限の検索機能 (キーワード検索) 最低限の画像閲覧 機能 (PDFなので十 分)
  23. OPAC+画像リンク型:PDF Enjuデモの例 https://enju.next-l.jp/ 「スキル」で検索

  24. OPACシステム OPAC+画像リンク型:HTML(JPG&PDF) Webサーバー 走れメロス 太宰治 筑摩書房 請求記号:913|タ https://www.samp le.jp/hashire/ https://www.sample.jp/hashire/

    書誌詳細 画面に 本文リンク Webサーバーに HTML,JPG,PDFを置く よく知られた画像 フォーマット (JPG,PDF) 資料の同定のための メタデータ 最低限の検索機能 (キーワード検索) 最低限の画像 閲覧機能
  25. OPAC+画像リンク型: 早稲田大学図書館の例(1) •OPACトップページ→「古代連歌九百韻」→検索 https://waseda.primo.exlibrisgroup.com/

  26. 早稲田大学図書館の例(2) --検索結果にデジタル資料への リンク(URL)-- 「画像情報」リンクをクリック • 検索結果(書誌の詳細) • タイトルや書誌情報など • 「画像情報」にリンク

  27. 早稲田大学図書館の例(3) --静的なHTMLと画像ファイル-- *「PDF」リンクをクリックしたらPDFへ 「HTML」リンクをクリック • 請求記号 • カット番号 • トップのサムネイル

    • HTMLへのリンク • PDFへのリンク(ファイ ルサイズ) http://archive.wul.waseda.ac.jp/kosho/bunko31/bunko31_e021 4/
  28. 早稲田大学図書館の例(4) --サムネイル画像とカット数-- 「2」リンクをクリック • 請求記号 • カット数 • 各ページのサムネイル •

    画像(JPEG)へのリンク • カット番号 http://archive.wul.waseda.ac.jp/kosho/bunko31/bunko31_e0214/bunko31_e0214.h
  29. 早稲田大学図書館の例(5) JPG画像が表示される http://archive.wul.waseda.ac.jp/kosho/bunk o31/bunko31_e0214/bunko31_e0214_p000 2.jpg http://archive.wul.waseda.ac.jp/kosho/bunko31/bunko31_e0214/bunko31_e0214_p000

  30. Webサーバー(静的ファイルのみ) ノンシステム型 https://www.sample.jp/hashire/ よく知られた画像 フォーマット (JPG,PDF) 最低限の画像 閲覧機能 (サムネイル 一覧などで工

    夫) カテゴリ:文学 ◦◦コレクション 資料の同定のための メタデータ 書誌詳細画面に ダウンロードリンク Webサーバーに HTML,JPG,PDF を置く 最低限の検索機能 (カテゴリ検索) メタデータ含めて全てを静的なファイルだ けで作り、一つのWebサーバーで提供
  31. ノンシステム型のメリット • Webサーバーに「フォルダごとコピー」するだけ で公開できる ✓移行は、ファイル容量が十分な一般的なWebサーバーを 用意し、フォルダごとコピーするだけで完了! ✓最悪、Webサーバーが用意できない場合でも、Web公開 はできなくとも、HDDにファイルをフォルダごとコピー するだけで、ローカルPCで閲覧する環境を整えられる •

    システムのセキュリティ対応がほとんど必要ない (システム運用コストが安価) ✓普通のWebサーバーのメンテナンスコストのみ ✓デジタルアーカイブそのものへのシステムメンテナンス が必要ない セキュリティパッチを充てるなどが必要ない (Javascriptを使用している場合は多少必要の可能性あり、その場合は、 Javascriptの使用を切れるように対策しておくなどは必要)
  32. ノンシステム型(+Javascript)の例: 国立教育政策研究所教育図書館貴重資料 デジタルコレクション http://www.nier.go.jp/library/rarebooks/ ※デザインとHTML作成は業務委託で作成

  33. 教育図書館貴重資料 デジタルコレクション(1) •トップページ 最低限の検索機能 (カテゴリ検索)

  34. 教育図書館貴重資料 デジタルコレクション(2) •カテゴリページ 利用ライセンスの明 示(オープンライセ ンス)

  35. 教育図書館貴重資料 デジタルコレクション(3) •資料ページ 資料の同定のための メタデータ (タイトル,ヨミ,出版者, 出版年,大きさ,請求記号) よく知られた画像 フォーマット (PDF)

    パーマネントリンク or せめて「資料ID」
  36. 教育図書館貴重資料 デジタルコレクション(4) •ビューアで見る 拡大、回転、 次のページへ、 ダウンロードなど 最低限の画像閲覧 機能 サムネイルで 一覧表示

  37. 余談:Japan Seachと連携するとIIIF で提供できるらしい •朗報です!Japan Searchに連携するとIIIFに自図 書館で対応していなくてもできる*そうです。 •現在、「国立教育政策研究所教育図書館貴重資 料デジタルコレクション」に対してこの方法で IIIF提供するように進めています。順調にいけ ば12月頃にはできるようになるはず。

    ref. 「ジャパンサーチのメタデータ連携について」p.5 「簡易IIIF-API」 https://jpsearch.go.jp/static/pdf/cooperation/jps_manual_202010.pdf
  38. まとめ •図書館が一番実現したいことを常に頭に ✓「来館せずに,本文画像を閲覧できるように」 ✓そのほかのことは思い切って切り捨てる心持ち重要 •ずっと続けられるサービス ✓移行・運用コストを最小限に •パーマネットリンク,永続的識別子がキモかも •便利なツールが出てきたのでやりやすくなった ✓Javascriptで動くビューア