Upgrade to Pro — share decks privately, control downloads, hide ads and more …

2022-11-16-lf2022-da

Yuka Egusa
November 15, 2022

 2022-11-16-lf2022-da

図書館総合展2022 イベント
【11/16】そのデジタルアーカイブ、続けられますか?~小規模図書館に必要十分なデジタルアーカイブについて一緒に考えます~
https://2020.libraryfair.jp/forum/2022/610

Yuka Egusa

November 15, 2022
Tweet

More Decks by Yuka Egusa

Other Decks in Technology

Transcript

  1. 小規模図書館における
    ずっと続けられるための
    “必要十分な”デジタルアーカイブの
    構築について
    国立教育政策研究所
    研究企画開発部
    教育研究情報推進室
    総括研究官
    江草由佳
    2022年11月16日 10:30〜
    図書館総合展2022イベント
    (30分講演スライド資料)

    View Slide

  2. 自己紹介
    • おもな業務:国立教育政策研究所教育図書館担当
    の研究者として
    ✓教育図書館作成・提供のデジタルアーカイブのお手伝い
    (システム面)
    ✓教育図書館が作成・提供しているDBのブラッシュアップ
    やプロトタイプシステムの構築
    ✓研究所の図書館システムの仕様策定委員
    ✓もちろん研究もやってます
    最近は教科書LOD、学習指導要領LODなど
    • Project Next-L
    • Code4Lib JAPAN 共同代表
    • saveMLAK
    • 鶴見大学で非常勤講師(情報サービス演習II)

    View Slide

  3. いただいたお題
    •小規模図書館でずっと続けられるための”必要十
    分な”デジタルアーカイブの構築について
    •このお題に答えられるようなという観点で話し
    ます。つまり
    ✓小規模な図書館,小規模なデジタル資料,必要十分
    なをキーワードに話します

    View Slide

  4. デジタルアーカイブとは
    • 「博物館・美術館・公文書館などの所蔵資料や、自治
    体・大学・研究機関などの公共性が高いデータを電子化
    して管理・公開するシステム。絵画・彫刻・文書・写
    真・音声・映像などを対象とし、インターネットを通じ
    て資料目録を検索したり、デジタル画像などを閲覧した
    りできる。デジタルアーカイブズ。」(『デジタル大辞
    泉』より)
    • 「有形・無形の文化財をデジタル情報として記録し,劣
    化なく永久保存するとともに,ネットワークなどを用い
    て提供すること.最初からデジタル情報として生産され
    た文化財も対象となる.「デジタルアーカイブ」という
    用語は1990年代半ばから使われ始めたが,指す範囲や対
    象はさまざまである.主な担い手は,博物館や美術館,
    図書館,文書館,研究機関などである」(『図書館情報
    学用語辞典』より)

    View Slide

  5. (図書館が)デジタルアーカイブで
    一番実現したいことは何か?
    利用者が
    A) 来館せずに,本文画像*を閲覧できるように
    B) 許諾申請なしに,本文画像を再利用できるように
    →「ずっと続けられるサービス」
    であることが大前提!
    (A)だけの時も多いが,A)+B)のことも増えてきた )
    * 本来は画像だけでなく,映像,音声なども入るが今回は画像にフォーカスして話す

    View Slide

  6. ずっと続けられるサービスであるため
    には?
    •❌高機能≒移行・運用コストが高い
    → 移行・運用コストが捻出できず,サービスそ
    のものが維持できなくなる危険も高い
    •目指すべきは移行・運用コストの低さ
    ✓もちろん,最低限の機能は必要
    •徹底的なスリム化・本当にやりたいこと(来館
    せずに本文画像の閲覧可)に絞る

    View Slide

  7. まとめると
    • 一番やりたいこと:「来館せずに,本文画像*を閲覧で
    きるように」
    → ずっと続けられることが必要(持続的なサービスであ
    り続ける)
    →移行・運用コスト捻出できない危険性を排除
    → ❌高機能≒移行・運用コストが高い
    →低機能≒移行・運用コストが低い
    →徹底的な機能のスリム化
    常に、一番やりたいことは何かに立ち戻り、サービス
    継続しやすさを目指す、つまり、最低限の機能があれば
    いい!

    View Slide

  8. デジタルアーカイブで
    一番実現したいことのためには
    持続可能なサービスで,利用者が
    A) 来館せずに,本文画像を閲覧できるように
    B) 許諾申請なしに,本文画像を再利用できるように
    そのためには
    1. 最低限の検索機能
    ✓カテゴリ検索 or/and キーワード検索
    2. 資料の同定のためのメタデータ
    3. よく知られた画像フォーマット:PDF/JPG/PNG
    4. 最低限の画像閲覧機能
    5. 資料のURLはパーマネントリンク or せめて「資料
    ID」
    6. 利用ライセンスの明示(オープンライセンス) B

    View Slide

  9. 1. 最低限の検索機能:
    カテゴリ検索も検索
    • 貯めてるあるところから必要な
    情報を見つけ出して、たどり着
    ければ(持ってこれれば)なん
    でも検索!
    • キーワード検索
    ✓キーワード入力して、検索ボタンク
    リックして、検索結果一覧が表示さ
    れるような検索
    • カテゴリ検索
    ✓カテゴリをたどっていって資料にた
    どるつける→これも検索
    • 小規模コレクションならキー
    ワード検索がなくてもいい!カ
    テゴリ検索だけでも良い
    • カテゴリ検索だけならノンシス
    テムで実現可能!
    https://www.nier.go.jp/library/rarebooks/

    View Slide

  10. 2.資料同定のためのメタデータ
    •それが何であるかわかるための~
    •欲しいものかどうか判断できるための~
    •似たものと区別できるための~
    資料の同定のための
    メタデータ
    (タイトル,ヨミ,
    出版者,出版年,大
    きさ,請求記号)
    最低限あればよい
    何が最低限かはコレク
    ションによる

    View Slide

  11. 3. よく知られた画像フォーマット
    • 最大のポイントは、「将来にわたってずっと見れるよ
    うにする!」ために必要なこと
    • PDF, JPG, PNGなど
    • Webブラウザ標準の機能で閲覧・印刷できる
    ✓特別なプラグインのインストールが必要ない
    • 一般的なOSの標準アプリで閲覧・印刷できる
    ✓特別なアプリをインストールする必要がない
    • 画像フォーマットの仕様がオープンである
    • このような画像フォーマットであれば、プラグインや
    アプリが突然なくなって見れれなくなるということは
    ない

    View Slide

  12. 4. 最低限の画像閲覧機能(1)
    •画像が見える
    ✓(機能ではないが:十分な大きさ・解像度の画像を
    提供している前提)
    •画像が拡大できる
    •一つの資料に複数の画像がある場合:
    ✓個々のサムネイルがある
    ✓サムネイル一覧がある
    ✓次の画像に行ける and/or 特定の画像に行ける
    •画像がダウンロードできる
    •画像が印刷できる
    ✓(ダウンロードできれば、印刷できなくても可)

    View Slide

  13. 4. 最低限の画像閲覧機能(2)
    画像閲覧
    拡大、
    次のページへ、
    ダウンロードなど
    サムネイルで
    一覧表示
    PDFダウンロード
    余談:国立教育政策研究所教育図書館貴重資料デ
    ジタルコレクションでは、複数枚ある資料に対す
    る印刷とダウンロードの利便性のために、PDFを
    ダウンロードできるようにしました。
    複数ページを一度に印刷するのやりやすいだろう
    という理由からです。
    https://www.nier.go.jp/library/rarebooks/painting/370.98-314/

    View Slide

  14. 5.資料のURLはパーマネントリンク
    or せめて「資料ID」
    •特定の資料ページにURLでアクセスできる
    ✓URLはパーマネントリンク
    ✓もしくは資料IDがわかればベースのURL部分だけを
    一括変換するだけでよいようにしておく
    パーマネントリンク or
    せめて「資料ID」

    View Slide

  15. 6.利用ライセンスの明示 利用ライセンスの明
    示(オープンライセ
    ンス)
    https://www.nier.go.jp/library/rarebooks/oraimono/K067-1/

    View Slide

  16. 移行・運用しやすい=お安く、簡単に画
    像ファイルを公開する方法を検討する
    •3つの型が考えられる
    •OPAC添付型
    ✓OPACの標準機能or安いオプションがあれば
    •OPAC+画像リンク型
    ✓別のWebサーバに画像を置き、OPACの資料画面か
    らリンク
    •ノンシステム型
    ✓静的なファイル+普通のWebサーバで完結(検索も
    ふくめ)

    View Slide

  17. OPAC添付型(1)
    •OPACシステムの標準機能に書誌レコードに
    「添付ファイル機能」があればそれを使う
    ✓標準機能ではなくても安価なオプションでも
    ✓例:「情報館」の「デジタル資料公開機能」
    ✓OPACがいらないってことはないだろうのでそこに
    乗っかることで「続けられる」を確保する作戦。
    ✓気を付けること:移行でベンダーロックにあわない
    ような対策をとる(画像ファイルと画像ファイルリ
    ストを手元で保存しておくなど)
    余談:国立教育政策研究所近代教科書デジタルアーカイブでは、
    資料ID.pdf というファイル名にして、ファイル名とサーバ上の実
    ファイルのありかの対応のリストを出力できるようにして対策し
    た(資料IDはシステムが変わっても維持する前提)

    View Slide

  18. OPACシステム
    OPAC添付型(2) •これでも十分デジタル
    アーカイブ
    走れメロス
    太宰治
    筑摩書房
    請求記号:913|タ
    書誌詳細画面に
    画像ファイルを
    添付できる機能
    を利用
    よく知られた画像
    フォーマット
    (PDF)
    資料の同定のための
    メタデータ
    最低限の検索機能
    (キーワード検索)
    最低限の画像
    閲覧機能
    (PDFなので
    十分)
    ※情報館では複数枚のjpgもできるそうです!

    View Slide

  19. OPAC添付型の例:
    BICライブラリ
    https://bicl.opac.jp/opac/Advanced_search
    「日本機械産業」で検索

    View Slide

  20. OPAC+画像リンク型
    •OPACの資料の画面から別のWebサーバーへ
    置いた画像へリンクを貼る
    •画像部分はウェブサーバだけあれば公開で
    きるように
    ✓ウェブブラウザにビューアのプラグインなどは
    必要なく
    ✓CMSなどは使わない
    ✓ウェブサーバーに、phpなどのインストールを
    必要としない
    •=フォルダごとコピーするだけで別のウェ
    ブサーバに移行できるように
    •1資料 → 1フォルダ or 1ファイル
    •静的なファイル(HTML, CSS, Javascript, JPG,
    PDF, json など)だけで作る

    View Slide

  21. 別サーバに置く画像の置き方の様々
    なパターン
    (下に行くほど複雑)
    1. PDFをそのまま置く
    2. HTMLとJPG/PDFだけで作る
    3. 2 + Javascriptの画像ビューアを使う
    ✓例:画像ビューア:Viewer.js を使う
    デモサイト: https://fengyuanchen.github.io/viewerjs/
    Javascriptで動く画像ビューア
    4. 2 + IIIF Manifest のjsonファイルを使う
    (今回は、 4 の詳細な説明は省略します)

    View Slide

  22. OPACシステム
    OPAC+画像リンク型:PDF
    •これでも十分デジタルアー
    カイブ
    Webサーバー
    走れメロス
    太宰治
    筑摩書房
    請求記号:913|タ
    https://www.samp
    le.jp/hashire.pdf
    https://www.sample.jp/hashire.pdf
    書誌詳細画面に
    PDFへのリンク
    Webサーバーに
    PDFを置くだけ
    よく知られた画像
    フォーマット
    (PDF)
    資料の同定のための
    メタデータ
    最低限の検索機能
    (キーワード検索)
    最低限の画像閲覧
    機能
    (PDFなので十
    分)

    View Slide

  23. OPAC+画像リンク型:PDF
    Enjuデモの例
    https://enju.next-l.jp/
    「スキル」で検索

    View Slide

  24. OPACシステム
    OPAC+画像リンク型:HTML(JPG&PDF)
    Webサーバー
    走れメロス
    太宰治
    筑摩書房
    請求記号:913|タ
    https://www.samp
    le.jp/hashire/
    https://www.sample.jp/hashire/
    書誌詳細
    画面に
    本文リンク
    Webサーバーに
    HTML,JPG,PDFを置く
    よく知られた画像
    フォーマット
    (JPG,PDF)
    資料の同定のための
    メタデータ
    最低限の検索機能
    (キーワード検索)
    最低限の画像
    閲覧機能

    View Slide

  25. OPAC+画像リンク型:
    早稲田大学図書館の例(1)
    •OPACトップページ→「古代連歌九百韻」→検索
    https://waseda.primo.exlibrisgroup.com/

    View Slide

  26. 早稲田大学図書館の例(2)
    --検索結果にデジタル資料への
    リンク(URL)--
    「画像情報」リンクをクリック
    • 検索結果(書誌の詳細)
    • タイトルや書誌情報など
    • 「画像情報」にリンク

    View Slide

  27. 早稲田大学図書館の例(3)
    --静的なHTMLと画像ファイル--
    *「PDF」リンクをクリックしたらPDFへ
    「HTML」リンクをクリック
    • 請求記号
    • カット番号
    • トップのサムネイル
    • HTMLへのリンク
    • PDFへのリンク(ファイ
    ルサイズ)
    http://archive.wul.waseda.ac.jp/kosho/bunko31/bunko31_e021
    4/

    View Slide

  28. 早稲田大学図書館の例(4)
    --サムネイル画像とカット数--
    「2」リンクをクリック
    • 請求記号
    • カット数
    • 各ページのサムネイル
    • 画像(JPEG)へのリンク
    • カット番号
    http://archive.wul.waseda.ac.jp/kosho/bunko31/bunko31_e0214/bunko31_e0214.h

    View Slide

  29. 早稲田大学図書館の例(5)
    JPG画像が表示される
    http://archive.wul.waseda.ac.jp/kosho/bunk
    o31/bunko31_e0214/bunko31_e0214_p000
    2.jpg
    http://archive.wul.waseda.ac.jp/kosho/bunko31/bunko31_e0214/bunko31_e0214_p000

    View Slide

  30. Webサーバー(静的ファイルのみ)
    ノンシステム型
    https://www.sample.jp/hashire/
    よく知られた画像
    フォーマット
    (JPG,PDF)
    最低限の画像
    閲覧機能
    (サムネイル
    一覧などで工
    夫)
    カテゴリ:文学
    ○○コレクション
    資料の同定のための
    メタデータ
    書誌詳細画面に
    ダウンロードリンク
    Webサーバーに
    HTML,JPG,PDF
    を置く
    最低限の検索機能
    (カテゴリ検索)
    メタデータ含めて全てを静的なファイルだ
    けで作り、一つのWebサーバーで提供

    View Slide

  31. ノンシステム型のメリット
    • Webサーバーに「フォルダごとコピー」するだけ
    で公開できる
    ✓移行は、ファイル容量が十分な一般的なWebサーバーを
    用意し、フォルダごとコピーするだけで完了!
    ✓最悪、Webサーバーが用意できない場合でも、Web公開
    はできなくとも、HDDにファイルをフォルダごとコピー
    するだけで、ローカルPCで閲覧する環境を整えられる
    • システムのセキュリティ対応がほとんど必要ない
    (システム運用コストが安価)
    ✓普通のWebサーバーのメンテナンスコストのみ
    ✓デジタルアーカイブそのものへのシステムメンテナンス
    が必要ない
    セキュリティパッチを充てるなどが必要ない
    (Javascriptを使用している場合は多少必要の可能性あり、その場合は、
    Javascriptの使用を切れるように対策しておくなどは必要)

    View Slide

  32. ノンシステム型(+Javascript)の例:
    国立教育政策研究所教育図書館貴重資料
    デジタルコレクション
    http://www.nier.go.jp/library/rarebooks/ ※デザインとHTML作成は業務委託で作成

    View Slide

  33. 教育図書館貴重資料
    デジタルコレクション(1)
    •トップページ
    最低限の検索機能
    (カテゴリ検索)

    View Slide

  34. 教育図書館貴重資料
    デジタルコレクション(2)
    •カテゴリページ
    利用ライセンスの明
    示(オープンライセ
    ンス)

    View Slide

  35. 教育図書館貴重資料
    デジタルコレクション(3)
    •資料ページ
    資料の同定のための
    メタデータ
    (タイトル,ヨミ,出版者,
    出版年,大きさ,請求記号)
    よく知られた画像
    フォーマット
    (PDF)
    パーマネントリンク or
    せめて「資料ID」

    View Slide

  36. 教育図書館貴重資料
    デジタルコレクション(4)
    •ビューアで見る
    拡大、回転、
    次のページへ、
    ダウンロードなど
    最低限の画像閲覧
    機能
    サムネイルで
    一覧表示

    View Slide

  37. 余談:Japan Seachと連携するとIIIF
    で提供できるらしい
    •朗報です!Japan Searchに連携するとIIIFに自図
    書館で対応していなくてもできる*そうです。
    •現在、「国立教育政策研究所教育図書館貴重資
    料デジタルコレクション」に対してこの方法で
    IIIF提供するように進めています。順調にいけ
    ば12月頃にはできるようになるはず。
    ref. 「ジャパンサーチのメタデータ連携について」p.5 「簡易IIIF-API」
    https://jpsearch.go.jp/static/pdf/cooperation/jps_manual_202010.pdf

    View Slide

  38. まとめ
    •図書館が一番実現したいことを常に頭に
    ✓「来館せずに,本文画像を閲覧できるように」
    ✓そのほかのことは思い切って切り捨てる心持ち重要
    •ずっと続けられるサービス
    ✓移行・運用コストを最小限に
    •パーマネットリンク,永続的識別子がキモかも
    •便利なツールが出てきたのでやりやすくなった
    ✓Javascriptで動くビューア

    View Slide