図書館総合展2022 イベント 【11/16】そのデジタルアーカイブ、続けられますか?~小規模図書館に必要十分なデジタルアーカイブについて一緒に考えます~ https://2020.libraryfair.jp/forum/2022/610
小規模図書館におけるずっと続けられるための“必要十分な”デジタルアーカイブの構築について国立教育政策研究所研究企画開発部教育研究情報推進室総括研究官江草由佳2022年11月16日 10:30〜図書館総合展2022イベント(30分講演スライド資料)
View Slide
自己紹介• おもな業務:国立教育政策研究所教育図書館担当の研究者として✓教育図書館作成・提供のデジタルアーカイブのお手伝い(システム面)✓教育図書館が作成・提供しているDBのブラッシュアップやプロトタイプシステムの構築✓研究所の図書館システムの仕様策定委員✓もちろん研究もやってます最近は教科書LOD、学習指導要領LODなど• Project Next-L• Code4Lib JAPAN 共同代表• saveMLAK• 鶴見大学で非常勤講師(情報サービス演習II)
いただいたお題•小規模図書館でずっと続けられるための”必要十分な”デジタルアーカイブの構築について•このお題に答えられるようなという観点で話します。つまり✓小規模な図書館,小規模なデジタル資料,必要十分なをキーワードに話します
デジタルアーカイブとは• 「博物館・美術館・公文書館などの所蔵資料や、自治体・大学・研究機関などの公共性が高いデータを電子化して管理・公開するシステム。絵画・彫刻・文書・写真・音声・映像などを対象とし、インターネットを通じて資料目録を検索したり、デジタル画像などを閲覧したりできる。デジタルアーカイブズ。」(『デジタル大辞泉』より)• 「有形・無形の文化財をデジタル情報として記録し,劣化なく永久保存するとともに,ネットワークなどを用いて提供すること.最初からデジタル情報として生産された文化財も対象となる.「デジタルアーカイブ」という用語は1990年代半ばから使われ始めたが,指す範囲や対象はさまざまである.主な担い手は,博物館や美術館,図書館,文書館,研究機関などである」(『図書館情報学用語辞典』より)
(図書館が)デジタルアーカイブで一番実現したいことは何か?利用者がA) 来館せずに,本文画像*を閲覧できるようにB) 許諾申請なしに,本文画像を再利用できるように→「ずっと続けられるサービス」であることが大前提!(A)だけの時も多いが,A)+B)のことも増えてきた )* 本来は画像だけでなく,映像,音声なども入るが今回は画像にフォーカスして話す
ずっと続けられるサービスであるためには?•❌高機能≒移行・運用コストが高い→ 移行・運用コストが捻出できず,サービスそのものが維持できなくなる危険も高い•目指すべきは移行・運用コストの低さ✓もちろん,最低限の機能は必要•徹底的なスリム化・本当にやりたいこと(来館せずに本文画像の閲覧可)に絞る
まとめると• 一番やりたいこと:「来館せずに,本文画像*を閲覧できるように」→ ずっと続けられることが必要(持続的なサービスであり続ける)→移行・運用コスト捻出できない危険性を排除→ ❌高機能≒移行・運用コストが高い→低機能≒移行・運用コストが低い→徹底的な機能のスリム化常に、一番やりたいことは何かに立ち戻り、サービス継続しやすさを目指す、つまり、最低限の機能があればいい!
デジタルアーカイブで一番実現したいことのためには持続可能なサービスで,利用者がA) 来館せずに,本文画像を閲覧できるようにB) 許諾申請なしに,本文画像を再利用できるようにそのためには1. 最低限の検索機能✓カテゴリ検索 or/and キーワード検索2. 資料の同定のためのメタデータ3. よく知られた画像フォーマット:PDF/JPG/PNG4. 最低限の画像閲覧機能5. 資料のURLはパーマネントリンク or せめて「資料ID」6. 利用ライセンスの明示(オープンライセンス) B
1. 最低限の検索機能:カテゴリ検索も検索• 貯めてるあるところから必要な情報を見つけ出して、たどり着ければ(持ってこれれば)なんでも検索!• キーワード検索✓キーワード入力して、検索ボタンクリックして、検索結果一覧が表示されるような検索• カテゴリ検索✓カテゴリをたどっていって資料にたどるつける→これも検索• 小規模コレクションならキーワード検索がなくてもいい!カテゴリ検索だけでも良い• カテゴリ検索だけならノンシステムで実現可能!https://www.nier.go.jp/library/rarebooks/
2.資料同定のためのメタデータ•それが何であるかわかるための~•欲しいものかどうか判断できるための~•似たものと区別できるための~資料の同定のためのメタデータ(タイトル,ヨミ,出版者,出版年,大きさ,請求記号)最低限あればよい何が最低限かはコレクションによる
3. よく知られた画像フォーマット• 最大のポイントは、「将来にわたってずっと見れるようにする!」ために必要なこと• PDF, JPG, PNGなど• Webブラウザ標準の機能で閲覧・印刷できる✓特別なプラグインのインストールが必要ない• 一般的なOSの標準アプリで閲覧・印刷できる✓特別なアプリをインストールする必要がない• 画像フォーマットの仕様がオープンである• このような画像フォーマットであれば、プラグインやアプリが突然なくなって見れれなくなるということはない
4. 最低限の画像閲覧機能(1)•画像が見える✓(機能ではないが:十分な大きさ・解像度の画像を提供している前提)•画像が拡大できる•一つの資料に複数の画像がある場合:✓個々のサムネイルがある✓サムネイル一覧がある✓次の画像に行ける and/or 特定の画像に行ける•画像がダウンロードできる•画像が印刷できる✓(ダウンロードできれば、印刷できなくても可)
4. 最低限の画像閲覧機能(2)画像閲覧拡大、次のページへ、ダウンロードなどサムネイルで一覧表示PDFダウンロード余談:国立教育政策研究所教育図書館貴重資料デジタルコレクションでは、複数枚ある資料に対する印刷とダウンロードの利便性のために、PDFをダウンロードできるようにしました。複数ページを一度に印刷するのやりやすいだろうという理由からです。https://www.nier.go.jp/library/rarebooks/painting/370.98-314/
5.資料のURLはパーマネントリンクor せめて「資料ID」•特定の資料ページにURLでアクセスできる✓URLはパーマネントリンク✓もしくは資料IDがわかればベースのURL部分だけを一括変換するだけでよいようにしておくパーマネントリンク orせめて「資料ID」
6.利用ライセンスの明示 利用ライセンスの明示(オープンライセンス)https://www.nier.go.jp/library/rarebooks/oraimono/K067-1/
移行・運用しやすい=お安く、簡単に画像ファイルを公開する方法を検討する•3つの型が考えられる•OPAC添付型✓OPACの標準機能or安いオプションがあれば•OPAC+画像リンク型✓別のWebサーバに画像を置き、OPACの資料画面からリンク•ノンシステム型✓静的なファイル+普通のWebサーバで完結(検索もふくめ)
OPAC添付型(1)•OPACシステムの標準機能に書誌レコードに「添付ファイル機能」があればそれを使う✓標準機能ではなくても安価なオプションでも✓例:「情報館」の「デジタル資料公開機能」✓OPACがいらないってことはないだろうのでそこに乗っかることで「続けられる」を確保する作戦。✓気を付けること:移行でベンダーロックにあわないような対策をとる(画像ファイルと画像ファイルリストを手元で保存しておくなど)余談:国立教育政策研究所近代教科書デジタルアーカイブでは、資料ID.pdf というファイル名にして、ファイル名とサーバ上の実ファイルのありかの対応のリストを出力できるようにして対策した(資料IDはシステムが変わっても維持する前提)
OPACシステムOPAC添付型(2) •これでも十分デジタルアーカイブ走れメロス太宰治筑摩書房請求記号:913|タ書誌詳細画面に画像ファイルを添付できる機能を利用よく知られた画像フォーマット(PDF)資料の同定のためのメタデータ最低限の検索機能(キーワード検索)最低限の画像閲覧機能(PDFなので十分)※情報館では複数枚のjpgもできるそうです!
OPAC添付型の例:BICライブラリhttps://bicl.opac.jp/opac/Advanced_search「日本機械産業」で検索
OPAC+画像リンク型•OPACの資料の画面から別のWebサーバーへ置いた画像へリンクを貼る•画像部分はウェブサーバだけあれば公開できるように✓ウェブブラウザにビューアのプラグインなどは必要なく✓CMSなどは使わない✓ウェブサーバーに、phpなどのインストールを必要としない•=フォルダごとコピーするだけで別のウェブサーバに移行できるように•1資料 → 1フォルダ or 1ファイル•静的なファイル(HTML, CSS, Javascript, JPG,PDF, json など)だけで作る
別サーバに置く画像の置き方の様々なパターン(下に行くほど複雑)1. PDFをそのまま置く2. HTMLとJPG/PDFだけで作る3. 2 + Javascriptの画像ビューアを使う✓例:画像ビューア:Viewer.js を使うデモサイト: https://fengyuanchen.github.io/viewerjs/Javascriptで動く画像ビューア4. 2 + IIIF Manifest のjsonファイルを使う(今回は、 4 の詳細な説明は省略します)
OPACシステムOPAC+画像リンク型:PDF•これでも十分デジタルアーカイブWebサーバー走れメロス太宰治筑摩書房請求記号:913|タhttps://www.sample.jp/hashire.pdfhttps://www.sample.jp/hashire.pdf書誌詳細画面にPDFへのリンクWebサーバーにPDFを置くだけよく知られた画像フォーマット(PDF)資料の同定のためのメタデータ最低限の検索機能(キーワード検索)最低限の画像閲覧機能(PDFなので十分)
OPAC+画像リンク型:PDFEnjuデモの例https://enju.next-l.jp/「スキル」で検索
OPACシステムOPAC+画像リンク型:HTML(JPG&PDF)Webサーバー走れメロス太宰治筑摩書房請求記号:913|タhttps://www.sample.jp/hashire/https://www.sample.jp/hashire/書誌詳細画面に本文リンクWebサーバーにHTML,JPG,PDFを置くよく知られた画像フォーマット(JPG,PDF)資料の同定のためのメタデータ最低限の検索機能(キーワード検索)最低限の画像閲覧機能
OPAC+画像リンク型:早稲田大学図書館の例(1)•OPACトップページ→「古代連歌九百韻」→検索https://waseda.primo.exlibrisgroup.com/
早稲田大学図書館の例(2)--検索結果にデジタル資料へのリンク(URL)--「画像情報」リンクをクリック• 検索結果(書誌の詳細)• タイトルや書誌情報など• 「画像情報」にリンク
早稲田大学図書館の例(3)--静的なHTMLと画像ファイル--*「PDF」リンクをクリックしたらPDFへ「HTML」リンクをクリック• 請求記号• カット番号• トップのサムネイル• HTMLへのリンク• PDFへのリンク(ファイルサイズ)http://archive.wul.waseda.ac.jp/kosho/bunko31/bunko31_e0214/
早稲田大学図書館の例(4)--サムネイル画像とカット数--「2」リンクをクリック• 請求記号• カット数• 各ページのサムネイル• 画像(JPEG)へのリンク• カット番号http://archive.wul.waseda.ac.jp/kosho/bunko31/bunko31_e0214/bunko31_e0214.h
早稲田大学図書館の例(5)JPG画像が表示されるhttp://archive.wul.waseda.ac.jp/kosho/bunko31/bunko31_e0214/bunko31_e0214_p0002.jpghttp://archive.wul.waseda.ac.jp/kosho/bunko31/bunko31_e0214/bunko31_e0214_p000
Webサーバー(静的ファイルのみ)ノンシステム型https://www.sample.jp/hashire/よく知られた画像フォーマット(JPG,PDF)最低限の画像閲覧機能(サムネイル一覧などで工夫)カテゴリ:文学○○コレクション資料の同定のためのメタデータ書誌詳細画面にダウンロードリンクWebサーバーにHTML,JPG,PDFを置く最低限の検索機能(カテゴリ検索)メタデータ含めて全てを静的なファイルだけで作り、一つのWebサーバーで提供
ノンシステム型のメリット• Webサーバーに「フォルダごとコピー」するだけで公開できる✓移行は、ファイル容量が十分な一般的なWebサーバーを用意し、フォルダごとコピーするだけで完了!✓最悪、Webサーバーが用意できない場合でも、Web公開はできなくとも、HDDにファイルをフォルダごとコピーするだけで、ローカルPCで閲覧する環境を整えられる• システムのセキュリティ対応がほとんど必要ない(システム運用コストが安価)✓普通のWebサーバーのメンテナンスコストのみ✓デジタルアーカイブそのものへのシステムメンテナンスが必要ないセキュリティパッチを充てるなどが必要ない(Javascriptを使用している場合は多少必要の可能性あり、その場合は、Javascriptの使用を切れるように対策しておくなどは必要)
ノンシステム型(+Javascript)の例:国立教育政策研究所教育図書館貴重資料デジタルコレクションhttp://www.nier.go.jp/library/rarebooks/ ※デザインとHTML作成は業務委託で作成
教育図書館貴重資料デジタルコレクション(1)•トップページ最低限の検索機能(カテゴリ検索)
教育図書館貴重資料デジタルコレクション(2)•カテゴリページ利用ライセンスの明示(オープンライセンス)
教育図書館貴重資料デジタルコレクション(3)•資料ページ資料の同定のためのメタデータ(タイトル,ヨミ,出版者,出版年,大きさ,請求記号)よく知られた画像フォーマット(PDF)パーマネントリンク orせめて「資料ID」
教育図書館貴重資料デジタルコレクション(4)•ビューアで見る拡大、回転、次のページへ、ダウンロードなど最低限の画像閲覧機能サムネイルで一覧表示
余談:Japan Seachと連携するとIIIFで提供できるらしい•朗報です!Japan Searchに連携するとIIIFに自図書館で対応していなくてもできる*そうです。•現在、「国立教育政策研究所教育図書館貴重資料デジタルコレクション」に対してこの方法でIIIF提供するように進めています。順調にいけば12月頃にはできるようになるはず。ref. 「ジャパンサーチのメタデータ連携について」p.5 「簡易IIIF-API」https://jpsearch.go.jp/static/pdf/cooperation/jps_manual_202010.pdf
まとめ•図書館が一番実現したいことを常に頭に✓「来館せずに,本文画像を閲覧できるように」✓そのほかのことは思い切って切り捨てる心持ち重要•ずっと続けられるサービス✓移行・運用コストを最小限に•パーマネットリンク,永続的識別子がキモかも•便利なツールが出てきたのでやりやすくなった✓Javascriptで動くビューア