Slide 1

Slide 1 text

典拠データを生かす 検索サービス 情報探索行動の変化 LODの社会的効果 高久雅生 (筑波大学図書館情報メディア系) [email protected] 1 国立国会図書館・識別子の方針策定に係る意見聴取会 2019年3月20日

Slide 2

Slide 2 text

研究の枠組み 2 情報検索 システム コンテンツ 文書群 コレクション ユーザ コミュニティ 情報要求 これらの要素とその間の相互作用 の役割を明らかにすることが学問 としての中心的課題 構造化 組織化

Slide 3

Slide 3 text

(テーマ1) ユーザの情報要求と情報探索 • どのような情報要求のもとにユーザは行動 しているか? 情報探索行動、インタラクション(HCI) どのように検証するか? • 研究室実験(被験者)、ユーザ観察、質問紙調査、 ダイアリ法、インタビュー • 現代の情報検索サービスのなかで: 伝統的な情報検索モデルを { 踏まえて / 超える } • 探索サービスはウェブの中に埋め込まれる ユーザタスクとユーザ像の再考が求められる 3

Slide 4

Slide 4 text

検索クエリ 適合文書 集合 検索結果 (ランキング) 情報要求 情報検索システム 文書集合 伝統的な情報検索モデル 検索クエリ? 情報要求 探索目標 Webにおける動的な情報探索モデル Web サービス サービス サービス 4

Slide 5

Slide 5 text

サーチエンジンにおける 検索キーワードランキング 1. 天気 2. 東京 3. 漫画 4. ヤフー 5. youtube 6. ニュース 7. モンスト 8. 映画 9. 楽天 10. 京都 5 出典:Google トレンド https://trends.google.co.jp/trends /explore?date=2018-01- 01%202018-12-31&geo=JP

Slide 6

Slide 6 text

情報検索のタスク分類例 (1) • ウェブ検索エンジンにおけるタスク [Broder,2002] ※質問紙調査 + ログ分析  情報収集 Informational  ナビゲーション Navigational  トランザクション(買い物)Transactional • クエリのトピック[Kamvar,2006] ※ログ分析  ローカルサービス、芸能・エンタメ、コンピュータ・ 技術、旅行・趣味、インターネット・通信、アダルト、 スポーツ、飲食、健康・美容、社会、自動車、ショッ ピング・消費サービス、ライフスタイル・コミュニ ティ、ゲーム、ニュース・時事、投資・保険、芸術・ 文芸、趣味、産業、家庭・園芸、科学、不動産、ビジ ネス (23カテゴリ) 6

Slide 7

Slide 7 text

情報検索のタスク分類例 (2) • 情報利用のための多様なタスク [Kellar,2007] ※ダイアリ法 事実発見 Fact finding 情報収集 Information gathering ブラウジング Browsing (巡回) Monitoring トランザクション Transaction 7

Slide 8

Slide 8 text

情報要求とユーザタスクの次元 • 情報探索のステージ[Kuhlthau, 2004] 探索テーマの模索、テーマの選択、探索、テー マの確定、情報の収集、探索終了 • タスクの複雑さ[Liu, 2012] 情報の規模、範囲、種類、信頼性、タスクのあ いまいさ、変化の度合い、作業内容の複雑さ、 時間的制約 • ユーザ特性[高久, 2010][南, 2016] 探索スキル(戦術、方略) ドメイン知識 etc. 8

Slide 9

Slide 9 text

書誌情報探索のタスク • 情報組織化の文脈におけるユーザタスク (FRBR由来) 発見 Find 識別 Identify 選択 Select 入手 Obtain 探索 Explore ※IFLA LRMにおける追加 • 私見:一般的な情報探索研究の視点から見るとや や書誌情報特有の構造に依存しすぎていて、広義 のユーザタスクとは異なる  「ユーザタスク」の粒度が異なるため、前スライドで 述べたような探索タスクの次元とは別途に関連付けが 必要 9

Slide 10

Slide 10 text

(いったんのまとめ) 書誌情報システムは 何をサポートするか? • 多様なタスクに応える 素早い探索 効果的な検索 情報遭遇、セレンディピティ • メディア環境やコレクション環境の多様化 10

Slide 11

Slide 11 text

(テーマ2) 情報組織化とLinked Open Data • 図書館で組織化・提供されてきたコレク ションをよりモダンな環境で構造化して提 供する • 事例:教科書LOD(Linked Open Data) 教育図書館の保有する日本の現行の検定制度の 教科書の書誌情報を提供いただいて研究開発 対象:約7,000件の書誌情報(タイトルや著者、 出版社等)、その他の関連リソース LODチャレンジ2016 テーマ賞「教育LOD賞」 11

Slide 12

Slide 12 text

Linked Dataの4原則 1. ものごと(概念)の命名(識別)にはURIを 用いる 2. HTTP URIを用いて、識別されたモノの情報 を確認できるようにする 3. URIにアクセスすれば有用な情報を得られる ようにする(RDFやSPARQLなどの標準も) 4. 他のURIへのリンクを加えて、さらなる情報 源となるようにする 12 https://www.w3.org/DesignIssues/LinkedData.html

Slide 13

Slide 13 text

(関連して) クールなURIは変わらない • URIを変更しないで済むように設計する 2年後、20年後、200年にも使えるURI? • URIから除外すべきもの 技術的制約 • ファイル名(拡張子) • 使用ソフトウェア名 • ドライブ名 文書管理上または制度上の方法 • 担当者名 • 主題トピック • 状態 • アクセス権限 13 http://www.kanzaki.com/docs/Style/URI.html

Slide 14

Slide 14 text

Linked Open Dataの事例 • Webサーチエンジン エンティティ検索、リッチスニペット • LOD提供の事例 DBpedia : http://ja.dbpedia.org/ Wikidata:https://wikidata.org/ NDL Web Authorities : https://id.ndl.go.jp/auth/ndla CiNii Articles : http://ci.nii.ac.jp/ LC Linked Data : http://id.loc.gov/ 14

Slide 15

Slide 15 text

エンティティ検索の例 15 https://www.google.co.jp/search?q=嘉納治五郎

Slide 16

Slide 16 text

Wikipedia(Wikidata)による 「典拠管理」機能 16

Slide 17

Slide 17 text

小規模なLODデータセットの一例 • 教科書LOD[江草, 2018] 2017年1月公開提供開始 LODチャレンジ2016「教育賞」を受賞 https://w3id.org/jp-textbook/ • 対象 初等教育、中等教育で使われている学習指導要 領と教科用教科書の情報をLinked Open Data (LOD)化 約7000件の書誌情報 教育図書館(国立教育政策研究所)提供 17

Slide 18

Slide 18 text

教科書LODとは • 教科書の書誌データをLOD化 • 教科書を URI (IRI) で一意に示せる・利用 可能に 18 https://w3id.org/jp-textbook/高等学校/2006/世B/013 例:高等学校で使われている「世界史B」の教科書 (2006年に検定済み(奥付に記載あり)、東京書籍が出版) • 教科書記号(例:世B)及び教科書番号 (例:013) • 教科書のわかりやすいところに記載さ ている • (文部科学省が検定済教科書を整理・ 周知する際に使用) 高等学校地理歴史教科用 文部科学省検定済教科書 2 東書 世B 013 教科書の表紙に:

Slide 19

Slide 19 text

textbook:中学校 /2001/英語/904 textbook:school /中学校 textbook: curriculum/ 中学校/2002 英語 NEW CROWN ENGLISH SERIES 3 森住衛 ほか 29名 2001 904 K260.91||S1 2U||01/02 EB10015324 2002 2005 textbook: curriculum/ 中学校 /2002/ 外国語 textbook: curriculum/ 中学校 /2002/ 外国語/英語 中学校学習 指導要領 1998- 12-14 2002- 04-01 http://www.mext.go.jp/a_ menu/shotou/cs/1320061.h tm 改訂版 3 NIER請求記号 NIERレコードID 書名 編著者名 版情報 出版者名 検定年 使用年 対象学年 教科書記号 教科書番号 種目(科目) 掲載教科書目録 教科 対応する 学習指導要領 名称 告示日 施行年月日 本文URL 学校種別 学校種別 2005年度より 「改訂版」に変 更。 注記 教科がある 所蔵情報 種目がある 120 B5 ページ数 大きさ B2|600|H17/18 220050110 所蔵情報 RCレコードID RC請求記号 978-4- 385- 70190-5 ISBN textbook: catalogue/ 中学校/2004 textbook: catalogue/ 中学校/2003 textbook: catalogue/ 中学校/2002 textbook: catalogue/ 中学校/2001 textbook: publisher/ 2001/三省堂

Slide 20

Slide 20 text

教科書LODの特徴 • ベースURI: https://w3id.org/jp-textbook/ すべての教科書にURIを付与 • https://w3id.org/jp-textbook/中学校/2001/国語/704 ※ 学校種別+検定年度+教科書記号+教科書番号 そのほか、付随するすべての教科・科目、学習 指導要領や教科書目録に対してもURIを付与 URIにアクセスすると関連情報が提供されるよ うにブラウジング用ページの作成 • 外部サービス(クラウド)の活用 Githubページ 永続URIサービス(w3id.org)活用など 20

Slide 21

Slide 21 text

研究の枠組み 21 情報検索 システム コンテンツ 文書群 コレクション ユーザ コミュニティ 情報要求 これらの要素とその間の相互作用 の役割を明らかにすることが学問 としての中心的課題 構造化 組織化

Slide 22

Slide 22 text

参照文献 • [Broder,2002]  Andrei Broder. A taxonomy of web search. SIGIR Forum, Vol.36, No.2, pp.3-10, 2002. https://doi.org/10.1145/792550.792552 • [Kellar,2007]  Melanie Kellar, et al. A field study characterizing Web-based information-seeking tasks. Journal of the American Society for Information Science and Technology, Vol.58, No.7, pp.999-1018, 2007. https://doi.org/10.1002/asi.20590 • [Kuhlthau, 2004]  Carol Kuhlthau. Seeking meaning : a process approach to library and information services. 2nd Edition. Libraries Unlimited, 2004, 247p. • [Liu, 2012]  Peng Liu, Zhizhong Li. Task complexity: A review and conceptualization framework. International Journal of Industrial Ergonomics, Vol.42, No.6, 2012, pp.553-568. https://doi.org/10.1016/j.ergon.2012.09.001 • [Kamvar,2006]  Maryam Kamvar, Shumeet Baluja. A large scale study of wireless search behavior: Google mobile search. Proceedings of SIGCHI 2006. pp-701-709, 2006. https://doi.org/10.1145/1124772.1124877 • [江草, 2018]  江草由佳, 高久雅生. 教科書Linked Open Data(LOD)の構築と公開. 情報の科学と技術, 2018, Vol.68, No.7, pp.361-367. https://doi.org/10.18919/jkg.68.7_361 • [高久, 2010]  高久雅生ほか. タスク種別とユーザ特性の違いがWeb情報探索行動に与える影響: 眼球運 動データおよび閲覧行動ログを用いた分析. 情報知識学会誌, Vol.20, No.3, pp.249-276, 2010. https://doi.org/10.2964/jsik.20-026 • [南, 2016]  南友紀子ほか. ウェブ環境における情報検索スキル. 日本図書館情報学会誌, Vol.62, No.3, pp.163-180, 2016. https://doi.org/10.20651/jslis.62.3_163