$30 off During Our Annual Pro Sale. View Details »

典拠データを生かす検索サービス、情報探索行動の変化、LODの社会的効果 / 2019-03-20 NDL Identifier

典拠データを生かす検索サービス、情報探索行動の変化、LODの社会的効果 / 2019-03-20 NDL Identifier

Masao Takaku

March 20, 2019
Tweet

More Decks by Masao Takaku

Other Decks in Science

Transcript

  1. 典拠データを生かす
    検索サービス
    情報探索行動の変化
    LODの社会的効果
    高久雅生
    (筑波大学図書館情報メディア系)
    [email protected]
    1
    国立国会図書館・識別子の方針策定に係る意見聴取会
    2019年3月20日

    View Slide

  2. 研究の枠組み
    2
    情報検索
    システム
    コンテンツ
    文書群
    コレクション
    ユーザ
    コミュニティ
    情報要求
    これらの要素とその間の相互作用
    の役割を明らかにすることが学問
    としての中心的課題
    構造化
    組織化

    View Slide

  3. (テーマ1)
    ユーザの情報要求と情報探索
    • どのような情報要求のもとにユーザは行動
    しているか?
    情報探索行動、インタラクション(HCI)
    どのように検証するか?
    • 研究室実験(被験者)、ユーザ観察、質問紙調査、
    ダイアリ法、インタビュー
    • 現代の情報検索サービスのなかで:
    伝統的な情報検索モデルを { 踏まえて / 超える }
    • 探索サービスはウェブの中に埋め込まれる
    ユーザタスクとユーザ像の再考が求められる
    3

    View Slide

  4. 検索クエリ
    適合文書
    集合
    検索結果
    (ランキング)
    情報要求
    情報検索システム
    文書集合
    伝統的な情報検索モデル
    検索クエリ?
    情報要求
    探索目標
    Webにおける動的な情報探索モデル
    Web
    サービス
    サービス
    サービス
    4

    View Slide

  5. サーチエンジンにおける
    検索キーワードランキング
    1. 天気
    2. 東京
    3. 漫画
    4. ヤフー
    5. youtube
    6. ニュース
    7. モンスト
    8. 映画
    9. 楽天
    10. 京都
    5
    出典:Google トレンド
    https://trends.google.co.jp/trends
    /explore?date=2018-01-
    01%202018-12-31&geo=JP

    View Slide

  6. 情報検索のタスク分類例 (1)
    • ウェブ検索エンジンにおけるタスク [Broder,2002]
    ※質問紙調査 + ログ分析
     情報収集 Informational
     ナビゲーション Navigational
     トランザクション(買い物)Transactional
    • クエリのトピック[Kamvar,2006]
    ※ログ分析
     ローカルサービス、芸能・エンタメ、コンピュータ・
    技術、旅行・趣味、インターネット・通信、アダルト、
    スポーツ、飲食、健康・美容、社会、自動車、ショッ
    ピング・消費サービス、ライフスタイル・コミュニ
    ティ、ゲーム、ニュース・時事、投資・保険、芸術・
    文芸、趣味、産業、家庭・園芸、科学、不動産、ビジ
    ネス (23カテゴリ)
    6

    View Slide

  7. 情報検索のタスク分類例 (2)
    • 情報利用のための多様なタスク [Kellar,2007]
    ※ダイアリ法
    事実発見 Fact finding
    情報収集 Information gathering
    ブラウジング Browsing
    (巡回) Monitoring
    トランザクション Transaction
    7

    View Slide

  8. 情報要求とユーザタスクの次元
    • 情報探索のステージ[Kuhlthau, 2004]
    探索テーマの模索、テーマの選択、探索、テー
    マの確定、情報の収集、探索終了
    • タスクの複雑さ[Liu, 2012]
    情報の規模、範囲、種類、信頼性、タスクのあ
    いまいさ、変化の度合い、作業内容の複雑さ、
    時間的制約
    • ユーザ特性[高久, 2010][南, 2016]
    探索スキル(戦術、方略)
    ドメイン知識
    etc.
    8

    View Slide

  9. 書誌情報探索のタスク
    • 情報組織化の文脈におけるユーザタスク
    (FRBR由来)
    発見 Find
    識別 Identify
    選択 Select
    入手 Obtain
    探索 Explore ※IFLA LRMにおける追加
    • 私見:一般的な情報探索研究の視点から見るとや
    や書誌情報特有の構造に依存しすぎていて、広義
    のユーザタスクとは異なる
     「ユーザタスク」の粒度が異なるため、前スライドで
    述べたような探索タスクの次元とは別途に関連付けが
    必要
    9

    View Slide

  10. (いったんのまとめ)
    書誌情報システムは
    何をサポートするか?
    • 多様なタスクに応える
    素早い探索
    効果的な検索
    情報遭遇、セレンディピティ
    • メディア環境やコレクション環境の多様化
    10

    View Slide

  11. (テーマ2)
    情報組織化とLinked Open Data
    • 図書館で組織化・提供されてきたコレク
    ションをよりモダンな環境で構造化して提
    供する
    • 事例:教科書LOD(Linked Open Data)
    教育図書館の保有する日本の現行の検定制度の
    教科書の書誌情報を提供いただいて研究開発
    対象:約7,000件の書誌情報(タイトルや著者、
    出版社等)、その他の関連リソース
    LODチャレンジ2016 テーマ賞「教育LOD賞」
    11

    View Slide

  12. Linked Dataの4原則
    1. ものごと(概念)の命名(識別)にはURIを
    用いる
    2. HTTP URIを用いて、識別されたモノの情報
    を確認できるようにする
    3. URIにアクセスすれば有用な情報を得られる
    ようにする(RDFやSPARQLなどの標準も)
    4. 他のURIへのリンクを加えて、さらなる情報
    源となるようにする
    12
    https://www.w3.org/DesignIssues/LinkedData.html

    View Slide

  13. (関連して)
    クールなURIは変わらない
    • URIを変更しないで済むように設計する
    2年後、20年後、200年にも使えるURI?
    • URIから除外すべきもの
    技術的制約
    • ファイル名(拡張子)
    • 使用ソフトウェア名
    • ドライブ名
    文書管理上または制度上の方法
    • 担当者名
    • 主題トピック
    • 状態
    • アクセス権限
    13
    http://www.kanzaki.com/docs/Style/URI.html

    View Slide

  14. Linked Open Dataの事例
    • Webサーチエンジン
    エンティティ検索、リッチスニペット
    • LOD提供の事例
    DBpedia : http://ja.dbpedia.org/
    Wikidata:https://wikidata.org/
    NDL Web Authorities :
    https://id.ndl.go.jp/auth/ndla
    CiNii Articles : http://ci.nii.ac.jp/
    LC Linked Data : http://id.loc.gov/
    14

    View Slide

  15. エンティティ検索の例
    15
    https://www.google.co.jp/search?q=嘉納治五郎

    View Slide

  16. Wikipedia(Wikidata)による
    「典拠管理」機能
    16

    View Slide

  17. 小規模なLODデータセットの一例
    • 教科書LOD[江草, 2018]
    2017年1月公開提供開始
    LODチャレンジ2016「教育賞」を受賞
    https://w3id.org/jp-textbook/
    • 対象
    初等教育、中等教育で使われている学習指導要
    領と教科用教科書の情報をLinked Open Data
    (LOD)化
    約7000件の書誌情報
    教育図書館(国立教育政策研究所)提供
    17

    View Slide

  18. 教科書LODとは
    • 教科書の書誌データをLOD化
    • 教科書を URI (IRI) で一意に示せる・利用
    可能に
    18
    https://w3id.org/jp-textbook/高等学校/2006/世B/013
    例:高等学校で使われている「世界史B」の教科書
    (2006年に検定済み(奥付に記載あり)、東京書籍が出版)
    • 教科書記号(例:世B)及び教科書番号
    (例:013)
    • 教科書のわかりやすいところに記載さ
    ている
    • (文部科学省が検定済教科書を整理・
    周知する際に使用)
    高等学校地理歴史教科用
    文部科学省検定済教科書
    2 東書 世B 013
    教科書の表紙に:

    View Slide

  19. textbook:中学校
    /2001/英語/904
    textbook:school
    /中学校
    textbook:
    curriculum/
    中学校/2002
    英語
    NEW
    CROWN
    ENGLISH
    SERIES 3
    森住衛 ほか
    29名
    2001
    904
    K260.91||S1
    2U||01/02
    EB10015324
    2002
    2005
    textbook:
    curriculum/
    中学校
    /2002/
    外国語
    textbook:
    curriculum/
    中学校
    /2002/
    外国語/英語
    中学校学習
    指導要領 1998-
    12-14
    2002-
    04-01
    http://www.mext.go.jp/a_
    menu/shotou/cs/1320061.h
    tm
    改訂版
    3
    NIER請求記号
    NIERレコードID
    書名
    編著者名
    版情報
    出版者名
    検定年 使用年
    対象学年
    教科書記号
    教科書番号
    種目(科目)
    掲載教科書目録
    教科
    対応する
    学習指導要領
    名称
    告示日 施行年月日 本文URL
    学校種別
    学校種別
    2005年度より
    「改訂版」に変
    更。
    注記
    教科がある
    所蔵情報
    種目がある
    120
    B5
    ページ数
    大きさ
    B2|600|H17/18
    220050110
    所蔵情報
    RCレコードID
    RC請求記号
    978-4-
    385-
    70190-5
    ISBN
    textbook:
    catalogue/
    中学校/2004
    textbook:
    catalogue/
    中学校/2003
    textbook:
    catalogue/
    中学校/2002
    textbook:
    catalogue/
    中学校/2001
    textbook:
    publisher/
    2001/三省堂

    View Slide

  20. 教科書LODの特徴
    • ベースURI: https://w3id.org/jp-textbook/
    すべての教科書にURIを付与
    • https://w3id.org/jp-textbook/中学校/2001/国語/704
    ※ 学校種別+検定年度+教科書記号+教科書番号
    そのほか、付随するすべての教科・科目、学習
    指導要領や教科書目録に対してもURIを付与
    URIにアクセスすると関連情報が提供されるよ
    うにブラウジング用ページの作成
    • 外部サービス(クラウド)の活用
    Githubページ
    永続URIサービス(w3id.org)活用など
    20

    View Slide

  21. 研究の枠組み
    21
    情報検索
    システム
    コンテンツ
    文書群
    コレクション
    ユーザ
    コミュニティ
    情報要求
    これらの要素とその間の相互作用
    の役割を明らかにすることが学問
    としての中心的課題
    構造化
    組織化

    View Slide

  22. 参照文献
    • [Broder,2002]
     Andrei Broder. A taxonomy of web search. SIGIR Forum, Vol.36, No.2, pp.3-10, 2002.
    https://doi.org/10.1145/792550.792552
    • [Kellar,2007]
     Melanie Kellar, et al. A field study characterizing Web-based information-seeking tasks. Journal
    of the American Society for Information Science and Technology, Vol.58, No.7, pp.999-1018,
    2007. https://doi.org/10.1002/asi.20590
    • [Kuhlthau, 2004]
     Carol Kuhlthau. Seeking meaning : a process approach to library and information services. 2nd
    Edition. Libraries Unlimited, 2004, 247p.
    • [Liu, 2012]
     Peng Liu, Zhizhong Li. Task complexity: A review and conceptualization framework. International
    Journal of Industrial Ergonomics, Vol.42, No.6, 2012, pp.553-568.
    https://doi.org/10.1016/j.ergon.2012.09.001
    • [Kamvar,2006]
     Maryam Kamvar, Shumeet Baluja. A large scale study of wireless search behavior: Google mobile
    search. Proceedings of SIGCHI 2006. pp-701-709, 2006.
    https://doi.org/10.1145/1124772.1124877
    • [江草, 2018]
     江草由佳, 高久雅生. 教科書Linked Open Data(LOD)の構築と公開. 情報の科学と技術,
    2018, Vol.68, No.7, pp.361-367. https://doi.org/10.18919/jkg.68.7_361
    • [高久, 2010]
     高久雅生ほか. タスク種別とユーザ特性の違いがWeb情報探索行動に与える影響: 眼球運
    動データおよび閲覧行動ログを用いた分析. 情報知識学会誌, Vol.20, No.3, pp.249-276,
    2010. https://doi.org/10.2964/jsik.20-026
    • [南, 2016]
     南友紀子ほか. ウェブ環境における情報検索スキル. 日本図書館情報学会誌, Vol.62, No.3,
    pp.163-180, 2016. https://doi.org/10.20651/jslis.62.3_163

    View Slide