Linked Open Data on GitHub Pages 教科書LODでの経験から
Linked Open Dataon GitHub Pages― 教科書LODでの経験から ―高久雅生(筑波大学)[email protected]12018年9月1日 – 9月2日Code4Lib JAPANカンファレンス2018
View Slide
最初に結論から…• Linked Open Dataでは URI こそが最重要• URIを自由に設定できる永続URIサービスが重要w3id.org や purl.org など• 永続URIサービスからのリンク先にGithub Pagesを使えば、無料のクラウド環境を使って、LOD発信できる!2
Linked Dataとは?1. URIを使って名前付け(識別)する2. HTTP URIを用いて識別されたモノの情報を確認できるようにする3. URIにアクセスすれば有用な情報を得られるようにする(RDFやSPARQL等の標準を用いる)4. 他のURIへのリンクを加えて、さらなる情報を見つけられるようにする3https://www.w3.org/DesignIssues/LinkedData.html
Linked Open Dataの開発と公開• 形式 RDF, Turtle, N-Triples, RDF/XML, JSON-LD, etc.• 語彙 RDF Schema, OWL, DC, Schema.org, IMI,DBpedia, Wikidata, Geonames, etc.• データアクセス方法 URI resolution, SPARQL endpoint, RDF dump• サーバ環境 Virtuoso, Amazon Neptune, Apache Jena, ???4
5https://w3id.org/jp-textbook/• URIを指定すれば、基本的な情報を閲覧可能• Turtle形式のファイルでも全RDFデータを一括ダウンロード可能
6江草由佳, 高久雅生. 教科書Linked Open Data(LOD)の構築と公開. 情報の科学と技術.2018, Vol.68, No.7, p.361-367https://doi.org/10.18919/jkg.68.7_361
教科書LODとは• 教科書の書誌データをLOD化• 教科書を URI (IRI) で一意に示せる・利用可能に7https://w3id.org/jp-textbook/高等学校/2006/世B/013例:高等学校で使われている「世界史B」の教科書(2006年に検定済み(奥付に記載あり)、東京書籍が出版)• 教科書記号(例:世B)及び教科書番号(例:013)• 教科書のわかりやすいところに記載さている• (文部科学省が検定済教科書を整理・周知する際に使用)高等学校地理歴史教科用文部科学省検定済教科書2 東書 世B 013教科書の表紙に:
Github• バージョンコントロール 変更履歴がたどれる• クラウド環境• 無料で使える8
Github Pages• 公開 Github Pages 無料で公開するためのホスティングサービス9
Github PagesでのLOD公開 (1)• Githubサイトでリポジトリを作成して、Github Pagesで公開する!• https://(プロジェクト名).github.io/xxxというアドレスで公開されるこのアドレスに固定URIサービスのリダイレクト先を振り向けるhttps://w3id.org の場合: Github 上で Pull Request を送って対応依頼10
w3id.org – on Githubhttps://github.com/perma-id/w3id.org11
Github PagesでのLOD公開 (2)• LD原則No.3「URIにアクセスすれば有用な情報を得られるように(RDFやSPARQL等の標準を用いて)」• 固定URLサービス(w3id.org)の場合: Github.com/perma-id/w3id.org リポジトリへ Pull request するだけ 「Accept: text/turtle」ヘッダ付きリクエストに対応しよう12RewriteEngine onRewriteCond "%{HTTP_ACCEPT}" "text/turtle"RewriteRule ^(.+) https://jp-textbook.github.io/$1.ttl [R=302,L]RewriteRule ^(.*) https://jp-textbook.github.io/$1 [R=302,L]cf. https://github.com/perma-id/w3id.org/blob/master/jp-textbook/.htaccess