Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
オープンな知識グラフWikidataを利用したアプリ開発例
Search
Kouji Kozaki
February 26, 2024
Technology
1
33
オープンな知識グラフWikidataを利用したアプリ開発例
自分の活動に活かすオープンデータ勉強会(2024/2/23)
にて使用した発表スライドです.
Wikidataを用いた開発したアプリの例を紹介しています.
Kouji Kozaki
February 26, 2024
Tweet
Share
More Decks by Kouji Kozaki
See All by Kouji Kozaki
生成AIと知識グラフの相互利用に基づく文書解析
koujikozaki
1
190
ナレッジグラフとLLMの相互利用
koujikozaki
1
800
Other Decks in Technology
See All in Technology
SDNという名のデータプレーンプログラミングの歴史
ebiken
PRO
2
210
VideoMamba: State Space Model for Efficient Video Understanding
chou500
0
260
Exadata Database Service on Dedicated Infrastructure(ExaDB-D) UI スクリーン・キャプチャ集
oracle4engineer
PRO
2
3.2k
Application Development WG Intro at AppDeveloperCon
salaboy
0
210
The Role of Developer Relations in AI Product Success.
giftojabu1
0
160
ExaDB-D dbaascli で出来ること
oracle4engineer
PRO
0
3.9k
JAWS UG 青森(弘前)クラウド・AWS入門
hiragahh
0
100
Terraform Stacks入門 #HashiTalks
msato
0
380
TanStack Routerに移行するのかい しないのかい、どっちなんだい! / Are you going to migrate to TanStack Router or not? Which one is it?
kaminashi
0
660
生成AIが変えるデータ分析の全体像
ishikawa_satoru
0
250
OCI Network Firewall 概要
oracle4engineer
PRO
0
4.2k
Adopting Jetpack Compose in Your Existing Project - GDG DevFest Bangkok 2024
akexorcist
0
120
Featured
See All Featured
What's new in Ruby 2.0
geeforr
343
31k
It's Worth the Effort
3n
183
27k
No one is an island. Learnings from fostering a developers community.
thoeni
19
3k
Designing Experiences People Love
moore
138
23k
jQuery: Nuts, Bolts and Bling
dougneiner
61
7.5k
Put a Button on it: Removing Barriers to Going Fast.
kastner
59
3.5k
Product Roadmaps are Hard
iamctodd
PRO
49
11k
We Have a Design System, Now What?
morganepeng
50
7.2k
Imperfection Machines: The Place of Print at Facebook
scottboms
265
13k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
329
21k
Making Projects Easy
brettharned
115
5.9k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
27
4.3k
Transcript
オープンな知識グラフWikidataを 利用したアプリ開発例 大阪電気通信大学 古崎 晃司 自分の活動に活かすオープンデータ勉強会 2024/2/23 2024/2/23 1
Wikidata • ウィキメディア財団が運営する Wikipediaの「データ版」 • 現在,約1億項目 • Wikipediaと同じようにデータをコミュ ニティで編集,公開できる •
API(SPARQLエンドポイント)や各種検 索ツールなども提供 • オープンな知識グラフ(=LOD;Linked Open Data)として利用可 http://wikidata.org/ (ウィキデータ) 参考 英語版Wikipedia 670万記事 日本語版Wikipedia 140万記事 日本国語大辞典 50万項目 ★ 2 2024/2/23
ウィキデータの特徴 ウィキデータは、自由・共同作業・多言語・二次情報を 特徴とする、構造化データのデータベースです。 収集された構造化データは、ウィキペディア、ウィキメ ディア・コモンズや、その他のウィキメディアのプロジェク トで活用されているほか、世界中の誰でも利用できます。 https://www.wikidata.org/wiki/Wikidata:Introduction/ja より
ウィキデータに登録したデータ(知識)は, そのまま,すぐに,オープンデータとして, 「全世界」に公開される! 2024/2/23 3
WikipediaからWikidataへ Wikipediaの各記事から 対応する Wikidata項目へのリンク 4 2024/2/23
Wikidataのデータ例(1/3) Wikidataにおいて 「大阪電気通信大学(Q7105556)」にアクセスした例 https://www.wikidata.org/wiki/Q7105556 さまざまな言語での 「ラベル」,「概要説明」,「別名」 Wikidata上のID :Q****の形式ですべてのデータIDが付けられている 5 2024/2/23
Wikidataのデータ例(2/2) 6 述 語 (プ ロ パ テ ィ )
目 的 語 (オ ブ ジ ェ ク ト ) 他のリソース へのリンク 2024/2/23
IRIによるLODへのアクセス例 7 http://www.wikidata.org/entity/Q7105556.ttl とすると,Turtle形式でデータ取得が可 (Wikidataは,ほかに,.rdf,.nt,.json等に対応) 2024/2/23
Wikidataのおススメポイント 知識/データの量と質 すべてのデータはクリエイティブ・コモンズ CC0 ラ イセンスの下で利用可 登録項目数:108,595,026
(2024/2/23時点) Wikipediaと同様のエディタチェックに基づいた, 登録ユーザによる共同編集 データの入力統制によるクオリティコントロール 検索用API/GUI 使いやすい検索サービス 検索結果の可視化,他サイトへの埋め込みにも対応 APIの提供(SPARQL,Wikipedia API) 2024/2/23 8
Wikidataクエリサービスを用いた SPARQL検索結果の可視化 Wikidataクエリサービスを利用すると, SPARQL検索結果を,データの種類に応じて 可視化することができる. 2024/2/23 9
WikidataのSPARQLエンドポイント ここに,クエリを入れる ・ブラウザからのアクセス https://query.wikidata.org/ ・プログラムからのアクセス https://query.wikidata.org/sparql クエリ結果の表示 10 2024/2/23
可視化例:Timeline https://w.wiki/4ou 検索例3-3-a 「日本にある大学の一覧」を 「設立日」 2024/2/23 11
可視化例:Bar chart https://w.wiki/65ZN select ?s ?sLabel ?o where { ?s
wdt:P31 wd:Q3918 . # ?Sの「分類」が「大学」 ?s wdt:P17 wd:Q17 . # ?sの「国」が「日本」 ?s wdt:P2196 ?o . # ?sの「学生数」を?oとする SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],ja". } }ORDER BY DESC(?o) # DESC(?o)とする「降順」に LIMIT 100 他のグラフ(Chart) も試してみる ここの述語 を変更 2024/2/23 12
可視化例:Map https://w.wiki/65ZP select ?s ?sLabel ?o where { ?s wdt:P31
wd:Q3918 . # ?Sの「分類」が「大学」 ?s wdt:P17 wd:Q17 . # ?sの「国」が「日本」 ?s wdt:P625 ?o . # ?sの「位置座標」を?oとする SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],ja". } } ここの述語 を変更 2024/2/23 13
可視化例:Image gird https://w.wiki/65ZU select ?s ?sLabel ?o where { ?s
wdt:P31 wd:Q3918 . # ?Sの「分類」が「大学」 ?s wdt:P17 wd:Q17 . # ?sの「国」が「日本」 ?s wdt:P18 ?o . # ?sの「画像」を?oとする SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],ja". } } ここの述語 を変更 2024/2/23 14
Wikidataを利用した アプリの開発例 WikidataクエリサービスのAPIなど利用す ることで,様々なアプリの開発が可能 主に研究室の学生が開発したアプリの例 を紹介します 2024/2/23 15
Wikidataを使った検索ツール 開発用のライブラリ 2024/2/23 16 KGSearchForWD(https://kgs.hozo.jp/) Wikidataを使った「知識グラフ検索ツール」開発用のJavaScriptライブラリ Wikidataを使った検索サイトがノーコードで作成可能
Wikidataを用いた エンティティ・リンキング 2024/2/23 17 LODチャレンジ2022 データ活用部門「優秀賞」を受賞 https://shunafuku.github.io/entity- lnking-by-wikidata/ 入力したテキストを解析して Wikidataへのリンクを付与
(エンティティ・リンキング)する
Wikidataによるクイズ生成 2024/2/23 18 https://hozo.jp/opc/ ・Wikidataを使って「2択クイズ」を自動生成 ・テンプレートとなる「SPARQLクエリ」を変える と様々なジャンルのクイズが生成できる LODチャレンジ2023 データ活用部門「優秀賞」を受賞
Wikdiataを用いた動物検索 2024/2/23 19 https://oecu-kozaki-lab.github.io/animalpages/animals.html 「Wikidataの各データから外部DBへのリンク」を 利用して,動物に関する複数のDBを横断検索
まとめ Wikidataはオープンな知識グラフ (=LOD;Linked Open Data)として活用可 すでに多くのデータが公開されているので, プロトタイプ開発にも有効
足りないデータを追加し,オープンデータとして 公開することも可能 他のオープンデータとの連携にも有用 2024/2/23 20 皆さんも,Wikidataを使ってみませんか?