Slide 1

Slide 1 text

オープンなデータベースを利用した行動計画提案に関する研究 加藤 文彦(国立情報学研究所) 小出 誠二(国立情報学研究所) 武田 英明(国立情報学研究所,総合研究大学院大学) 落合 勇太(トヨタ自動車株式会社) 上田 健揮(トヨタ自動車株式会社)

Slide 2

Slide 2 text

常識推論の研究の現在 l 常識推論研究[Davis16] n Web Mining n 知識ベースアプローチ u フォーマルアプローチ l Situation calculus, QPT etc. u インフォーマルアプローチ l Frame, Scripts, Case-based u 大規模 l CYC n クラウドソーシング u CoceptNet, OpenMind l 80年代以降、実用的な意味ではどのアプローチも大きな進歩は見られない [Davis 16] Davis, E. and Marcus, G.: Commonsense reasoning and commonsense knowledge in artificial intelligence. Commun. ACM, Vol. 58, No. 9, pp.92-103. (2015) DOI:https://doi.org/10.1145/2701413.

Slide 3

Slide 3 text

本研究のアプローチ l 環境の変化 n 大規模知識ベース、データベースの存在 n 大規模computing n Semantic Web Technologies l 目的:既存の大規模知識ベース、データベースを利用して、 特定問題の解決システムを作る。 n 自動車の搭乗者の曖昧な要求を理解して、目的地やスケ ジュールを提案する。 l 手段:DBpedia, Linked Geo Data (Open Street Map), Wikidata, WordNetを合目的的に結合して利用する。

Slide 4

Slide 4 text

課題設定 l 入力: 目的地に関する要求 または 行動要求 n “ライオンが見たいな” n “温泉に入りたい” n “酒が飲みたい” l 出力: 具体的な場所(施設,観光地等)や地域 n “上野恩賜公園” n “大江戸温泉物語” n “神谷バー”

Slide 5

Slide 5 text

ユーザ要求: “ライオンが⾒たい”

Slide 6

Slide 6 text

ユーザ要求: “ライオンが⾒たい” 提案: “恩賜上野動物園”

Slide 7

Slide 7 text

ユーザ要求: “ライオンが⾒たい” 提案: “恩賜上野動物園” この間にはギャップがある

Slide 8

Slide 8 text

No content

Slide 9

Slide 9 text

No content

Slide 10

Slide 10 text

“動物のライオンを見たい”としたときに, 人は動物園や類似施設と限定して探す この限定はどこから来るのか?

Slide 11

Slide 11 text

問題まとめ 1. ユーザ要求の曖昧性解消 n 要求対象の「ライオン」とは u 「動物」「店」「会社」など u 動物のライオン: 生きているのか剥製なのか 2. 対象についての知識 n 「(動物の)ライオン」は「動物」であり「哺乳類」であり 3. 施設についての知識 n 「動物園」では「動物」を「見る」ことができる n デパート特設展示で剥製見るといった特殊条件は省略 4. 実施設の提示 n 「動物園」がどこにあるのか

Slide 12

Slide 12 text

本研究のアプローチ l 問題2-4について既存のオープンなデータベースや知識を組み 合わせることでどの程度解決可能か n 既知のつながりもあるが不十分 n 目的に応じてつなぐ知識を追加 データセット 版 トリプル数 クラス数 利用状況 事実 DBpedia core+en 2016-04-01 1,131,657,931 - △ DBpedia Japanese 2017-02-20 113,299,748 - ○ LinkedGeoData 2015-11-02 1,216,560,762 - ○ 汎用オントロジー DBpedia Ontology 2016-11-01 30,793 758○ LGD Ontology 2014-09-09 24,530 1,200○ 日本語WordNet 2013-06-26 4,003,288 57,238○ 日本語Wikipediaオントロジー 2013-11-07 21,863,327 166,397× YAGO 3.0.2 1,001,461,792 5,130,031× OpenCyc 2012-05-10 5,783,451 233,644× UMBEL 1.5 392,728 33,686×

Slide 13

Slide 13 text

世界に関する 一般的知識 経験的知識 事実に関する知識 (Fact DB) 知識の分類 個別の事象,事柄に関して客観的に記述したもの 事象,事柄を抽象的に記述したもの,その関係を記述したもの 一部の間で合意されている知識や個人的知識

Slide 14

Slide 14 text

世界に関する 一般的知識 経験的知識 事実に関する知識 (Fact DB) Linked Geo Data (Open Street Map) DBpedia/Wikipedia Wikidata WordNet 既存知識の構造

Slide 15

Slide 15 text

世界に関する 一般的知識 経験的知識 事実に関する知識 (Fact DB) Linked Geo Data (Open Street Map) DBpedia/Wikipedia Wikidata WordNet つなぐための知識の追加 施設オントロジー サービスオントロジー 行動対象 オントロジー 施設データ 要求解釈知識 行動要求

Slide 16

Slide 16 text

施設オントロジー l LGDの施設関連クラスを主な対象 n LGDはOSMベースなのでクラスもインスタンスも豊富 n レジャーや食事中心 l 関係するDBpediaクラスへマッピング n LGDのインスタンスを補完 l 施設サービスを手動で定義 n サービス = ユーザが行える行動とその行動対象のペア lgdo:Zoo a owl:Class; servicevoc:dbpediaClass dbo:Zoo ; servicevoc:provideService [ servicevoc:hasService [ servicevoc:action action:払う; servicevoc:target target:文化施設入場料 ], [ servicevoc:action action:見る; servicevoc:target target:動物 ]] ; rdfs:subClassOf servicevoc:Facility .

Slide 17

Slide 17 text

行動対象オントロジー l サービス記述には行動対象の体系化が必要 l 施設におけるユーザ行動: 購買とそれ以外 n 購買: 家計調査収支項目分類よりオントロジー生成 n それ以外: WordNetを利用 target:文化施設入場料 a owl:Class; rdfs:label "文化施設入場料"; rdfs:subClassOf target:入場・観覧・ゲーム代 .

Slide 18

Slide 18 text

サービスオントロジー l 施設オントロジーのサービス部分を体系化 l サービスレベルで関連する施設クラスを探索可能 service:見る_動物_サービス a owl:Class; rdfs:label "見る_動物_サービス"; servicevoc:hasService [ servicevoc:action action:見る; servicevoc:target target:動物 ]; rdfs:subClassOf service:見る_サービス .

Slide 19

Slide 19 text

データセット 版 トリプル数 クラス数 施設オントロジー 2017-02-20 3,257 418 サービスオントロジー 2017-02-20 3,933 750 行動対象オントロジー 2017-02-20 2,030 622 行動オントロジー 2017-02-20 153 55 計 9,373 1,845 追加知識の統計

Slide 20

Slide 20 text

要求 適切な対象と 動詞の設定 適切なサービスと 施設クラスの決定 適切な施設 インスタンスの決定 WordNet 行動対象オントロジー サービスオントロジー 施設オントロジー Linked Geo Data DBpedia 処理の流れと対応するデータ

Slide 21

Slide 21 text

ライオンが見たいの処理例 ਪ࿦ ϓϩηε 3: ࢪઃ୳ࡧ ϓϩηε 2: ࢪઃΫϥε୳ࡧ ϓϩηε 1: ߦಈର৅୳ࡧ ߦಈݟΔ ߦಈର৅: ϥΠΦϯ ཁٻղऍ RDF Store ߦಈର৅Φϯτϩδʔ 8PSE/FU ࢪઃΦϯτϩδʔ -JOLFE(FP%BUB %#QFEJB+BQBOFTF ߦಈݟΔ ߦಈର৅: ಈ෺ Oͳ͍৔߹ ߦಈର৅Λ൚Խͯ͠΁ ࢪઃΫϥεMHEPಈ෺Ԃ 2ߦಈର৅͕͋Δ͔ 2ࢪઃ͕͋Δ͔ Oͳ͍৔߹΁ Oͳ͍৔߹΁ Zߦಈର৅͋Γ ZࢪઃΫϥε͋Γ Zࢪઃ͋Γ Ϣʔβཁٻ lϥΠΦϯ͕ݟ͍ͨz ग़ྗ lԸࣀ্໺ಈ෺Ԃz 2ࢪઃΫϥε͕͋Δ͔

Slide 22

Slide 22 text

system> ライオンを見たい。そのあと温泉に入りたい。 現在地はNIIです。 動物を見る場所を探します。 一番近くの場所を案内します。 距離は3.0625353kmです。 場所:恩賜上野動物園 緯度:35.7175 経度:139.771 URL :"http://ja.dbpedia.org/resource/恩賜上野動物園" 現在地は(35.7175 . 139.771)です。 温泉に入る場所を探します。 ……. 温泉に入る場所を探します。 一番近くの場所を案内します。 距離は3.0740614kmです。 場所:Inari-yu 緯度:35.6901 経度:139.766 URL :"http://linkedgeodata.org/triplify/node1744076702" system> 実行例

Slide 23

Slide 23 text

アルゴリズムの概要 Main loop sentence = ユーザより1行入力 morphs = sentence を 形態素解析(mecab+ipadic) interp = morphs を shift-reduce 法 により構文解析 aspect = 文末情報から文章のaspect(質問/要望/宣言)を決定 if 質問 then 質問に答える else if 要望 then 要望を満足する場所をSPARQL複合検索 else if 宣言 then 宣言を記憶 end loop SPARQL複合検索 subject,verb,object,to-place,from-place,tool = interp の格解析結果 loop verb と object によるSPARQL複合検索を実行 while 結果 = Nul do object を汎化 場所の緯度・経度から一番近い場所を求めて答えとする

Slide 24

Slide 24 text

複合SPARQL検索例 PREFIX geo: PREFIX virtrdf: PREFIX servicevoc: PREFIX action: PREFIX target: PREFIX wn20instances: PREFIX wn20schema: PREFIX wn30instances: PREFIX wnja11instances: PREFIX wn21schema: select distinct * where { GRAPH { ?lgd_class rdfs:subClassOf servicevoc:Facility ; servicevoc:provideService/servicevoc:hasService [ servicevoc:action action:見る ; servicevoc:target target:動物 ] . target:動物 servicevoc:wordnet ?wordnet } GRAPH { ?wordnet wn20schema:sense ?sense . } } LIMIT 10

Slide 25

Slide 25 text

まとめ l アプローチ n 既存の知識ベース・データベースを組み合わせて問題解決 l 課題 n そのままでは繋がらない l 課題解決 n 繋ぐ知識を作ることで可能になる l メリット n 大規模知識・データを利用できる n さらに知識を加えることも可能 u 専門的データベース、商用データベース l デメリット n 各知識・データの不完全性、非一貫性、誤謬をどう処理するか。 u オープン知識処理の課題 n 繋ぐ知識構築 u 新しい知識工学の必要性

Slide 26

Slide 26 text

Attribution l 上野動物園 by Wei-Te Wong l ライオン by 吉鷹 l ライオン岩 (Lion rock) by pakku l 銀座ライオン by Sharon Hahn Darlin l Zoo Free Icon by My Town Leisure