Upgrade to Pro — share decks privately, control downloads, hide ads and more …

オープンなデータベースを利用した行動計画提案に関する研究 / Open Databases

fumi
May 23, 2017

オープンなデータベースを利用した行動計画提案に関する研究 / Open Databases

2017-05-23 第31回人工知能学会全国大会での内容

fumi

May 23, 2017
Tweet

More Decks by fumi

Other Decks in Technology

Transcript

  1. 常識推論の研究の現在 l 常識推論研究[Davis16] n Web Mining n 知識ベースアプローチ u フォーマルアプローチ

    l Situation calculus, QPT etc. u インフォーマルアプローチ l Frame, Scripts, Case-based u 大規模 l CYC n クラウドソーシング u CoceptNet, OpenMind l 80年代以降、実用的な意味ではどのアプローチも大きな進歩は見られない [Davis 16] Davis, E. and Marcus, G.: Commonsense reasoning and commonsense knowledge in artificial intelligence. Commun. ACM, Vol. 58, No. 9, pp.92-103. (2015) DOI:https://doi.org/10.1145/2701413.
  2. 本研究のアプローチ l 環境の変化 n 大規模知識ベース、データベースの存在 n 大規模computing n Semantic Web

    Technologies l 目的:既存の大規模知識ベース、データベースを利用して、 特定問題の解決システムを作る。 n 自動車の搭乗者の曖昧な要求を理解して、目的地やスケ ジュールを提案する。 l 手段:DBpedia, Linked Geo Data (Open Street Map), Wikidata, WordNetを合目的的に結合して利用する。
  3. 課題設定 l 入力: 目的地に関する要求 または 行動要求 n “ライオンが見たいな” n “温泉に入りたい”

    n “酒が飲みたい” l 出力: 具体的な場所(施設,観光地等)や地域 n “上野恩賜公園” n “大江戸温泉物語” n “神谷バー”
  4. 問題まとめ 1. ユーザ要求の曖昧性解消 n 要求対象の「ライオン」とは u 「動物」「店」「会社」など u 動物のライオン: 生きているのか剥製なのか

    2. 対象についての知識 n 「(動物の)ライオン」は「動物」であり「哺乳類」であり 3. 施設についての知識 n 「動物園」では「動物」を「見る」ことができる n デパート特設展示で剥製見るといった特殊条件は省略 4. 実施設の提示 n 「動物園」がどこにあるのか
  5. 本研究のアプローチ l 問題2-4について既存のオープンなデータベースや知識を組み 合わせることでどの程度解決可能か n 既知のつながりもあるが不十分 n 目的に応じてつなぐ知識を追加 データセット 版

    トリプル数 クラス数 利用状況 事実 DBpedia core+en 2016-04-01 1,131,657,931 - △ DBpedia Japanese 2017-02-20 113,299,748 - ◦ LinkedGeoData 2015-11-02 1,216,560,762 - ◦ 汎用オントロジー DBpedia Ontology 2016-11-01 30,793 758◦ LGD Ontology 2014-09-09 24,530 1,200◦ 日本語WordNet 2013-06-26 4,003,288 57,238◦ 日本語Wikipediaオントロジー 2013-11-07 21,863,327 166,397× YAGO 3.0.2 1,001,461,792 5,130,031× OpenCyc 2012-05-10 5,783,451 233,644× UMBEL 1.5 392,728 33,686×
  6. 世界に関する 一般的知識 経験的知識 事実に関する知識 (Fact DB) Linked Geo Data (Open

    Street Map) DBpedia/Wikipedia Wikidata WordNet つなぐための知識の追加 施設オントロジー サービスオントロジー 行動対象 オントロジー 施設データ 要求解釈知識 行動要求
  7. 施設オントロジー l LGDの施設関連クラスを主な対象 n LGDはOSMベースなのでクラスもインスタンスも豊富 n レジャーや食事中心 l 関係するDBpediaクラスへマッピング n

    LGDのインスタンスを補完 l 施設サービスを手動で定義 n サービス = ユーザが行える行動とその行動対象のペア lgdo:Zoo a owl:Class; servicevoc:dbpediaClass dbo:Zoo ; servicevoc:provideService [ servicevoc:hasService [ servicevoc:action action:払う; servicevoc:target target:文化施設入場料 ], [ servicevoc:action action:見る; servicevoc:target target:動物 ]] ; rdfs:subClassOf servicevoc:Facility .
  8. 行動対象オントロジー l サービス記述には行動対象の体系化が必要 l 施設におけるユーザ行動: 購買とそれ以外 n 購買: 家計調査収支項目分類よりオントロジー生成 n

    それ以外: WordNetを利用 target:文化施設入場料 a owl:Class; rdfs:label "文化施設入場料"; rdfs:subClassOf target:入場・観覧・ゲーム代 .
  9. データセット 版 トリプル数 クラス数 施設オントロジー 2017-02-20 3,257 418 サービスオントロジー 2017-02-20

    3,933 750 行動対象オントロジー 2017-02-20 2,030 622 行動オントロジー 2017-02-20 153 55 計 9,373 1,845 追加知識の統計
  10. ライオンが見たいの処理例 ਪ࿦ ϓϩηε 3: ࢪઃ୳ࡧ ϓϩηε 2: ࢪઃΫϥε୳ࡧ ϓϩηε 1:

    ߦಈର৅୳ࡧ ߦಈݟΔ ߦಈର৅: ϥΠΦϯ ཁٻղऍ RDF Store ߦಈର৅Φϯτϩδʔ 8PSE/FU ࢪઃΦϯτϩδʔ -JOLFE(FP%BUB %#QFEJB+BQBOFTF ߦಈݟΔ ߦಈର৅: ಈ෺ Oͳ͍৔߹ ߦಈର৅Λ൚Խͯ͠΁ ࢪઃΫϥεMHEPಈ෺Ԃ 2ߦಈର৅͕͋Δ͔ 2ࢪઃ͕͋Δ͔ Oͳ͍৔߹΁ Oͳ͍৔߹΁ Zߦಈର৅͋Γ ZࢪઃΫϥε͋Γ Zࢪઃ͋Γ Ϣʔβཁٻ lϥΠΦϯ͕ݟ͍ͨz ग़ྗ lԸࣀ্໺ಈ෺Ԃz 2ࢪઃΫϥε͕͋Δ͔
  11. system> ライオンを見たい。そのあと温泉に入りたい。 現在地はNIIです。 動物を見る場所を探します。 一番近くの場所を案内します。 距離は3.0625353kmです。 場所:恩賜上野動物園 緯度:35.7175 経度:139.771 URL

    :"http://ja.dbpedia.org/resource/恩賜上野動物園" 現在地は(35.7175 . 139.771)です。 温泉に入る場所を探します。 ……. 温泉に入る場所を探します。 一番近くの場所を案内します。 距離は3.0740614kmです。 場所:Inari-yu 緯度:35.6901 経度:139.766 URL :"http://linkedgeodata.org/triplify/node1744076702" system> 実行例
  12. アルゴリズムの概要 Main loop sentence = ユーザより1行入力 morphs = sentence を

    形態素解析(mecab+ipadic) interp = morphs を shift-reduce 法 により構文解析 aspect = 文末情報から文章のaspect(質問/要望/宣言)を決定 if 質問 then 質問に答える else if 要望 then 要望を満足する場所をSPARQL複合検索 else if 宣言 then 宣言を記憶 end loop SPARQL複合検索 subject,verb,object,to-place,from-place,tool = interp の格解析結果 loop verb と object によるSPARQL複合検索を実行 while 結果 = Nul do object を汎化 場所の緯度・経度から一番近い場所を求めて答えとする
  13. 複合SPARQL検索例 PREFIX geo: <http://www.w3.org/2003/01/geo/wgs84_pos#> PREFIX virtrdf: <http://www.openlinksw.com/schemas/virtrdf#> PREFIX servicevoc: <http://tp.lodac.nii.ac.jp/ns/service#>

    PREFIX action: <http://tp.lodac.nii.ac.jp/action/> PREFIX target: <http://tp.lodac.nii.ac.jp/target/> PREFIX wn20instances: <http://www.w3.org/2006/03/wn/wn20/instances/> PREFIX wn20schema: <http://www.w3.org/2006/03/wn/wn20/schema/> PREFIX wn30instances: <http://www.w3.org/2006/03/wn/wn30/instances/> PREFIX wnja11instances: <http://wordnet.jp/ja11/instances/> PREFIX wn21schema: <http://www.w3.org/2006/03/wn/wn21/schema/> select distinct * where { GRAPH <http://tp.lodac.nii.ac.jp> { ?lgd_class rdfs:subClassOf servicevoc:Facility ; servicevoc:provideService/servicevoc:hasService [ servicevoc:action action:見る ; servicevoc:target target:動物 ] . target:動物 servicevoc:wordnet ?wordnet } GRAPH <http://wordnet.jp> { ?wordnet wn20schema:sense ?sense . } } LIMIT 10
  14. まとめ l アプローチ n 既存の知識ベース・データベースを組み合わせて問題解決 l 課題 n そのままでは繋がらない l

    課題解決 n 繋ぐ知識を作ることで可能になる l メリット n 大規模知識・データを利用できる n さらに知識を加えることも可能 u 専門的データベース、商用データベース l デメリット n 各知識・データの不完全性、非一貫性、誤謬をどう処理するか。 u オープン知識処理の課題 n 繋ぐ知識構築 u 新しい知識工学の必要性
  15. Attribution l 上野動物園 by Wei-Te Wong l ライオン by 吉鷹

    l ライオン岩 (Lion rock) by pakku l 銀座ライオン by Sharon Hahn Darlin l Zoo Free Icon by My Town Leisure