$30 off During Our Annual Pro Sale. View Details »

オープンなデータベースを利用した行動計画提案に関する研究 / Open Databases

fumi
May 23, 2017

オープンなデータベースを利用した行動計画提案に関する研究 / Open Databases

2017-05-23 第31回人工知能学会全国大会での内容

fumi

May 23, 2017
Tweet

More Decks by fumi

Other Decks in Technology

Transcript

  1. オープンなデータベースを利用した行動計画提案に関する研究
    加藤 文彦(国立情報学研究所)
    小出 誠二(国立情報学研究所)
    武田 英明(国立情報学研究所,総合研究大学院大学)
    落合 勇太(トヨタ自動車株式会社)
    上田 健揮(トヨタ自動車株式会社)

    View Slide

  2. 常識推論の研究の現在
    l 常識推論研究[Davis16]
    n Web Mining
    n 知識ベースアプローチ
    u フォーマルアプローチ
    l Situation calculus, QPT etc.
    u インフォーマルアプローチ
    l Frame, Scripts, Case-based
    u 大規模
    l CYC
    n クラウドソーシング
    u CoceptNet, OpenMind
    l 80年代以降、実用的な意味ではどのアプローチも大きな進歩は見られない
    [Davis 16] Davis, E. and Marcus, G.: Commonsense reasoning and commonsense knowledge in artificial intelligence.
    Commun. ACM, Vol. 58, No. 9, pp.92-103. (2015) DOI:https://doi.org/10.1145/2701413.

    View Slide

  3. 本研究のアプローチ
    l 環境の変化
    n 大規模知識ベース、データベースの存在
    n 大規模computing
    n Semantic Web Technologies
    l 目的:既存の大規模知識ベース、データベースを利用して、
    特定問題の解決システムを作る。
    n 自動車の搭乗者の曖昧な要求を理解して、目的地やスケ
    ジュールを提案する。
    l 手段:DBpedia, Linked Geo Data (Open Street Map), Wikidata,
    WordNetを合目的的に結合して利用する。

    View Slide

  4. 課題設定
    l 入力: 目的地に関する要求 または 行動要求
    n “ライオンが見たいな”
    n “温泉に入りたい”
    n “酒が飲みたい”
    l 出力: 具体的な場所(施設,観光地等)や地域
    n “上野恩賜公園”
    n “大江戸温泉物語”
    n “神谷バー”

    View Slide

  5. ユーザ要求: “ライオンが⾒たい”

    View Slide

  6. ユーザ要求: “ライオンが⾒たい” 提案: “恩賜上野動物園”

    View Slide

  7. ユーザ要求: “ライオンが⾒たい” 提案: “恩賜上野動物園”
    この間にはギャップがある

    View Slide

  8. View Slide

  9. View Slide

  10. “動物のライオンを見たい”としたときに,
    人は動物園や類似施設と限定して探す
    この限定はどこから来るのか?

    View Slide

  11. 問題まとめ
    1. ユーザ要求の曖昧性解消
    n 要求対象の「ライオン」とは
    u 「動物」「店」「会社」など
    u 動物のライオン: 生きているのか剥製なのか
    2. 対象についての知識
    n 「(動物の)ライオン」は「動物」であり「哺乳類」であり
    3. 施設についての知識
    n 「動物園」では「動物」を「見る」ことができる
    n デパート特設展示で剥製見るといった特殊条件は省略
    4. 実施設の提示
    n 「動物園」がどこにあるのか

    View Slide

  12. 本研究のアプローチ
    l 問題2-4について既存のオープンなデータベースや知識を組み
    合わせることでどの程度解決可能か
    n 既知のつながりもあるが不十分
    n 目的に応じてつなぐ知識を追加
    データセット 版 トリプル数 クラス数 利用状況
    事実
    DBpedia core+en 2016-04-01 1,131,657,931 - △
    DBpedia Japanese 2017-02-20 113,299,748 - ○
    LinkedGeoData 2015-11-02 1,216,560,762 - ○
    汎用オントロジー
    DBpedia Ontology 2016-11-01 30,793 758○
    LGD Ontology 2014-09-09 24,530 1,200○
    日本語WordNet 2013-06-26 4,003,288 57,238○
    日本語Wikipediaオントロジー 2013-11-07 21,863,327 166,397×
    YAGO 3.0.2 1,001,461,792 5,130,031×
    OpenCyc 2012-05-10 5,783,451 233,644×
    UMBEL 1.5 392,728 33,686×

    View Slide

  13. 世界に関する
    一般的知識
    経験的知識
    事実に関する知識
    (Fact DB)
    知識の分類
    個別の事象,事柄に関して客観的に記述したもの
    事象,事柄を抽象的に記述したもの,その関係を記述したもの
    一部の間で合意されている知識や個人的知識

    View Slide

  14. 世界に関する
    一般的知識
    経験的知識
    事実に関する知識
    (Fact DB)
    Linked Geo Data
    (Open Street Map)
    DBpedia/Wikipedia
    Wikidata
    WordNet
    既存知識の構造

    View Slide

  15. 世界に関する
    一般的知識
    経験的知識
    事実に関する知識
    (Fact DB)
    Linked Geo Data
    (Open Street Map)
    DBpedia/Wikipedia
    Wikidata
    WordNet
    つなぐための知識の追加
    施設オントロジー
    サービスオントロジー
    行動対象
    オントロジー
    施設データ
    要求解釈知識
    行動要求

    View Slide

  16. 施設オントロジー
    l LGDの施設関連クラスを主な対象
    n LGDはOSMベースなのでクラスもインスタンスも豊富
    n レジャーや食事中心
    l 関係するDBpediaクラスへマッピング
    n LGDのインスタンスを補完
    l 施設サービスを手動で定義
    n サービス = ユーザが行える行動とその行動対象のペア
    lgdo:Zoo a owl:Class;
    servicevoc:dbpediaClass dbo:Zoo ;
    servicevoc:provideService
    [ servicevoc:hasService [
    servicevoc:action action:払う;
    servicevoc:target target:文化施設入場料 ], [
    servicevoc:action action:見る;
    servicevoc:target target:動物 ]] ;
    rdfs:subClassOf servicevoc:Facility .

    View Slide

  17. 行動対象オントロジー
    l サービス記述には行動対象の体系化が必要
    l 施設におけるユーザ行動: 購買とそれ以外
    n 購買: 家計調査収支項目分類よりオントロジー生成
    n それ以外: WordNetを利用
    target:文化施設入場料 a owl:Class;
    rdfs:label "文化施設入場料";
    rdfs:subClassOf target:入場・観覧・ゲーム代 .

    View Slide

  18. サービスオントロジー
    l 施設オントロジーのサービス部分を体系化
    l サービスレベルで関連する施設クラスを探索可能
    service:見る_動物_サービス a owl:Class;
    rdfs:label "見る_動物_サービス";
    servicevoc:hasService [
    servicevoc:action action:見る;
    servicevoc:target target:動物
    ];
    rdfs:subClassOf service:見る_サービス .

    View Slide

  19. データセット 版 トリプル数 クラス数
    施設オントロジー 2017-02-20 3,257 418
    サービスオントロジー 2017-02-20 3,933 750
    行動対象オントロジー 2017-02-20 2,030 622
    行動オントロジー 2017-02-20 153 55
    計 9,373 1,845
    追加知識の統計

    View Slide

  20. 要求
    適切な対象と
    動詞の設定
    適切なサービスと
    施設クラスの決定
    適切な施設
    インスタンスの決定
    WordNet
    行動対象オントロジー
    サービスオントロジー
    施設オントロジー
    Linked Geo Data
    DBpedia
    処理の流れと対応するデータ

    View Slide

  21. ライオンが見たいの処理例
    ਪ࿦
    ϓϩηε 3: ࢪઃ୳ࡧ
    ϓϩηε 2: ࢪઃΫϥε୳ࡧ
    ϓϩηε 1: ߦಈର৅୳ࡧ
    ߦಈݟΔ
    ߦಈର৅: ϥΠΦϯ
    ཁٻղऍ
    RDF Store
    ߦಈର৅Φϯτϩδʔ
    8PSE/FU
    ࢪઃΦϯτϩδʔ
    -JOLFE(FP%BUB
    %#QFEJB+BQBOFTF
    ߦಈݟΔ
    ߦಈର৅: ಈ෺
    Oͳ͍৔߹
    ߦಈର৅Λ൚Խͯ͠΁
    ࢪઃΫϥεMHEPಈ෺Ԃ
    2ߦಈର৅͕͋Δ͔
    2ࢪઃ͕͋Δ͔
    Oͳ͍৔߹΁
    Oͳ͍৔߹΁
    Zߦಈର৅͋Γ
    ZࢪઃΫϥε͋Γ
    Zࢪઃ͋Γ
    Ϣʔβཁٻ
    lϥΠΦϯ͕ݟ͍ͨz
    ग़ྗ
    lԸࣀ্໺ಈ෺Ԃz
    2ࢪઃΫϥε͕͋Δ͔

    View Slide

  22. system> ライオンを見たい。そのあと温泉に入りたい。
    現在地はNIIです。
    動物を見る場所を探します。
    一番近くの場所を案内します。
    距離は3.0625353kmです。
    場所:恩賜上野動物園
    緯度:35.7175
    経度:139.771
    URL :"http://ja.dbpedia.org/resource/恩賜上野動物園"
    現在地は(35.7175 . 139.771)です。
    温泉に入る場所を探します。
    …….
    温泉に入る場所を探します。
    一番近くの場所を案内します。
    距離は3.0740614kmです。
    場所:Inari-yu
    緯度:35.6901
    経度:139.766
    URL :"http://linkedgeodata.org/triplify/node1744076702"
    system>
    実行例

    View Slide

  23. アルゴリズムの概要
    Main
    loop sentence = ユーザより1行入力
    morphs = sentence を 形態素解析(mecab+ipadic)
    interp = morphs を shift-reduce 法 により構文解析
    aspect = 文末情報から文章のaspect(質問/要望/宣言)を決定
    if 質問 then 質問に答える
    else if 要望 then 要望を満足する場所をSPARQL複合検索
    else if 宣言 then 宣言を記憶
    end loop
    SPARQL複合検索
    subject,verb,object,to-place,from-place,tool
    = interp の格解析結果
    loop verb と object によるSPARQL複合検索を実行
    while 結果 = Nul
    do object を汎化
    場所の緯度・経度から一番近い場所を求めて答えとする

    View Slide

  24. 複合SPARQL検索例
    PREFIX geo:
    PREFIX virtrdf:
    PREFIX servicevoc:
    PREFIX action:
    PREFIX target:
    PREFIX wn20instances:
    PREFIX wn20schema:
    PREFIX wn30instances:
    PREFIX wnja11instances:
    PREFIX wn21schema:
    select distinct *
    where {
    GRAPH {
    ?lgd_class rdfs:subClassOf servicevoc:Facility ;
    servicevoc:provideService/servicevoc:hasService [
    servicevoc:action action:見る ;
    servicevoc:target target:動物
    ] .
    target:動物 servicevoc:wordnet ?wordnet
    }
    GRAPH {
    ?wordnet wn20schema:sense ?sense .
    }
    }
    LIMIT 10

    View Slide

  25. まとめ
    l アプローチ
    n 既存の知識ベース・データベースを組み合わせて問題解決
    l 課題
    n そのままでは繋がらない
    l 課題解決
    n 繋ぐ知識を作ることで可能になる
    l メリット
    n 大規模知識・データを利用できる
    n さらに知識を加えることも可能
    u 専門的データベース、商用データベース
    l デメリット
    n 各知識・データの不完全性、非一貫性、誤謬をどう処理するか。
    u オープン知識処理の課題
    n 繋ぐ知識構築
    u 新しい知識工学の必要性

    View Slide

  26. Attribution
    l 上野動物園 by Wei-Te Wong
    l ライオン by 吉鷹
    l ライオン岩 (Lion rock) by pakku
    l 銀座ライオン by Sharon Hahn Darlin
    l Zoo Free Icon by My Town Leisure

    View Slide