Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Learning Semantic Textual Relatedness using Nat...

Atom
January 29, 2019
87

Learning Semantic Textual Relatedness using Natural Deduction Proofs

Presenting literature

Atom

January 29, 2019
Tweet

More Decks by Atom

Transcript

  1. 定理証明器Coqとccg2lambdaを用いる 1. 文A, B を論理式A’, B’ と変換し,′ ⇒ ′, ′

    ⇒ ′ を行う 2. 1.の証明に失敗したら, ′ ⇒ ¬′, ′ ⇒ ¬′ を行う 3. 2.の証明も失敗したら,後述する定理の生成を行う 4. 1.および2.を生成された公理の下で行う 5. 4.の証明すらも失敗したら,強制終了する 6. 5.までにおける推論の情報をCoqの出力結果から抽出 7 3.5 自然演繹による証明戦略
  2. 1. WordNetを用いて前提と結論中の述語間の意味的関係(例:形態 変化)をチェックし,マッチすれば確信度(共通する上位概念へ の最短経路の長さ)つきの公理を作成 2. WordNetに述語間の関係が存在しない場合は,Word2Vecの200次 元単語ベクトル(Google News Corpus (約30億語)で学習済み)

    を用いて前提と結論中の述語間の類似度を計算し,確信度(コサ イン類似度)つきの公理を作成する 確信度は0.0~1.0の値をとし,0.25未満は公理として採用しない 8 3.5 語彙知識を用いた公理の生成
  3. 4.1 データセット ・SemEval2014 Task1 SICK データセット 文の意味的類似度と含意関係認識の評価用データセット 類似度:1.0~5.0, 訓練データ:4,500件, 開発データ:500件

    テストデータ:4,927件 ・SemEval2012 MSR-videoデータセット 文の意味的類似度の評価用データセット 類似度:0.0~5.0, 開発データ, テストデータが750件ずつ 10
  4. 4.5 本研究の手法と深層学習による手法の比較 18 ・提案手法とMueller and Thyagarajan 2016 による予測類似度 との比較すると,4,927件中 2,666件は提案手法の方が正解スコ

    アに近い類似度を予測していた ・2,666件について,言語現象の傾向を分析(表12) ・提案手法が高精度で予測した文例数とテストデータ中の割合を 計算した結果を表13に示す.