Slide 1

Slide 1 text

デマを判定するための自動推論 筑波大学 システム情報工学研究科 D4 田尻

Slide 2

Slide 2 text

発表のモチベーション ➢ 個人では処理しきれない量の情報が流れてくる ➢ すべての情報のソースをしっかり確かめてると日が暮れる ➢ ファクトチェックは手間がかかるしめんどくさい →玉石混交な情報からなるべく自動でデマを弾きたい 2

Slide 3

Slide 3 text

アイディア ➢ その情報の結論に注目する ➢ デマの結論は、文中の前提に対して矛盾してそう ➢ もしくはより信頼できる情報源(文外の前提)に対して矛盾してそう → 「前提たちが結論を意味的に含んでない情報」はおそらくデマ 3

Slide 4

Slide 4 text

含意関係認識 ➢ 「前提Piとしたn文(n≧1)が、結論Cの1文の意味を含むかどうか 予測する」という問題 ➢ 論理構造の検証の一部分 例 (n = 2): P1: ソクラテスは人間である。 P2: 人間は死ぬ。 C: ソクラテスは死ぬ。   こたえ→Yes 4

Slide 5

Slide 5 text

今回のアプローチ 5 自動でデマを判定 論理式での 含意関係認識 よく見る End to End この手法 日本語を論理式に変換

Slide 6

Slide 6 text

定理証明支援系 ➢ 論理式の形式的な変形・証明を支援するソフトウェア ➢ 形式的な操作だけをおこなうので、極めて間違えづらい ➢ 変形をプログラムしたり、ある程度自動で証明させたりできる 6

Slide 7

Slide 7 text

定理証明支援系の例(Proof-General) 7 左:定理と証明 右:証明の途中経過

Slide 8

Slide 8 text

ここまで 8 自動でデマを判定 論理式での 含意関係認識 End to End この手法 日本語を論理式に変換 定理証明支援系 組合せ範疇文法

Slide 9

Slide 9 text

組合せ範疇文法(Combinatory Categorial Grammer) ➢ 形式意味論の文法の理論のひとつ。辞書と組合せ規則からなる ➢ 辞書は{単語, 統語範疇, 意味表示}の三つ組の集合 ➢ 単語毎の統語範疇へ、組合せ規則を適用して構文木を算出する ➢ 構文木と組合せ規則から、文の意味として論理式を算出する 9

Slide 10

Slide 10 text

組合せ範疇文法(CCG)の辞書 辞書は{単語, 統語範疇, 意味表示}の三つ組 ➢ 統語範疇: 「品詞」のCCGでの呼び方 ➢ 意味表示: 単語に与える意味。論理式っぽいもの 10

Slide 11

Slide 11 text

組合せ範疇文法(CCG)の組合せ規則 ➢ 「統語範疇:意味表示」を一つの単位として適用できる ➢ 2つの単語・文節を組合せ、1つにする 例: 11 規則名 組合せ後 組合せ前

Slide 12

Slide 12 text

ざっくり組合せ範疇文法(CCG) ➢ 自然言語の文法の理論 ➢ 自然言語→論理式という変換ができる ➢ 2つの構成要素からなる ⭗ 単語の辞書 ⭗ 組合せの規則 12

Slide 13

Slide 13 text

CCGで日本語→論理式の変換 1. まず辞書によって単語から統語範疇と論理式を追加する 2. 組合せ規則と統語範疇をつかって構文木をつくる 3. 構文木にしたがって論理式も組合せる 例:「小さな犬が吠えた」の構文木と論理式 13

Slide 14

Slide 14 text

ccg2lambda: A Compositional Semantics System CCGに基づいて、文章を論理式に変換するソフトウェア ➢ CCGに基づくパーサーの出力から論理式を導く ➢ 定理証明支援系によって論理式同士の含意関係を出力 ➢ 実装 https://github.com/mynlp/ccg2lambda ➢ 含意関係認識のデータセットJSeMにおいて高い適合率を達成 14 “ccg2lambda: A Compositional Semantics System”, Martinez-Gomez,Pascual; Mineshima,Koji; Miyao,Yusuke;Bekki,Daisuke; (2016). In Proceedings of the 54st Annual Meeting of the Association for Computational Linguistics (ACL2016), System Demonstrations, pp.85-90, August 7-12, Berlin, Germany.

Slide 15

Slide 15 text

ccg2lambdaによる変換例 ➢ 例文 ⭗ 日本人研究者は誰もノーベル賞を受賞しなかった。 ➢ 出力 ⭗ all y.(exists x.(_日本人(x) & _者(x) & _研究(x) & (x = y)) -> -(_賞(_ノーベル) & True & exists e.(_受賞(e) & _する(e) & Past(e) & (Nom(e) = y) & (Acc(e) = _ノーベル)))) 15

Slide 16

Slide 16 text

『「全員にPCR検査すべき」は適切ではない』 (中略) 新型コロナウイルス肺炎は、今のところ抗ウイルス薬など特定の治療薬 はなく、対症療法を行うだけであり、無症状や軽症例に特別な治療は必 要がない。 「検査を行っても治療法や対処法が変わらない場合、その検査は行う意 味がない」と考えるのが医学の原則なのだ。 16 “新型コロナで「情報汚染」されたメディアが報じない「 5つの真実」 ”https://gendai.ismedia.jp/articles/amp/70709?page=2 サンプル文章

Slide 17

Slide 17 text

サンプル文章の話の整理 帰結 ➢ 症状のある人全員にはPCR検査は必要ない 根拠 ➢ PCR検査によってCOVID-19を検出できる可能性がある ➢ COVID-19にかかっても、無症状・軽症例に特別な治療は必要ない ➢ 検査を行っても治療法が変わらない場合、その検査を行う必要はな い 「根拠たちが帰結を意味として含むか」を自動で判定したい 17

Slide 18

Slide 18 text

論理式に変換(手作業版) ➢ 症状のある人全員にはPCR検査は必要ない ⭗ ¬∀x. (症状のある人(x) → PCR検査が必要な人(x)) ➢ PCR検査によってCOVID-19を検出できる可能性がある ⭗ ギブアップ ➢ COVID-19にかかっても、無症状・軽症例に特別な治療は必要ない ⭗ ¬∀x. (COVID-19(x)∧無症状(x) → 特別な治療が必要な人(x)) ➢ 検査しても治療法が変わらない場合、その検査を行う必要はない ⭗ ギブアップ 18

Slide 19

Slide 19 text

論理式に変換(ccg2lambda版) ➢ 症状のある人全員にはPCR検査は必要ない ⭗ ∀ x.((_人(x)) -> (Content(x,\F1.∃ x.(_症状(x))) & -∃ z2.(_PCR(z2) & _検査(z2)))) ➢ PCR検査によってCOVID-19を検出できる可能性がある ⭗ ∃ x.(_性(x) & _可能(x) & Content(x,\K.∃ x.(_COVID(x) & _HYPHEN(x) & _19(x) & ∃ e.(K(\e2.(_ 検出(e2) & _できる(e2) & ∃ x.(_PCR(x) & _検査(x) & _によって(e2,x))),e) & (Acc(e) = x))))) ➢ COVID-19にかかっても、無症状・軽症例に特別な治療は必要ない ⭗ エラー ➢ 検査しても治療法が変わらない場合、その検査を行う必要はない ⭗ エラー 19

Slide 20

Slide 20 text

困難な点 ➢ 係り受けの曖昧さ ➢ 前提知識の不足 20

Slide 21

Slide 21 text

係り受けの曖昧さ 意味が通る構文木が、一つとは限らない → 係り受けの曖昧さによって、意味も曖昧になる場合がある 21 ((赤い魚)をくわえる)猫 (赤い(魚をくわえる猫))

Slide 22

Slide 22 text

前提知識の不足 普段我らが推論するときには、無意識に前提知識を考慮している → 無意識に使用している前提知識を補完する必要がある 例: 「その人は上手に日本語を話せる」 → 「話すのに時間がかからな い」 ● 日本語は言語のひとつである ● 任意の言語について、上手に話せるならば、話すスピードが速い ● 話すスピードが速いと、話すのに時間がかからない 22

Slide 23

Slide 23 text

おすすめ参考書 23

Slide 24

Slide 24 text

『日本語文法の形式理論』 [戸次 2010] 24 ➢ 日本語におけるCCGを網羅的に定義 ➢ 1章でいわゆる言語学とNLPの剥離、 及びその剥離を埋めるCCGの導入 ➢ 2章でCCGの説明 ➢ 3章で日本語におけるCCGの概観 ➢ 4章以降は個別の文法に対する網羅的 な分析

Slide 25

Slide 25 text

『現代意味論入門』[吉本・中村 2016] 25 ➢ 形式意味論の幅広い分野をカバーする ➢ 数理論理学の基礎 ➢ 句構造文法、CCGなどの文法理論 ➢ 可能世界意味論 ➢ モンタギュー意味論 ➢ 動的意味論など、1990年代までの比較的 新しめの話

Slide 26

Slide 26 text

まとめ ➢ 玉石混交な情報からなるべく自動でデマを弾きたい ➢ デマであれば論理的におかしい部分があるはず ➢ ccg2lambdaでやってみた間に合いませんでした… ⭗ 主に困難な点(前述)のせい 26

Slide 27

Slide 27 text

参考文献 ➢ Bekki,Daisuke; Miho,Sato; (2015).”Calculating Projections via Type Checking”, In Extended abstracts of the ESSLLI 2015 workshop TYTLES: Types Theory and Lexical Semantics, Robin Cooper, Christian Retore (eds.), Aug 2015, Barcelona, Spain. 2015. slide:https://www.slideshare.net/kaleidotheater/bekki-satotytles2015 ➢ Martinez-Gomez,Pascual; Mineshima,Koji; Miyao,Yusuke;Bekki,Daisuke; (2016). “ccg2lambda: A Compositional Semantics System”, In Proceedings of the 54st Annual Meeting of the Association for Computational Linguistics (ACL2016), System Demonstrations, pp.85-90, August 7-12, Berlin, Germany. ➢ 『日本語文法の形式理論』戸次 , 2010 ➢ Koji Mineshima, Ribeka Tanaka, Pascual Martínez-Gómez, Yusuke Miyao, Daisuke Bekki. “Building compositional semantics and higher-order inference system for wide-coverage Japanese CCG parsers”, Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing, pages 2236-2242, Austin, Texas, 1-5 November 2016. 27