Upgrade to Pro — share decks privately, control downloads, hide ads and more …

CCGに基づいて論理構造を自動検証する日本語エディタ

Sponsored · SiteGround - Reliable hosting with speed, security, and support you can count on.
Avatar for denjiry denjiry
March 03, 2020

 CCGに基づいて論理構造を自動検証する日本語エディタ

Avatar for denjiry

denjiry

March 03, 2020
Tweet

More Decks by denjiry

Other Decks in Programming

Transcript

  1. 自己紹介 ➢ 名前 ⭗ 田尻健斗(@denjiry) ➢ 所属 ⭗ 筑波大学大学院システム情報工学研究科D3 ⭗

    全脳アーキテクチャ若手の会 ⭗ (株)科学計算総合研究所 ➢ 研究分野 ⭗ FPGA・SVM ➢ ライフワーク (今日の話) ⭗ 組合せ範疇文法・依存型意味論 2
  2. 組合せ範疇文法(Combinatory Categorial Grammer) ➢ 文法の理論のひとつ ➢ 辞書は{単語, 統語範疇, 論理式}の三つ組の集合 ➢

    単語毎の統語範疇へ、組合せ規則を適用して構文木を算出する ➢ 構文木と組合せ規則から、文の意味として論理式を算出する 18
  3. ccg2lambda CCGに基づいて、文章を論理式に変換するソフトウェア ➢ CCGに基づくパーサーの出力から論理式を導く ➢ 定理証明支援系によって論理式同士の含意関係を出力 ➢ 実装 https://github.com/mynlp/ccg2lambda ➢

    含意関係認識のデータセットJSeMにおいて高い適合率を達成 26 “ccg2lambda: A Compositional Semantics System”, Martinez-Gomez,Pascual; Mineshima,Koji; Miyao,Yusuke;Bekki,Daisuke; (2016). In Proceedings of the 54st Annual Meeting of the Association for Computational Linguistics (ACL2016), System Demonstrations, pp.85-90, August 7-12, Berlin, Germany.
  4. ccg2lambdaによる変換例 ➢ 例文 ⭗ 日本人研究者は誰もノーベル賞を受賞しなかった。 ➢ 出力 ⭗ all y.(exists

    x.(_日本人(x) & _者(x) & _研究(x) & (x = y)) -> -(_賞(_ノーベル) & True & exists e.(_受賞(e) & _する(e) & Past(e) & (Nom(e) = y) & (Acc(e) = _ノーベル)))) 28
  5. 元の文と論理式の直感的意味の剥離 論理式は読みづらく、日本語に再翻訳すると元の文とかなり異なる 例: 「ソクラテスは人間である。」 exists x, (and (_人間 x) (exists

    e, (and ((Nom e) = x) ((Nom e) = _ソ クラテス)))) 「あるxがあって、xは人間であり、かつxはソクラテスである。」 36 変換 翻訳
  6. 前提知識の不足 普段なにかの論理構造を考えるとき、無意識に前提知識を考慮してい る → なんらかの形で、前提知識を補完する必要がある 例: 「上手に日本語を話せる」 → 「話すのに時間がかからない」 •

    日本語は言語のひとつである • 任意の言語について、上手に話せるならば、話すスピードが速い • 話すスピードが速いと、話すのに時間がかからない 37
  7. ccg2lambdaにエディタを実装 すぐに文を修正できて、かつ文の解析結果を表示させられるUI → 日本語のエディタ ➢ 係り受けの曖昧さ ⭗ ユーザーにアノテーションさせる or 候補から選ばせる

    ➢ 元の文と論理式の直感的意味の剥離 ⭗ 論理構造の可視化によって、論理式を見やすくする ➢ 前提知識の不足 ⭗ 解析結果によって指摘させ、手動で不足分の前提知識を追加 38
  8. 知識の利用と保存 ➢ 知識の利用・保存は、人類の活動において必要不可欠 ⭗ 研究・技術開発 ⭗ 司法・行政 ⭗ 専門技術を要する職業 ➢

    知識を利用・保存するのに必要なこと ⭗ 論理構造を正しく理解する ⭗ 正しい論理構造で文章を書く 45
  9. 実用的な「言葉の定義」の要件とは? 文章の解釈を揃えたい… → 「言葉の定義」をつくる 実用的な「言葉の定義」の要件とは? ➢ 解釈が一通りに定まる ⭗ 論理式など、形式的に定義されているもの ➢

    習得のしやすさ ⭗ 日本語など、広く普及していて誰でも使えるもの 両方をみたすような「言語の定義」は、定義することが難しい… 48
  10. 参考文献 ➢ Bekki,Daisuke; Miho,Sato; (2015).”Calculating Projections via Type Checking”, In

    Extended abstracts of the ESSLLI 2015 workshop TYTLES: Types Theory and Lexical Semantics, Robin Cooper, Christian Retore (eds.), Aug 2015, Barcelona, Spain. 2015. slide:https://www.slideshare.net/kaleidotheater/bekki-satotytles2015 ➢ Martinez-Gomez,Pascual; Mineshima,Koji; Miyao,Yusuke;Bekki,Daisuke; (2016). “ccg2lambda: A Compositional Semantics System”, In Proceedings of the 54st Annual Meeting of the Association for Computational Linguistics (ACL2016), System Demonstrations, pp.85-90, August 7-12, Berlin, Germany. ➢ 『日本語文法の形式理論』戸次 , 2010 ➢ Koji Mineshima, Ribeka Tanaka, Pascual Martínez-Gómez, Yusuke Miyao, Daisuke Bekki. “Building compositional semantics and higher-order inference system for wide-coverage Japanese CCG parsers”, Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing, pages 2236-2242, Austin, Texas, 1-5 November 2016. 54
  11. 直積型とタプル ➢ 直積型 A×Bはタプル(a, b)を表す型 ⭗ 論理式ではA∧Bに対応 ➢ タプルの中身にアクセスする演算子 ⭗

    π1: 1番目の要素をとりだす操作 π1 (a, b) → a ⭗ π2: 2番目の要素をとりだす操作 π2 (a, b) → b 62
  12. 文章とラムダ式による照応の表現 “A man entered. He whistled.” ➢ 「「xはman」かつ「xはenterした」」かつ「(π1 u)は口笛を吹いた」 ➢

    π1はpairの第1成分を取り出す演算子なのでπ1 u = x ➢ よって「「xはman」かつ「xはenterした」」かつ「xは口笛を吹いた」 66 π1 u “He”の正体は”A man” →照応が解決できた!
  13. 未指定項@の機能 ➢ 文脈にまつわる現象の表現 ⭗ 照応: 代名詞が別の部分を指し示す ⭗ 選択的制約: 述語が主語に課す意味的な制約 ⭗

    前提射影:ある文に暗黙的に含まれている意味 ⭗ コアージョン:文脈による意味の強制 ➢ これらの現象は、未指定項をつかうことで表現可能! ⭗ 未指定項@の型情報から自動証明によって解けるかも 71