CCGに基づいて論理構造を自動検証する日本語エディタ

Bbb37a2347eb8d2f5448213c74f9fa6f?s=47 denjiry
March 03, 2020

 CCGに基づいて論理構造を自動検証する日本語エディタ

Bbb37a2347eb8d2f5448213c74f9fa6f?s=128

denjiry

March 03, 2020
Tweet

Transcript

  1. 2.

    自己紹介 ➢ 名前 ⭗ 田尻健斗(@denjiry) ➢ 所属 ⭗ 筑波大学大学院システム情報工学研究科D3 ⭗

    全脳アーキテクチャ若手の会 ⭗ (株)科学計算総合研究所 ➢ 研究分野 ⭗ FPGA・SVM ➢ ライフワーク (今日の話) ⭗ 組合せ範疇文法・依存型意味論 2
  2. 18.

    組合せ範疇文法(Combinatory Categorial Grammer) ➢ 文法の理論のひとつ ➢ 辞書は{単語, 統語範疇, 論理式}の三つ組の集合 ➢

    単語毎の統語範疇へ、組合せ規則を適用して構文木を算出する ➢ 構文木と組合せ規則から、文の意味として論理式を算出する 18
  3. 26.

    ccg2lambda CCGに基づいて、文章を論理式に変換するソフトウェア ➢ CCGに基づくパーサーの出力から論理式を導く ➢ 定理証明支援系によって論理式同士の含意関係を出力 ➢ 実装 https://github.com/mynlp/ccg2lambda ➢

    含意関係認識のデータセットJSeMにおいて高い適合率を達成 26 “ccg2lambda: A Compositional Semantics System”, Martinez-Gomez,Pascual; Mineshima,Koji; Miyao,Yusuke;Bekki,Daisuke; (2016). In Proceedings of the 54st Annual Meeting of the Association for Computational Linguistics (ACL2016), System Demonstrations, pp.85-90, August 7-12, Berlin, Germany.
  4. 28.

    ccg2lambdaによる変換例 ➢ 例文 ⭗ 日本人研究者は誰もノーベル賞を受賞しなかった。 ➢ 出力 ⭗ all y.(exists

    x.(_日本人(x) & _者(x) & _研究(x) & (x = y)) -> -(_賞(_ノーベル) & True & exists e.(_受賞(e) & _する(e) & Past(e) & (Nom(e) = y) & (Acc(e) = _ノーベル)))) 28
  5. 36.

    元の文と論理式の直感的意味の剥離 論理式は読みづらく、日本語に再翻訳すると元の文とかなり異なる 例: 「ソクラテスは人間である。」 exists x, (and (_人間 x) (exists

    e, (and ((Nom e) = x) ((Nom e) = _ソ クラテス)))) 「あるxがあって、xは人間であり、かつxはソクラテスである。」 36 変換 翻訳
  6. 37.

    前提知識の不足 普段なにかの論理構造を考えるとき、無意識に前提知識を考慮してい る → なんらかの形で、前提知識を補完する必要がある 例: 「上手に日本語を話せる」 → 「話すのに時間がかからない」 •

    日本語は言語のひとつである • 任意の言語について、上手に話せるならば、話すスピードが速い • 話すスピードが速いと、話すのに時間がかからない 37
  7. 38.

    ccg2lambdaにエディタを実装 すぐに文を修正できて、かつ文の解析結果を表示させられるUI → 日本語のエディタ ➢ 係り受けの曖昧さ ⭗ ユーザーにアノテーションさせる or 候補から選ばせる

    ➢ 元の文と論理式の直感的意味の剥離 ⭗ 論理構造の可視化によって、論理式を見やすくする ➢ 前提知識の不足 ⭗ 解析結果によって指摘させ、手動で不足分の前提知識を追加 38
  8. 45.

    知識の利用と保存 ➢ 知識の利用・保存は、人類の活動において必要不可欠 ⭗ 研究・技術開発 ⭗ 司法・行政 ⭗ 専門技術を要する職業 ➢

    知識を利用・保存するのに必要なこと ⭗ 論理構造を正しく理解する ⭗ 正しい論理構造で文章を書く 45
  9. 48.

    実用的な「言葉の定義」の要件とは? 文章の解釈を揃えたい… → 「言葉の定義」をつくる 実用的な「言葉の定義」の要件とは? ➢ 解釈が一通りに定まる ⭗ 論理式など、形式的に定義されているもの ➢

    習得のしやすさ ⭗ 日本語など、広く普及していて誰でも使えるもの 両方をみたすような「言語の定義」は、定義することが難しい… 48
  10. 54.

    参考文献 ➢ Bekki,Daisuke; Miho,Sato; (2015).”Calculating Projections via Type Checking”, In

    Extended abstracts of the ESSLLI 2015 workshop TYTLES: Types Theory and Lexical Semantics, Robin Cooper, Christian Retore (eds.), Aug 2015, Barcelona, Spain. 2015. slide:https://www.slideshare.net/kaleidotheater/bekki-satotytles2015 ➢ Martinez-Gomez,Pascual; Mineshima,Koji; Miyao,Yusuke;Bekki,Daisuke; (2016). “ccg2lambda: A Compositional Semantics System”, In Proceedings of the 54st Annual Meeting of the Association for Computational Linguistics (ACL2016), System Demonstrations, pp.85-90, August 7-12, Berlin, Germany. ➢ 『日本語文法の形式理論』戸次 , 2010 ➢ Koji Mineshima, Ribeka Tanaka, Pascual Martínez-Gómez, Yusuke Miyao, Daisuke Bekki. “Building compositional semantics and higher-order inference system for wide-coverage Japanese CCG parsers”, Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing, pages 2236-2242, Austin, Texas, 1-5 November 2016. 54
  11. 62.

    直積型とタプル ➢ 直積型 A×Bはタプル(a, b)を表す型 ⭗ 論理式ではA∧Bに対応 ➢ タプルの中身にアクセスする演算子 ⭗

    π1: 1番目の要素をとりだす操作 π1 (a, b) → a ⭗ π2: 2番目の要素をとりだす操作 π2 (a, b) → b 62
  12. 66.

    文章とラムダ式による照応の表現 “A man entered. He whistled.” ➢ 「「xはman」かつ「xはenterした」」かつ「(π1 u)は口笛を吹いた」 ➢

    π1はpairの第1成分を取り出す演算子なのでπ1 u = x ➢ よって「「xはman」かつ「xはenterした」」かつ「xは口笛を吹いた」 66 π1 u “He”の正体は”A man” →照応が解決できた!
  13. 71.

    未指定項@の機能 ➢ 文脈にまつわる現象の表現 ⭗ 照応: 代名詞が別の部分を指し示す ⭗ 選択的制約: 述語が主語に課す意味的な制約 ⭗

    前提射影:ある文に暗黙的に含まれている意味 ⭗ コアージョン:文脈による意味の強制 ➢ これらの現象は、未指定項をつかうことで表現可能! ⭗ 未指定項@の型情報から自動証明によって解けるかも 71