形式論理学に基づく演繹コーパスによる言語モデルに対する演繹推論能力の付与

Slide 1

Slide 1 text

形式論理学に基づく演繹コーパスによる言語モデルに対する演繹推論能力の付与森下皓文日立製作所先端AIイノベーションセンタメディア知能処理研究部 B1-2

Slide 2

Slide 2 text

Slide 3

Slide 3 text

© Hitachi, Ltd. 2022. All rights reserved. 3 要約  言語モデルに演繹推論を教えるため，多数の演繹推論事例からなるコーパスを生成．  先行研究と違い，形式論理学に基く根拠ある演繹規則群を採用．  実験により，演繹推論能力の強化に繋がることを確認．  特に，先行研究に比べ，演繹規則への汎化性能が高い． → 現実世界で必要な様々な演繹規則を表現できる可能性．  コーパス・モデル・コードを公開予定．  コーパスは先行研究より高難易度 → ベンチマークとしても有用．

Slide 4

Slide 4 text

Slide 5

Slide 5 text

© Hitachi, Ltd. 2022. All rights reserved. 5 背景  論理的な推論能力を持ったAIの実現は大きなゴール．  近年，様々なベンチマークが提案される[2,3,4,5]．  しかし，言語モデル(LM)は，論理推論が苦手(*)[6,7,8]．  例: LMは否定(negation)が苦手[]  LMはその能力をテキストコーパス中の多量の事例から獲得． → 論理推論能力の低さは，論理推論の事例が足りないからでは？論理推論の事例を大量に生成し， LMに学習させればよいのでは？ (*)..他のタスクに比べてまだ伸びしろが大きい

Slide 6

Slide 6 text

Slide 7

Slide 7 text

Slide 8

Slide 8 text

Slide 9

Slide 9 text

Slide 10

Slide 10 text

Slide 11

Slide 11 text

Slide 12

Slide 12 text

Slide 13

Slide 13 text

Slide 14

Slide 14 text

© Hitachi, Ltd. 2022. All rights reserved. 14  提案手法: Formal Logic Deduction (FLD)  公理系を用いた多段推論事例を自動生成するためのフレームワーク  先行研究  (RuleTaker) Transformers as soft reasoners over language  論証: 含意  Critical thinking for language models  論証: クリティカルシンキング公理系を用いた演繹推論事例の生成論証が恣意的→完全性を持たず多様な演繹推論を表せない (Peter Clark, Oyvind Tafjord, and Kyle Richardson) (Gregor Betz, Christian Voigt, and Kyle Richardson) 次ページ 𝑮𝑮(𝒃𝒃) ∀𝒙𝒙 𝑭𝑭 𝒙𝒙 → 𝑮𝑮(𝒙𝒙) 𝑭𝑭(𝒂𝒂) 𝓕𝓕 → 𝓖𝓖 ¬𝓖𝓖 → ¬𝓕𝓕

Slide 15

Slide 15 text

Slide 16

Slide 16 text

Slide 17

Slide 17 text

Slide 18

Slide 18 text

© Hitachi, Ltd. 2022. All rights reserved. 18 実験  問い: 「FLDコーパスでの学習は演繹推論能力の強化に繋がるか？」  手法: LMをFLDで学習→ベンチマークで演繹推論能力を計測  FLDでの学習: 30,000事例, 20,000ステップ  ベンチマーク  演繹コーパス (後述: FLD/RuleTakerを用いる)  EntailmentBank [14]: 人手で作られた演繹推論ベンチマーク  モデル  ステップワイズ証明器[8]: T5[13]を用いて証明を１ステップづつ生成する．詳細は予稿を参考のこと

Slide 19

Slide 19 text

Slide 20

Slide 20 text

Slide 21

Slide 21 text

Slide 22

Slide 22 text

Slide 23

Slide 23 text

© Hitachi, Ltd. 2022. All rights reserved. 23 今後の展望  演繹推論能力のどのような側面の強化に繋がっているか？  多様な論証の習得  ステップ数の多い演繹の実行  論理的言明を表す言語表現の理解  コーパスを他のタイプの論理推論へと拡張する  事実を自分で獲得する演繹推論  仮説推論  巨大言語モデル(LLM)に学習させたらスーパー・ロジカル・LLMにならないか？  CoTとの併用も

Slide 24

Slide 24 text

© Hitachi, Ltd. 2022. All rights reserved. 24 本日のまとめご静聴ありがとうございました．  言語モデルに演繹推論を教えるため，多数の演繹推論事例からなるコーパスを生成．  先行研究と違い，形式論理学に基く根拠ある演繹規則群を採用  実験により，演繹推論能力の強化に繋がることを確認．  特に，先行研究に比べ，演繹規則への汎化性能が高い． → 現実世界で必要な様々な演繹規則を表現できる可能性．  コーパス・モデル・コードを公開予定．  コーパスは先行研究より高難易度 → ベンチマークとしても有用．