人工演繹推論コーパスによる学習は言語モデルをどのように強化するか？

人工演繹推論コーパスによる学習は言語モデルをどのように強化するか？森下皓文日立製作所先端AIイノベーションセンタメディア知能処理研究部

© Hitachi, Ltd. 2023. All rights reserved. 要約 1. 要約
2. 背景 3. 前提知識① - 演繹推論とは？ 4. 前提知識② - 完全性定理 5. 公理系による多段推論事例の自動生成フレームワーク 6. 実験 7. まとめ

© Hitachi, Ltd. 2023. All rights reserved. 3 要約 
言語モデル(LM)に演繹推論を学習させるため，演繹推論コーパスを自動生成するフレームワークを提案．  実験により: 1. LM(GPT-4/T5)の演繹推論能力を評価． 2. 提案コーパスでの学習による演繹推論能力の向上を確認． 3. LMの演繹推論能力で不十分な側面を解析 → 方向性を議論  コーパス・モデル・コードを公開  https://github.com/hitachi-nlp/FLD

© Hitachi, Ltd. 2023. All rights reserved. 5 背景 
豊富な知識と高い推論能力を備えた=考える機械[1]の実現は大きなゴール  言語モデル(LM)は知識は豊富 → 論理推論は苦手？  例: LMは否定(negation)が苦手，  Can Large Language Models Reason? https://aiguide.substack.com/p/can-large-language-models-reason  論理推論をどのように学習させればよいか？  「豊富な知識」はテキストコーパス中の大量の実例から学習．

豊富な知識と高い推論能力を備えた=考える機械[1]の実現は大きなゴール  言語モデル(LM)は知識は豊富 → 論理推論は苦手？  例: LMは否定(negation)が苦手，  Can Large Language Models Reason? https://aiguide.substack.com/p/can-large-language-models-reason  論理推論をどのように学習させればよいか？  「豊富な知識」はテキストコーパス中の大量の実例から学習．論理推論の実例を大量に学習させればよい？

© Hitachi, Ltd. 2023. All rights reserved. 前提知識① - 演繹推論とは？-
1. 要約 2. 背景 3. 前提知識① - 演繹推論とは？ 4. 前提知識② - 完全性定理 5. 公理系による多段推論事例の自動生成フレームワーク 6. 実験 7. まとめ

© Hitachi, Ltd. 2023. All rights reserved. 8 妥当な推論ステップ -
その１論理的に出てくる

© Hitachi, Ltd. 2023. All rights reserved. 9 妥当な推論ステップ -
その２論理的に出てくる

© Hitachi, Ltd. 2023. All rights reserved. 10 演繹推論のステップとは何か？ 
演繹推論ステップ=論証は記号で表現可能  論証の妥当性は，前提や結論の内容の妥当性には依存しない．もし仮に前提が成立していれば，結論が論理的に出てくるかのみで判定される．

© Hitachi, Ltd. 2023. All rights reserved. 11 論理 ≠
知識地球には四季が埋めて!

知識地球には四季がある我々の世界で成り立っていると知っているから埋まる

知識地球には四季がある  知識 : 前提や結論の内容自体の妥当性=この世界で成り立っているか(真=1か偽=0か) →NLPにおける世界知識・常識知識我々の世界で成り立っていると知っているから埋まる

知識地球には四季がある  知識 : 前提や結論の内容自体の妥当性=この世界で成り立っているか(真=1か偽=0か)  論理 : もし仮に前提が成立したら結論が論理的に出てくるか →形式論理の統語論 →NLPにおける世界知識・常識知識我々の世界で成り立っていると知っているから埋まる

知識地球には四季がある我々の世界で成り立っていると知っているから埋まる知識と論理は別モノ!  知識 : 前提や結論の内容自体の妥当性=この世界で成り立っているか(真=1か偽=0か)  論理 : もし仮に前提が成立したら結論が論理的に出てくるか →形式論理の統語論 →NLPにおける世界知識・常識知識

豊富な知識と高い推論能力を備えた=考える機械[1]の実現は大きなゴール  言語モデル(LM)は知識は豊富 → 論理推論は苦手？  例: LMは否定(negation)が苦手等[6-8]．  Can Large Language Models Reason? https://aiguide.substack.com/p/can-large-language-models-reason  論理推論をどのように学習させる？ 1. 豊富な知識 = テキストコーパス中の大量の実例から学習． 2. 論理推論能力 = 大量の論理推論の実例から学習させればよい？非自明な問い

© Hitachi, Ltd. 2023. All rights reserved. 前提知識② - 一階述語論理の完全性
- 1. 要約 2. 背景 3. 前提知識① - 演繹推論とは？ 4. 前提知識② - 完全性定理 5. 公理系による多段推論事例の自動生成フレームワーク 6. 実験 7. まとめ

© Hitachi, Ltd. 2023. All rights reserved. 18 様々な論証前提・結論に現れうる論理式は多様なパターン
→ 論証は多様なパターンが考えられる (三段論法)

© Hitachi, Ltd. 2023. All rights reserved. 20 完全性一階述語論理の完全性定理
[Gödel, 1929] 1. 全ての妥当な(*)論証は，公理系による多段推論よって導出できる． 2. 公理系による多段推論によって導出された論証は全て妥当である． (*)..前提が全て真 (=1) ならば結論も必ず真 (=1) となるような論証のこと原子的な論証の集合 (次ページ)

© Hitachi, Ltd. 2023. All rights reserved. 23 言語モデルに何を学ばせる？問い:
論証は多様なパターン．言語モデルにどれを学ばせようか？

© Hitachi, Ltd. 2023. All rights reserved. 24 言語モデルに何を学ばせる？ [完全性]
公理系による多段推論は任意の論証を表すことができる問い: 論証は多様なパターン．言語モデルにどれを学ばせようか？

© Hitachi, Ltd. 2023. All rights reserved. 25 言語モデルに何を学ばせる？公理系による多段推論を学ばせたい...!
[完全性] 公理系による多段推論は任意の論証を表すことができる問い: 論証は多様なパターン．言語モデルにどれを学ばせようか？

© Hitachi, Ltd. 2023. All rights reserved. 26 言語モデルに何を学ばせる？公理系による多段推論を学ばせたい...!
[完全性] 公理系による多段推論は任意の論証を表すことができる「公理系による多段推論の実例」を大量に用意して学習させればよい!! 問い: 論証は多様なパターン．言語モデルにどれを学ばせようか？

© Hitachi, Ltd. 2023. All rights reserved. 31  (RuleTaker)
Transformers as soft reasoners over language  論証 = 含意  Critical thinking for language models  論証 =クリティカルシンキング先行研究 - 演繹推論実例の生成 (Peter Clark, Oyvind Tafjord, and Kyle Richardson) (Gregor Betz, Christian Voigt, and Kyle Richardson) 𝑮𝑮(𝒂𝒂) ∀𝒙𝒙 𝑭𝑭 𝒙𝒙 → 𝑮𝑮(𝒙𝒙) 𝑭𝑭(𝒂𝒂) 𝓕𝓕 → 𝓖𝓖 ¬𝓖𝓖 → ¬𝓕𝓕  論証が恣意的(=公理系ではないので完全性を持たず) → 多様な演繹推論実例を生成できない → 言語モデルに多様な演繹推論を教えられない  実例に関する様々な条件を設定できない → 解析研究ができない．問題点

© Hitachi, Ltd. 2023. All rights reserved. 34 言語モデルの演繹推論能力を評価 FLD
: 証明ステップ数=1~3 FLD★ : 証明ステップ数=1~8 言語モデル(T5/GPT-4)の，提案コーパスFLDでの性能(証明正解率[21])を評価小さい言語モデル(0.2Bパラメタ)． fine-tuningした後に評価． (30kデータ, 20k ステップ)．例のでかいやつ(105B パラメタ?) 20-shotで評価．言語モデルの演繹推論能力はまだ十分ではない．

© Hitachi, Ltd. 2023. All rights reserved. 36 演繹コーパスでの学習の効果ベンチマーク=
自動生成された演繹コーパス学習コーパスベンチマークベンチマーク=人手作製コーパス (EntailmentBank[14]) 学習コーパス提案コーパスでの学習は演繹推論能力の向上に繋がる言語モデルT5(演繹コーパスでの学習あり/なし)を論理推論ベンチマークで評価ベンチマーク学習無し先行コーパスで学習提案コーパスで学習

© Hitachi, Ltd. 2023. All rights reserved. 38 不十分な側面は何？性能×→LMは元々「複雑な論理式を理解する能力」を持たず
言語モデルに足りない側面が明らかになる → 今後の方向性を議論できる作製したコーパス群学習コーパス評価コーパス「論理式の複雑さ」に関する調査問題設定が異なる様々なコーパスを作製 → 言語モデルT5の転移性能を測り「差分を埋められるか」を特定「言語的多様性」に関する調査性能◦→LMは元々「多様な言語表現」を理解する能力を保持学習コーパス評価コーパス転移評価単純: 𝐴𝐴 → 𝐵𝐵 複雑: ¬ 𝐴𝐴 ∧ ¬𝐵𝐵 → ¬¬𝐶𝐶 単純複雑

© Hitachi, Ltd. 2023. All rights reserved. 39 各側面における結果と，今後の方向性側面
側面の説明言語モデルのみで十分か？今後の方向性複雑な論理式の理解例: 単純: 𝐴𝐴 → 𝐵𝐵 複雑: ¬ 𝐴𝐴 ∧ ¬𝐵𝐵 → ¬¬𝐶𝐶 × (事前学習コーパスに明示的な教示なし) • 演繹コーパスにもっと複雑な論理式を含める． • 学習論的アプローチ[Pröllochs 19, Hosseini 21] 多様な言語表現の理解例: “A cause B” ≓ “A leads to B” ◦ (不要) ステップ数が多い演繹の実行 1 ~ 8 ステップを試行 × (FLDでの学習後でも4ステップ以上は解けない．公理系の組み合わせによる証明木の空間は膨大．探索できてない．) • 証明木の空間上での，賢い探索方法を取り入れる．ノイズ事実への頑健性事実群(facts)に最大20個のノイズ事実を混入 × (事前学習コーパスにはノイズ事実は含まれず) • より実際的なシーンを模擬したノイズ事実を使う(e.g., 検索によって集めたノイズ混じりの事実群を使う) 演繹規則(論証)の知識公理系や三段論法等，無限個． × • FLDで様々な論証を原理的に学習可(完全性の恩恵)．詳細は予稿を参考のこと

© Hitachi, Ltd. 2023. All rights reserved. 41 まとめご静聴ありがとうございました．
 言語モデルに演繹推論を学習させるため，演繹推論コーパスを自動生成するフレームワークを提案． 1. 一階述語論理の完全性に基づき，多様な演繹推論実例を生成． 2. 解析実験のため様々な条件でコーパスを生成可能．  実験により: 1. LM(GPT-4/T5)の演繹推論能力を評価． 2. 提案コーパスでの学習による演繹推論能力の向上を確認． 3. LMの演繹推論能力で不十分な側面を解析 → 方向性を議論  コーパス・モデル・コードを公開  https://github.com/hitachi-nlp/FLD

人工演繹推論コーパスによる学習は言語モデルをどのように強化するか？

人工演繹推論コーパスによる学習は言語モデルをどのように強化するか？

More Decks by もりし

Featured

Transcript