Upgrade to Pro — share decks privately, control downloads, hide ads and more …

2026年度 言語処理学会 最優秀論文賞 招待講演 「大規模言語モデルに推論を教えるための人工...

Avatar for もりし もりし
March 09, 2026
92

2026年度 言語処理学会 最優秀論文賞 招待講演 「大規模言語モデルに推論を教えるための人工論理推論コーパスを用いたアプローチ」

Avatar for もりし

もりし

March 09, 2026
Tweet

More Decks by もりし

Transcript

  1. © Hitachi, Ltd. 2026. All rights reserved. 3  東京大学

    - 物理学専攻  素粒子物理学  素粒子: 宇宙を構成する最小要素 (≪分子・原子)  素粒子の法則 = 宇宙の根源的な法則  暗黒物質(ダークマター)の起源の探索  宇宙を満たしているとされる 目に見えない正体不明の物質  株式会社 東芝 研究開発センター  深層学習による音声認識エンジン  株式会社 日立製作所 中央研究所  アンサンブル学習の基礎理論  LLMを用いたマクロ経済シミュレーション  LLMに推論を教えるための論理推論コーパス生成 自己紹介 経歴 私 ICML 2023 NeurIPS 2024 記号論理学に基づく 論理推論コーパス生成 MorishTr • 日立製作所 中央研究所 先端AIイノベーションセンター • 自然言語処理/機械学習/経済シミュレーション 森下 皓文 Morishita Terufumi 経済成長理論に基づく LLM100体・25年間のシミュレーション アンサンブル性能を決める要因を 理論的に解明 暗黒物質の探索 - 超対称性粒子を候補として - JSAI2025 優秀賞 AAAI 2026 (Bridge, keynote) ICML 2022 (spotlight)
  2. © Hitachi, Ltd. 2026. All rights reserved. 背景 1. 背景

    2. サンプルの設計指針 1. 未知なる事実での推論 2. 前提不足のサンプル 3. 公理系による多段推論 4. 多様な言語表現 3. サンプルの自動生成 4. 実験 5. 結果と考察
  3. © Hitachi, Ltd. 2026. All rights reserved. 19 知識と推論 

    知識: 世界に関する既知の事実 1. 「地球は質量を持つ」 2. 「質量を持つものは重力場を生む」  推論:
  4. © Hitachi, Ltd. 2026. All rights reserved. 20 知識と推論 

    知識: 世界に関する既知の事実 1. 「地球は質量を持つ」 2. 「質量を持つものは重力場を生む」  推論: 知識を組み合わせることで、新しい知識を生み出す思考形態 3. 知識1と知識2 → 「地球は重力場を生む」
  5. © Hitachi, Ltd. 2026. All rights reserved. 21 LLMは「大推論時代」 •

    DeepMindのAIシステムが国際数学オリンピックで金メダル相当(2025) • O1-previewはアメリカ数学オリンピック予選を83%(全国上位約500人相当). • 専門家が作った超高難易度の数学問題(FrontierMath)を25%解ける。 • AI支援(ChatGPT/Gemini)によりErdos問題の一部が解決 (#728/#729/#1051等, Lean で形式検証済) • AxiomProverが数値半群に関するFelの予想を証明.形式検証まで自動生成. 数学 • DeepMindのGraph Networks for Materials Exploration (GNoME) は 新規な結晶材料を約220万種類予測し、そのうち38万種を安定物質と判定。 • MITのCollins教授らは生成AIを用いて薬剤耐性菌に効く新たな抗生物質候補を創出。AI が提案した化合物から合成された「NG1」はマウス感染モデルで淋菌を死滅させる • 医療特化LLM「Med-PaLM 2」は米国医師国家試験形式の問題で医師レベルに到達(正答 率86.5%)。 • 強迫性障害患者の症例要約を用いたGPT-4は専門家グループを凌駕する診断率(主要診断 を100%的中)。OpenAIの新モデル「o1」は、物理・化学・生物の博士課程レベルの難問集 (GPQAベンチマーク)で博士号保持者チームの平均成績を上回る • GPT-4oはドイツ物理オリンピックの問題で平均的参加者を上回る成績 • AlphaFold 3(DeepMind)はタンパク質に限らず,タンパク質–核酸・リガンド・抗原抗体など の複合体構造を統一モデルで高精度に予測。 • DeepMindが2023年に開発したAlphaMissenseは、ヒトの全タンパク質に起こり得る7100万 通りのミスセンス変異について、その89%を「良性」または「病原性」のどちらかに分類する ことに成功した. • IQテストで平均約136ポイントを記録。人間平均100を大きく凌駕。 自然科学 • Codeforcesで参加者上位約7%(レート1807) • 国際プログラミングコンテスト(IOI/ICPC)の過去の難問235問を集めた新ベンチマーク 「Humanity’s Last Code Exam」において、最新LLMがメダル相当の成績を記録しました。 • AlphaDev 強化学習エージェントが新しい高速ソートアルゴリズムを発見し、 人間研究者が最適化してきた従来アルゴリズムを凌駕 • AI脆弱性ハンター「Big Sleep」は、2024年11月に最初のセキュリティ脆弱性を発見し、 その後FFmpegやImageMagickといった主要OSSで計20件の脆弱性を自律的に発見・再現. • カリフォルニア大学バークレー校は、初心者向けCSコースにGPT-4ベースの学習支援AIを 導入。2学期で延べ2,000人以上の学生が利用し、宿題完了までの時間が平均30分以上短縮。 • GitHub Copilotは2025年7月、が2,000 万人以上の累計ユーザー数を突破 コーディング • GPT-3.5を用いて、2006〜2023年の米上場企業の決算説明会約12万件の文字記録を分析し、 経営者の発言から景気楽観度を数値化した指標(AIエコノミースコア)を作成。このAI指標 は、翌四半期のGDP成長率をエコノミストより高精度で予測 • 財務諸表を与えた GPT-4 がアナリストより高精度で増益/減益方向を予測 • LLMがインフレ率の予測で専門家の精度を上回る。 • GPT-4が米国の統一司法試験で上位10%に入る高スコア • GPT-4搭載のAIチューターを導入した大規模実験で、従来型の授業に比べ学習成績が平均 127%も向上しました • o3モデルはメリーランド大学ロースクールの期末試験8科目でA+からBまでの成績を収め、 憲法や財産法など複数科目でクラス最上位のA+評価を獲得しました 社会科学
  6. © Hitachi, Ltd. 2026. All rights reserved. 23 本日の話 推論は人工知能の中心トピック

    1. 推論とは?→ 基礎から一歩づつ明確に 我々の研究
  7. © Hitachi, Ltd. 2026. All rights reserved. 24 本日の話 推論は人工知能の中心トピック

    1. 推論とは?→ 基礎から一歩づつ明確に 2. LLMに推論を教えるには? 我々の研究
  8. © Hitachi, Ltd. 2026. All rights reserved. 25 本日の話 推論は人工知能の中心トピック

    1. 推論とは?→ 基礎から一歩づつ明確に 2. LLMに推論を教えるには?→学習サンプルが満たすべき性質を明らかに 我々の研究
  9. © Hitachi, Ltd. 2026. All rights reserved. 26 本日の話 推論は人工知能の中心トピック

    1. 推論とは?→ 基礎から一歩づつ明確に 2. LLMに推論を教えるには?→学習サンプルが満たすべき性質を明らかに 3. 学習サンプルを自動生成する手法を構築 我々の研究
  10. © Hitachi, Ltd. 2026. All rights reserved. 27 本日の話 推論は人工知能の中心トピック

    1. 推論とは?→ 基礎から一歩づつ明確に 2. LLMに推論を教えるには?→学習サンプルが満たすべき性質を明らかに 3. 学習サンプルを自動生成する手法を構築 4. LLMの推論能力の向上を確認 我々の研究
  11. © Hitachi, Ltd. 2026. All rights reserved. 29 「形式論理学に基づく演繹コーパスによる言語モデルに対する演繹推論能力の付与」 言語処理学会

    2023 「人工演繹推論コーパスによる学習は言語モデルをどのように強化するか?」 人工知能学会 2023 「帰納的に多様な巨大論理推論コーパスによりLLMの汎用論理推論能力を向上させる」 人工知能学会 2024 「日本語論理推論ベンチマークJFLDの提案」 言語処理学会 2024 「LLMに論理推論を教えられるか? - 人工コーパスを用いたアプローチ」 NLPコロキウム 2024/12 「Learning Deductive Reasoning from Synthetic Corpus based on Formal Logic」 ICML 2023 「Enhancing Reasoning Capabilities of LLMs via Principled Synthetic Logic Corpus」 NeurIPS 2024 「JFLD: A Japanese Benchmark for Deductive Reasoning based on Formal Logic」 LREC-COLING 2024 「Can We Teach Logical Reasoning to LLMs? – An Approach Using Synthetic Corpora」 AAAI 2026 (Bridge, 招待講演) 本日の話 既存発表
  12. © Hitachi, Ltd. 2026. All rights reserved. 30 「形式論理学に基づく演繹コーパスによる言語モデルに対する演繹推論能力の付与」 言語処理学会

    2023 「人工演繹推論コーパスによる学習は言語モデルをどのように強化するか?」 人工知能学会 2023 「帰納的に多様な巨大論理推論コーパスによりLLMの汎用論理推論能力を向上させる」 人工知能学会 2024 「日本語論理推論ベンチマークJFLDの提案」 言語処理学会 2024 「LLMに論理推論を教えられるか? - 人工コーパスを用いたアプローチ」 NLPコロキウム 2024/12 「Learning Deductive Reasoning from Synthetic Corpus based on Formal Logic」 ICML 2023 「Enhancing Reasoning Capabilities of LLMs via Principled Synthetic Logic Corpus」 NeurIPS 2024 「JFLD: A Japanese Benchmark for Deductive Reasoning based on Formal Logic」 LREC-COLING 2024 「Can We Teach Logical Reasoning to LLMs? – An Approach Using Synthetic Corpora」 AAAI 2026 (Bridge, 招待講演) 本日の話 既存発表 「LLMに推論を教えるための 人工論理推論コーパスを用いたアプローチ」 自然言語処理 2025/06 (52ページ)
  13. © Hitachi, Ltd. 2026. All rights reserved. 31 「形式論理学に基づく演繹コーパスによる言語モデルに対する演繹推論能力の付与」 言語処理学会

    2023 「人工演繹推論コーパスによる学習は言語モデルをどのように強化するか?」 人工知能学会 2023 「帰納的に多様な巨大論理推論コーパスによりLLMの汎用論理推論能力を向上させる」 人工知能学会 2024 「日本語論理推論ベンチマークJFLDの提案」 言語処理学会 2024 「LLMに論理推論を教えられるか? - 人工コーパスを用いたアプローチ」 NLPコロキウム 2024/12 「Learning Deductive Reasoning from Synthetic Corpus based on Formal Logic」 ICML 2023 「Enhancing Reasoning Capabilities of LLMs via Principled Synthetic Logic Corpus」 NeurIPS 2024 「JFLD: A Japanese Benchmark for Deductive Reasoning based on Formal Logic」 LREC-COLING 2024 「Can We Teach Logical Reasoning to LLMs? – An Approach Using Synthetic Corpora」 AAAI 2026 (Bridge, 招待講演) 本日の話 既存発表 要点を紹介 「LLMに推論を教えるための 人工論理推論コーパスを用いたアプローチ」 自然言語処理 2025/06 (52ページ)
  14. © Hitachi, Ltd. 2026. All rights reserved. サンプルの設計指針1 - 未知なる事実での推論

    - 1. 背景 2. サンプルの設計指針 1. 未知なる事実での推論 2. 前提不足のサンプル 3. 公理系による多段推論 4. 多様な言語表現 3. サンプルの自動生成 4. 実験 5. 結果と考察
  15. © Hitachi, Ltd. 2026. All rights reserved. 43 論理的なステップ -

    その1 論理的に出てくる 前提 結論
  16. © Hitachi, Ltd. 2026. All rights reserved. 54 演繹規則 演繹規則

    「論理的な正しさ」≠「𝓕𝓕や𝓖𝓖の内容の正しさ(知識的な正しさ)」 𝓕𝓕や𝓖𝓖は任意
  17. © Hitachi, Ltd. 2026. All rights reserved. 55 演繹規則 ℱや𝒢𝒢は未知でもよい

    演繹規則 「論理的な正しさ」≠「𝓕𝓕や𝓖𝓖の内容の正しさ(知識的な正しさ)」 𝓕𝓕や𝓖𝓖は任意
  18. © Hitachi, Ltd. 2026. All rights reserved. 56 演繹規則 未知なる知識を導く力

    ℱや𝒢𝒢は未知でもよい 演繹規則 「論理的な正しさ」≠「𝓕𝓕や𝓖𝓖の内容の正しさ(知識的な正しさ)」 𝓕𝓕や𝓖𝓖は任意
  19. © Hitachi, Ltd. 2026. All rights reserved. 57 演繹規則 未知なる知識を導く力

    ℱや𝒢𝒢は未知でもよい 演繹規則 「論理的な正しさ」≠「𝓕𝓕や𝓖𝓖の内容の正しさ(知識的な正しさ)」 𝓕𝓕や𝓖𝓖は任意
  20. © Hitachi, Ltd. 2026. All rights reserved. 58 知識と推論 

    知識: 世界に関する既知の事実 1. 「地球は質量を持つ」 2. 「質量を持つものは重力場を生む」  推論: 知識を組み合わせることで、新しい知識を生み出す思考形態 3. 知識1と知識2 → 「地球は重力場を生む」
  21. © Hitachi, Ltd. 2026. All rights reserved. 59 知識と推論 

    知識: 世界に関する既知の事実 1. 「地球は質量を持つ」 2. 「質量を持つものは重力場を生む」  推論: 知識を組み合わせることで、新しい知識を生み出す思考形態 3. 知識1と知識2 → 「地球は重力場を生む」
  22. © Hitachi, Ltd. 2026. All rights reserved. 60 知識と推論 

    知識: 世界に関する既知の事実 1. 「地球は質量を持つ」 2. 「質量を持つものは重力場を生む」  推論: 知識を組み合わせることで、新しい知識を生み出す思考形態 3. 知識1と知識2 → 「地球は重力場を生む」 未知
  23. © Hitachi, Ltd. 2026. All rights reserved. 61 知識と推論 

    知識: 世界に関する既知の事実 1. 「地球は質量を持つ」 2. 「質量を持つものは重力場を生む」  推論: 知識を組み合わせることで、新しい知識を生み出す思考形態 3. 知識1と知識2 → 「地球は重力場を生む」 未知 人類の知的活動の源泉
  24. © Hitachi, Ltd. 2026. All rights reserved. 62 LLMは「大推論時代」 •

    DeepMindのAIシステムが国際数学オリンピックで金メダル相当(2025) • O1-previewはアメリカ数学オリンピック予選を83%(全国上位約500人相当). • 専門家が作った超高難易度の数学問題(FrontierMath)を25%解ける。 • AI支援(ChatGPT/Gemini)によりErdos問題の一部が解決 (#728/#729/#1051等, Lean で形式検証済) • AxiomProverが数値半群に関するFelの予想を証明.形式検証まで自動生成. 数学 • DeepMindのGraph Networks for Materials Exploration (GNoME) は 新規な結晶材料を約220万種類予測し、そのうち38万種を安定物質と判定。 • MITのCollins教授らは生成AIを用いて薬剤耐性菌に効く新たな抗生物質候補を創出。AI が提案した化合物から合成された「NG1」はマウス感染モデルで淋菌を死滅させる • 医療特化LLM「Med-PaLM 2」は米国医師国家試験形式の問題で医師レベルに到達(正答 率86.5%)。 • 強迫性障害患者の症例要約を用いたGPT-4は専門家グループを凌駕する診断率(主要診断 を100%的中)。OpenAIの新モデル「o1」は、物理・化学・生物の博士課程レベルの難問集 (GPQAベンチマーク)で博士号保持者チームの平均成績を上回る • GPT-4oはドイツ物理オリンピックの問題で平均的参加者を上回る成績 • AlphaFold 3(DeepMind)はタンパク質に限らず,タンパク質–核酸・リガンド・抗原抗体など の複合体構造を統一モデルで高精度に予測。 • DeepMindが2023年に開発したAlphaMissenseは、ヒトの全タンパク質に起こり得る7100万 通りのミスセンス変異について、その89%を「良性」または「病原性」のどちらかに分類する ことに成功した. • IQテストで平均約136ポイントを記録。人間平均100を大きく凌駕。 自然科学 • Codeforcesで参加者上位約7%(レート1807) • 国際プログラミングコンテスト(IOI/ICPC)の過去の難問235問を集めた新ベンチマーク 「Humanity’s Last Code Exam」において、最新LLMがメダル相当の成績を記録しました。 • AlphaDev 強化学習エージェントが新しい高速ソートアルゴリズムを発見し、 人間研究者が最適化してきた従来アルゴリズムを凌駕 • AI脆弱性ハンター「Big Sleep」は、2024年11月に最初のセキュリティ脆弱性を発見し、 その後FFmpegやImageMagickといった主要OSSで計20件の脆弱性を自律的に発見・再現. • カリフォルニア大学バークレー校は、初心者向けCSコースにGPT-4ベースの学習支援AIを 導入。2学期で延べ2,000人以上の学生が利用し、宿題完了までの時間が平均30分以上短縮。 • GitHub Copilotは2025年7月、が2,000 万人以上の累計ユーザー数を突破 コーディング • GPT-3.5を用いて、2006〜2023年の米上場企業の決算説明会約12万件の文字記録を分析し、 経営者の発言から景気楽観度を数値化した指標(AIエコノミースコア)を作成。このAI指標 は、翌四半期のGDP成長率をエコノミストより高精度で予測 • 財務諸表を与えた GPT-4 がアナリストより高精度で増益/減益方向を予測 • LLMがインフレ率の予測で専門家の精度を上回る。 • GPT-4が米国の統一司法試験で上位10%に入る高スコア • GPT-4搭載のAIチューターを導入した大規模実験で、従来型の授業に比べ学習成績が平均 127%も向上しました • o3モデルはメリーランド大学ロースクールの期末試験8科目でA+からBまでの成績を収め、 憲法や財産法など複数科目でクラス最上位のA+評価を獲得しました 社会科学
  25. © Hitachi, Ltd. 2026. All rights reserved. 63 演繹規則 未知なる知識を導く力

    ℱや𝒢𝒢は未知でもよい 「論理的な正しさ」と「𝓕𝓕や𝓖𝓖の内容の正しさ≓ 知識的な正しさ」は別モノ 𝓕𝓕や𝓖𝓖は任意 演繹規則
  26. © Hitachi, Ltd. 2026. All rights reserved. 64 LLMはℱや𝒢𝒢の任意性を理解しているか? 問題1

    地球は太陽を周回している もし地球が太陽を周回していれば 地球には四季がある 地球には四季がある 問題2 地球は太陽を周回している もし地球が太陽を周回していれば 地球には四季がない 地球には四季がない 問題3 ぴよぴよがある ぴよぴよがあれば ぽよぽよもある ぽよぽよがある 事前学習直後のLLM
  27. © Hitachi, Ltd. 2026. All rights reserved. 65 LLMはℱや𝒢𝒢の任意性を理解しているか? 解ける

    知識があるだけ? 問題1 地球は太陽を周回している もし地球が太陽を周回していれば 地球には四季がある 地球には四季がある 問題2 地球は太陽を周回している もし地球が太陽を周回していれば 地球には四季がない 地球には四季がある 問題3 ぴよぴよがある ぴよぴよがあれば ぽよぽよもある 地球には四季がある 事前学習直後のLLM
  28. © Hitachi, Ltd. 2026. All rights reserved. 66 LLMはℱや𝒢𝒢の任意性を理解しているか? 解ける

    解けない 知識があるだけ? 問題1 地球は太陽を周回している もし地球が太陽を周回していれば 地球には四季がある 地球には四季がある 問題2 地球は太陽を周回している もし地球が太陽を周回していれば 地球には四季がない 地球には四季がない 問題3 ぴよぴよがある ぴよぴよがあれば ぽよぽよもある ぽよぽよがある 事前学習直後のLLM
  29. © Hitachi, Ltd. 2026. All rights reserved. 67 LLMはℱや𝒢𝒢の任意性を理解しているか? 解ける

    解けない 知識があるだけ? ℱ,𝒢𝒢の任意性を 理解していない 問題1 地球は太陽を周回している もし地球が太陽を周回していれば 地球には四季がある 地球には四季がある 問題2 地球は太陽を周回している もし地球が太陽を周回していれば 地球には四季がない 地球には四季がない 問題3 ぴよぴよがある ぴよぴよがあれば ぽよぽよもある ぽよぽよがある 事前学習直後のLLM
  30. © Hitachi, Ltd. 2026. All rights reserved. 68 LLMはℱや𝒢𝒢の任意性を理解しているか? 解ける

    解けない 知識があるだけ? ℱ,𝒢𝒢の任意性を 理解していない 問題1 地球は太陽を周回している もし地球が太陽を周回していれば 地球には四季がある 地球には四季がある 問題2 地球は太陽を周回している もし地球が太陽を周回していれば 地球には四季がない 地球には四季がない 問題3 ぴよぴよがある ぴよぴよがあれば ぽよぽよもある ぽよぽよがある ℱ ℱ → 𝒢𝒢 𝒢𝒢 ℱ ℱ → 𝒢𝒢 𝒢𝒢 ℱ ℱ → 𝒢𝒢 𝒢𝒢 事前学習直後のLLM
  31. © Hitachi, Ltd. 2026. All rights reserved. 69 LLMはℱや𝒢𝒢の任意性を理解しているか? 解ける

    解けない 知識があるだけ? ℱ,𝒢𝒢の任意性を 理解していない 問題1 地球は太陽を周回している もし地球が太陽を周回していれば 地球には四季がある 地球には四季がある 問題2 地球は太陽を周回している もし地球が太陽を周回していれば 地球には四季がない 地球には四季がない 問題3 ぴよぴよがある ぴよぴよがあれば ぽよぽよもある ぽよぽよがある ℱ ℱ → 𝒢𝒢 𝒢𝒢 ℱ ℱ → 𝒢𝒢 𝒢𝒢 ℱ ℱ → 𝒢𝒢 𝒢𝒢 どのような学習サンプルが必要か? 事前学習直後のLLM
  32. © Hitachi, Ltd. 2026. All rights reserved. 83 地球は太陽を周回している もし地球が太陽を周回していれば

    地球には四季がある 地球には四季がある ℱや𝒢𝒢の任意性を教えるための学習サンプルとは? サンプル1 サンプル2 地球は太陽を周回している もし地球が太陽を周回していれば 地球には四季がない 地球には四季がない
  33. © Hitachi, Ltd. 2026. All rights reserved. 84 地球は太陽を周回している もし地球が太陽を周回していれば

    地球には四季がある 地球には四季がある ℱや𝒢𝒢の任意性を教えるための学習サンプルとは? サンプル1 演繹規則1 サンプル2 地球は太陽を周回している もし地球が太陽を周回していれば 地球には四季がない 地球には四季がない ℱ, 𝒢𝒢は任意
  34. © Hitachi, Ltd. 2026. All rights reserved. 85 地球は太陽を周回している もし地球が太陽を周回していれば

    地球には四季がある 地球には四季がある ℱや𝒢𝒢の任意性を教えるための学習サンプルとは? サンプル1 演繹規則1 演繹規則2 サンプル2 地球は太陽を周回している もし地球が太陽を周回していれば 地球には四季がない 地球には四季がない ℱ, 𝒢𝒢は任意 ℱ, 𝒢𝒢に「地球」が 含まれる場合のみ成立
  35. © Hitachi, Ltd. 2026. All rights reserved. 86 地球は太陽を周回している もし地球が太陽を周回していれば

    地球には四季がある 地球には四季がある ℱや𝒢𝒢の任意性を教えるための学習サンプルとは? サンプル1 演繹規則1 演繹規則2 演繹規則3 サンプル2 地球は太陽を周回している もし地球が太陽を周回していれば 地球には四季がない 地球には四季がない ℱ, 𝒢𝒢は任意 ℱ, 𝒢𝒢に天文学の単語が 含まれる場合のみ成立 ℱ, 𝒢𝒢に「地球」が 含まれる場合のみ成立
  36. © Hitachi, Ltd. 2026. All rights reserved. 87 地球は太陽を周回している もし地球が太陽を周回していれば

    地球には四季がある 地球には四季がある ℱや𝒢𝒢の任意性を教えるための学習サンプルとは? サンプル1 演繹規則1 演繹規則2 演繹規則3 サンプル2 地球は太陽を周回している もし地球が太陽を周回していれば 地球には四季がない 地球には四季がない ... ℱ, 𝒢𝒢は任意 ℱ, 𝒢𝒢に天文学の単語が 含まれる場合のみ成立 ℱ, 𝒢𝒢に「地球」が 含まれる場合のみ成立
  37. © Hitachi, Ltd. 2026. All rights reserved. 88 地球は太陽を周回している もし地球が太陽を周回していれば

    地球には四季がある 地球には四季がある ℱや𝒢𝒢の任意性を教えるための学習サンプルとは? サンプル1 演繹規則1 演繹規則2 演繹規則3 サンプル2 地球は太陽を周回している もし地球が太陽を周回していれば 地球には四季がない 地球には四季がない ... 帰納には無数の候補がある (Hume, 1748; Goodman, 1954; Quine, 1969) ℱ, 𝒢𝒢は任意 ℱ, 𝒢𝒢に天文学の単語が 含まれる場合のみ成立 ℱ, 𝒢𝒢に「地球」が 含まれる場合のみ成立
  38. © Hitachi, Ltd. 2026. All rights reserved. 89 地球は太陽を周回している もし地球が太陽を周回していれば

    地球には四季がある 地球には四季がある ℱや𝒢𝒢の任意性を教えるための学習サンプルとは? サンプル1 演繹規則1 演繹規則2 演繹規則3 サンプル2 地球は太陽を周回している もし地球が太陽を周回していれば 地球には四季がない 地球には四季がない ... ℱ, 𝒢𝒢は任意 ℱ, 𝒢𝒢に天文学の単語が 含まれる場合のみ成立 ℱ, 𝒢𝒢に「地球」が 含まれる場合のみ成立
  39. © Hitachi, Ltd. 2026. All rights reserved. 90 地球は太陽を周回している もし地球が太陽を周回していれば

    地球には四季がある 地球には四季がある ℱや𝒢𝒢の任意性を教えるための学習サンプルとは? サンプル1 演繹規則1 演繹規則2 演繹規則3 サンプル2 シンプルな規則を好む (Bertrand; Wittgenstein, 1922) 地球は太陽を周回している もし地球が太陽を周回していれば 地球には四季がない 地球には四季がない ... ℱ, 𝒢𝒢は任意 ℱ, 𝒢𝒢に天文学の単語が 含まれる場合のみ成立 ℱ, 𝒢𝒢に「地球」が 含まれる場合のみ成立
  40. © Hitachi, Ltd. 2026. All rights reserved. 91 地球は太陽を周回している もし地球が太陽を周回していれば

    地球には四季がある 地球には四季がある ℱや𝒢𝒢の任意性を教えるための学習サンプルとは? サンプル1 演繹規則1 演繹規則2 演繹規則3 サンプル2 シンプルな規則を好む (Bertrand; Wittgenstein, 1922) 地球は太陽を周回している もし地球が太陽を周回していれば 地球には四季がない 地球には四季がない ... ℱ, 𝒢𝒢は任意 ℱ, 𝒢𝒢に天文学の単語が 含まれる場合のみ成立 ℱ, 𝒢𝒢に「地球」が 含まれる場合のみ成立
  41. © Hitachi, Ltd. 2026. All rights reserved. 92 地球は太陽を周回している もし地球が太陽を周回していれば

    地球には四季がある 地球には四季がある ℱや𝒢𝒢の任意性を教えるための学習サンプルとは? サンプル1 演繹規則1 演繹規則2 演繹規則3 サンプル2 シンプルな規則を好む (Bertrand; Wittgenstein, 1922) どの規則を選ぶ? 地球は太陽を周回している もし地球が太陽を周回していれば 地球には四季がない 地球には四季がない ... ℱ, 𝒢𝒢は任意 ℱ, 𝒢𝒢に天文学の単語が 含まれる場合のみ成立 ℱ, 𝒢𝒢に「地球」が 含まれる場合のみ成立
  42. © Hitachi, Ltd. 2026. All rights reserved. 93 地球は太陽を周回している もし地球が太陽を周回していれば

    地球には四季がある 地球には四季がある ℱや𝒢𝒢の任意性を教えるための学習サンプルとは? サンプル1 演繹規則1 演繹規則2 演繹規則3 サンプル2 シンプルな規則を好む (Bertrand; Wittgenstein, 1922) サンプル3 サンプル4 どの規則を選ぶ? ぽりぽりがマグロを一本釣りする ぽりぽりがマグロを一本釣りすれば つんつんは宇宙一周の度に出る つんつんは宇宙一周の度に出る フィリピンバナナが猛烈に踊る もしフィリピンバナナが猛烈に踊れば ヒマラヤ山脈は気怠げに読書する ヒマラヤ山脈は気怠げに読書する 地球は太陽を周回している もし地球が太陽を周回していれば 地球には四季がない 地球には四季がない ... ℱ, 𝒢𝒢は任意 ℱ, 𝒢𝒢に天文学の単語が 含まれる場合のみ成立 ℱ, 𝒢𝒢に「地球」が 含まれる場合のみ成立
  43. © Hitachi, Ltd. 2026. All rights reserved. 94 地球は太陽を周回している もし地球が太陽を周回していれば

    地球には四季がある 地球には四季がある ℱや𝒢𝒢の任意性を教えるための学習サンプルとは? サンプル1 ℱ, 𝒢𝒢は任意 演繹規則1 演繹規則2 演繹規則3 サンプル2 サンプル3 サンプル4 ぽりぽりがマグロを一本釣りする ぽりぽりがマグロを一本釣りすれば つんつんは宇宙一周の度に出る つんつんは宇宙一周の度に出る フィリピンバナナが猛烈に踊る もしフィリピンバナナが猛烈に踊れば ヒマラヤ山脈は気怠げに読書する ヒマラヤ山脈は気怠げに読書する 地球は太陽を周回している もし地球が太陽を周回していれば 地球には四季がない 地球には四季がない ... ℱ, 𝒢𝒢に天文学の単語が 含まれる場合のみ成立 ℱ, 𝒢𝒢に「地球」が 含まれる場合のみ成立
  44. © Hitachi, Ltd. 2026. All rights reserved. 95 地球は太陽を周回している もし地球が太陽を周回していれば

    地球には四季がある 地球には四季がある ℱや𝒢𝒢の任意性を教えるための学習サンプルとは? サンプル1 演繹規則1 設計指針1: ℱや𝒢𝒢に任意の内容を割り当てたサンプルを用意する 演繹規則2 演繹規則3 サンプル2 サンプル3 サンプル4 ぽりぽりがマグロを一本釣りする ぽりぽりがマグロを一本釣りすれば つんつんは宇宙一周の度に出る つんつんは宇宙一周の度に出る フィリピンバナナが猛烈に踊る もしフィリピンバナナが猛烈に踊れば ヒマラヤ山脈は気怠げに読書する ヒマラヤ山脈は気怠げに読書する 地球は太陽を周回している もし地球が太陽を周回していれば 地球には四季がない 地球には四季がない ... ℱ, 𝒢𝒢は任意 ℱ, 𝒢𝒢に天文学の単語が 含まれる場合のみ成立 ℱ, 𝒢𝒢に「地球」が 含まれる場合のみ成立
  45. © Hitachi, Ltd. 2026. All rights reserved. サンプルの設計指針2 - 前提不足のサンプル

    - 1. 背景 2. サンプルの設計指針 1. 未知なる事実での推論 2. 前提不足のサンプル 3. 公理系による多段推論 4. 多様な言語表現 3. サンプルの自動生成 4. 実験 5. 結果と考察
  46. © Hitachi, Ltd. 2026. All rights reserved. サンプルの設計指針3 - 公理系を用いた多段推論

    - 1. 背景 2. サンプルの設計指針 1. 未知なる事実での推論 2. 前提不足のサンプル 3. 公理系による多段推論 4. 多様な言語表現 3. サンプルの自動生成 4. 実験 5. 結果と考察
  47. © Hitachi, Ltd. 2026. All rights reserved. 116 多段推論 ℱ

    → 𝒢𝒢 ∧ (𝒢𝒢 → ℋ) ∧ 除去 ℱ → 𝒢𝒢 (𝒢𝒢 → ℋ)
  48. © Hitachi, Ltd. 2026. All rights reserved. 117 多段推論 ℱ

    → 𝒢𝒢 ∧ (𝒢𝒢 → ℋ) ℱ → 𝒢𝒢 (𝒢𝒢 → ℋ) ℱ
  49. © Hitachi, Ltd. 2026. All rights reserved. 118 多段推論 𝒢𝒢

    ℱ → 𝒢𝒢 ∧ (𝒢𝒢 → ℋ) ℱ → 𝒢𝒢 (𝒢𝒢 → ℋ) ℱ Modus ponens
  50. © Hitachi, Ltd. 2026. All rights reserved. 119 多段推論 𝒢𝒢

    ℱ → 𝒢𝒢 ∧ (𝒢𝒢 → ℋ) ℱ → 𝒢𝒢 (𝒢𝒢 → ℋ) ℱ (𝒢𝒢 → ℋ)
  51. © Hitachi, Ltd. 2026. All rights reserved. 120 多段推論 𝒢𝒢

    ℋ Modus ponens ℱ → 𝒢𝒢 ∧ (𝒢𝒢 → ℋ) ℱ → 𝒢𝒢 (𝒢𝒢 → ℋ) ℱ (𝒢𝒢 → ℋ)
  52. © Hitachi, Ltd. 2026. All rights reserved. 121 多段推論 𝒢𝒢

    ℋ ℱ → 𝒢𝒢 ∧ (𝒢𝒢 → ℋ) ℱ → 𝒢𝒢 (𝒢𝒢 → ℋ) ℱ (𝒢𝒢 → ℋ) ℱ → ℋ → 導入
  53. © Hitachi, Ltd. 2026. All rights reserved. 122 多段推論 𝒢𝒢

    ℋ Modus ponens ℱ → 𝒢𝒢 ∧ (𝒢𝒢 → ℋ) ∧ 除去 ℱ → 𝒢𝒢 (𝒢𝒢 → ℋ) ℱ (𝒢𝒢 → ℋ) Modus ponens ℱ → ℋ → 導入
  54. © Hitachi, Ltd. 2026. All rights reserved. 123 多段推論 𝒢𝒢

    ℋ ℱ → 𝒢𝒢 ∧ (𝒢𝒢 → ℋ) ℱ → 𝒢𝒢 (𝒢𝒢 → ℋ) ℱ (𝒢𝒢 → ℋ) ℱ → ℋ
  55. © Hitachi, Ltd. 2026. All rights reserved. 131 完全性 一階述語論理の完全性定理

    (Gödel, 1929) 任意の妥当な演繹規則は,公理系による多段推論よって表現できる. 原子的な演繹規則の集合 複雑な演繹規則 原子的な演繹規則
  56. © Hitachi, Ltd. 2026. All rights reserved. 141 演繹規則,何を使う? 無限個の演繹規則は覚えきれない

    設計指針3: 公理系による多段推論を教える(=サンプルとする) 任意の演繹規則は公理系の多段推論と等価 完全性
  57. © Hitachi, Ltd. 2026. All rights reserved. サンプルの設計指針4 - 多様な言語表現-

    1. 背景 2. サンプルの設計指針 1. 未知なる事実での推論 2. 前提不足のサンプル 3. 公理系による多段推論 4. 多様な言語表現 3. サンプルの自動生成 4. 実験 5. 結果と考察
  58. © Hitachi, Ltd. 2026. All rights reserved. 146 設計指針 1.

    𝓕𝓕や𝓖𝓖に任意の内容を割り当てた,未知のサンプルを用意する. 2. 前提不足のサンプルを含める. 3. 演繹規則として公理系を用いた多段推論をサンプルとする. 4. 多様な言語表現を含める. 設計指針
  59. © Hitachi, Ltd. 2026. All rights reserved. 147 設計指針 1.

    𝓕𝓕や𝓖𝓖に任意の内容を割り当てた,未知のサンプルを用意する. 2. 前提不足のサンプルを含める. 3. 演繹規則として公理系を用いた多段推論をサンプルとする. 4. 多様な言語表現を含める. 設計指針 ぴよぴよ!
  60. © Hitachi, Ltd. 2026. All rights reserved. サンプルの自動生成 1. 背景

    2. サンプルの設計指針 1. 未知なる事実での推論 2. 前提不足のサンプル 3. 公理系による多段推論 4. 多様な言語表現 3. サンプルの自動生成 4. 実験 5. 結果と考察
  61. © Hitachi, Ltd. 2026. All rights reserved. 150 自動生成プログラム 設計指針3:

    公理系を用いた多段推論 設計指針2: 前提不足 設計指針1: 任意の𝓕𝓕, 𝓖𝓖 設計指針4: 多様な言語表現
  62. © Hitachi, Ltd. 2026. All rights reserved. 151 設計指針2: 前提不足

    自動生成プログラム 設計指針1: 任意の𝓕𝓕, 𝓖𝓖 設計指針4: 多様な言語表現 設計指針3: 公理系を用いた多段推論 ランダムに選択し 繋ぐ Modus ponens ∧ 除去 → 導入 Modus ponens ∧ 除去
  63. © Hitachi, Ltd. 2026. All rights reserved. 152 自動生成プログラム 設計指針1:

    任意の𝓕𝓕, 𝓖𝓖 設計指針4: 多様な言語表現 設計指針2: 前提不足 事実 多段推論 結論
  64. © Hitachi, Ltd. 2026. All rights reserved. 153 サンプルの自動生成 設計指針1:

    任意の𝓕𝓕, 𝓖𝓖 設計指針4: 多様な言語表現 事実 多段推論 結論 事実 多段推論 結論
  65. © Hitachi, Ltd. 2026. All rights reserved. 160 サンプル例 –

    日本語ぷにぷに版コーパスから 1. そのぴよぴわLv.62は憎たらしい 2. 「湿気易くない」 モンスターはいる 3. このみちょみょLv.65は対応し易い 4. 「このみちょみょLv.65が悲しいとしたらこのぴちょぴちゅLv.71は悲しい」 ということは確かだ 5. そのぴよぴわLv.62は対応し易い 6. そのもにゅもにLv.62は発症し易くて更にそれは悲しい 7. 仮にこのみちょみょLv.65が悲しいならそのぴよぴわLv.62は親らしい 8. このみちょみょLv.65は親らしいしその上対応し易い 9. このみちょみょLv.65は腑甲斐無い 10.「このぽよぽえLv.85は悲しい」 ということは事実である 11.もし仮にこのみちょみょLv.65が親らしいならばそのぴよぴわLv.62は悲しい そのぴよぴわLv.62は悲しい 事実8 このみちょみょLv.65は親らしい 事実11 そのぴよぴわLv.62は悲しい 事実 多段推論 結論
  66. © Hitachi, Ltd. 2026. All rights reserved. 161 サンプル例 –

    日本語ぷにぷに版コーパスから 1. そのぴよぴわLv.62は憎たらしい 2. 「湿気易くない」 モンスターはいる 3. このみちょみょLv.65は対応し易い 4. 「このみちょみょLv.65が悲しいとしたらこのぴちょぴちゅLv.71は悲しい」 ということは確かだ 5. そのぴよぴわLv.62は対応し易い 6. そのもにゅもにLv.62は発症し易くて更にそれは悲しい 7. 仮にこのみちょみょLv.65が悲しいならそのぴよぴわLv.62は親らしい 8. このみちょみょLv.65は親らしいしその上対応し易い 9. このみちょみょLv.65は腑甲斐無い 10.「このぽよぽえLv.85は悲しい」 ということは事実である 11.もし仮にこのみちょみょLv.65が親らしいならばそのぴよぴわLv.62は悲しい そのぴよぴわLv.62は悲しい 事実8 このみちょみょLv.65は親らしい 事実11 そのぴよぴわLv.62は悲しい 事実 多段推論 結論 プロンプト 出力
  67. © Hitachi, Ltd. 2026. All rights reserved. 162 サンプル例 –

    日本語ぷにぷに版コーパスから 1. そのぴよぴわLv.62は憎たらしい 2. 「湿気易くない」 モンスターはいる 3. このみちょみょLv.65は対応し易い 4. 「このみちょみょLv.65が悲しいとしたらこのぴちょぴちゅLv.71は悲しい」 ということは確かだ 5. そのぴよぴわLv.62は対応し易い 6. そのもにゅもにLv.62は発症し易くて更にそれは悲しい 7. 仮にこのみちょみょLv.65が悲しいならそのぴよぴわLv.62は親らしい 8. このみちょみょLv.65は親らしいしその上対応し易い 9. このみちょみょLv.65は腑甲斐無い 10.「このぽよぽえLv.85は悲しい」 ということは事実である 11.もし仮にこのみちょみょLv.65が親らしいならばそのぴよぴわLv.62は悲しい そのぴよぴわLv.62は悲しい 事実8 このみちょみょLv.65は親らしい 事実11 そのぴよぴわLv.62は悲しい 事実 多段推論 結論
  68. © Hitachi, Ltd. 2026. All rights reserved. 163 サンプル例 –

    日本語ぷにぷに版コーパスから 1. そのぴよぴわLv.62は憎たらしい 2. 「湿気易くない」 モンスターはいる 3. このみちょみょLv.65は対応し易い 4. 「このみちょみょLv.65が悲しいとしたらこのぴちょぴちゅLv.71は悲しい」 ということは確かだ 5. そのぴよぴわLv.62は対応し易い 6. そのもにゅもにLv.62は発症し易くて更にそれは悲しい 7. 仮にこのみちょみょLv.65が悲しいならそのぴよぴわLv.62は親らしい 8. このみちょみょLv.65は親らしいしその上対応し易い 9. このみちょみょLv.65は腑甲斐無い 10.「このぽよぽえLv.85は悲しい」 ということは事実である 11.もし仮にこのみちょみょLv.65が親らしいならばそのぴよぴわLv.62は悲しい そのぴよぴわLv.62は悲しい 事実8 このみちょみょLv.65は親らしい 事実11 そのぴよぴわLv.62は悲しい 事実 多段推論 結論 𝓕𝓕 𝓖𝓖
  69. © Hitachi, Ltd. 2026. All rights reserved. 164 サンプル例 –

    日本語ぷにぷに版コーパスから 1. そのぴよぴわLv.62は憎たらしい 2. 「湿気易くない」 モンスターはいる 3. このみちょみょLv.65は対応し易い 4. 「このみちょみょLv.65が悲しいとしたらこのぴちょぴちゅLv.71は悲しい」 ということは確かだ 5. そのぴよぴわLv.62は対応し易い 6. そのもにゅもにLv.62は発症し易くて更にそれは悲しい 7. 仮にこのみちょみょLv.65が悲しいならそのぴよぴわLv.62は親らしい 8. このみちょみょLv.65は親らしいしその上対応し易い 9. このみちょみょLv.65は腑甲斐無い 10.「このぽよぽえLv.85は悲しい」 ということは事実である 11.もし仮にこのみちょみょLv.65が親らしいならばそのぴよぴわLv.62は悲しい そのぴよぴわLv.62は悲しい 事実8 このみちょみょLv.65は親らしい 事実11 そのぴよぴわLv.62は悲しい 事実 多段推論 結論 𝓕𝓕 𝓖𝓖 𝓕𝓕 ∧ 𝓖𝓖
  70. © Hitachi, Ltd. 2026. All rights reserved. 165 サンプル例 –

    日本語ぷにぷに版コーパスから 1. そのぴよぴわLv.62は憎たらしい 2. 「湿気易くない」 モンスターはいる 3. このみちょみょLv.65は対応し易い 4. 「このみちょみょLv.65が悲しいとしたらこのぴちょぴちゅLv.71は悲しい」 ということは確かだ 5. そのぴよぴわLv.62は対応し易い 6. そのもにゅもにLv.62は発症し易くて更にそれは悲しい 7. 仮にこのみちょみょLv.65が悲しいならそのぴよぴわLv.62は親らしい 8. このみちょみょLv.65は親らしいしその上対応し易い 9. このみちょみょLv.65は腑甲斐無い 10.「このぽよぽえLv.85は悲しい」 ということは事実である 11.もし仮にこのみちょみょLv.65が親らしいならばそのぴよぴわLv.62は悲しい そのぴよぴわLv.62は悲しい 事実8 このみちょみょLv.65は親らしい 事実11 そのぴよぴわLv.62は悲しい 事実 多段推論 結論 𝓕𝓕 𝓖𝓖 𝓕𝓕 ∧ 𝓖𝓖 𝓕𝓕
  71. © Hitachi, Ltd. 2026. All rights reserved. 167 サンプル例 –

    日本語ぷにぷに版コーパスから 1. そのぴよぴわLv.62は憎たらしい 2. 「湿気易くない」 モンスターはいる 3. このみちょみょLv.65は対応し易い 4. 「このみちょみょLv.65が悲しいとしたらこのぴちょぴちゅLv.71は悲しい」 ということは確かだ 5. そのぴよぴわLv.62は対応し易い 6. そのもにゅもにLv.62は発症し易くて更にそれは悲しい 7. 仮にこのみちょみょLv.65が悲しいならそのぴよぴわLv.62は親らしい 8. このみちょみょLv.65は親らしいしその上対応し易い 9. このみちょみょLv.65は腑甲斐無い 10.「このぽよぽえLv.85は悲しい」 ということは事実である 11.もし仮にこのみちょみょLv.65が親らしいならばそのぴよぴわLv.62は悲しい そのぴよぴわLv.62は悲しい 事実8 このみちょみょLv.65は親らしい 事実11 そのぴよぴわLv.62は悲しい 事実 多段推論 結論
  72. © Hitachi, Ltd. 2026. All rights reserved. 168 サンプル例 –

    日本語ぷにぷに版コーパスから 1. そのぴよぴわLv.62は憎たらしい 2. 「湿気易くない」 モンスターはいる 3. このみちょみょLv.65は対応し易い 4. 「このみちょみょLv.65が悲しいとしたらこのぴちょぴちゅLv.71は悲しい」 ということは確かだ 5. そのぴよぴわLv.62は対応し易い 6. そのもにゅもにLv.62は発症し易くて更にそれは悲しい 7. 仮にこのみちょみょLv.65が悲しいならそのぴよぴわLv.62は親らしい 8. このみちょみょLv.65は親らしいしその上対応し易い 9. このみちょみょLv.65は腑甲斐無い 10.「このぽよぽえLv.85は悲しい」 ということは事実である 11.もし仮にこのみちょみょLv.65が親らしいならばそのぴよぴわLv.62は悲しい そのぴよぴわLv.62は悲しい 事実8 このみちょみょLv.65は親らしい 事実11 そのぴよぴわLv.62は悲しい 事実 多段推論 結論 𝓗𝓗 𝓕𝓕
  73. © Hitachi, Ltd. 2026. All rights reserved. 169 サンプル例 –

    日本語ぷにぷに版コーパスから 1. そのぴよぴわLv.62は憎たらしい 2. 「湿気易くない」 モンスターはいる 3. このみちょみょLv.65は対応し易い 4. 「このみちょみょLv.65が悲しいとしたらこのぴちょぴちゅLv.71は悲しい」 ということは確かだ 5. そのぴよぴわLv.62は対応し易い 6. そのもにゅもにLv.62は発症し易くて更にそれは悲しい 7. 仮にこのみちょみょLv.65が悲しいならそのぴよぴわLv.62は親らしい 8. このみちょみょLv.65は親らしいしその上対応し易い 9. このみちょみょLv.65は腑甲斐無い 10.「このぽよぽえLv.85は悲しい」 ということは事実である 11.もし仮にこのみちょみょLv.65が親らしいならばそのぴよぴわLv.62は悲しい そのぴよぴわLv.62は悲しい 事実8 このみちょみょLv.65は親らしい 事実11 そのぴよぴわLv.62は悲しい 事実 多段推論 結論 𝓗𝓗 𝓕𝓕 𝓕𝓕 → 𝓗𝓗
  74. © Hitachi, Ltd. 2026. All rights reserved. 170 サンプル例 –

    日本語ぷにぷに版コーパスから 1. そのぴよぴわLv.62は憎たらしい 2. 「湿気易くない」 モンスターはいる 3. このみちょみょLv.65は対応し易い 4. 「このみちょみょLv.65が悲しいとしたらこのぴちょぴちゅLv.71は悲しい」 ということは確かだ 5. そのぴよぴわLv.62は対応し易い 6. そのもにゅもにLv.62は発症し易くて更にそれは悲しい 7. 仮にこのみちょみょLv.65が悲しいならそのぴよぴわLv.62は親らしい 8. このみちょみょLv.65は親らしいしその上対応し易い 9. このみちょみょLv.65は腑甲斐無い 10.「このぽよぽえLv.85は悲しい」 ということは事実である 11.もし仮にこのみちょみょLv.65が親らしいならばそのぴよぴわLv.62は悲しい そのぴよぴわLv.62は悲しい 事実8 このみちょみょLv.65は親らしい 事実11 そのぴよぴわLv.62は悲しい 事実 多段推論 結論 𝓗𝓗 𝓕𝓕 𝓕𝓕 → 𝓗𝓗 𝓕𝓕
  75. © Hitachi, Ltd. 2026. All rights reserved. 171 サンプル例 –

    日本語ぷにぷに版コーパスから 1. そのぴよぴわLv.62は憎たらしい 2. 「湿気易くない」 モンスターはいる 3. このみちょみょLv.65は対応し易い 4. 「このみちょみょLv.65が悲しいとしたらこのぴちょぴちゅLv.71は悲しい」 ということは確かだ 5. そのぴよぴわLv.62は対応し易い 6. そのもにゅもにLv.62は発症し易くて更にそれは悲しい 7. 仮にこのみちょみょLv.65が悲しいならそのぴよぴわLv.62は親らしい 8. このみちょみょLv.65は親らしいしその上対応し易い 9. このみちょみょLv.65は腑甲斐無い 10.「このぽよぽえLv.85は悲しい」 ということは事実である 11.もし仮にこのみちょみょLv.65が親らしいならばそのぴよぴわLv.62は悲しい そのぴよぴわLv.62は悲しい 事実8 このみちょみょLv.65は親らしい 事実11 そのぴよぴわLv.62は悲しい 事実 多段推論 結論 𝓗𝓗 𝓕𝓕 𝓕𝓕 → 𝓗𝓗 𝓕𝓕 𝓗𝓗
  76. © Hitachi, Ltd. 2026. All rights reserved. 172 サンプル例 –

    日本語ぷにぷに版コーパスから 1. そのぴよぴわLv.62は憎たらしい 2. 「湿気易くない」 モンスターはいる 3. このみちょみょLv.65は対応し易い 4. 「このみちょみょLv.65が悲しいとしたらこのぴちょぴちゅLv.71は悲しい」 ということは確かだ 5. そのぴよぴわLv.62は対応し易い 6. そのもにゅもにLv.62は発症し易くて更にそれは悲しい 7. 仮にこのみちょみょLv.65が悲しいならそのぴよぴわLv.62は親らしい 8. このみちょみょLv.65は親らしいしその上対応し易い 9. このみちょみょLv.65は腑甲斐無い 10.「このぽよぽえLv.85は悲しい」 ということは事実である 11.もし仮にこのみちょみょLv.65が親らしいならばそのぴよぴわLv.62は悲しい そのぴよぴわLv.62は悲しい 事実8 このみちょみょLv.65は親らしい 事実11 そのぴよぴわLv.62は悲しい 事実 多段推論 結論 𝓗𝓗
  77. © Hitachi, Ltd. 2026. All rights reserved. 173 サンプル例 –

    日本語ぷにぷに版コーパスから 1. そのぴよぴわLv.62は憎たらしい 2. 「湿気易くない」 モンスターはいる 3. このみちょみょLv.65は対応し易い 4. 「このみちょみょLv.65が悲しいとしたらこのぴちょぴちゅLv.71は悲しい」 ということは確かだ 5. そのぴよぴわLv.62は対応し易い 6. そのもにゅもにLv.62は発症し易くて更にそれは悲しい 7. 仮にこのみちょみょLv.65が悲しいならそのぴよぴわLv.62は親らしい 8. このみちょみょLv.65は親らしいしその上対応し易い 9. このみちょみょLv.65は腑甲斐無い 10.「このぽよぽえLv.85は悲しい」 ということは事実である 11.もし仮にこのみちょみょLv.65が親らしいならばそのぴよぴわLv.62は悲しい そのぴよぴわLv.62は悲しい 事実8 このみちょみょLv.65は親らしい 事実11 そのぴよぴわLv.62は悲しい 事実 多段推論 結論 𝓕𝓕 ∧ 𝓖𝓖 𝓕𝓕 → 𝓗𝓗 設計指針3: 公理系による多段推論 設計指針1: 未知なる 𝓕𝓕,𝓖𝓖
  78. © Hitachi, Ltd. 2026. All rights reserved. 193 FLDコーパス 1.

    そのぴよぴわLv.62は憎たらしい 2. 「湿気易くない」 モンスターはいる 3. このみちょみょLv.65は対応し易い 4. 「このみちょみょLv.65が悲しいとしたらこのぴちょぴちゅLv.71は悲しい」 ということは確かだ 5. そのぴよぴわLv.62は対応し易い 6. そのもにゅもにLv.62は発症し易くて更にそれは悲しい 7. 仮にこのみちょみょLv.65が悲しいならそのぴよぴわLv.62は親らしい 8. このみちょみょLv.65は親らしいしその上対応し易い 9. このみちょみょLv.65は腑甲斐無い 10.「このぽよぽえLv.85は悲しい」 ということは事実である 11.もし仮にこのみちょみょLv.65が親らしいならばそのぴよぴわLv.62は悲しい そのぴよぴわLv.62は悲しい 事実8 このみちょみょLv.65は親らしい 事実11 そのぴよぴわLv.62は悲しい 事実 多段推論 結論 𝓕𝓕 ∧ 𝓖𝓖 𝓕𝓕 → 𝓗𝓗 𝐅𝐅𝐅𝐅𝐃𝐃×𝟐𝟐コーパス 命名 Formal Logic Deduction Diverse サンプル10万件を生成
  79. © Hitachi, Ltd. 2026. All rights reserved. 実験 1. 背景

    2. サンプルの設計指針 1. 未知なる事実での推論 2. 前提不足のサンプル 3. 公理系による多段推論 4. 多様な言語表現 3. サンプルの自動生成 4. 実験 5. 結果と考察
  80. © Hitachi, Ltd. 2026. All rights reserved. 195 実験設定 

    エポック数: 1  未知の事実を暗記させない  Optimizer: Recall Adam  過学習・破滅的忘却を防ぐAdam.  元のパラメタを中心に 近似フィッシャー行列で正則化  プロンプトは勾配流さず LLaMA-3.1-70B (ベースモデル) モデル 学習  サンプル数 10万件 ~0.1Bトークン  学習率:3e-06  バッチサイズ: 256 10万件でSFT プロンプト 出力 既存知識を破壊しない ハイパラ 事前学習直後のLLM
  81. © Hitachi, Ltd. 2026. All rights reserved. 196 ベンチマーク 論理推論

    数学 コーディング NLI その他 (科学等) 総合 31の推論ベンチマーク / 5-shot 文脈内学習 評価
  82. © Hitachi, Ltd. 2026. All rights reserved. 結果と考察 1. 背景

    2. サンプルの設計指針 1. 未知なる事実での推論 2. 前提不足のサンプル 3. 公理系による多段推論 4. 多様な言語表現 3. サンプルの自動生成 4. 実験 5. 結果と考察
  83. © Hitachi, Ltd. 2026. All rights reserved. 198 FLD×2による性能向上 +8.7

    +6.2 +FLD×2 +3.3 +2.4 +0.8 +5.0 +1.5 +4.9 +10.7 +0.8 +3.7 論理推論 数学 コーディング NLI その他 (科学等) 精 度
  84. © Hitachi, Ltd. 2026. All rights reserved. 199 FLD×2による性能向上 +8.7

    +6.2 +FLD×2 +3.3 +2.4 +0.8 +5.0 +1.5 +4.9 +10.7 +0.8 +3.7 多様な推論タスクで性能向上 論理推論 数学 コーディング NLI 精 度 その他 (科学等)
  85. © Hitachi, Ltd. 2026. All rights reserved. 200 FLD×2による性能向上 +8.7

    +6.2 +FLD×2 +3.3 +2.4 +0.8 +5.0 +1.5 +4.9 +10.7 +0.8 +3.7 多様な推論タスクで性能向上 論理推論 数学 コーディング NLI 精 度 その他 (科学等)
  86. © Hitachi, Ltd. 2026. All rights reserved. 201 FLD×2による性能向上 +8.7

    +6.2 +FLD×2 +3.3 +2.4 +0.8 +5.0 +1.5 +4.9 +10.7 +0.8 +3.7 多様な推論タスクで性能向上 論理推論 数学 コーディング NLI 精 度 その他 (科学等) 論理推論は推論の基礎 よく汎化
  87. © Hitachi, Ltd. 2026. All rights reserved. 206 FLD×2による性能向上 –

    詳細 論理推論 コーディング +32 +7.6 +10 +5.5 +1.6 数学 NLI その他
  88. © Hitachi, Ltd. 2026. All rights reserved. 207 FLD×2により解けるようになった問題 1.

    Mice are afraid of wolves. 2. Jessica is a cat. 3. Wolves are afraid of cats. 4. Cats are afraid of sheep. 5. Winona is a wolf. 6. Sheep are afraid of cats. Jessica is afraid of sheep. 事実 結論
  89. © Hitachi, Ltd. 2026. All rights reserved. 208 FLD×2により解けるようになった問題 1.

    Mice are afraid of wolves. 2. Jessica is a cat. 3. Wolves are afraid of cats. 4. Cats are afraid of sheep. 5. Winona is a wolf. 6. Sheep are afraid of cats. Jessica is afraid of sheep. 事実 結論
  90. © Hitachi, Ltd. 2026. All rights reserved. 209 FLD×2により解けるようになった問題 1.

    Mice are afraid of wolves. 2. Jessica is a cat. 3. Wolves are afraid of cats. 4. Cats are afraid of sheep. 5. Winona is a wolf. 6. Sheep are afraid of cats. Jessica is afraid of sheep. 事実 結論 不自然
  91. © Hitachi, Ltd. 2026. All rights reserved. 210 FLD×2により解けるようになった問題 1.

    Mice are afraid of wolves. 2. Jessica is a cat. 3. Wolves are afraid of cats. 4. Cats are afraid of sheep. 5. Winona is a wolf. 6. Sheep are afraid of cats. Jessica is afraid of sheep. 事実 結論 論理的に 出てくる 不自然
  92. © Hitachi, Ltd. 2026. All rights reserved. 211 FLD×2により解けるようになった問題 1.

    Mice are afraid of wolves. 2. Jessica is a cat. 3. Wolves are afraid of cats. 4. Cats are afraid of sheep. 5. Winona is a wolf. 6. Sheep are afraid of cats. Jessica is afraid of sheep. 事実 結論 論理的に 出てくる 不自然 未知なる事実での推論能力(設計指針1)が 身についた
  93. © Hitachi, Ltd. 2026. All rights reserved. 221 1. Mice

    are afraid of wolves. 2. Jessica is a cat. 3. Wolves are afraid of cats. 4. Cats are afraid of sheep. 5. Winona is a wolf. 6. Sheep are afraid of cats. Jessica is afraid of sheep. 1. Rhett is not modest. 2. Vivian is confused. 3. Rhett is lazy. 4. If someone is modest or not confused, then he is not eager. Rhett is confused. (導けない) 1. All eels are fish. 2. No fish are plants. 3. Everything displayed in the collection is either a plant or an animal. 4. All animals displayed in the collection are multicellular. 5. A sea eel is displayed in the collection. 6. The sea eel is an eel or an animal or not a plant. 事実 1. Common utilities include water, electricity, gas, heating, sewer, trash, and recycling. 2. Many apartment rents cover the cost of water and electricity. 3. Susan lives in an apartment where the rent covers all utilities. 4. The rent of the apartment where Ava lives does not cover any utility expenses. 5. Noah lives in an apartment where the rent does not cover heating. 事実 事実 事実 結論 結論 Noah and Ava both need to pay the heating bill. The sea eel is multicellular or is bacteria. 結論 結論 FLD×2により解けるようになった問題
  94. © Hitachi, Ltd. 2026. All rights reserved. 222 1. Mice

    are afraid of wolves. 2. Jessica is a cat. 3. Wolves are afraid of cats. 4. Cats are afraid of sheep. 5. Winona is a wolf. 6. Sheep are afraid of cats. Jessica is afraid of sheep. 1. Rhett is not modest. 2. Vivian is confused. 3. Rhett is lazy. 4. If someone is modest or not confused, then he is not eager. Rhett is confused. (導けない) 1. All eels are fish. 2. No fish are plants. 3. Everything displayed in the collection is either a plant or an animal. 4. All animals displayed in the collection are multicellular. 5. A sea eel is displayed in the collection. 6. The sea eel is an eel or an animal or not a plant. 事実 1. Common utilities include water, electricity, gas, heating, sewer, trash, and recycling. 2. Many apartment rents cover the cost of water and electricity. 3. Susan lives in an apartment where the rent covers all utilities. 4. The rent of the apartment where Ava lives does not cover any utility expenses. 5. Noah lives in an apartment where the rent does not cover heating. 事実 事実 事実 結論 結論 Noah and Ava both need to pay the heating bill. The sea eel is multicellular or is bacteria. 結論 結論 FLD×2により解けるようになった問題 設計指針で意図した能力を獲得 設計指針1: 未知での推論 設計指針3: 公理系の多段推論 設計指針2: 前提不足 設計指針4: 多様な言語表現
  95. © Hitachi, Ltd. 2026. All rights reserved. 223 参考 -

    推論モデルへの効果 4Bモデルへの効果 30Bモデルへの効果 ⊕ 𝐅𝐅𝐅𝐅𝐃𝐃×𝟐𝟐 ⊕ 𝐅𝐅𝐅𝐅𝐃𝐃×𝟐𝟐
  96. © Hitachi, Ltd. 2026. All rights reserved. 224 参考 -

    推論モデルへの効果 推論モデルに対しても効果あり ⊕ 𝐅𝐅𝐅𝐅𝐃𝐃×𝟐𝟐 4Bモデルへの効果 30Bモデルへの効果 ⊕ 𝐅𝐅𝐅𝐅𝐃𝐃×𝟐𝟐
  97. © Hitachi, Ltd. 2026. All rights reserved. 233 1. 推論とは?→

    基礎から一歩づつ明確に 2. LLMに推論を教えるには?→学習サンプルが満たすべき性質を明らかに 3. 学習サンプルを自動生成する手法を構築 4. LLMの推論能力の向上を確認 本日のまとめ 論理推論 論理・数学・科学・コーディング等 本内容をポスター発表します! 議論だけでも歓迎です!! 3/12 (木) 11:15~ C会場 「大規模言語モデルに推論を教えるための人工論理推論コーパスを用いたアプローチ」 1.未知なる事実での推論 2.前提不足のサンプル 3.公理系による多段推論 4.多様な言語表現 設計指針