Solving olympiad geometry without human demonstrations

by Toma Tanaka

Slide 1

Slide 1 text

田中冬馬 2023/1/22 ShibuyAI No.4

Slide 2

Slide 2 text

自己紹介株式会社ブレインパッドデータサイエンティストとしてマーケティング分析，広告文の自動生成などの自然言語処理の業務に従事その他の活動 LLM 関連で論文執筆 Inductive-bias Learning: Generating Code Models with Large Language Model Data Science wiki データ分析手法，AI 関連の技術のまとめサイト Qiita の執筆 @fuyu_quant 1

Slide 3

Slide 3 text

概要 Googe DeepMind の研究，Nature(2024/1/17) に掲載言語モデルと演繹的推論を組み合わせたAlphaGeometry を提案平面幾何学の問題限定でIMO 金メダリストの平均的なスコアに迫る正解率を達成 (SOTA) 演繹的推論だけで導けない補助項の生成に言語モデルを利用人間による注釈や問題文を使わず合成データだけで言語モデルを学習学習データ不足になりがちな数学などの領域に対する一つの指針となるフレームワーク ※IMO ．．．International mathmatical Olympaid( 国際数学オリンピック) 2

Slide 4

Slide 4 text

前提知識 DD(Deductive databse) http://www.mmrc.iss.ac.cn/~xgao/paper/jar-gdbase.pdf データベースを使い幾何学的な問題を演繹的に推論する手法 AR(Algebraic reasoning) 代数的な概念，原則，手法を用いて問題を解く方法論文のAppendix に記載 (※ 上記についての説明は含みませんが内容は理解できると思います) 3

Slide 5

Slide 5 text

背景・課題，目的 4

Slide 6

Slide 6 text

背景・課題背景定理証明能力は論理的な推論に精通し，広範な空間を探索する能力を必要とするため人工知能研究の一つの焦点定理証明は学習ベースの手法では困難と言われている課題学習データが少ない人間の証明を機械が検証可能な言語(Lean9 など) に翻訳したデータが少ない特に幾何学は翻訳することが難しく証明例が非常に少ない 5

Slide 7

Slide 7 text

目的人によるデータ作成を行わずに合成データを作成する方法を提案合成データにより学習した言語モデルと演繹的推論をくみあわせる他手法 (AlphaGeometry) を使いIMO 金メダリストの平均スコアに迫るスコアを実証する． 6

Slide 8

Slide 8 text

手法 7

Slide 9

Slide 9 text

手法学習のための合成データの作成利用した言語モデル言語モデルの学習 AlphaGeometry の動作 8

Slide 10

Slide 10 text

学習のための合成データの生成右図にあるような“ 前提” からサンプリングを行う “ 前提“ から記号的演繹エンジン(DD+AR) を使い様々なtrue statements を生成証明の中の部分的な演繹推論を取り出し，1 億個のユニークな証明のサンプルを生成 (IMO-AG-30 問題を含まないような) ・・・ ( 全部で55 個) 9

Slide 11

Slide 11 text

学習のための合成データの生成記号的演繹エンジン(DD+AR) を使い“ 前提” をもとにtrue statements を生成上記の場合，学習データサンプルは以下のようになる前提：ランダムサンプリングしたもの結論：“HA ⊥BC” 証明：“HA ⊥BC” 以外の緑色のノード 10

Slide 12

Slide 12 text

利用した言語モデル利用したライブラリ Meliad 人気のあるTransformer アーキテクチャを拡張し，長いシーケンスに対応させたものなどが含まれている https://github.com/google-research/meliad 言語モデルアーキテクチャ：(Transformer-XL with sliding window ？) Meliad のベースラインモデルで採用されており，今回の研究では基本設定を使ったと記載があるためパラメータ：1 億5100 万 12 層埋め込み次元：1024 アテンションのヘッド：8 Tokenizer SentencePiece を単語モードで学習 11

Slide 13

Slide 13 text

言語モデルの学習 “ 前提, 結論, 証明” の順番で文字列を作成し，“ 前提, 結論” から“ 証明” を生成するように言語モデルを学習このような学習を行うことで演繹的推論だけでは導けない補助項を生成できるようになる補助項の構築は以前から研究されていたが，手作業で作成されたテンプレートなどを活用しており人間の経験のサブセットに制限されていた言語モデルと組み合わせることで記号的演繹エンジン(DD+AR) で解ける以上の問題を解くことができる 12

Slide 14

Slide 14 text

AlphaGeometry の証明方法実行方法( 以下を繰り返す) 記号的演繹エンジンで与えられた記述から証明を試みる a. 証明できない場合に言語モデルにより補助項を追加する b. 設定最大反復回数：16 回ビームサーチ LLM の出力の上位512 個を用いて探索する 13

Slide 15

Slide 15 text

結果 14

Slide 16

Slide 16 text

結果テストデータセット 2000 年から現在までのIMO の公式問題から作成 AlphaGeometry が対象とする幾何学の問題に絞り作成幾何学的な不等式など，他の数学の領域を必要とする問題は対象外全部で30 題の問題を用意全て学習データに含まれていないことを確認済み 15

Slide 17

Slide 17 text

結果 AlphaGeometry は30 問中25 問を解答 16

Slide 18

Slide 18 text

結果 10 種類のソルバーを使い比較 AlphaGeometry でSOTA を達成 17

Slide 19

Slide 19 text

結果人間にも難しい問題はAlphaGeometry の証明の長さに反映されている簡単な問題( 人間のscore>3.5) では人間のスコアと証明長に相関は見られない 18

Slide 20

Slide 20 text

まとめ 19

Slide 21

Slide 21 text

概要( 再掲) Googe DeepMind の研究，Nature(2024/1/17) に掲載言語モデルと演繹的推論を組み合わせたAlphaGeometry を提案平面幾何学の問題限定でIMO 金メダリストの平均的なスコアに迫る正解率を達成 (SOTA) 演繹的推論だけで導けない補助項の生成に言語モデルを利用人間による注釈や問題文を使わず合成データだけで言語モデルを学習学習データ不足になりがちな数学などの領域に対する一つの指針となるフレームワーク ※IMO ．．．International mathmatical Olympaid( 国際数学オリンピック) 20

Slide 22

Slide 22 text

No content

Slide 23

Slide 23 text

関連するリンク公式ページ https://deepmind.google/discover/blog/alphageometry- an-olympiad-level-ai-system-for-geometry/ Nature https://www.nature.com/articles/s41586-023-06747-5 GitHub https://github.com/google-deepmind/alphageometry