Towards AI that Conducts AI Research

Slide 1

Slide 1 text

Towards AI that Conducts AI Research Shiro Takagi ver.0:2024-06-16

Slide 2

Slide 2 text

はじめに

Slide 3

Slide 3 text

己の無力さを痛感しています！志を共にする方、興味持ってくださった方がいらっしゃいましたら、是非連絡ください！！ AI 研究の自動化を一緒に進めていきましょう！ [email protected] @takagi_shiro

Slide 4

Slide 4 text

何を作りたいか？

Slide 5

Slide 5 text

自律的に人工知能の研究ができる人工知能

Slide 6

Slide 6 text

自律的に人工知能の研究ができる人工知能

Slide 7

Slide 7 text

新しい知識 ↑これを作りたい

Slide 8

Slide 8 text

OOを達成したい（e.g. 癌の根絶）目的 ↑これを作りたい論文競争的な査読に通るレベル

Slide 9

Slide 9 text

自律的に人工知能の研究ができる人工知能

Slide 10

Slide 10 text

実験結果からOO を直してくださいこれが問題ですこのデータを使ってください仮説はこのように考えてください目的はOOですあとは頑張ってくださいこの実験をやってください

Slide 11

Slide 11 text

無制約では無理だし今の技術では限界がある… 人に役立つレベルの研究/その支援が自動でできるやつをとりあえず簡単でも制約付きでもいいので早く作るどの程度のどんな制約をどこに入れる必要があるかを仮説検証しその制約の克服を基礎研究に繋げる

Slide 12

Slide 12 text

研究の質自律性多少自律性が落ちてもいいのでまずは人間レベルの研究にちゃんと役立つものから作る方針役立たないおもちゃのようなものでいいので完全に自律的にできるものから作る方針

Slide 13

Slide 13 text

自律的に人工知能の研究ができる人工知能

Slide 14

Slide 14 text

自律実行が大変社会への影響が甚大他分野の研究自動化にも寄与研究成果で自己改善課題を研究課題に PC内で完結 AI 安全性の技術的解決にも寄与

Slide 15

Slide 15 text

例えば… Transformer を超える新アーキテクチャの自動提案既存手法よりはるかに効率的な PEFT の自動提案 AI の安全性を高める学習法の自動提案強力な open source LLM の自動開発 ... etc.

Slide 16

Slide 16 text

（私個人の）お気持ち

Slide 17

Slide 17 text

AI 研究の自動化は今全リソース注いで進める価値がある AIがAI 自身を生み出せればそこから（理想的には）指数的に発展していく可能性がある最後は汎用手法に帰着すると思うが、AI研究の自動化は汎用手法を生み出す特化手法という点で他の特化手法と質的に異なる

Slide 18

Slide 18 text

ある種の自動AI研究は現在でもそこまで非現実的じゃない純粋に演繹的な操作や物理世界との相互作用のような現在のNNが苦手なものを必要としない研究もあるシェルの操作・コーディング・ブラウザ検索・文献検索/理解が完璧にできればかなりのことができるが、それらの萌芽的な取り組みが出てきてる研究タイプをうまく絞り、すべきことを相当程度うまく誘導すれば、完璧ではないまでもそれらしいものが end-to-end でできる可能性はありえなくない

Slide 19

Slide 19 text

組織や地域を超えて分散的に開発が進めてけると嬉しい各社既に開発を進めてると思うが少数企業による独占が健全かは議論の余地があると思う

Slide 20

Slide 20 text

AI研究アシスタント 2024 2025 2026 人工AI研究者遅くとも2026年の終わりくらいまでには役立つレベルの AI研究が自動でできるAIシステムを実現したい

Slide 21

Slide 21 text

今やってること/模索してること

Slide 22

Slide 22 text

機械学習研究過程の構造化 LLM の API 叩いてプロンプト調整研究タスクを自動実行させるためのロジックの構築/ 制約の検討/対象とするML研究の範囲決定 etc...

Slide 23

Slide 23 text

論文データベース目的提案解法実装実験計画課題解決手法案実験結果論文実験コード研究課題自動ML研究パイプライン

Slide 24

Slide 24 text

Reflection Plan Thought Action Reflection Plan Thought Action Reflection Plan Thought Action Obervation Obervation Obervation LLM agent Task LLM agent LLM agent パイプラインからエージェントへ

Slide 25

Slide 25 text

ベースラインが単純すぎます SOTAを使ってくださいまずはHuman-in-the-Loop 前提のassistant？これが実験計画ですこれで進めますか？修正を反映しましたこれで進めますか？お願いします了解しましたこれから実験を実行します

Slide 26

Slide 26 text

必要だと思うこと

Slide 27

Slide 27 text

学術文献処理能力　目的に応じた文献群の取得、所望の情報の取得... プランニング能力　部分問題への分割、実現可能性を考慮した計画... 数理能力　アイデアを数学的に表現、（数学的主張の理解）... エンジニアリング能力　手法や実験計画の実装、リファクタ、デバッグ ... 行動能力　PC空間内での自在な行動（シェル/ブラウザ操作）...

Slide 28

Slide 28 text

研究過程上流で生じた変動への適応/変動の吸収仮説１：ReLU が悪さしてるのでは？検証１：ReLu を取り外す/別のものに変えて学習＆比較問い１：なぜOOのテスト精度がよくないのか？仮説２：訓練データの質が悪いのではないか？仮説１：人の価値観をよく理解してそれを教えればいいのでは？検証１：人の価値観を表現するデータを作成して学習＆評価問い２：どうすればAIが人の価値に沿うようにできるか？仮説２：人の価値に沿うよう推論時に指示すればいいのでは？検証２：訓練データを集め直して学習＆比較検証２：人の価値に沿う指示したプロンプトで推論＆評価この多様性に如何に対応して適切な仮説生成/検証を計画・実行させることができるか？どのような制約をどこまで加えればどれだけの広いクラスの研究をカバーできるか？

Slide 29

Slide 29 text

おわりに

Slide 30

Slide 30 text

今や財界政界科学界社会へと AI は大きな影響を与えており、AI 技術の発展は極めて重要です今世界を大きく動かしている LLM もその元になってる Transformer も Neural Network もその誕生には AI 研究が不可欠な役割を果たしていますもっといえば、AIの安全性などの技術的な解決にもAI研究は不可欠ですその意味で自律的に AI 研究ができる AI の実現はめちゃくちゃ重要なテーマだと思っています今年どのような成果が出るか、来年再来年までにどこまでいけるかで未来が大きく変わると思っており、AI 研究の自動化はこれから 1-2 年での動きがとても重要だと思っていますその意味であまり時間がないと思っていて、AI 研究ができるAIシステムの実現は1人でも多くの人が少しでも多く協力して進めていけるかが鍵だと考えています私個人としてはこうした運動が国や会社や研究所や組織の垣根を超えて分散的に実現されていったらいいなという気持ちを持っています私自身は研究もエンジニアリングもあまりできないので、これを私が自分で進めることに限界を感じており、是非多くの人のお力をお借りできたらと思っております是非同じ志を持ったみなさんのご協力をいただけるととても嬉しいですし、一緒にできなくても AI 研究の自動化実現のため私が何かご提供できるものがあれば喜んでお手伝いいたします

Slide 1

Slide 1 text

Slide 2

Slide 2 text

Slide 3

Slide 3 text

Slide 4

Slide 4 text

Slide 5

Slide 5 text

Slide 6

Slide 6 text

Slide 7

Slide 7 text

Slide 8

Slide 8 text

Slide 9

Slide 9 text

Slide 10

Slide 10 text

Slide 11

Slide 11 text

Slide 12

Slide 12 text

Slide 13

Slide 13 text

Slide 14

Slide 14 text

Slide 15

Slide 15 text

Slide 16

Slide 16 text

Slide 17

Slide 17 text

Slide 18

Slide 18 text

Slide 19

Slide 19 text

Slide 20

Slide 20 text

Slide 21

Slide 21 text

Slide 22

Slide 22 text

Slide 23

Slide 23 text

Slide 24

Slide 24 text

Slide 25

Slide 25 text

Slide 26

Slide 26 text

Slide 27

Slide 27 text

Slide 28

Slide 28 text

Slide 29

Slide 29 text

Slide 30

Slide 30 text

Slide 31

Slide 31 text