Slide 1

Slide 1 text

Towards AI that Conducts AI Research Shiro Takagi ver.0:2024-06-16

Slide 2

Slide 2 text

はじめに

Slide 3

Slide 3 text

己の無力さを痛感しています! 志を共にする方、興味持ってくださった方がいらっ しゃいましたら、是非連絡ください!! AI 研究の自動化を一緒に進めていきましょう! [email protected] @takagi_shiro

Slide 4

Slide 4 text

何を作りたいか?

Slide 5

Slide 5 text

自律的に人工知能の研究ができる人工知能

Slide 6

Slide 6 text

自律的に人工知能の研究ができる人工知能

Slide 7

Slide 7 text

新しい知識 ↑これを作りたい

Slide 8

Slide 8 text

OOを達成したい (e.g. 癌の根絶) 目的 ↑これを作りたい 論文 競争的な査読に 通るレベル

Slide 9

Slide 9 text

自律的に人工知能の研究ができる人工知能

Slide 10

Slide 10 text

実験結果からOO を直してください これが問題です このデータを使っ てください 仮説はこのように 考えてください 目的はOOです あとは頑張ってください この実験をやって ください

Slide 11

Slide 11 text

無制約では無理だし今の技術では限界がある… 人に役立つレベルの研究/その支援が自動でできるやつ をとりあえず簡単でも制約付きでもいいので早く作る どの程度のどんな制約をどこに入れる必要があるかを 仮説検証しその制約の克服を基礎研究に繋げる

Slide 12

Slide 12 text

研究の質 自律性 多少自律性が落ちてもいいので まずは人間レベルの研究にちゃ んと役立つものから作る方針 役立たないおもちゃの ようなものでいいので 完全に自律的にできる ものから作る方針

Slide 13

Slide 13 text

自律的に人工知能の研究ができる人工知能

Slide 14

Slide 14 text

自律実行が大変 社会への影響が甚大 他分野の研究自動化にも寄与 研究成果で 自己改善 課題を 研究課題に PC内で完結 AI 安 全 性 の 技 術 的 解 決 に も 寄 与

Slide 15

Slide 15 text

例えば… Transformer を超える新アーキテクチャの自動提案 既存手法よりはるかに効率的な PEFT の自動提案 AI の安全性を高める学習法の自動提案 強力な open source LLM の自動開発 ... etc.

Slide 16

Slide 16 text

(私個人の)お気持ち

Slide 17

Slide 17 text

AI 研究の自動化は今全リソース注いで進める価値がある AIがAI 自身を生み出せればそこから(理想的には) 指数的に発展していく可能性がある 最後は汎用手法に帰着すると思うが、AI研究の自動 化は汎用手法を生み出す特化手法という点で他の特 化手法と質的に異なる

Slide 18

Slide 18 text

ある種の自動AI研究は現在でもそこまで非現実的じゃない 純粋に演繹的な操作や物理世界との相互作用のよう な現在のNNが苦手なものを必要としない研究もある シェルの操作・コーディング・ブラウザ検索・文献 検索/理解が完璧にできればかなりのことができる が、それらの萌芽的な取り組みが出てきてる 研究タイプをうまく絞り、すべきことを相当程度う まく誘導すれば、完璧ではないまでもそれらしいも のが end-to-end でできる可能性はありえなくない

Slide 19

Slide 19 text

組織や地域を超えて分散的に開発が進めてけると嬉しい 各社既に開発を進めてると思うが少数企業による独占が健全かは議論の余地があると思う

Slide 20

Slide 20 text

AI研究アシスタント 2024 2025 2026 人工AI研究者 遅くとも2026年の終わりくらいまでには役立つレベルの AI研究が自動でできるAIシステムを実現したい

Slide 21

Slide 21 text

今やってること/模索してること

Slide 22

Slide 22 text

機械学習研究過程の構造化 LLM の API 叩いてプロンプト調整 研究タスクを自動実行させるためのロジックの構築/ 制約の検討/対象とするML研究の範囲決定 etc...

Slide 23

Slide 23 text

論文データベース 目的 提案解法実装 実験計画 課題解決手法案 実験結果 論文 実験コード 研究課題 自動ML研究パイプライン

Slide 24

Slide 24 text

Reflection Plan Thought Action Reflection Plan Thought Action Reflection Plan Thought Action Obervation Obervation Obervation LLM agent Task LLM agent LLM agent パイプラインからエージェントへ

Slide 25

Slide 25 text

ベースラインが単純すぎます SOTAを使ってください まずはHuman-in-the-Loop 前提のassistant? これが実験計画です これで進めますか? 修正を反映しました これで進めますか? お願いします 了解しました これから実験を実行します

Slide 26

Slide 26 text

必要だと思うこと

Slide 27

Slide 27 text

学術文献処理能力  目的に応じた文献群の取得、所望の情報の取得... プランニング能力  部分問題への分割、実現可能性を考慮した計画... 数理能力  アイデアを数学的に表現、(数学的主張の理解)... エンジニアリング能力  手法や実験計画の実装、リファクタ、デバッグ ... 行動能力  PC空間内での自在な行動(シェル/ブラウザ操作)...

Slide 28

Slide 28 text

研究過程上流で生じた変動への適応/変動の吸収 仮説1:ReLU が悪さしてるのでは? 検証1:ReLu を取り外す/別のものに変えて学習&比較 問い1:なぜOOのテスト精度がよくないのか? 仮説2:訓練データの質が悪いのではないか? 仮説1:人の価値観をよく理解してそれを教えればいいのでは? 検証1:人の価値観を表現するデータを作成して学習&評価 問い2:どうすればAIが人の価値に沿うようにできるか? 仮説2:人の価値に沿うよう推論時に指示すればいいのでは? 検証2:訓練データを集め直して学習&比較 検証2:人の価値に沿う指示したプロンプトで推論&評価 この多様性に如何 に対応して適切な 仮説生成/検証を 計画・実行させる ことができるか? どのような制約を どこまで加えれば どれだけの広いク ラスの研究をカバ ーできるか?

Slide 29

Slide 29 text

おわりに

Slide 30

Slide 30 text

今や財界政界科学界社会へと AI は大きな影響を与えており、AI 技術の発展は極めて重要です 今世界を大きく動かしている LLM もその元になってる Transformer も Neural Network も その誕生には AI 研究が不可欠な役割を果たしています もっといえば、AIの安全性などの技術的な解決にもAI研究は不可欠です その意味で自律的に AI 研究ができる AI の実現はめちゃくちゃ重要なテーマだと思っています 今年どのような成果が出るか、来年再来年までにどこまでいけるかで未来が大きく変わると思 っており、AI 研究の自動化はこれから 1-2 年での動きがとても重要だと思っています その意味であまり時間がないと思っていて、AI 研究ができるAIシステムの実現は1人でも多く の人が少しでも多く協力して進めていけるかが鍵だと考えています 私個人としてはこうした運動が国や会社や研究所や組織の垣根を超えて分散的に実現されてい ったらいいなという気持ちを持っています 私自身は研究もエンジニアリングもあまりできないので、これを私が自分で進めることに限界 を感じており、是非多くの人のお力をお借りできたらと思っております 是非同じ志を持ったみなさんのご協力をいただけるととても嬉しいですし、一緒にできなくて も AI 研究の自動化実現のため私が何かご提供できるものがあれば喜んでお手伝いいたします

Slide 31

Slide 31 text

己の無力さを痛感しています! 志を共にする方、興味持ってくださった方がいらっ しゃいましたら、是非連絡ください!! AI 研究の自動化を一緒に進めていきましょう! [email protected] @takagi_shiro