Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Claude Code × autoresearch 実践

Claude Code × autoresearch 実践

無限に試行錯誤するAIエージェントを堅実に/安全に回す

Avatar for 数理の弾丸

数理の弾丸

May 08, 2026

More Decks by 数理の弾丸

Other Decks in Research

Transcript

  1. autoresearch 提案・評価のループを AI エージェントに繰り返させることで試行錯誤を自動化する Karpathy 発の取り組み Andrej Karpathy @karpathy In

    the image, every dot is a complete LLM training run that lasts exactly 5 minutes. The agent works in an autonomous loop on a git feature branch and accumulates git commits to the training script as it finds better settings (of lower validation loss by the end) of the neural network architecture, the optimizer, all the hyperparameters, etc. この画像において、各点はちょうど5分間行われるLLMの学習を指しています。エージェントはgitのfetature ブランチ上で [中略] gitコミットを蓄積していきます。 評 価 指 標 採用された提案 却下された提案 試行回数 https://x.com/karpathy/status/2030371219518931079 数理の弾丸, 2026
  2. 実際に取り組んでみて autoresearch ループを回す中で特に気をつけるべきことが大きく2つある 井の中の蛙問題 autoresearch = 評価用ベンチマークに沿う ロジックの探索 シンプルに危ないという問題 目を離した隙に取り返しがつかないアクションを

    打たれてしまう可能性がある 下はあくまでイメージ 改善提案 ベンチマーク での評価 そのベンチマークでしか役に立たないものが 出来上がっているかもしれない この問題は機械学習では meta-overfitting(メタ過学習)などと呼ぶ 数理の弾丸, 2026 寝ている間に試行錯誤が進む、がautoresearchの コンセプト。それならば安全にも気を配りたい
  3. 各問題への対処 それぞれの問題に対して私がやっている対処法を紹介します 井の中の蛙問題に対して 試行錯誤ループで使っているのとは別の データでの評価を並走させる シンプルに危ないという問題に対して Docker サンドボックスで走らせる ホスト環境 Docker

    サンドボックス 赤点:ドメイン外 / 分布外データでの評価 評価データも評価結果もエージェント不可視化 最悪、壊しても良い環境で無限作業させる (Permission/Hooks なども使って多層に守る) 数理の弾丸, 2026