Upgrade to Pro — share decks privately, control downloads, hide ads and more …

SSII2026 [OS1-3] 実験室自動化を目指した 計算機との試行錯誤

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.

SSII2026 [OS1-3] 実験室自動化を目指した 計算機との試行錯誤

More Decks by 画像センシングシンポジウム

Transcript

  1. おざき・はるか 専門:バイオインフォマティクス 2 2018-現在 PI 筑波大学 茨城県つくば 市 +研究自動化 2015-2018 ポスドク

    理研 埼玉県和光市 +1細胞オミ クス 2025-現在 PI 理研 兵庫県神戸市 +AI生物学 2010-2015 大学院 東大 千葉県柏市 塩基配列解 析 2008-2010 学部 東大 本郷 時間生物学 @yuifu haruka-ozaki
  2. 3 理研 BDR AI生物学研究チーム (2025〜) ▶ 生命科学研究を取り巻く情報環境を設計・実装 生命科学の研究現場に AIやロボットが当たり前にある日常 をつく

    • 非人間(AIやロボット)的 アプローチの開発・実装、 生命科学研究での応用・検証 • 理論化・学問化 AIエージェントや基盤モデルによる解析や知識統合の自動化 実験自動化のインフォマティクス
  3. 科学者AIアーキテクチャの構築 4 仮説生成・実験戦略策定 モジュール • LLMに 、実験目的・背景情報・ データベースか 、ターゲットについ て仮説を生成

    • 生成した仮説に対す 検証実験の戦 略を策定 • 検証実験が難しい仮説は除外 実験計画策定・実行 モジュール 結果解釈・論文執筆 モジュール • LLMや最適化アルゴリズムに 、実 行可能な実験計画(スケジュール、手 順、消耗品)を策定 • 人間の実験者やロボット実験室に対 し、実験計画の実行を指示し、結果を 受領 • 実験結果を解釈し、仮説の妥当性を 評価 • 論文を執筆 DB Operation Care自動化 ロボット実験施設 実験計画 LLM 科学者 仮説 実験戦略 論文 実験結果 ※ウェット実験もインシリコも
  4. AI科学者が立てた仮説を実験検証するのは人手 5 ▶ AI科学者/AIエージェントとロボット実験の接続が次の課題 システム 仮説 生成 実験 計画 実験

    検証 結果 解釈 AI Scientist v2 (Sanaka AI) 🤖 🤖 🤖💻 🤖 Co-Scientist (Google) 🤖 🤖 👱🧪 👱 Robin (FutureHouse) 🤖 🤖 👱🧪 🤖 ▲物理空間での 実験検証は人手に依存
  5. ロボット実験は人間の「ケア」に依存 6 ▶ AI科学者が次々に立てる仮説を検証する際、人間依存がボトルネックに Ochiai and Tahara-Arai et al., Digital

    Discovery (2025) • ロボット実験は、「実験操作」を自動化している • 人間の介在(ケア)に依存 → ロボット実験室が実行できる実験群の量と種類が制限される
  6. ラボ管理AIによるロボット実験室自体の自動化 • AIエージェントのためのセンサー系とアクチュエータ系を整備 • Planning:LLM、VLMに 実験 • Perception: 実験室のモニタリング(画像・センサー情報の取得・判断) •

    Control: 実験ロボットの制御、ロボットアーム(模倣学習の推論) 8 AI agent LA robots Perception Planning Control Automated lab Human & AI scientists ▶ AI科学者の仮説検証を、ラボ管理AIが管理するロボット実験室が担う
  7. 研究室で利用している計算資源 • NVIDIA DGX Spark ◦ 20コア Arm CPU、128 GBメモリ、Blackwell

    GPU • R-CCS GPUインスタンス ◦ VLAの模倣学習(LeRobot) ◦ slurmなどジョブスケジューラで確保。最大24時間しか確保できない • デスクトップマシン ◦ VLAの推論(LeRobot) • HOKUSAI Sailing Ship (HSS) ◦ 生命科学系データベースのためのデータ処理 ◦ 大量のデータを置いておく(ストレージ無料) • AWS EC2 ◦ 生命科学系データ解析 ◦ 生命科学系データベース公開 9
  8. 実験「室」自動化で、計算資源で気をつけたい点 • セキュリティ ◦ 実験室の情報を外に出したくない • プライバシー ◦ 実験室内の映像や音を外に出したくない •

    バイオセーフティへの対応 ◦ ビッグテックのAPIを使用してい と弾か 場合も • リアルタイム制御 ◦ といっても、現状では1秒程度でも十分かも • サーバー室 は実験室に置きたい ◦ 実験室の人だけで管理(スイッチON/OFF)でき うにしたい • 実験室の面積は計算資源にあま 割きたくない 10 ▶ DGX Sparkでローカルモデルを使うのがよさそう
  9. DGX Spark 2台のクラスタ • 20コア Arm CPU、128 GBメモリ • Blackwell

    GPU (第5世代 Tensor Core、第4世代 RT Core) • 2台をつなぐ。下に空調(一般的なノートPC用のUSBファン) 11
  10. DGX Spark での LLM 速度比較 12 測定環境: vLLM v0.13.0 (OpenAI-compatible

    server) + Ray (2-node only) 評価データ: GPQA Diamond 10問 + FrontierScience Olympiad 10問、各3試行、固定抽出、GPT-5.4 judge
  11. DGX Spark での VLM 速度比較 13 測定環境: vLLM v0.13.0 (OpenAI-compatible

    server) + Ray (2-node only) 評価データ: MMMU Science / Health & Medicine 10問、CharXiv 10問、各3試行、固定抽出、GPT-5.4 judge
  12. ラフな指示を実験手順(実験プロトコル)に変換するタスク LA-Bench (2025) 🏆2025年度人工知能学会コンペティション開催支援制度 • 入力:実験の目的・使用物品・元 プロトコル・期待さ 最終状 態などの情報 •

    出力:実際に実験室で実行可能 な詳細な手順 14 DGX Sparkで検証 • qwen3:32b • vLLM ベンチマーク結果 • スコア:8.90 ◦ コンペの上位28%く い • 1問あた 平均時間: 127 s • prompt tok/s (wall, 平 均): 9.8 • completion tok/s (wall, 平均): 6.5
  13. まとめスライド • DGX Sparkで単独タスクはできそう • まだ複数同時にタスクをこなせ かは未検証 ◦ 実験「室」自動化のためには複数のタスクを常時動かしていたい •

    まずはラボメンバー/AI科学者をユーザと想定 • 今後、外部も含めて大規模にクエリが来 場合、中規模サーバや複数台 での役割分担なども必要? 16