SSII2026 [OS1-3] 実験室自動化を目指した計算機との試行錯誤

実験室自動化を目指した計算機との試行錯誤 2026.6.10 尾崎遼（理化学研究所）

おざき・はるか　専門：バイオインフォマティクス 2 2018-現在 PI 筑波大学茨城県つくば市 +研究自動化 2015-2018 ポスドク
理研埼玉県和光市 +１細胞オミクス 2025-現在 PI 理研兵庫県神戸市 +AI生物学 2010-2015 大学院東大千葉県柏市塩基配列解析 2008-2010 学部東大本郷時間生物学 @yuifu haruka-ozaki

3 理研 BDR AI生物学研究チーム（2025〜） ▶ 生命科学研究を取り巻く情報環境を設計・実装生命科学の研究現場に AIやロボットが当たり前にある日常をつく
• 非人間（AIやロボット）的アプローチの開発・実装、生命科学研究での応用・検証 • 理論化・学問化 AIエージェントや基盤モデルによる解析や知識統合の自動化実験自動化のインフォマティクス

科学者AIアーキテクチャの構築 4 仮説生成・実験戦略策定モジュール • LLMに、実験目的・背景情報・データベースか、ターゲットについて仮説を生成
• 生成した仮説に対す検証実験の戦略を策定 • 検証実験が難しい仮説は除外実験計画策定・実行モジュール結果解釈・論文執筆モジュール • LLMや最適化アルゴリズムに、実行可能な実験計画（スケジュール、手順、消耗品）を策定 • 人間の実験者やロボット実験室に対し、実験計画の実行を指示し、結果を受領 • 実験結果を解釈し、仮説の妥当性を評価 • 論文を執筆 DB Operation Care自動化ロボット実験施設実験計画 LLM 科学者仮説実験戦略論文実験結果 ※ウェット実験もインシリコも

AI科学者が立てた仮説を実験検証するのは人手 5 ▶ AI科学者／AIエージェントとロボット実験の接続が次の課題システム仮説生成実験計画実験
検証結果解釈 AI Scientist v2 (Sanaka AI) 🤖 🤖 🤖💻 🤖 Co-Scientist (Google) 🤖 🤖 👱🧪 👱 Robin (FutureHouse) 🤖 🤖 👱🧪 🤖 ▲物理空間での実験検証は人手に依存

ロボット実験は人間の「ケア」に依存 6 ▶ AI科学者が次々に立てる仮説を検証する際、人間依存がボトルネックに Ochiai and Tahara-Arai et al., Digital
Discovery (2025) • ロボット実験は、「実験操作」を自動化している • 人間の介在（ケア）に依存 →　ロボット実験室が実行できる実験群の量と種類が制限される

人間の「ケア」も自動化し、実験「室」全体を自動化 7 Ochiai and Tahara-Arai et al., Digital Discovery (2025)

ラボ管理AIによるロボット実験室自体の自動化 • AIエージェントのためのセンサー系とアクチュエータ系を整備 • Planning：LLM、VLMに実験 • Perception：実験室のモニタリング（画像・センサー情報の取得・判断） •
Control: 実験ロボットの制御、ロボットアーム（模倣学習の推論） 8 AI agent LA robots Perception Planning Control Automated lab Human & AI scientists ▶ AI科学者の仮説検証を、ラボ管理AIが管理するロボット実験室が担う

研究室で利用している計算資源 • NVIDIA DGX Spark ◦ 20コア Arm CPU、128 GBメモリ、Blackwell
GPU • R-CCS GPUインスタンス ◦ VLAの模倣学習（LeRobot） ◦ slurmなどジョブスケジューラで確保。最大24時間しか確保できない • デスクトップマシン ◦ VLAの推論（LeRobot） • HOKUSAI Sailing Ship (HSS) ◦ 生命科学系データベースのためのデータ処理 ◦ 大量のデータを置いておく（ストレージ無料） • AWS EC2 ◦ 生命科学系データ解析 ◦ 生命科学系データベース公開 9

実験「室」自動化で、計算資源で気をつけたい点 • セキュリティ ◦ 実験室の情報を外に出したくない • プライバシー ◦ 実験室内の映像や音を外に出したくない •
バイオセーフティへの対応 ◦ ビッグテックのAPIを使用していと弾か場合も • リアルタイム制御 ◦ といっても、現状では１秒程度でも十分かも • サーバー室は実験室に置きたい ◦ 実験室の人だけで管理（スイッチON/OFF）できうにしたい • 実験室の面積は計算資源にあま割きたくない 10 ▶ DGX Sparkでローカルモデルを使うのがよさそう

DGX Spark 2台のクラスタ • 20コア Arm CPU、128 GBメモリ • Blackwell
GPU （第5世代 Tensor Core、第4世代 RT Core） • 2台をつなぐ。下に空調（一般的なノートPC用のUSBファン） 11

DGX Spark での LLM 速度比較 12 測定環境: vLLM v0.13.0 (OpenAI-compatible
server) + Ray (2-node only) 評価データ: GPQA Diamond 10問 + FrontierScience Olympiad 10問、各3試行、固定抽出、GPT-5.4 judge

DGX Spark での VLM 速度比較 13 測定環境: vLLM v0.13.0 (OpenAI-compatible
server) + Ray (2-node only) 評価データ: MMMU Science / Health & Medicine 10問、CharXiv 10問、各3試行、固定抽出、GPT-5.4 judge

ラフな指示を実験手順（実験プロトコル）に変換するタスク LA-Bench (2025) 🏆2025年度人工知能学会コンペティション開催支援制度 • 入力：実験の目的・使用物品・元プロトコル・期待さ最終状態などの情報 •
出力：実際に実験室で実行可能な詳細な手順 14 DGX Sparkで検証 • qwen3:32b • vLLM ベンチマーク結果 • スコア：8.90 ◦ コンペの上位28%くい • １問あた平均時間: 127 s • prompt tok/s (wall, 平均): 9.8 • completion tok/s (wall, 平均): 6.5

AIエージェントによる実験室内のモニタリング（の試作） VLMで実験室内の正常・異常モニタリングを行う（人間の検出：2秒おき、状況説明：10秒おき） DGX Spark 2台連結, gemma3:4b, ollama 15 🖥Y. Chinen

まとめスライド • DGX Sparkで単独タスクはできそう • まだ複数同時にタスクをこなせかは未検証 ◦ 実験「室」自動化のためには複数のタスクを常時動かしていたい •
まずはラボメンバー／AI科学者をユーザと想定 • 今後、外部も含めて大規模にクエリが来場合、中規模サーバや複数台での役割分担なども必要？ 16

SSII2026 [OS1-3] 実験室自動化を目指した計算機との試行錯誤

SSII2026 [OS1-3] 実験室自動化を目指した計算機との試行錯誤

画像センシングシンポジウム PRO

More Decks by 画像センシングシンポジウム

Featured

Transcript

実験室自動化を目指した計算機との試行錯誤 2026.6.10 尾崎遼（理化学研究所）

おざき・はるか　専門：バイオインフォマティクス 2 2018-現在 PI 筑波大学茨城県つくば市 +研究自動化 2015-2018 ポスドク

3 理研 BDR AI生物学研究チーム（2025〜） ▶ 生命科学研究を取り巻く情報環境を設計・実装生命科学の研究現場に AIやロボットが当たり前にある日常をつく

科学者AIアーキテクチャの構築 4 仮説生成・実験戦略策定モジュール • LLMに、実験目的・背景情報・データベースか、ターゲットについて仮説を生成

AI科学者が立てた仮説を実験検証するのは人手 5 ▶ AI科学者／AIエージェントとロボット実験の接続が次の課題システム仮説生成実験計画実験

ロボット実験は人間の「ケア」に依存 6 ▶ AI科学者が次々に立てる仮説を検証する際、人間依存がボトルネックに Ochiai and Tahara-Arai et al., Digital

人間の「ケア」も自動化し、実験「室」全体を自動化 7 Ochiai and Tahara-Arai et al., Digital Discovery (2025)

ラボ管理AIによるロボット実験室自体の自動化 • AIエージェントのためのセンサー系とアクチュエータ系を整備 • Planning：LLM、VLMに実験 • Perception：実験室のモニタリング（画像・センサー情報の取得・判断） •

研究室で利用している計算資源 • NVIDIA DGX Spark ◦ 20コア Arm CPU、128 GBメモリ、Blackwell

実験「室」自動化で、計算資源で気をつけたい点 • セキュリティ ◦ 実験室の情報を外に出したくない • プライバシー ◦ 実験室内の映像や音を外に出したくない •

DGX Spark 2台のクラスタ • 20コア Arm CPU、128 GBメモリ • Blackwell

DGX Spark での LLM 速度比較 12 測定環境: vLLM v0.13.0 (OpenAI-compatible

DGX Spark での VLM 速度比較 13 測定環境: vLLM v0.13.0 (OpenAI-compatible

ラフな指示を実験手順（実験プロトコル）に変換するタスク LA-Bench (2025) 🏆2025年度人工知能学会コンペティション開催支援制度 • 入力：実験の目的・使用物品・元プロトコル・期待さ最終状態などの情報 •

AIエージェントによる実験室内のモニタリング（の試作） VLMで実験室内の正常・異常モニタリングを行う（人間の検出：2秒おき、状況説明：10秒おき） DGX Spark 2台連結, gemma3:4b, ollama 15 🖥Y. Chinen

まとめスライド • DGX Sparkで単独タスクはできそう • まだ複数同時にタスクをこなせかは未検証 ◦ 実験「室」自動化のためには複数のタスクを常時動かしていたい •

SSII2026 [OS1-3] 実験室自動化を目指した 計算機との試行錯誤

SSII2026 [OS1-3] 実験室自動化を目指した 計算機との試行錯誤

More Decks by 画像センシングシンポジウム

Featured

Transcript

SSII2026 [OS1-3] 実験室自動化を目指した計算機との試行錯誤

SSII2026 [OS1-3] 実験室自動化を目指した計算機との試行錯誤