Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SSII2026 [OS1-3] 実験室自動化を目指した 計算機との試行錯誤
Search
画像センシングシンポジウム
PRO
June 09, 2026
310
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
SSII2026 [OS1-3] 実験室自動化を目指した 計算機との試行錯誤
画像センシングシンポジウム
PRO
June 09, 2026
More Decks by 画像センシングシンポジウム
See All by 画像センシングシンポジウム
SSII2026 [SS1] 作業動画理解 〜基盤モデル時代の応用と課題〜
ssii
PRO
0
630
SSII2026 [SS2] CADにおけるAI分野の動向と製造業 への実適⽤
ssii
PRO
1
1.2k
SSII2026 [TS2] 日本古典文化とAI ~ データセットからアプリケーションまで~
ssii
PRO
0
450
SSII2026 [PT1] アクセラレーテッド・コンピューティングが切り拓く知能の最前線 ~生成AIからエージェンティックAI、そしてフィジカルAIへの進化~
ssii
PRO
0
590
SSII2026 [PT2] 記号創発ロボティクスとフィジカルAIの展開 〜集合的予測符号化が繋ぐ言語と身体の時空間階層性〜
ssii
PRO
0
610
SSII2026 [OS1] 計算機インフラどうしてる?
ssii
PRO
0
350
SSII2026 [OS1-1] 機械学習のための計算基盤の開発
ssii
PRO
0
340
SSII2026 [OS1-2] 学術クラウド基盤mdx IIの 設計と運用
ssii
PRO
0
340
SSII2026 [OS2] 産業界における生成AIの利活用
ssii
PRO
0
570
Featured
See All Featured
The Pragmatic Product Professional
lauravandoore
37
7.3k
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
1
1.3k
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
230
What does AI have to do with Human Rights?
axbom
PRO
1
2.2k
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
170
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
1
400
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
1
1.4k
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
1k
Navigating the moral maze — ethical principles for Al-driven product design
skipperchong
2
400
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
180
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
210
Code Review Best Practice
trishagee
74
20k
Transcript
実験室自動化を目指した 計算機との試行錯誤 2026.6.10 尾崎 遼(理化学研究所)
おざき・はるか 専門:バイオインフォマティクス 2 2018-現在 PI 筑波大学 茨城県つくば 市 +研究自動化 2015-2018 ポスドク
理研 埼玉県和光市 +1細胞オミ クス 2025-現在 PI 理研 兵庫県神戸市 +AI生物学 2010-2015 大学院 東大 千葉県柏市 塩基配列解 析 2008-2010 学部 東大 本郷 時間生物学 @yuifu haruka-ozaki
3 理研 BDR AI生物学研究チーム (2025〜) ▶ 生命科学研究を取り巻く情報環境を設計・実装 生命科学の研究現場に AIやロボットが当たり前にある日常 をつく
• 非人間(AIやロボット)的 アプローチの開発・実装、 生命科学研究での応用・検証 • 理論化・学問化 AIエージェントや基盤モデルによる解析や知識統合の自動化 実験自動化のインフォマティクス
科学者AIアーキテクチャの構築 4 仮説生成・実験戦略策定 モジュール • LLMに 、実験目的・背景情報・ データベースか 、ターゲットについ て仮説を生成
• 生成した仮説に対す 検証実験の戦 略を策定 • 検証実験が難しい仮説は除外 実験計画策定・実行 モジュール 結果解釈・論文執筆 モジュール • LLMや最適化アルゴリズムに 、実 行可能な実験計画(スケジュール、手 順、消耗品)を策定 • 人間の実験者やロボット実験室に対 し、実験計画の実行を指示し、結果を 受領 • 実験結果を解釈し、仮説の妥当性を 評価 • 論文を執筆 DB Operation Care自動化 ロボット実験施設 実験計画 LLM 科学者 仮説 実験戦略 論文 実験結果 ※ウェット実験もインシリコも
AI科学者が立てた仮説を実験検証するのは人手 5 ▶ AI科学者/AIエージェントとロボット実験の接続が次の課題 システム 仮説 生成 実験 計画 実験
検証 結果 解釈 AI Scientist v2 (Sanaka AI) 🤖 🤖 🤖💻 🤖 Co-Scientist (Google) 🤖 🤖 👱🧪 👱 Robin (FutureHouse) 🤖 🤖 👱🧪 🤖 ▲物理空間での 実験検証は人手に依存
ロボット実験は人間の「ケア」に依存 6 ▶ AI科学者が次々に立てる仮説を検証する際、人間依存がボトルネックに Ochiai and Tahara-Arai et al., Digital
Discovery (2025) • ロボット実験は、「実験操作」を自動化している • 人間の介在(ケア)に依存 → ロボット実験室が実行できる実験群の量と種類が制限される
人間の「ケア」も自動化し、実験「室」全体を自動化 7 Ochiai and Tahara-Arai et al., Digital Discovery (2025)
ラボ管理AIによるロボット実験室自体の自動化 • AIエージェントのためのセンサー系とアクチュエータ系を整備 • Planning:LLM、VLMに 実験 • Perception: 実験室のモニタリング(画像・センサー情報の取得・判断) •
Control: 実験ロボットの制御、ロボットアーム(模倣学習の推論) 8 AI agent LA robots Perception Planning Control Automated lab Human & AI scientists ▶ AI科学者の仮説検証を、ラボ管理AIが管理するロボット実験室が担う
研究室で利用している計算資源 • NVIDIA DGX Spark ◦ 20コア Arm CPU、128 GBメモリ、Blackwell
GPU • R-CCS GPUインスタンス ◦ VLAの模倣学習(LeRobot) ◦ slurmなどジョブスケジューラで確保。最大24時間しか確保できない • デスクトップマシン ◦ VLAの推論(LeRobot) • HOKUSAI Sailing Ship (HSS) ◦ 生命科学系データベースのためのデータ処理 ◦ 大量のデータを置いておく(ストレージ無料) • AWS EC2 ◦ 生命科学系データ解析 ◦ 生命科学系データベース公開 9
実験「室」自動化で、計算資源で気をつけたい点 • セキュリティ ◦ 実験室の情報を外に出したくない • プライバシー ◦ 実験室内の映像や音を外に出したくない •
バイオセーフティへの対応 ◦ ビッグテックのAPIを使用してい と弾か 場合も • リアルタイム制御 ◦ といっても、現状では1秒程度でも十分かも • サーバー室 は実験室に置きたい ◦ 実験室の人だけで管理(スイッチON/OFF)でき うにしたい • 実験室の面積は計算資源にあま 割きたくない 10 ▶ DGX Sparkでローカルモデルを使うのがよさそう
DGX Spark 2台のクラスタ • 20コア Arm CPU、128 GBメモリ • Blackwell
GPU (第5世代 Tensor Core、第4世代 RT Core) • 2台をつなぐ。下に空調(一般的なノートPC用のUSBファン) 11
DGX Spark での LLM 速度比較 12 測定環境: vLLM v0.13.0 (OpenAI-compatible
server) + Ray (2-node only) 評価データ: GPQA Diamond 10問 + FrontierScience Olympiad 10問、各3試行、固定抽出、GPT-5.4 judge
DGX Spark での VLM 速度比較 13 測定環境: vLLM v0.13.0 (OpenAI-compatible
server) + Ray (2-node only) 評価データ: MMMU Science / Health & Medicine 10問、CharXiv 10問、各3試行、固定抽出、GPT-5.4 judge
ラフな指示を実験手順(実験プロトコル)に変換するタスク LA-Bench (2025) 🏆2025年度人工知能学会コンペティション開催支援制度 • 入力:実験の目的・使用物品・元 プロトコル・期待さ 最終状 態などの情報 •
出力:実際に実験室で実行可能 な詳細な手順 14 DGX Sparkで検証 • qwen3:32b • vLLM ベンチマーク結果 • スコア:8.90 ◦ コンペの上位28%く い • 1問あた 平均時間: 127 s • prompt tok/s (wall, 平 均): 9.8 • completion tok/s (wall, 平均): 6.5
AIエージェントによる実験室内のモニタリング(の試作) VLMで実験室内の正常・異常モニタリングを行う(人間の検出:2秒おき、状況説明:10秒おき) DGX Spark 2台連結, gemma3:4b, ollama 15 🖥Y. Chinen
まとめスライド • DGX Sparkで単独タスクはできそう • まだ複数同時にタスクをこなせ かは未検証 ◦ 実験「室」自動化のためには複数のタスクを常時動かしていたい •
まずはラボメンバー/AI科学者をユーザと想定 • 今後、外部も含めて大規模にクエリが来 場合、中規模サーバや複数台 での役割分担なども必要? 16