Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Googleのロボット技術紹介。RT-1からGemini Robotics-ER 1.5 まで
Search
Minoru Natsutani
November 15, 2025
Technology
70
0
Share
Googleのロボット技術紹介。RT-1からGemini Robotics-ER 1.5 まで
GCPUG in Shiga #4 「はじめての生成AI Gemini・BigQuery」での発表資料です。
Minoru Natsutani
November 15, 2025
More Decks by Minoru Natsutani
See All by Minoru Natsutani
放熱勉強会資料
natsutan
0
18
グラフの書き方勉強会
natsutan
0
94
動き検出勉強会資料
natsutan
0
51
WindowsでGenesisに挑戦した話
natsutan
0
500
辛い仕事をプリキュアで乗り切りHack
natsutan
0
87
論文読み勉強会 RoboGen
natsutan
0
350
プログラミング写経のすすめ
natsutan
0
1.5k
ロボット模倣学習勉強会
natsutan
0
480
スモールデータ勉強会発表資料
natsutan
1
1.5k
Other Decks in Technology
See All in Technology
関西に縁あるMicrosoft MVPsが語るCopilotの未来
kasada
0
990
APIテストとは?
nagix
0
170
Spring AI × MCP 入門〜AIエージェントへのツール公開、境界設計から始める最小構成 〜
yuyamiyamoto
0
200
OCI Oracle AI Database Services新機能アップデート(2026/03-2026/05)
oracle4engineer
PRO
0
120
Javaで学ぶSOLID原則
negima
1
270
「気づいたら仕事が終わっている」バクラクAIエージェント本番運用の裏側 / layerx-bakuraku-aie2026
yuya4
16
7.5k
oracle-to-databricks-migration-with-llm-and-dbt
casek
1
410
AIを「創る」と「使う」の循環 — HRテックが実践するリアルなAI組織実装
taketo957
0
680
ルールやカスタム機能、どう使う?理想の出力を引き出すために今知りたいIBM Bob 5つの機能
muehara
1
280
マーケットプレイス版Oracle WebCenter Content For OCI
oracle4engineer
PRO
5
1.8k
Strands Agents超入門
kintotechdev
1
160
Agentic ERPをどう設計するか ー 受発注エージェントを動かす、現場の知見と設計思想ー
recerqainc
1
660
Featured
See All Featured
The Invisible Side of Design
smashingmag
302
52k
The Director’s Chair: Orchestrating AI for Truly Effective Learning
tmiket
1
180
Leveraging LLMs for student feedback in introductory data science courses - posit::conf(2025)
minecr
1
270
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
47
8.1k
How to audit for AI Accessibility on your Front & Back End
davetheseo
0
400
From π to Pie charts
rasagy
0
200
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
2
570
First, design no harm
axbom
PRO
2
1.2k
Heart Work Chapter 1 - Part 1
lfama
PRO
7
36k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
How to Think Like a Performance Engineer
csswizardry
28
2.6k
AI: The stuff that nobody shows you
jnunemaker
PRO
8
680
Transcript
Google DeepMindのロボット技術紹介 ~ RT-1からGemini Robotics-ER 1.5まで 2025.10.09 @natsutan 1
2 自己紹介 株式会社パソナ 営業統括本部 エキスパート・BPO事業本部 X-TECH本部 第1エンジニア室 AIソリューションチーム プリンシパルエンジニア 夏谷実
X:@natsutan
3 ロボット業界の概要 ここ数年のブレークスルーはLLM。LLMの登場で今までできなかったことができるようになった。 アメリカ、中国を中心にヒューマノイドロボットの開発が盛ん。季節に一回は大きな発表がある。 ・日本、ヨーロッパは既存の工場への導入を前提とした開発。 ・アメリカ、中国はロボットのための工場を作る。 https://www.youtube.com/watch?v=2hxFmwginMk
4 なぜロボットにLLMなのか? 従来のロボット開発だと、人間の常識を全て一から教えていた。 LLMを使うことで、常識を持った状態からの学習が可能になった。 画像から読み取れること ・天気は曇り ・場所は駅前 ・時計がある ・車が2台止まっている。一台はタクシー ・手前の横断歩道は渡れる
・柵は乗り越えられない
5 Google DeepMindの取り組み 2022年 RT-1:Transformerベースの模倣学習 2023年 RT-2:VLMモデルの採用 2023年 RT-X:ロボット向け大規模データセット 2025年
Gemini Robotics: Geminiベースのロボット向け基盤モデル
6 RT-1 https://robotics-transformer1.github.io/ 動画は四倍速 https://arxiv.org/pdf/2212.06817 ロボットの制御にTransformerを採用 13台のロボットを17ヶ月かけてデータを収集した。
7 RT-2 https://robotics-transformer2.github.io/ 動画は等倍 https://arxiv.org/pdf/2307.15818 RT-1の発展形。 VLMが採用されている。
8 RT-X https://robotics-transformer-x.github.io/ 動画は等倍 34の研究室から22種類のロボットのデータを収集。デ ータセットの共通化。 https://arxiv.org/pdf/2310.08864
9 Gemini Robotics 等倍アピール Geminiベースのロボット制御。 この動きはまず無理というレベルの制御をしている。 難易度の高いところ ・対象物が半透明 ・マニピュレーションしながら形が変化する。 ・狭いところに指や物を通さないといけない。これも半
透明かつ不定形。 ・双腕の制御 https://www.youtube.com/watch?v=m-G4- slYcGE&list=PLqYmG7hTraZC4Mx6pEKr6FVJehafA7vWE&index=16
10 Gemini Robotics ER https://storage.googleapis.com/deepmind-media/gemini-robotics/Gemini-Robotics-1-5-Tech-Report.pdf Gemini Robotics-ER Embodied Reasoning 人間のような思考を担当
Gemini Robotics ロボットのAction(制御) 担当 Google AI Studioから アクセス可能
11 まとめ Google DeepMind社からRT-1が発表されて3年でロボットのAI がめちゃくちゃ進化してます。 中国企業も負けてないので、毎月が驚きの連続。 こういう技術を趣味のロボットまで持っていきたい