$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Googleのロボット技術紹介。RT-1からGemini Robotics-ER 1.5 まで
Search
Minoru Natsutani
November 15, 2025
Technology
0
42
Googleのロボット技術紹介。RT-1からGemini Robotics-ER 1.5 まで
GCPUG in Shiga #4 「はじめての生成AI Gemini・BigQuery」での発表資料です。
Minoru Natsutani
November 15, 2025
Tweet
Share
More Decks by Minoru Natsutani
See All by Minoru Natsutani
動き検出勉強会資料
natsutan
0
30
WindowsでGenesisに挑戦した話
natsutan
0
310
辛い仕事をプリキュアで乗り切りHack
natsutan
0
66
論文読み勉強会 RoboGen
natsutan
0
250
プログラミング写経のすすめ
natsutan
0
1.2k
ロボット模倣学習勉強会
natsutan
0
350
スモールデータ勉強会発表資料
natsutan
1
1.3k
Robotics勉強会資料
natsutan
0
84
Human-in-the-loop機械学習社内勉強会
natsutan
0
1.6k
Other Decks in Technology
See All in Technology
Product Engineer
resilire
0
140
Bakuraku Engineering Team Deck
layerx
PRO
11
6k
ブロックテーマとこれからの WordPress サイト制作 / Toyama WordPress Meetup Vol.81
torounit
0
340
M5UnifiedとPicoRubyで楽しむM5シリーズ
kishima
0
120
freeeにおけるファンクションを超えた一気通貫でのAI活用
jaxx2104
3
1.2k
生成AI時代の自動E2Eテスト運用とPlaywright実践知_引持力哉
legalontechnologies
PRO
0
150
小さな判断で育つ、大きな意思決定力 / 20251204 Takahiro Kinjo
shift_evolve
PRO
1
380
プロダクトマネージャーが押さえておくべき、ソフトウェア資産とAIエージェント投資効果 / pmconf2025
i35_267
2
420
Master Dataグループ紹介資料
sansan33
PRO
1
4k
直接メモリアクセス
koba789
0
170
研究開発部メンバーの働き⽅ / Sansan R&D Profile
sansan33
PRO
3
21k
JSConf JP 2025 LINEヤフーのセッション紹介&アンケート 結果発表
lycorptech_jp
PRO
0
130
Featured
See All Featured
Large-scale JavaScript Application Architecture
addyosmani
514
110k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
54k
Art, The Web, and Tiny UX
lynnandtonic
303
21k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
359
30k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
120
20k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.1k
Reflections from 52 weeks, 52 projects
jeffersonlam
355
21k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
285
14k
Designing for humans not robots
tammielis
254
26k
Java REST API Framework Comparison - PWX 2021
mraible
34
9k
How to Think Like a Performance Engineer
csswizardry
28
2.3k
The Language of Interfaces
destraynor
162
25k
Transcript
Google DeepMindのロボット技術紹介 ~ RT-1からGemini Robotics-ER 1.5まで 2025.10.09 @natsutan 1
2 自己紹介 株式会社パソナ 営業統括本部 エキスパート・BPO事業本部 X-TECH本部 第1エンジニア室 AIソリューションチーム プリンシパルエンジニア 夏谷実
X:@natsutan
3 ロボット業界の概要 ここ数年のブレークスルーはLLM。LLMの登場で今までできなかったことができるようになった。 アメリカ、中国を中心にヒューマノイドロボットの開発が盛ん。季節に一回は大きな発表がある。 ・日本、ヨーロッパは既存の工場への導入を前提とした開発。 ・アメリカ、中国はロボットのための工場を作る。 https://www.youtube.com/watch?v=2hxFmwginMk
4 なぜロボットにLLMなのか? 従来のロボット開発だと、人間の常識を全て一から教えていた。 LLMを使うことで、常識を持った状態からの学習が可能になった。 画像から読み取れること ・天気は曇り ・場所は駅前 ・時計がある ・車が2台止まっている。一台はタクシー ・手前の横断歩道は渡れる
・柵は乗り越えられない
5 Google DeepMindの取り組み 2022年 RT-1:Transformerベースの模倣学習 2023年 RT-2:VLMモデルの採用 2023年 RT-X:ロボット向け大規模データセット 2025年
Gemini Robotics: Geminiベースのロボット向け基盤モデル
6 RT-1 https://robotics-transformer1.github.io/ 動画は四倍速 https://arxiv.org/pdf/2212.06817 ロボットの制御にTransformerを採用 13台のロボットを17ヶ月かけてデータを収集した。
7 RT-2 https://robotics-transformer2.github.io/ 動画は等倍 https://arxiv.org/pdf/2307.15818 RT-1の発展形。 VLMが採用されている。
8 RT-X https://robotics-transformer-x.github.io/ 動画は等倍 34の研究室から22種類のロボットのデータを収集。デ ータセットの共通化。 https://arxiv.org/pdf/2310.08864
9 Gemini Robotics 等倍アピール Geminiベースのロボット制御。 この動きはまず無理というレベルの制御をしている。 難易度の高いところ ・対象物が半透明 ・マニピュレーションしながら形が変化する。 ・狭いところに指や物を通さないといけない。これも半
透明かつ不定形。 ・双腕の制御 https://www.youtube.com/watch?v=m-G4- slYcGE&list=PLqYmG7hTraZC4Mx6pEKr6FVJehafA7vWE&index=16
10 Gemini Robotics ER https://storage.googleapis.com/deepmind-media/gemini-robotics/Gemini-Robotics-1-5-Tech-Report.pdf Gemini Robotics-ER Embodied Reasoning 人間のような思考を担当
Gemini Robotics ロボットのAction(制御) 担当 Google AI Studioから アクセス可能
11 まとめ Google DeepMind社からRT-1が発表されて3年でロボットのAI がめちゃくちゃ進化してます。 中国企業も負けてないので、毎月が驚きの連続。 こういう技術を趣味のロボットまで持っていきたい