Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Googleのロボット技術紹介。RT-1からGemini Robotics-ER 1.5 まで
Search
Minoru Natsutani
November 15, 2025
Technology
0
54
Googleのロボット技術紹介。RT-1からGemini Robotics-ER 1.5 まで
GCPUG in Shiga #4 「はじめての生成AI Gemini・BigQuery」での発表資料です。
Minoru Natsutani
November 15, 2025
Tweet
Share
More Decks by Minoru Natsutani
See All by Minoru Natsutani
グラフの書き方勉強会
natsutan
0
71
動き検出勉強会資料
natsutan
0
42
WindowsでGenesisに挑戦した話
natsutan
0
420
辛い仕事をプリキュアで乗り切りHack
natsutan
0
73
論文読み勉強会 RoboGen
natsutan
0
300
プログラミング写経のすすめ
natsutan
0
1.4k
ロボット模倣学習勉強会
natsutan
0
450
スモールデータ勉強会発表資料
natsutan
1
1.4k
Robotics勉強会資料
natsutan
0
99
Other Decks in Technology
See All in Technology
Claude Codeの進化と各機能の活かし方
oikon48
12
3.6k
技術的負債の泥沼から組織を救う3つの転換点
nwiizo
7
2.3k
Datadog Cloud Cost Management で実現するFinOps
taiponrock
PRO
0
140
型を書かないRuby開発への挑戦
riseshia
0
190
ビズリーチにおける検索・推薦の取り組み / DEIM2026
visional_engineering_and_design
1
100
クラウド時代における一時権限取得
krrrr38
1
170
作りっぱなしで終わらせない! 価値を出し続ける AI エージェントのための「信頼性」設計 / Designing Reliability for AI Agents that Deliver Continuous Value
aoto
PRO
1
130
Shifting from MCP to Skills / ベストプラクティスの変遷を辿る
yamanoku
2
200
越境する組織づくり ─ 多様性を前提にしたチームビルディングとリードの実践知
kido_engineer
1
110
Serverless Agent Architecture on Azure / serverless-agent-on-azure
miyake
1
150
Claude Cowork Plugins を読む - Skills駆動型業務エージェント設計の実像と構造
knishioka
0
270
わたしがセキュアにAWSを使えるわけないじゃん、ムリムリ!(※ムリじゃなかった!?)
cmusudakeisuke
0
110
Featured
See All Featured
Google's AI Overviews - The New Search
badams
0
930
Six Lessons from altMBA
skipperchong
29
4.2k
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
87
GraphQLとの向き合い方2022年版
quramy
50
14k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
11
850
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
80
End of SEO as We Know It (SMX Advanced Version)
ipullrank
3
4k
The Cult of Friendly URLs
andyhume
79
6.8k
Fireside Chat
paigeccino
42
3.8k
Abbi's Birthday
coloredviolet
2
5.1k
Faster Mobile Websites
deanohume
310
31k
[RailsConf 2023] Rails as a piece of cake
palkan
59
6.4k
Transcript
Google DeepMindのロボット技術紹介 ~ RT-1からGemini Robotics-ER 1.5まで 2025.10.09 @natsutan 1
2 自己紹介 株式会社パソナ 営業統括本部 エキスパート・BPO事業本部 X-TECH本部 第1エンジニア室 AIソリューションチーム プリンシパルエンジニア 夏谷実
X:@natsutan
3 ロボット業界の概要 ここ数年のブレークスルーはLLM。LLMの登場で今までできなかったことができるようになった。 アメリカ、中国を中心にヒューマノイドロボットの開発が盛ん。季節に一回は大きな発表がある。 ・日本、ヨーロッパは既存の工場への導入を前提とした開発。 ・アメリカ、中国はロボットのための工場を作る。 https://www.youtube.com/watch?v=2hxFmwginMk
4 なぜロボットにLLMなのか? 従来のロボット開発だと、人間の常識を全て一から教えていた。 LLMを使うことで、常識を持った状態からの学習が可能になった。 画像から読み取れること ・天気は曇り ・場所は駅前 ・時計がある ・車が2台止まっている。一台はタクシー ・手前の横断歩道は渡れる
・柵は乗り越えられない
5 Google DeepMindの取り組み 2022年 RT-1:Transformerベースの模倣学習 2023年 RT-2:VLMモデルの採用 2023年 RT-X:ロボット向け大規模データセット 2025年
Gemini Robotics: Geminiベースのロボット向け基盤モデル
6 RT-1 https://robotics-transformer1.github.io/ 動画は四倍速 https://arxiv.org/pdf/2212.06817 ロボットの制御にTransformerを採用 13台のロボットを17ヶ月かけてデータを収集した。
7 RT-2 https://robotics-transformer2.github.io/ 動画は等倍 https://arxiv.org/pdf/2307.15818 RT-1の発展形。 VLMが採用されている。
8 RT-X https://robotics-transformer-x.github.io/ 動画は等倍 34の研究室から22種類のロボットのデータを収集。デ ータセットの共通化。 https://arxiv.org/pdf/2310.08864
9 Gemini Robotics 等倍アピール Geminiベースのロボット制御。 この動きはまず無理というレベルの制御をしている。 難易度の高いところ ・対象物が半透明 ・マニピュレーションしながら形が変化する。 ・狭いところに指や物を通さないといけない。これも半
透明かつ不定形。 ・双腕の制御 https://www.youtube.com/watch?v=m-G4- slYcGE&list=PLqYmG7hTraZC4Mx6pEKr6FVJehafA7vWE&index=16
10 Gemini Robotics ER https://storage.googleapis.com/deepmind-media/gemini-robotics/Gemini-Robotics-1-5-Tech-Report.pdf Gemini Robotics-ER Embodied Reasoning 人間のような思考を担当
Gemini Robotics ロボットのAction(制御) 担当 Google AI Studioから アクセス可能
11 まとめ Google DeepMind社からRT-1が発表されて3年でロボットのAI がめちゃくちゃ進化してます。 中国企業も負けてないので、毎月が驚きの連続。 こういう技術を趣味のロボットまで持っていきたい