Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Googleのロボット技術紹介。RT-1からGemini Robotics-ER 1.5 まで
Search
Minoru Natsutani
November 15, 2025
Technology
70
0
Share
Googleのロボット技術紹介。RT-1からGemini Robotics-ER 1.5 まで
GCPUG in Shiga #4 「はじめての生成AI Gemini・BigQuery」での発表資料です。
Minoru Natsutani
November 15, 2025
More Decks by Minoru Natsutani
See All by Minoru Natsutani
放熱勉強会資料
natsutan
0
18
グラフの書き方勉強会
natsutan
0
94
動き検出勉強会資料
natsutan
0
51
WindowsでGenesisに挑戦した話
natsutan
0
500
辛い仕事をプリキュアで乗り切りHack
natsutan
0
87
論文読み勉強会 RoboGen
natsutan
0
350
プログラミング写経のすすめ
natsutan
0
1.5k
ロボット模倣学習勉強会
natsutan
0
480
スモールデータ勉強会発表資料
natsutan
1
1.5k
Other Decks in Technology
See All in Technology
「気づいたら仕事が終わっている」バクラクAIエージェント本番運用の裏側 / layerx-bakuraku-aie2026
yuya4
16
7.5k
Sony_KMP_Journey_KotlinConf2026
sony
2
200
GoとSIMDとWasmの今。
askua
3
470
Databricks 月刊サービスアップデート 2026年05月号
tyosi1212
0
200
自称宇宙最速で不合格となったAIP-C01にリベンジを果たすべくAIで問題集アプリを作ってみた。
yama3133
0
260
形式手法特論:公平性制約の位相的特徴づけ #kernelvm / Kernel VM Study Kansai 12th
ytaka23
1
680
地元にいないローカルオーガナイザーの立ち回り
uvb_76
1
440
long-running-tasks
cipepser
3
460
プラットフォームエンジニア ワークショップ/ platform-workshop
databricksjapan
0
170
チームで実践する AI-DLC 思考の軌跡を残すチェックポイント設計
belongadmin
0
1.7k
Javaで学ぶSOLID原則
negima
1
270
Agentic ERPをどう設計するか ー 受発注エージェントを動かす、現場の知見と設計思想ー
recerqainc
1
660
Featured
See All Featured
Navigating the Design Leadership Dip - Product Design Week Design Leaders+ Conference 2024
apolaine
1
330
Site-Speed That Sticks
csswizardry
13
1.2k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
35k
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
Ethics towards AI in product and experience design
skipperchong
2
300
Ten Tips & Tricks for a 🌱 transition
stuffmc
0
120
Building an army of robots
kneath
306
46k
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
240
The Spectacular Lies of Maps
axbom
PRO
1
780
Navigating Weather and Climate Data
rabernat
0
210
The Language of Interfaces
destraynor
162
27k
Into the Great Unknown - MozCon
thekraken
41
2.5k
Transcript
Google DeepMindのロボット技術紹介 ~ RT-1からGemini Robotics-ER 1.5まで 2025.10.09 @natsutan 1
2 自己紹介 株式会社パソナ 営業統括本部 エキスパート・BPO事業本部 X-TECH本部 第1エンジニア室 AIソリューションチーム プリンシパルエンジニア 夏谷実
X:@natsutan
3 ロボット業界の概要 ここ数年のブレークスルーはLLM。LLMの登場で今までできなかったことができるようになった。 アメリカ、中国を中心にヒューマノイドロボットの開発が盛ん。季節に一回は大きな発表がある。 ・日本、ヨーロッパは既存の工場への導入を前提とした開発。 ・アメリカ、中国はロボットのための工場を作る。 https://www.youtube.com/watch?v=2hxFmwginMk
4 なぜロボットにLLMなのか? 従来のロボット開発だと、人間の常識を全て一から教えていた。 LLMを使うことで、常識を持った状態からの学習が可能になった。 画像から読み取れること ・天気は曇り ・場所は駅前 ・時計がある ・車が2台止まっている。一台はタクシー ・手前の横断歩道は渡れる
・柵は乗り越えられない
5 Google DeepMindの取り組み 2022年 RT-1:Transformerベースの模倣学習 2023年 RT-2:VLMモデルの採用 2023年 RT-X:ロボット向け大規模データセット 2025年
Gemini Robotics: Geminiベースのロボット向け基盤モデル
6 RT-1 https://robotics-transformer1.github.io/ 動画は四倍速 https://arxiv.org/pdf/2212.06817 ロボットの制御にTransformerを採用 13台のロボットを17ヶ月かけてデータを収集した。
7 RT-2 https://robotics-transformer2.github.io/ 動画は等倍 https://arxiv.org/pdf/2307.15818 RT-1の発展形。 VLMが採用されている。
8 RT-X https://robotics-transformer-x.github.io/ 動画は等倍 34の研究室から22種類のロボットのデータを収集。デ ータセットの共通化。 https://arxiv.org/pdf/2310.08864
9 Gemini Robotics 等倍アピール Geminiベースのロボット制御。 この動きはまず無理というレベルの制御をしている。 難易度の高いところ ・対象物が半透明 ・マニピュレーションしながら形が変化する。 ・狭いところに指や物を通さないといけない。これも半
透明かつ不定形。 ・双腕の制御 https://www.youtube.com/watch?v=m-G4- slYcGE&list=PLqYmG7hTraZC4Mx6pEKr6FVJehafA7vWE&index=16
10 Gemini Robotics ER https://storage.googleapis.com/deepmind-media/gemini-robotics/Gemini-Robotics-1-5-Tech-Report.pdf Gemini Robotics-ER Embodied Reasoning 人間のような思考を担当
Gemini Robotics ロボットのAction(制御) 担当 Google AI Studioから アクセス可能
11 まとめ Google DeepMind社からRT-1が発表されて3年でロボットのAI がめちゃくちゃ進化してます。 中国企業も負けてないので、毎月が驚きの連続。 こういう技術を趣味のロボットまで持っていきたい