VLAモデル構築のための AIロボット向け模倣学習キット

Ⓒ ugo, Inc. 2025. All rights reserved. Ⓡ AI ROBOT
JAPAN #1 AIロボット持ち込み勉強会 VLAモデル構築のための AIロボット向け模倣学習キットｕｇｏ株式会社

Ⓒ ugo, Inc. 2025. All rights reserved. 松井健スマホApp
システム開発 2023年東証グロース IPO #1 2006- 2011 ｕｇｏ株式会社代表取締役CEO IoT機器受託開発・量産事業会社へ売却 #2 2011- 2020 AIロボット #3 2018- Now Ⓡ 2 テクノロジー分野での起業３回システム開発 ▶ IoT機器開発 ▶ ロボティクス 6年 9年 8年〜

Ⓒ ugo, Inc. 2025. All rights reserved. 所在地東京都千代田区東神田 1-7-8
設　立 2018年2月20日代表者代表取締役CEO 松井健従業員数 87名資本金 1億円事業内容・ugoソリューションの提供・運用・RaaSフレームワークの開発・提供・運用ｕｇｏ株式会社についてユーゴー 4 人とロボティクスの融合で、新しい社会システムを構築し、新しい価値観を創する。 MISSION

Ⓒ ugo, Inc. 2025. All rights reserved. Ⓡ SCALE-OUT HUMAN
POSSIBILITY VLAモデル構築のための AIロボット向け模倣学習キット

Ⓒ ugo, Inc. 2025. All rights reserved. AIロボットを実現する｢フィジカル AI｣とは？ 8
ロボットや自動運転車などの物理的なシステムが、認識･理解思考行動現実世界を理解して “行動” に変えるAI 3D空間と物理世界を踏まえて思考し、マルチモーダルなデータを取り込み現実世界を認識･理解し、自律マシンが実行可能な行動を出力するこのような基盤モデルを、 VLAモデル (Vision-Language-Action) と呼ぶ

Ⓒ ugo, Inc. 2025. All rights reserved. 動向：AIロボット向けの基盤モデル / VLAモデル
9 VLAモデルを構築するためには、大量のロボット動作データセットが必要引用）米 Physical Intelligence社 https://www.physicalintelligence.company/research/real_time_chunking 様々なタスクを柔軟にこなせる AIロボットを実現しようと、あらゆる動作を学習させ汎化させた AIロボット向け基盤モデル / VLAモデルを、米中スタートアップや大学研究機関が研究開発している。引用）米 Figure AI社 https://youtu.be/Eu5mYMavctM?si=vc26_4SxdTgfHlxw

Ⓒ ugo, Inc. 2025. All rights reserved. 動向：AIロボット･データファクトリー 10 「頭脳」訓練工場で黙々と働く、
中国の人型ロボットたち中国のの人型ロボットユニコーン「智元機器人（ Agibot）」が上海市に巨大な「データ収集工場」を建設。（広さ3000平方メートル、200名以上のオペレーターが常時作業しデータ収集している）ヒューマノイドを遠隔操縦してあらゆるマニピュレーション動作を収集し、模倣学習し、汎用的なAIロボット向けのVLAモデルを開発している。引用）36KrJapan - https://36kr.jp/328562/ 寝室では、器用に洋服をたたむタスクを模倣学習する。スーパーのレジでは、ハンドスキャナーを持って商品バーコードを読み取る。

Ⓒ ugo, Inc. 2025. All rights reserved. 模倣学習とは？模倣学習（ Imitation
Learning）とは、専門家や熟練者の行動を観察し、それを模倣することで行動パターンを学習する機械学習の一手法です。強化学習のように試行錯誤を繰り返しながら報酬を最大化するのではなく、人間などの熟練者が実際にどのように行動したかというデモンストレーションデータから直接学習する点が特徴です。 11 模倣学習サイクル引用）図: SO-ARMとACTで実践する模倣学習 https://zenn.dev/rktm/articles/894b2ffccaf11f 模倣学習

Ⓒ ugo, Inc. 2025. All rights reserved. 13 AIロボット向け模倣学習キット直感的に遠隔操縦できる
専用バイラテラルコントローラ Bilateral 2ch ugo RobotConfig Library for LeRobot OSS模倣学習フレームワーク専用充電器ヘッドマウントカメラハンドカメラ

Ⓒ ugo, Inc. 2025. All rights reserved. AIロボット向け模倣学習キットの動作構成 15 オペレーター
コントローラ操縦デモンストレーションデータセット ugo Pro R&D 学習させたい動きのデータを収集 AIモデル学習･実行

Ⓒ ugo, Inc. 2025. All rights reserved. LeRobot連携をオープンソースで提供 16 模倣学習環境は、オープンソースソフトウェアである
“LeRobot” をベースに構築が可能です。本キットが対応する LeRobot用のプラグイン及びユーティリティツールも、オープンソースで公開されております。 ugo RobotConfig Library for LeRobot https://github.com/ugo-plus/lerobot-robot-ugo-pro テレオペ用マルチカメラモニタリングツール https://github.com/ugo-plus/ugo_multicam_monitor

Ⓒ ugo, Inc. 2025. All rights reserved. LeRobotとは 17 AIコミュニティのHugging
Faceが開発・公開している、ロボット学習のためのオープンソース・ライブラリおよびフレームワークです。データ収集モデルのトレーニングフィジカル AI 入門と実践 ~LeRobotで手を動かす　　ロボット作製と模倣学習 ~ 著者：日本PhysicalAI協会秋葉原支部実機での推論ロボット学習のための統合パイプライン模倣学習(IL) VLA 強化学習(RL) 報酬モデル

Ⓒ ugo, Inc. 2025. All rights reserved. LeRobotがサポートする Policy /
VLAモデル 18 Policy 概要利点制約 ACT (Action Chunking with Transformers) 行動クローニング型。画像＋状態から複数ステップの行動を一括生成する軽量Transformer。軽量・高・高精度。少量デモ (50件程度) で高成功率。タスク汎化が弱く、マルチタスクや言語入力に非対応。 Diffusion Policy 拡散モデルベースの行動生成。ノイズ除去過程で連続制御を学習。滑らかな動作・安定した学習。計算負荷が高くリアルタイム制御は工夫が必要。 SmolVLA (Small Vision-Language-Action) 小型VLMベースの模倣学習モデル。視覚＋言語＋状態から低レベル行動を生成。軽量でGPU負荷小。多タスク対応・オープンソース。長文指示や複雑推論は苦手。微調整が必須。 π₀ (Pi-0) 大規模PaLI-Gemmaベースの汎用VLAモデル。言語指示と画像から多ロボット制御。多ロボット・多タスク対応。高精度かつ 50Hz制御可。巨大（3Bパラメータ）で推論に高 GPUメモリ(約14GB)が必要。 π₀.₅ (Pi-0.5) π₀の改良版。Web・実ロボ混合学習による汎化力強化モデル。未知環境・新タスクへの適応性が高い。計算・データ規模が非常に大きい。 NVIDIA GR00T N1.5 NVIDIA開発の汎用推論モデル。マルチロボットVLA。言語追従・複雑マニピュレーションに強い。高性能GPU必須。学習データ非公開部分あり。 ※ここに紹介されているVLAモデルは、LeRobotでサポートされている、もしくは互換可能と想定されるVLAモデル群ですが、当社の模倣学習キットで動作を保証するものではありません。

Ⓒ ugo, Inc. 2025. All rights reserved. BYOH 具体実装レイヤー CLI
エントリポイント抽象基底レイヤー LeRobotの内部アーキテクチャ 19 Robot - connect() - calibrate() - configure() - get_observation() → dict - send_action(action) → dict - disconnect() Teleoperator - connect() - calibrate() - configure() - get_action() → dict - send_feedback(feedback) - disconnect() lerobot-calibrate lerobot-teleoperate lerobot-record lerobot-train / eval プラグイン発見・共通処理 lerobot_robot_* lerobot_teleoperator_* lerobot_camera_* プレフィックスのパッケージを発見 record_loop() 　 : 制御ループ teleop.get_action() robot.send_action() robot.get_observation() dataset.save_frame() Robot Config MyCoolRobot MyCoolRobotConfig MyBilateralController ハードウェア I/O レイヤー Camera MotorsBus Teleoperator Config

Ⓒ ugo, Inc. 2025. All rights reserved. AIロボット向け模倣学習の流れ 20 コントローラ
デモンストレーションデータセット ugo Pro R&D 学習させたい動きのデータを収集ローカル GPU or クラウド GPU 環境で方策の学習模倣学習キットお客様デモンストレーションの収集方策の学習実行と評価性能の改善 PC環境 LeRobot環境が構築されたカメラ ugo Pro R&D PC環境動作方策 VLAモデル VLAモデルを実行カメラ評価改善案アーム動作行動のカメラ(RGB)＋センサ列（関節角/力トルク等）の時系列ログ

Ⓒ ugo, Inc. 2025. All rights reserved. 模倣学習データ取得のコツ 23 Data
is King データ品質が成功の鍵ロボットのタスク実行精度はデータの良し悪しで決まります。 📷 カメラは全ての対象物が画角に収まる位置に前方斜め上からの視点が望ましく、操作用のリーダーアームは映さないように配置し、照明や背景にも配慮し、見やすい環境を意識する。 ⚠ 極端なバリエーションの過多初期段階から条件を増やしすぎるとモデルがうまく学習できず、性能低下の原因になります。バリエーションは段階的に拡大し、モデルの様子を見ながら追加しましょう。 🎯 タスクは明確かつシンプルなものから複雑な課題は成功デモが集めにくく精度も下がりやすいため、まずはシンプルな作業から開始するのがお勧め。 🔄 データの多様性あらゆる状況に対応できるモデルにするには、データ収集時に適度なバリエーションを持たせることが重要です。物体の形・色・向き・配置場所など条件を変えたデータを集めて汎用性を高めます。徐々に種類を増やすよう心がけましょう。目安として最初は50エピソードほど収集し、10エピソードごとに条件を少しずつ変えると良い。 ⚠ 失敗データはやり直しましょう人間の操作ミスやタスク未完了のエピソードをデータセットに含めると、モデルが誤学習する恐れがあります。失敗時はそのエピソードを保存せずやり直すようにしましょう。

VLAモデル構築のための AIロボット向け模倣学習キット

VLAモデル構築のための AIロボット向け模倣学習キット

Ken Matsui

More Decks by Ken Matsui

Other Decks in Technology

Featured

Transcript

Ⓒ ugo, Inc. 2025. All rights reserved. Ⓡ AI ROBOT

Ⓒ ugo, Inc. 2025. All rights reserved. 松井健スマホApp

Ⓒ ugo, Inc. 2025. All rights reserved. CONFIDENTIAL

Ⓒ ugo, Inc. 2025. All rights reserved. 所在地東京都千代田区東神田 1-7-8

Ⓒ ugo, Inc. 2025. All rights reserved. 6

Ⓒ ugo, Inc. 2025. All rights reserved. Ⓡ SCALE-OUT HUMAN

Ⓒ ugo, Inc. 2025. All rights reserved. AIロボットを実現する｢フィジカル AI｣とは？ 8

Ⓒ ugo, Inc. 2025. All rights reserved. 動向：AIロボット向けの基盤モデル / VLAモデル

Ⓒ ugo, Inc. 2025. All rights reserved. 動向：AIロボット･データファクトリー 10 「頭脳」訓練工場で黙々と働く、

Ⓒ ugo, Inc. 2025. All rights reserved. 模倣学習とは？模倣学習（ Imitation

Ⓒ ugo, Inc. 2025. All rights reserved. 12

Ⓒ ugo, Inc. 2025. All rights reserved. 13 AIロボット向け模倣学習キット直感的に遠隔操縦できる

Ⓒ ugo, Inc. 2025. All rights reserved. AIロボット向け模倣学習キットの動作デモ 14 https://www.youtube.com/watch?v=DLFMDuaDhho

Ⓒ ugo, Inc. 2025. All rights reserved. AIロボット向け模倣学習キットの動作構成 15 オペレーター

Ⓒ ugo, Inc. 2025. All rights reserved. LeRobot連携をオープンソースで提供 16 模倣学習環境は、オープンソースソフトウェアである

Ⓒ ugo, Inc. 2025. All rights reserved. LeRobotとは 17 AIコミュニティのHugging

Ⓒ ugo, Inc. 2025. All rights reserved. LeRobotがサポートする Policy /

Ⓒ ugo, Inc. 2025. All rights reserved. BYOH 具体実装レイヤー CLI

Ⓒ ugo, Inc. 2025. All rights reserved. AIロボット向け模倣学習の流れ 20 コントローラ

Ⓒ ugo, Inc. 2025. All rights reserved. 模倣学習におけるデータ取得のデモ 21

Ⓒ ugo, Inc. 2025. All rights reserved. テレオペ用マルチカメラモニタリングツール 22 オープンソースで公開中

Ⓒ ugo, Inc. 2025. All rights reserved. 模倣学習データ取得のコツ 23 Data

Ⓒ ugo, Inc. 2025. All rights reserved. CONFIDENTIAL Let's start