Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Dexmal 原力灵机

Dexmal 原力灵机

Avatar for TAKASU Masakazu

TAKASU Masakazu

May 08, 2026

More Decks by TAKASU Masakazu

Other Decks in Business

Transcript

  1. 公司发展历程 公司正式成立 宣布完成2亿元天使轮融资 AI 国际顶赛 CVPR2025 RoboTwin,斩获“双臂 协作”赛道并列第一;全球机器人顶赛 ICRA 2025

    ManiSkill-ViTac,荣获“纯触觉操控”和“触 觉传感器设计”两个赛道金牌 公司联合Hugging Face发起全球首个 具身智能的大规模真机评测平台 开源一站式 VLA 工具箱 ,推 出首款开源硬件产品 公司发表AI学术顶会论文十余篇, 代 表作Real-time VLA、MemoryVLA 和 SaptialActor 获得学界一致认可 完成近 A 轮融资由蔚来资本领投, A+轮融资阿里巴巴为独家投资方 与Hugging Face、智源研究院、 智 元机器人、Qwen、星海图、自变 量、清华大学、西安交通大学、 GOSIM 等共同成立RoboChallenge 组委会 2025年3月 2025年5月 2025年10月 2025年11月 2026年2月 ,取 得RoboChallenge榜单双项全球第一 发布,与RLinf 达成战略合 作,携手清华大学及无问芯穹打造具 身智能的PyTorch 发布 具身原生应用量产工作流
  2. 顶级团队:极稀缺的兼备大规模基模训练、AI技术突破、规模 化AI机器人落地、高可靠硬件量产能力的团队 • 旷视第6号员工,组建旷视研究院,管理百余人算法团队 • IOI金牌;软硬一体化算法专家; 清华姚班第一名 • 国内最早引入CNN降噪算法的端上实现 •

    开发国内第一颗纯NPU-ISP,开创“黑光”IPC新品类 • 开发全球第一颗基于AI算法的屏下光学指纹识别产品,积 累出货 2亿+颗 多领域顶尖复合型人才 范浩强 联合创始人 • IOI金牌;NIST FRVT2018冠军; 中国首届人工智能大赛人脸组金 奖;清华大学电子工程系毕业 • 旷视第12号员工,旷视科研院轮 值院长 • 旷视人脸算法负责人,算法覆盖 各旷视人脸产品线 • 旷视深度学习训练框架天元 MegEngine负责人 周而进 联合创始人 稀缺的大规模基础模型训练经验 唐文斌 联合创始人 / CEO • 旷视科技联合创始人,清华姚班毕业,计算机科学硕士 • 荣膺首届Yao Award,并率队斩获ACM/ICPC世界总决赛全 球第六(亚洲第一); 任中国信息学奥林匹克国家队总教 练长达七年 • 从0到1领导构建旷视物流机器人业务并开发机器人网络 操作系统旷视河图 • 主导旷视从顶尖科研团队向产业化落地的转型,实现多 个业务多年飞速增长 规模化AI机器人落地 大规模基础模型训练 • 旷视科技高级算法研究员 • 在CVPR、ICCV等累计发表论文30 余篇,成果入选2022年最具影响 力的100篇AI论文 • ECCV2022 DanceTrack国际挑战赛、 CVPR2023自动驾驶国际挑战赛冠 军;入选Elsevier世界前2%科学 家 汪天才 联合创始人 智驾端到端算法训练及落地经验 • 智元制造部负责人,实现国内首 个人形机器人商用量产,月产超 300 台、首批千台下线 • 禾赛制造部1号员工,建成国内首 座激光雷达量产工厂 • 负责管理苹果中国代工厂,深度 参与 iPhone、MacBook 等产品量 产爬坡 • 清华机械系;MIT制造学硕士 张绍政 联合创始人 丰富的高可靠具身硬件量产经验
  3. 技术理念:具身原生 Embodied Native 智能本质和形成机制都根植于物理交互的新AI范式 数据原生 • 真实世界全要素数据 • 具身多模态数据 •

    具身感知数据 • 从0开始,学习物理世界交互 训练原生 • 理解世界、影响世界,预测世界, 一起训练 • 模型为真实世界设计,用真实世 界效果评价 • Reward来自真机效果 架构原生 • 多模态支持 • 记忆能力 • 通用Action能力
  4. 原生范式,面向原生通用具身智能 具身大脑 Sys0:实时控制、稳定执行、稳定闭环 Sys1:闭环交互-感知行动-短时记忆 多感知 视觉 触觉 力反馈 深度 语音指令

    多形态 桌面双臂 轮式双臂 人行 四足 夹爪 灵巧手 通用状态反馈 通用任务指令 通用任务指令 真机 真实反馈 VLA基座 统一表征/统一策略/技能泛化 世界模型 模拟反馈 监督与规划 分层系统 Sys2:高层认知、规划决策、长时记忆
  5. 打造类人类智能系统的算法架构,实现High level 智能目标 以大规模 模型为基座, 和 协同强化, 持续提升模型能力 底色代表Dexmal和其他公司的差异化 Env-环境

    全球首个 多源数据基座VLM大模型 类比人类多传感系统 通用行动 通用观测 真机 真实反馈 世界模型 模拟反馈 Sys 1 Sys 0:实时控制、精细执行、稳定闭环 Sys 2:高层认知、规划决策、长时记忆 VLM Pretrain 真实世界 RL VLA基座 统一表征/统一策略/技能泛化 监督与规划 智驾数据 具身多模态数据 互联网数据
  6. 预训练:具身原生范式,全球首个融合多源数据大规模预 训练的VLM 联合训练 任何单一具身智能公司能企及的水平 具身多传感数据 Dexmal融合多传感数据的多模态具身智能 大模型 MMLA 自研各类模态传感器 获取底层无损机器人多模态数据

    解决单一模态无法处理的 corner cases 均与人类生活 息息相关 多模态互联网数据 提供语义理解、逻辑推理、知识库等基础, 是高阶智能的基石 智驾数据 世界感知与时空推理,对室外物理世界的 宏大、复杂理解,如物理规律、复杂场景 动态 多视角视觉 环境全局感知 物体识别与定位 深度信息 精确的空间关系 与距离感知 力觉信息 关节感知 柔顺控制 触觉信息 末端精细感知 判断抓取状态
  7. 后训练:创新性将VLA、Memory和World Model 融合,提升 复杂任务的成功率 现有VLA存在缺陷(如PI) 缺乏工作记忆 • 难以在长对话或任务 中保持连贯性 •

    混淆新旧信息 物理理解有限 • 感知模态单一 • 缺乏真实模拟反馈 难以跨本体 创新架构 维持任务连贯 理解时序逻辑 记录历史状态 解决机器人在复杂长程任务中因缺乏历史信息而导致的决策困难 Counter-Case数据 模拟状态演变 物理世界建模 通过识别预测与现实的差异,获取高质量训练样本,不断强化VLA输出 赋能VLA智能闭环 深度耦合 · 相互增强 VLA + 记忆 + 世界模型 持续协同强化 更快触及 High Level智能上限
  8. 应用场景RL:率先实现真实场景应用RL闭环,加速提升模 型智能和业务落地成功率 高效自采+真实场景RL 实现策略闭环自进化 采集数据 RL 真实场景 真机Rollout VLA 输入

    收集正/反样本 动作生成 策略进化更新,实现成功率更高的VLA 通过 RL 在业务场景中提升落地成功率 • :提升效率与精准度,同时 实现低成本大规模采集 • :超泛化组合覆盖 任务 排列,根据目标 低成本高效自采多元数据 • 物流场景内 的任务,是积 累真机数据、积累物理交互、进行强化学习的绝 佳环境 最快实现物流场景数据积累和 应用场景RL 应用RL 自采数据
  9. System 0:用智能解决具身落地“最后一毫米” System 0 可解决真实世界任务挑战 实现 参考:PI的RLT算法,但其为单任务的模型,灵机在做可泛化的通用模型 Sys 0 实时微调输出,响应

    实时传感数据,以控制复 杂执行末端 System 1 System 0 单次控制计算延时 在 2ms 以内 模块 矩阵 模块 效果 DM-Hand 高频控制接入 高自由度灵巧手 原不可行任务 灵巧手 Demo 展示 DM-Touch 面向接触密集任务 实现泛化性力控轨迹调节 高精尖任务 显著提升 DM-Speed 面向站效提升 实现通用轨迹调速 基础通用任务 大幅提升 计划推进中
  10. 26年超百万小时真实数据累积,融合超千万小时智驾/大模 型数据训练,有望最快触达通用具身智能 融合具身真实数据、智驾数据、互联网多模态数据,驱动模型成功率及泛化性指数级跃升 千万小时 融合数据 千万小时 融合数据 模型能力 快速进阶 模型能力

    快速进阶 超百万小时真实数据,双轨采集 (棚内受控+真实场景外采)覆盖 物流、工业、家庭等多元场景 千万级海量数据,涵盖图像、语言、 视频、空间等多元模态,增强模型 对物理世界的通用理解能力 核心单任务成功率近100%;零样本 泛化任务达90% SR;小样本微调任 务达70% SR 从单步操作扩展到多步任务链,覆 盖抓取、装配等原子动作,适配物 流等场景及多种机器人形态 实现物体、场景、任务、系统四个 层面的泛化
  11. 以通用具身智能为底座,撬动物流场景万亿美金级新增市场 • 目前 纯人工 • 全球人工 • 人工占比全仓 实现任务 完成

    • 人工参与度 • 全球人工 • 人工占比全仓 精准识别 万物抓取 泛化分装 复核物品 装箱/袋 填充气泡袋 缠保鲜膜 封箱 贴快递单 实现 步骤:从订单箱到打包台进行包装 步骤:从来源把物品放入订单箱 模型能力 持续提升
  12. DM原生大模型:更泛化、更智能 2026.2月 • 原子动作:广义动作、 精细操纵、双手协作 • 数分钟任务 2026.7月 • 跨物品、跨场景泛化:

    • 数十分钟复杂长程任务 • 零样本学习开箱即用 • 封闭场景特定任务 2026.12月 • 跨任务、跨本体泛化 • 小时级复杂任务 • 多技能开箱即用 • 稳定运行封闭场景任务
  13. 构建空间推理思维链 Pick the flower vase from the table 201, 10,

    155, 75, 100, 122, 5 [a_t, a_{t+1}, ..., a_{t+H}] 子任务预测 目标定位 轨迹规划 离散动作 连续动作 Subtask Target BBox EEF Trajectory Discrete Action Continuous Action Robot State Instructio n ε ~ N(0, I) ActionExpert (300M) LLM(1.7B) (400M)
  14. 率先构建具身行业基础设施,实现指数级迭代 • 模型“一键批量”部署到机器人本体 • 真机数据实时反哺训练,形成“越用越 智能”的正向循环 • 具身智能领域的“PyTorch”级开源框架 • 支持多源数据(真机交互、仿真、自

    动驾驶空间数据等)混合混训,统一 数据格式 • 联合Hugging Face ,发起国际性的机 器人基准测试 • 全球首个大规模具身智能真机评测标 准平台,旨在建立统一、客观、可复 现的真机性能基准 • 提供 快拆、易维护、成本较低的硬件 方案 DOS-W1 • 整机共17个自由度,广泛应用于科研 实验、教学实践、创客开发等场景 作为行业标准制定者, 形成 和
  15. Dexbotic&Rlinf携手打造具身智能 PyTorch 定位 作用 产出 Evolution 大模型 RL 后训练 利用强化学习进行深度攻坚

    高成功率的 VLA 最终策略 Foundation VLA预训练+有监督微调 利用海量数据进行广度覆盖 通用常识的VLA初始策略
  16. DFOL (Distributed Field Online Learning) 具身原生的应用量产工作流 Positive Example Negative Example

    Weight 云端 现场 模仿学习 强化学习 动作设计 迭代反馈 部署 可复制、可预期的 任务成功 • 人类与算法的联合迭代,快速实现 成功率与节拍的提升 • 来自一线现场的真实数据,是模型 进步的最佳养料
  17. 商业化范式:独创Physical Harness高效突破落地瓶颈 的可高效解决真实客户需求且实现具身在应用场景中RL的系统 L1 简单任务 标准规则物品(如盒子、瓶子) 简单硬件 世界模型 成本低,效率高,快速为客户产生价值, 降低人力成本

    L2 复杂任务 双臂机器人 具身模型 复杂情况(如柔性、不规则物品) 部分失败 遥操介入 解决行业绝大多数痛点 基于真实场景进行 ,形成 遥操介入&仿真还原 收集Corner Case 反哺模型进化 人工兜底 目前设备或者算法无法实现的任务 L3 长尾任务 系统闭环,完成所有业务 业务真正打通 任务 失败 收集Corner Case 未来逐步优化 深度融合应用需求,选择最优硬件形态 基础硬件 高性价比 低自由度 场景化硬件 商用级可靠 强软硬协同 场景定义硬件
  18. 长期形成智能、数据、商业化的增长飞轮 智能 数据 场景 应用场景RL+高效采集真机数据 • 率先推出具备高阶智能的具身大模型 • 首个融合大模型、智驾、具身数据的联合基座大模型 •

    Physical Harness 方案率先落地在优衣库、iHerb等KA客户,实现数亿级订单 • 具备高阶复杂任务规划能力和超高长程任务成功率的模型 • 具身智能领域商业化金额最大(非科研娱乐),达十亿级收入 • 具备交互性、高成功率的真正具身智能 • 从物流拓展到零售、商用等,为2C做好准备