AI大狗
已收录一千多项AI工具
返回资讯资讯详情
千元级机器人训练数据系统开源,前华为天才少年团队将精度提升至毫米级

千元级机器人训练数据系统开源,前华为天才少年团队将精度提升至毫米级

点击查看原文>

2026-06-30AI大狗3 分钟阅读13138549 阅读热度 770应用落地开源项目智能硬件
01

导读

机器人训练长期受困于数据获取的高昂成本和低效问题,如今一支中国团队试图打破这一僵局。由前华为天才少年李元庆领衔的穹明智能,近日开源了其千元级手持数据采集系统UMI ver.2,将精度提升至毫米级,并实现了双臂协同操作,而整套硬件成本不到3000元。

千元级机器人训练数据系统开源,前华为天才少年团队将精度提升至毫米级閰嶅浘1
02

从实验室到家庭场景的数据困局

大语言模型的成功,很大程度上得益于海量、低成本的互联网文本数据。但机器人训练无法直接复制这一路径——机器人数据从一开始就“昂贵”且“孤立”。传统方案依赖专业遥操作设备、光学动捕系统或力矩传感器,整套设备成本动辄数十万甚至上百万元,且不同机器人本体之间的数据互不通用,形成了“数据孤岛”。仿真数据虽成本低廉,却存在难以跨越的“仿真到现实”鸿沟。

2024年,斯坦福大学推出的UMI抓夹方案曾给行业带来希望:一套3D打印塑料架搭配GoPro相机,成本仅400美元(约合2800元人民币),验证了低成本采集的可行性。但UMI的精度仅停留在厘米级,只能应对积木叠放、衣物折叠等粗粒度任务,无法满足拧螺丝、穿针引线等需要“手感”的精细操作,且仅支持单臂操作,而人类日常80%以上的操作需要双手协同。

03

穹明智能的解法:系统工程思维压缩成本与提升精度

穹明智能的UMI ver.2,在UMI的低成本基础上实现了质的飞跃。据团队技术探索负责人高圆寺介绍,该系统的定位误差控制在0.5毫米以内,较上一代UMI提升了十倍以上,足以覆盖大多数精细操作类具身任务的数据采集需求。成本则进一步压缩至不到3000元,仅为传统动捕方案的1/100甚至更低。

“我们不是为低成本而低成本,而是基于对UMI数据的定位做出的选择。”高圆寺强调,团队将机器人学习视为一个系统性工程,而数据的质量与规模是决定模型效果的关键。UMI ver.2采用“无本体采集”方式,与机器人本体解耦,更适合在家庭等真实环境中采集数据。为了提升数据有效率——行业痛点在于采集100小时数据中可能只有10小时可用——团队从多传感器同步、视觉质量、位姿估计方案到采集流程标准化进行了系统性优化。例如,采用红外方案替代SLAM以应对家庭场景的精度下降,并严格定义操作SOP,从源头保证数据质量。

在硬件选型上,团队的原则是“在保证数据对齐和视频质量的前提下,尽量选用实惠的组件”。他们并不追求UMI数据能一次性训练出高精度泛化模型,而是让模型理解人类操作意图即可,因此无需亚毫米级精度。同时,整个训练pipeline经过优化,使得UMI数据能够与真实机器人数据对齐。

04

开源背后的生态野心与风险

穹明智能选择将UMI ver.2彻底开源:所有源码、硬件清单、部署教程、训练推理流程完全开放,用户可自由使用、修改、分发,二次开发衍生作品需以同等协议开源。品牌与开发者生态负责人郁葱葱表示,通用具身模型所需的数据规模堪比“登月工程”,不可能靠少数公司内部采集完成,需要整个社区共同参与。开源是目前构建生态的最佳路径。

然而,开源也伴随着风险,包括协议违规与商用滥用、技术碎片化、未经验证的修改导致安全隐患、社区维护压力以及高精度定位能力被用于非合规场景。郁葱葱坦言:“开源是勇敢者的游戏。”团队认为,关键在于通过清晰的协议约束、分层的能力开放机制以及社区共建的治理体系,将不确定性收敛在可控范围内。UMI ver.2将明确采用GNU General Public License。

穹明智能成立于2025年底,短短两年内已提出“伴随式数据采集”理念,自研外骨骼设备CoMiner、口袋机RoboPocket等数采设备,并与优必选等头部人形机器人企业、地方大型数采中心及跨国数采基地达成战略合作。同时,团队还推出了搭载自研大脑的软硬件一体解决方案,在酒店服务、零售药房等真实场景中批量部署。UMI ver.2的发布,或许正为具身智能领域的数据“互联网”铺设第一块基石。

文章来源:https://aidadog.com/news/ai/l9mzkmxqyk4wqdnyhwq21nde

同类推荐

继续阅读

查看更多