文章作者、来源:雷峰网 最近具身行业被一个开源项目刷屏了。 最早只是小圈子里传“有人在社区开源了一整套具身数据集”。我抱着“看看热闹”的心态去看了看,越看越不对劲,这不是简单的数据集,这是一整个无本体数采系统啊。 换句话说,别人开源的是"一段代码",而这个开源的是一套全身无本体数采+质检+训练+真机评测的完整链路,还有文章作者、来源:雷峰网 最近具身行业被一个开源项目刷屏了。 最早只是小圈子里传“有人在社区开源了一整套具身数据集”。我抱着“看看热闹”的心态去看了看,越看越不对劲,这不是简单的数据集,这是一整个无本体数采系统啊。 换句话说,别人开源的是"一段代码",而这个开源的是一套全身无本体数采+质检+训练+真机评测的完整链路,还有

国内首个!具身数采「黑箱」正式开源,具身数据昂贵的时代结束了

2026/06/16 10:44
阅读时长 10 分钟
如需对本内容提供反馈或相关疑问,请通过邮箱 crypto.news@mexc.com 联系我们。

文章作者、来源:雷峰网

最近具身行业被一个开源项目刷屏了。

最早只是小圈子里传“有人在社区开源了一整套具身数据集”。我抱着“看看热闹”的心态去看了看,越看越不对劲,这不是简单的数据集,这是一整个无本体数采系统啊。

换句话说,别人开源的是"一段代码",而这个开源的是一套全身无本体数采+质检+训练+真机评测的完整链路,还有2000多小时、覆盖3000个任务的多模态无本体数据集,都完整打包放出来了。

论文地址:https://arxiv.org/abs/2604.13001

这在国内还是头一遭,于是我深扒了扒对应的论文:

简单来说,XRZero-G0 这篇论文做了两件事,第一是撬开了机器人数采的"黑箱",手把手演示了如何超低成本采集一套高质量数据。第二,手把手教你怎么数据训练。

先说第一点,数据采集。之前大家可能听说过“具身行业采数据又难又贵”,甚至有人抛出暴论,说具身发展慢,都是被数采拖累了。

你看大模型,吃的是文本,互联网上到处都是。机器人吃的是物理数据,每一条都得真金白银去采。 而且过去采数据,行业里有三个大坑,贵、脏、不可复用,这也构成了具身数据层的"不可能三角"。

XRZero-G0论文里,给了一个巧妙的解法,核心就一句话:人戴着设备去干活,现场不需要机器人。

这条路其实有人走过(比如UMI范式),但以前这种方式有个致命的毛病,采回来的数据像个"黑箱",你不知道真机到底能不能跑通。而XRZero-G0这次通过三道"安检",把黑箱变成了透明的白盒。

第一道安检:三个摄像头。

过去数采手持设备只有单视角或双视角,这种有个缺点,双手一交叉,或者物体被手臂挡住,数据当场报废。XRZero-G0 的做法很直接:给操作员戴上PICO VR 头显,头顶一个全局相机,左右手腕各挂一个相机。

这三路视角加上六自由度位姿信息,加上背包边缘计算做时空对齐,精度直接≤4 毫米,不管你怎么转身、俯身、走动,遮挡和漂移问题都不会发生。

第二道安检:装一个虚拟限位器。

大家知道人的关节灵活,能做瑜伽,但机器人不行。之前遥操作的时候,我做了一个机器人做不出的动作,结果电机烧了。XRZero-G0 很聪明,引入自动逆运动学(IK)验证,过滤掉超出关节极限的动作。

第三道安检:真机回放。

前两道筛完,系统还会随机抽一部分数据,直接丢给真实的双臂机器人做"开环回放"。只有机器人顺利把任务做完,这批数据才算入库。

三层漏斗筛下来,入库数据的有效率被拉升到了 85% 以上,可用性跟真机数据一样,采集速度还更快。

看论文里数据,简单任务从 35 秒压缩到 15 秒,提速 2.33 倍;复杂任务也能快 1.71 倍。峰值采集速度达到 93.2 条轨迹每小时。这不比真机香?

但以上只是教会了"怎么更好的采集数据",XRZero-G0 论文里更关键的是教大家"怎么训"数据。

具身训练里,大家都知道要把"便宜无本体数据"和"昂贵真机数据"混在一起用,但比例怎么配?以前全靠炼丹。

XRZero-G0 团队做了一件特别扎实的事,系统性穷举实验,最终发现了一个"黄金比例"。

在这之前,他们对比了三套方案:

▪ 500 条纯真机数据(基线)

▪ 500 条真机+500 条无本体(1:1)

▪ 50 条真机+500 条无本体(10:1)

结果出乎意料:10:1 的方案,成功率跟 500 条纯真机基线持平,甚至更高。 说人话就是:你把真机数据用量砍掉 90%,总成本压到传统方式的二十分之一,训出来的模型一样聪明。20 倍的成本效率跃升。

论文解释了这背后的原因,叫"少样本物理锚定效应"。

还没完,这套数据训出来的模型,还能做到"零样本"跨本体迁移。

前面说了,传统真机遥操作,最怕本体迁移。桌子高了十公分,或者换一台机器人,直接崩。但 XRZero-G0 是背包式的,操作员走来走去,采集过程中视角、高度、光照天然充满了动态变化。这种丰富的"噪声",反而让模型练就了极强的鲁棒性。

论文展示了非常震撼的细节:把这套混合数据训出来的模型,扔到 EX001 和 CX001 上,没有见过真机数据,直接部署, 结果插花、叠毛巾、装香肠都没问题。

简单聊聊XRZero-G0 读后感,这篇论文核心就是把"怎么低成本采数据"和"怎么高效用数据"两件事,像说明书一样,掰开揉碎了给从业者看。

大家都能感知到,具身行业正从"拼Demo"转向"拼数据"。但该如何堆时长,行业是缺乏共识和方向的。XRZero-G0把"更方便地采数据"、"找到完美的数据配比",进而到最终实现"零样本跨本体迁移"这一整条链路,都教给行业了。

这种工程化的工作,不是某一个高校实验室或者明星学者能单枪匹马完成的,它必须是一支既懂学术又懂产业的产业界团队。

XRZero-G0 背后的公司,是自变量机器人(X-Square Robot)。

要理解自变量为啥能做XRZero-G0,看他们的路径选择就知道,公司从Day One就选端到端大模型,同时探索VLA、WM、WUM三条路线。圈内人都懂,这种路线没有扎实Infra能力根本跑不通,所以早期的从WALL-OSS,到XRZero-G0,自变量一直在建和Infra有关的基础设施。

这条路虽然难,但是正确。看资本就知道了,自变量不到两年9轮融资,估值过百亿,字节、美团、阿里、小米四家大厂都在股东名单。

至于XRZero-G0全量开源的原因,更简单粗暴了。

具身的"ChatGPT时刻"不可能靠一家公司憋出来。当高校、中小团队、个人开发者都能用XRZero-G0这套标准化工具链批量产数据时,全行业的数据飞轮才真正开始转动,那时候自变量的护城河,就建起来了。

文末附上 XRZero-G0 的GitHub主页,建议大家去玩玩看:

https://github.com/X-Square-Robot/XRZero-G0

世界杯预测,一单串多场,搏200倍收益!

世界杯预测,一单串多场,搏200倍收益!世界杯预测,一单串多场,搏200倍收益!

MEXC App 6.60.0 全新升级,巴西/法国/阿根廷等最多20场组合,一键轻松下注!

免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 crypto.news@mexc.com 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。

一脚点球,直通 50,000 USDT!

一脚点球,直通 50,000 USDT!一脚点球,直通 50,000 USDT!

百倍收益围猎第4期 · 世界杯专场,完成 DEX+ 任务解锁冠军转盘!