文章作者、来源：雷峰网最近具身行业被一个开源项目刷屏了。最早只是小圈子里传“有人在社区开源了一整套具身数据集”。我抱着“看看热闹”的心态去看了看，越看越不对劲，这不是简单的数据集，这是一整个无本体数采系统啊。换句话说，别人开源的是"一段代码"，而这个开源的是一套全身无本体数采+质检+训练+真机评测的完整链路，还有文章作者、来源：雷峰网最近具身行业被一个开源项目刷屏了。最早只是小圈子里传“有人在社区开源了一整套具身数据集”。我抱着“看看热闹”的心态去看了看，越看越不对劲，这不是简单的数据集，这是一整个无本体数采系统啊。换句话说，别人开源的是"一段代码"，而这个开源的是一套全身无本体数采+质检+训练+真机评测的完整链路，还有

国内首个！具身数采「黑箱」正式开源，具身数据昂贵的时代结束了

来源：MetaEra

2026/06/16 10:44

阅读时长 10 分钟

如需对本内容提供反馈或相关疑问，请通过邮箱 crypto.news@mexc.com 联系我们。

文章作者、来源：雷峰网

最近具身行业被一个开源项目刷屏了。

最早只是小圈子里传“有人在社区开源了一整套具身数据集”。我抱着“看看热闹”的心态去看了看，越看越不对劲，这不是简单的数据集，这是一整个无本体数采系统啊。

换句话说，别人开源的是"一段代码"，而这个开源的是一套全身无本体数采+质检+训练+真机评测的完整链路，还有2000多小时、覆盖3000个任务的多模态无本体数据集，都完整打包放出来了。

论文地址：https://arxiv.org/abs/2604.13001

这在国内还是头一遭，于是我深扒了扒对应的论文：

简单来说，XRZero-G0 这篇论文做了两件事，第一是撬开了机器人数采的"黑箱"，手把手演示了如何超低成本采集一套高质量数据。第二，手把手教你怎么数据训练。

先说第一点，数据采集。之前大家可能听说过“具身行业采数据又难又贵”，甚至有人抛出暴论，说具身发展慢，都是被数采拖累了。

你看大模型，吃的是文本，互联网上到处都是。机器人吃的是物理数据，每一条都得真金白银去采。而且过去采数据，行业里有三个大坑，贵、脏、不可复用，这也构成了具身数据层的"不可能三角"。

XRZero-G0论文里，给了一个巧妙的解法，核心就一句话：人戴着设备去干活，现场不需要机器人。

这条路其实有人走过（比如UMI范式），但以前这种方式有个致命的毛病，采回来的数据像个"黑箱"，你不知道真机到底能不能跑通。而XRZero-G0这次通过三道"安检"，把黑箱变成了透明的白盒。

第一道安检：三个摄像头。

过去数采手持设备只有单视角或双视角，这种有个缺点，双手一交叉，或者物体被手臂挡住，数据当场报废。XRZero-G0 的做法很直接：给操作员戴上PICO VR 头显，头顶一个全局相机，左右手腕各挂一个相机。

这三路视角加上六自由度位姿信息，加上背包边缘计算做时空对齐，精度直接≤4 毫米，不管你怎么转身、俯身、走动，遮挡和漂移问题都不会发生。

第二道安检：装一个虚拟限位器。

大家知道人的关节灵活，能做瑜伽，但机器人不行。之前遥操作的时候，我做了一个机器人做不出的动作，结果电机烧了。XRZero-G0 很聪明，引入自动逆运动学（IK）验证，过滤掉超出关节极限的动作。

第三道安检：真机回放。

前两道筛完，系统还会随机抽一部分数据，直接丢给真实的双臂机器人做"开环回放"。只有机器人顺利把任务做完，这批数据才算入库。

三层漏斗筛下来，入库数据的有效率被拉升到了 85% 以上，可用性跟真机数据一样，采集速度还更快。

看论文里数据，简单任务从 35 秒压缩到 15 秒，提速 2.33 倍；复杂任务也能快 1.71 倍。峰值采集速度达到 93.2 条轨迹每小时。这不比真机香？

但以上只是教会了"怎么更好的采集数据"，XRZero-G0 论文里更关键的是教大家"怎么训"数据。

具身训练里，大家都知道要把"便宜无本体数据"和"昂贵真机数据"混在一起用，但比例怎么配？以前全靠炼丹。

XRZero-G0 团队做了一件特别扎实的事，系统性穷举实验，最终发现了一个"黄金比例"。

在这之前，他们对比了三套方案：

▪ 500 条纯真机数据（基线）

▪ 500 条真机+500 条无本体（1:1）

▪ 50 条真机+500 条无本体（10:1）

结果出乎意料：10:1 的方案，成功率跟 500 条纯真机基线持平，甚至更高。说人话就是：你把真机数据用量砍掉 90%，总成本压到传统方式的二十分之一，训出来的模型一样聪明。20 倍的成本效率跃升。

论文解释了这背后的原因，叫"少样本物理锚定效应"。

还没完，这套数据训出来的模型，还能做到"零样本"跨本体迁移。

前面说了，传统真机遥操作，最怕本体迁移。桌子高了十公分，或者换一台机器人，直接崩。但 XRZero-G0 是背包式的，操作员走来走去，采集过程中视角、高度、光照天然充满了动态变化。这种丰富的"噪声"，反而让模型练就了极强的鲁棒性。

论文展示了非常震撼的细节：把这套混合数据训出来的模型，扔到 EX001 和 CX001 上，没有见过真机数据，直接部署，结果插花、叠毛巾、装香肠都没问题。

简单聊聊XRZero-G0 读后感，这篇论文核心就是把"怎么低成本采数据"和"怎么高效用数据"两件事，像说明书一样，掰开揉碎了给从业者看。

大家都能感知到，具身行业正从"拼Demo"转向"拼数据"。但该如何堆时长，行业是缺乏共识和方向的。XRZero-G0把"更方便地采数据"、"找到完美的数据配比"，进而到最终实现"零样本跨本体迁移"这一整条链路，都教给行业了。

这种工程化的工作，不是某一个高校实验室或者明星学者能单枪匹马完成的，它必须是一支既懂学术又懂产业的产业界团队。

XRZero-G0 背后的公司，是自变量机器人（X-Square Robot）。

要理解自变量为啥能做XRZero-G0，看他们的路径选择就知道，公司从Day One就选端到端大模型，同时探索VLA、WM、WUM三条路线。圈内人都懂，这种路线没有扎实Infra能力根本跑不通，所以早期的从WALL-OSS，到XRZero-G0，自变量一直在建和Infra有关的基础设施。

这条路虽然难，但是正确。看资本就知道了，自变量不到两年9轮融资，估值过百亿，字节、美团、阿里、小米四家大厂都在股东名单。

至于XRZero-G0全量开源的原因，更简单粗暴了。

具身的"ChatGPT时刻"不可能靠一家公司憋出来。当高校、中小团队、个人开发者都能用XRZero-G0这套标准化工具链批量产数据时，全行业的数据飞轮才真正开始转动，那时候自变量的护城河，就建起来了。

文末附上 XRZero-G0 的GitHub主页，建议大家去玩玩看：

https://github.com/X-Square-Robot/XRZero-G0

世界杯预测，一单串多场，搏200倍收益！

MEXC App 6.60.0 全新升级，巴西/法国/阿根廷等最多20场组合，一键轻松下注！

免责声明: 本网站转载的文章均来源于公开平台，仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利，请联系 crypto.news@mexc.com 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证，并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考，不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。