机器人 · Robotics · Dataset

RoboCOIN

An Open-Sourced Bimanual Robotic Data COllection for INtegrated Manipulation
Shihan Wu, Xuecheng Liu, Shaoxuan Xie, Pengwei Wang, Xinghang Li, Bowen Yang, Zhe Li, Kai Zhu, Hongyu Wu, Yiheng Liu, 等 82 位作者

RoboCOIN 是首个覆盖 15 种机器人平台、收录超过 18 万条人类遥操作示教的开源大规模双臂操作数据集。配套分层标注体系(Capability Pyramid)与 RTML 质量过滤框架,在 RoboTwin 2.0 仿真基准及真实机器人上均取得显著性能提升。

arXiv 2025.11 15 机器人平台 421 双臂任务 📄 arXiv:2511.17441 PDF 全文
bimanual manipulation robotic dataset teleoperation capability pyramid RTML CoRobot 双臂机器人 跨本体迁移 policy learning hierarchical annotation

01 动机 · Motivation

双臂协作操作(bimanual manipulation)是机器人迈向通用操作能力的关键一步,却面临严重的数据瓶颈:现有数据集大多针对单一机器人平台、任务类型单一、缺乏高质量标注,且规模远不足以支撑大模型预训练。

"Existing datasets are often limited in scale, diversity, or quality, failing to capture the breadth of bimanual manipulation tasks required for general robot learning."
RoboCOIN 数据集总览
图 1 · RoboCOIN 总览。数据集支持 15 种不同机器人平台,涵盖 421 项双臂任务,分布于 16 种真实场景(居家、商业、工作),收录 18 万余条高质量遥操作示教轨迹,并提供一键安装接口(one-click installation)。
180K+高质量示教轨迹
421双臂操作任务
15机器人平台
432操作对象类别
数据采集平台
图 2 · 数据采集平台类型。三大类平台:双臂机器人(dual-arm,如 AgileX Cobot Magic,配平行夹爪)、半人形机器人(half-humanoid,如 Realman RMC-AIDA-L,配外骨骼遥操作)以及人形机器人(humanoid,如 Unitree G1edu-u3,配动作捕捉设备)。

为什么需要 RoboCOIN?

数据集统计
图 3 · 数据集统计概览。15 个平台分三类,16 种场景(居家 47.1%、商业 18.6%、工作 34.3%),39 种协作动作类型,以及 432 种操作对象(刚性 83.9%、铰链 4.2%、可变形 11.9%)。

02 方法 · Method

RoboCOIN 由三部分构成:大规模多平台双臂数据集本身、层级能力金字塔(Capability Pyramid)标注体系,以及 CoRobot 数据处理管线——其核心是机器人轨迹标记语言(Robot Trajectory Markup Language, RTML),用于自动化质量验证与过滤。

分层能力金字塔(Hierarchical Capability Pyramid)

分层能力金字塔
图 4 · 三级分层标注体系。轨迹级(trajectory-level)提供全局任务概念;片段级(segment-level)提供时间对齐的子任务分解;帧级(frame-level)提供密集运动学细节(运动参数、夹爪状态),支持从概念理解到精细控制的多分辨率学习。

CoRobot 数据处理管线

CoRobot 处理管线
图 5 · CoRobot 三组件示意。(1)RTML 轨迹评估与过滤;(2)半自动分层标注管线(目标检测器 + 规则工具 + 人工精修);(3)基于 LeRobot 框架的统一机器人接口,支持多平台坐标对齐与数据集原子化管理。

RTML:机器人轨迹标记语言

RTML 以 YAML 格式定义两类约束,对每条轨迹进行自动化验证:

全局约束(Global Constraints)

  • 工作空间边界(workspace boundaries)
  • 速度 / 加速度上限(velocity / acceleration limits)
  • 轨迹时长范围(duration bounds)

局部相位约束(Local Phase Constraints)

  • 相位特定工作空间限制
  • 运动学细化(kinematic refinements)
  • 空闲臂控制(idle-arm controls)
  • 姿态约束 + 时序参数

双臂协作动作分类体系(39 种动作)

39 种双臂协作动作归为两大类:

动作按功能分为四类:通用操作(General Manipulation)10 种、对象状态改变(Object State Change)9 种、对象关系改变(Object Relation Change)9 种、任务特定动作(Task-Specific)11 种。

03 实验 · Experiments

实验在三类场景下验证 RoboCOIN 的价值:(1)RoboTwin 2.0 仿真基准上的跨本体策略迁移,(2)Realman RMC-AIDA-L 真实机器人上的分层标注收益,(3)Unitree G1edu-u3 上的 RTML 数据质量过滤效果。基准策略均为 π₀ 或 GR00T N1.5。

仿真基准:跨本体迁移(RoboTwin 2.0)

跨本体迁移实验结果
图 6 · π₀ 与 π₀-RoboCOIN 对比(RoboTwin 2.0)。在 ARX-X5(14 任务)和 Franka Emika Panda(11 任务)两种平台上,使用 RoboCOIN 数据预训练后均获得显著提升。高协作任务提升更为突出。
平台 / Platform 基线(π₀) +RoboCOIN(π₀-RoboCOIN) 相对提升
ARX-X5(全部任务) 17.3% 30.4% +75.7%
ARX-X5(高协作任务) +94.1%
Franka Emika Panda(全部任务) 8.5% 26.6% +212.9%

真实机器人:分层标注收益(Realman + π₀)

测试条件 基线(无 Pyramid) +Capability Pyramid 相对提升
分布内(In-distribution) 28% 43% +53.6%
分布外(Out-of-distribution) 22.5% 57.5% +155.6%
OOD 性能下降幅度 -43.8% -17.9% 鲁棒性显著提升

RTML 数据质量过滤(Unitree G1edu-u3 + GR00T N1.5)

RTML 质量过滤分析
图 7 · RTML 过滤效果分析。RTML 过滤掉 35.3% 的低质量轨迹;失败相位分布:抓取(grasping)52.7%、移动(moving)17.8%;失效原因:速度违规(velocity violations)46.2%、时长违规(duration violations)24.5%。GR00T-Fine(相位约束)相比原始数据提升 22.2%。
数据设置 任务成功率(相对原始数据)
原始数据(Raw data) 基准
RTML 过滤后 提升(移除 35.3% 低质量轨迹)
GR00T-Fine(相位级约束) +22.2%

消融实验总结

消融结果表明:(1)Capability Pyramid 的三级标注均有独立贡献,去掉任一层级均会导致性能下降;(2)RTML 过滤对 OOD 泛化的帮助尤为明显,说明数据质量比数据数量更重要;(3)跨平台预训练(cross-embodiment pre-training)的收益在高协作任务上更为突出,表明复杂协调动作更依赖大规模先验。

04 局限性 · Limitations

Note: 以下三点局限性均为作者在论文中明确陈述(stated by the authors)。
遥操作偏差(Teleoperation Bias)

作者指出:"Reliance on teleoperation may introduce inherent operator biases, leading to inter-operator variability in trajectory patterns." 不同操作员风格各异,导致同一任务的示教轨迹之间存在较大方差,可能影响策略学习的稳定性与泛化能力。

标注可扩展性瓶颈(Annotation Scalability Bottleneck)

"Manual annotation presents a scalability bottleneck due to its high labor costs and potential for subjectivity, which may impact data consistency." 尽管采用了半自动标注管线,人工精修环节仍然是扩展数据规模的主要瓶颈,且主观性难以完全消除。

RTML 灵活性受限(RTML Flexibility Constraints)

"The current RTML framework depends heavily on expert-defined heuristics, potentially constraining its flexibility when applied to niche tasks or novel robotic platforms." RTML 的约束规则由专家手工设计,对新型机器人平台或非常规任务的适用性有限,需要额外的专家介入来定义新规则。