点击右上角
微信好友
朋友圈

请使用浏览器分享功能进行分享

为机器人提供可交互训练数据,是具身智能领域的世界级难题,亦是未来发展的工作重点之一。面对传统端到端具身操作的固有数据瓶颈,真机数据堪称具身智能时代的 “石油”,更是推动机器人泛化能力突破与规模化落地的核心资源。
近日,睿尔曼正式宣布开源全球首个高质量、模态数量最多的真机数据集,旨在突破机器人研发中的数据壁垒,为全球学术界与工业界提供关键数据支撑,助力智能机器人算法的创新与产业化落地。此次开源的数据全部基于北京人形机器人数据训练中心的十大真实场景,以“高质量”与“多模态”两大特点,精准应对当前真机数据不足、模态不完整的行业痛点。
数据基座:十大应用场景锻造高质量真机数据集
睿尔曼此次开源的真机数据均来源于人形机器人数据训练中心,中心占地3000平方米,创新性地划分为“九年一贯制”训练区和“机器人大学”场景区。训练区专注于机器人基础抓拿取放能力的高效、批量训练,为算法模型打下坚实根基;场景区则精准复现了包括家庭康养、智能生活、农业采摘、新零售、汽车装配、新餐饮等十大核心场景。

其中智能生活区还原真实家居场景,包括客厅、卧室、卫生间、厨房等核心空间,可以实现机器人开关冰箱门、叠衣服、清洁卫生间等任务。工业场景模拟工厂流水线,可以实现物料分拣、包装打包、物流搬运等。能够真正做到数据采集并非在理想的“实验室温室”中进行,而是直面现实世界的复杂性与多样性,能够有效保证数据集的高保真度、强实用性及卓越的泛化能力。
数据集在多模态数据质量方面展现出全面优势,其模态完整性达到100%,确保了数据的全面与完备。同时,数据抗噪声评分达到78%,数据平滑性评分超过优秀线达到82.1%,有效保障了数据的低波动性与高稳定性。综合核心维度的评估显示,睿尔曼此次开源的数据集在数据的完整性、稳定性等关键指标上均表现均衡且出色,构筑了其坚实、可靠的高质量数据基础。
技术基座:六大核心优势定义多模态数据集新标准
睿尔曼此次发布的数据集涵盖机器人感知、决策、执行的全链路多模态数据,该数据集集成了包括但不限于图像数据、关节位置、关节速度、末端六维力、末端位姿、动作指令、时间戳、相机参数等多种传感模态。以六大核心技术优势,定义多模态数据集标准。第一,时空硬同步技术,为多模态感知建立统一的“时空坐标系”;第二,超低丢帧率,保障数据流的完整与连续性;第三,高精度运动控制,确保机器人动态响应灵敏;第四,出厂级高精度标定,实现“开箱即用”的数据标准;第五,深度泛化数据采集,赋予模型强大的泛化能力;第六,外骨骼遥操作技术,高度还原操作轨迹。
产品基座:高性能数据采集平台保障数据质量与采集效率
睿尔曼机械臂设计对标成年男性胳膊的长短、粗细、灵活度及负载能力,力求在外观与性能上实现与人、工作、生活环境的友好共融,达成“人能干,它能干”的效果。单臂(全臂展)额定负载5公斤,最大负载可达9公斤,TCP线速度1.8m/s。
本次开源数据集采用的本体来自睿源机器人专为数据采集而设计的高性能智能机器人RS-01轮式折叠机器人、RS-02具身双臂升降标准版、RS-03具身双臂双目增强版,三款机器人面部与腕部均搭载大FOV相机(水平90°/垂直65°),并结合全域时空硬同步技术,实现精准协同作业,成为集视觉、力控、灵活机械臂与自主移动能力的高性能采集平台,适用于工业自动化、家居服务、科研实验等多种复杂场景。

数据采集设备支持“真机遥操、动捕、VR”等多种主流技术采集方式,丰富的数据采集感知的周边可以选配,包括触觉、力觉、导航等。外骨骼遥操作设备采用同构设计,使主从机械臂及夹爪的结构完全一致,从而建立起高度直接的映射关系——操作者的动作能够以相同的关节角度实时映射到从臂,无需经过复杂的逆向运动学(IK)解算。在计算层面,系统由于大幅简化了运动学与动力学求解过程,显著提升了控制运算效率,无需依赖SoC等高性能计算单元即可达成高响应频率,系统延迟可被稳定控制在10毫秒以内,保证了操作的实时性与流畅性。
此次睿尔曼开源全球首个高质量、多模态真机数据集,其核心价值在于以开放共享的姿态,打破数据壁垒,为全球机器人技术发展注入关键动力。“未来,睿尔曼将持续迭代并开源更多高质量数据集,构建一个覆盖更广、维度更丰富的机器人开源生态矩阵,全力打造一个贯通技术研发与产业落地的赋能平台,与全球开发者及合作伙伴形成紧密的创新循环,为推动机器人技术普惠深化、开启人机协作新篇章奠定数据基石。”睿尔曼公司创始人兼CEO郑随兵说道。(李记)
