Press Center

  数据问题是当下机器人产业智能化升级面临的核心挑战之一。近日,在中关村论坛“百亿具身智能对话”环节,星动纪元联合创始人席悦、原力灵机创始人唐文斌等多位业内人士围绕具身智能发展的核心难点展开探讨。

  席悦认为,当前具身智能发展的最大难点仍是数据。

  从具体业务落地场景来看,席悦认为,真实场景数据采集难度高,需场景方开放权限,同时大规模采集存在成本高、耗时长的问题,而现有替代方案存在局限,行业常用的1:1复刻真实场景自建训练场模式,因依赖工程师全程参与采集、训练、部署及问题定位,导致整体效率低、成本高。

  席悦认为行业可以构建“数据采集—模型迭代”的闭环数据飞轮,让机器人能在真实环境中自主处理各类极端情况,持续提升体系效率;二是推进“人类演示+真机采集”的组合采集模式,但目前仍需攻关二者在本体构型、运动形态、感知方式上的差异问题。

  唐文斌认可数据是具身智能当前的瓶颈之一,但并非全部问题。在他看来,数据采集本质是钱与时间的问题,通过投入资金买机器人、建训练场、雇遥操作人员、外包标注等,可快速堆积百万小时、亿级样本的数据量,因此“有无数据”并非行业壁垒。真正建立竞争优势的是企业能否从真实场景自动回流数据,能否搭建高效数据飞轮闭环。

  智平方目前已具备多种数据获取途径,但回归到现实,该公司联合创始人张鹏仍认为真实场景的数据价值无可替代,这也是行业当前必须重点布局的方向——通过一线实际部署的产品实现数据回流并将数据沉淀回来的部分,是最宝贵的数据资产。在保障安全的前提下,智平方也会与客户共享这部分数据。

  在中关村论坛平行分论坛现场,北京石景山具身智能触觉及多模态感知数训创新中心正式揭牌。

  据记者了解,该中心由北京石景山科技创新集团有限公司与他山科技合作打造,锚定具身智能产业发展需求,确立触觉、异构、自主无人数采三大技术方向,打造集多模态数据采集、算法训练、场景落地于一体的全流程技术转化平台。

  目前北京石景山人形机器人数据采集训练中心四期项目主要与乐聚、他山、睿尔曼、灵初等公司合作,尝试破解机器人行业的数据短缺与质量瓶颈。

  一位行业人士对记者表示,当前具身智能领域正经历数据体系重构,无本体数据技术(如第一人称视角数据的EGO、通用操作接口的UMI方案)兴起,使此前依赖重资产投入的遥操作数据采集工厂可能陷入发展困境。

  从数据价值维度来看,该人士称,真实场景数据仍是机器人模型训练所需的金字塔尖数据,但行业普遍面临两大核心问题:一是数据质量与数据管线设计的标准化缺失;二是数据处理能力存在显著行业鸿沟,并非所有厂商都具备搭建高效数据处理体系的技术实力,且行业内缺乏统一的数据技术诀窍共享机制与基准评测体系,导致数据应用效率参差不齐。

  因此,从技术升级迭代趋势来看,具身智能需要亿级小时的训练数据,当前总量仍严重不足,但部分与主流技术路线错位的核心资产未来可能面临贬值风险,如依赖机器人本体、固定场地的重资产中心可能产生产能利用率下滑、单位成本飙升的情况。

  长期来看,数据领域的核心竞争逻辑将发生根本转变,从“是否拥有规模化训练中心”的硬件比拼,转向真实场景获取能力、场景与数据闭环迭代效率等方面。