具身智能走向产业化,卡在了数据上
具身智能在2025年写入政府工作报告,成为国家重点培育的未来产业方向。头部企业的人形机器人出货量已突破数千台,资本密集涌入,硬件与算法的迭代速度肉眼可见。
但一个反差也在浮现。
机器人的"身体"越来越成熟,"大脑"却还没吃饱。训练机器人学会操作物体、理解环境、执行复杂任务,依赖的是大规模高质量的真实行为数据。据具身智能企业它石智航创始人陈亦伦的公开判断,具身智能要真正可用,至少需要千万小时级别的训练数据。目前全行业的供给量,离这个数字差距悬殊。
采集方式有,但每条路都有瓶颈。遥控操作精度高,一台机器人配一个操作员,效率和成本都撑不住规模化;仿真环境可以批量生成,虚实之间的差距让模型一上真机就打折扣。规模和质量之间的矛盾,至今没有一种方案能同时解决。
2026年,一条新路线被全球头部机构密集验证——采集人类以第一视角完成操作任务的数据。
这种首视角采集的原理是:让人戴上采集设备正常干活,记录下整个操作过程的第一视角影像。这类数据天然包含手部动作轨迹、物体接触方式、视线聚焦等关键信息,与机器人实际部署时的视角高度一致。NVIDIA今年2月发布的EgoScale研究显示,基于超2万小时人类第一视角数据训练的操作模型,任务成功率较传统方案提升了54%。
这条路线的另一个关键优势在于采集门槛。不需要昂贵的机器人硬件,不需要实验室环境,工人在真实产线上正常作业的过程就是数据生产的过程。中国制造业场景的丰富度和人力资源条件,让这一方向有天然的落地土壤。
谁能率先把第一视角数据从论文验证变成产能建设,谁就在具身智能的下一轮竞争中占到位置。
尚跃智能正在做这件事。
董事长带队,深入数据生产一线
3月31日,尚跃智能集团创始人兼董事长尚立卓带队深入多个真实工业场景的第一视角行为数据采集现场,实地视察数据生产全流程。
尚跃智能集团创始人兼董事长尚立卓在生产车间实地视察
视察覆盖了纸杯包装生产线、服装加工车间等多种工业场景。这些不是为采集搭建的模拟环境——产线正常运转,工人照常作业。不同的是,部分一线工人佩戴了头盔式采集设备,在完成日常操作的同时,同步记录第一视角的行为数据。抓取、装箱、缝纫、质检——每一个动作、每一次物体接触,连操作间隙的停顿节奏都在被记录。
一线工人佩戴头盔式采集设备,在正常作业中同步记录第一视角行为数据
纸杯包装生产线采集现场
服装加工车间采集现场
尚立卓在视察中重点关注采集流程的标准化程度和跨场景复制能力。在纸杯包装产线上,采集设备需要适配高速重复性操作环境;在服装加工车间,则需要捕捉更精细的手指动作和柔性物体的操作方式。场景不同,采集方案就得跟着变——这种针对不同行业场景快速调整数据方案的经验,尚跃在多年数据服务中已经积累了一套方法。
采集现场:工人在完成日常作业的同时同步生成训练数据
自研平台上线,TB+级数据集同步发布
视察的同时,两项产品级成果同步落地。
尚跃智能自主研发的"首视角机器人数据"平台正式上线——一个面向具身智能领域的新一代数据价值流通平台,连接AI数据生产者与需求方,提供规格数据订阅、独立数据集交易、定制任务等一站式数据服务。
"首视角机器人数据"平台正式上线
首批TB+级第一视角行为数据集已在平台发布。数据覆盖多个真实工业场景,从采集、清洗、标注到发布的全链路,由尚跃自有体系完成。
当前数据生产者和数据需求方之间缺少高效的流通机制。机器人企业需要大量真实场景的第一视角数据来训练操作模型,但自建采集团队和场景的成本极高;与此同时,拥有丰富工业场景和人力资源的一方,往往不知道这些场景对于AI训练有多大价值。首视角机器人数据平台搭建的,正是这两端之间的桥梁——让数据从"副产品"变成"可交易的资产",让具身智能企业不必从零开始自建采集体系。
对尚跃智能而言,这也是一次业务模型的拓展。过去,尚跃的数据服务以项目制交付为主——客户提出需求,尚跃完成采集、标注、交付。平台模式打开了另一种可能:标准化数据集可以复用,定制任务可以按需响应,数据的价值不再是一次性的。TB+级数据集的首批发布,既是平台能力的验证,也是向行业释放的一个信号——尚跃不只是在做数据服务,而是在建数据基础设施。
提前布局的战略纵深
这两项成果不是临时动作。
早在数月前,尚跃智能已启动第一视角行为数据的业务布局。在行业多数企业还在讨论数据采集方案时,尚跃已经完成了从采集设备选型、场景落地到平台产品化的全链路搭建。
做这件事的底气,来自尚跃在AI数据领域走过的路。自动驾驶4D点云标注是尚跃做了多年的业务,每一帧点云数据的处理都涉及三维空间理解、多传感器融合、毫米级精度控制。这套对复杂数据的生产和质控能力,不是只能用在点云上。
切换到第一视角行为数据,变化的是数据形态——从三维点云到视频影像,从激光雷达到头戴式相机。不变的是同一套问题:大规模采集中如何保证数据一致性,跨基地协同中如何对齐质量标准,交付的数据集能不能让客户拿到就直接用、不需要二次返工。这些问题,尚跃在自动驾驶数据服务的多年交付中已经系统性地解决过。
从自动驾驶到具身智能,尚跃的路径是连贯的。4D点云标注业务验证了规模化数据生产的商业模式和质控体系;首视角数据平台把同一套能力投射到新的数据形态上;此前公布的具身智能数据训练中心建设计划,则是尚跃智能在AI基础设施上的新一轮投入。三步之间不是并列关系,是递进——每一步都建立在前一步已经跑通的基础上。
具身智能的产业竞赛已经换了赛段。前半程比的是谁的机器人能站起来、能走、能抓东西;下半程比的是谁能持续投喂机器人高质量的训练数据。
尚跃智能今天做的事情,是在下半程开始之前,夯实具身模型训练底座,利用首视角数据平台为具身智能产业提供高质量数据服务。
-
2025-10-05数据标注·AI背后的百亿美元市场【未来投...3月25日,保定市智能网联汽车产业迎重磅盛事!由保定市科学技术局指导,保定・中关村创新中心与北京物联网智能技术应用协会联合主办的 "智网世界、链通保定 - 智能网联车" 专场赛,在保定・中关村创新中心火热开启。详情
-
2025-10-05从河南到北京的智慧对话!尚跃智能 × 四维图新同台!路演现场高光记录3月25日,保定市智能网联汽车产业迎重磅盛事!由保定市科学技术局指导,保定・中关村创新中心与北京物联网智能技术应用协会联合主办的 "智网世界、链通保定 - 智能网联车" 专场赛,在保定・中关村创新中心火热开启。详情
-
2025-10-05尚跃智能2025供应商招募数据标注到底有多重要?这个问题必然要从人工智能的角度去解读。近年来,我们已经明确的看到人工智能发展的脚步以及其在未来举足轻重的作用。而作为人工智能的基础服务产业,数据标注必然将随之鹊起...详情
-
2026-01-12尚跃智能出资1000万设立城发数据产业公司,打造当地300-500 人规模数据产业基地尚跃智能正式宣布战略落子聊城莘县——出资1000万元设立城发数据产业(聊城)有限公司,同步启动300-500人规模数据产业基地建设,标志着公司在区域市场深耕与产业规模拓展上迈出关键一步。详情
-
2026-01-12三喜临门!尚跃智能长三角总部落户芜湖湾沚,数据标注产业实现"零"突破湾沚数字经济迎来里程碑时刻!11月27日,湾沚区数据标注产业园开园暨尚跃智能长三角总部正式开业,以及尚跃智能三周年庆典。 这标志着芜湖湾沚区在数据标注产业领域实现了"零"的突破,为长三角AI产业生态注入全新活力 !详情
-
2026-01-12从工具到生态:一场数据标注产业的“升维革命”大家好,我是尚跃智能 CEO 尚立卓,本月 16 日我公司主办的中原数据标注交流会成功落幕,感谢各位朋友的支持和认可,今天也想把自己的思考进一步分享给大家,和大家继续交流。详情