从北门进入世博展览馆,一排由人形机器人组成的“十八罗汉”几乎被观众围得水泄不通。不仅如此,本届大会还有特斯拉Optimus-Gen 2(擎天柱二代)、全尺寸开源通用的“青龙”等人形机器人国内首秀首发,受到多方关注。
去年大会上,似乎人人都在谈论ChatGPT,而今年,人形机器人的热度已经不输通用大模型。在首日的人形机器人主题论坛上,甚至有企业家表示,“具身智能才是实现AGI(通用人工智能)的最有效途径,OpenAI的大方向大概率是错的”。
人形机器人赛道,正在迎来产业化“蝶变”的关键时刻。
擎天柱二代2025年量产目标
像为国内企业定了个倒计时
提出“具身智能是实现AGI的最有效途径”观点的是宇树科技CEO王兴兴。王兴兴是90后,2016年创办宇树科技。几年时间里,宇树科技的员工从3人一路发展壮大到500人,连续拿下红杉中国、德迅投资等知名创投基金的投资,今年年初还完成了10亿元的B2轮融资。
“快”是这家企业发展的关键字。就在今年5月份,宇树科技发布了其最新的人形机器人产品——Unitree G1,市场售价仅9.9万元起,这让宇树科技一下子成为机器人市场的焦点。
9.9万元是什么概念?目前特斯拉公开的人形机器人Optimus-Gen 2,预计成本价在1万美元左右,市场售价在2万美元左右,9.9万元可以说是一个非常“接地气”的价格。展会现场,工作人员向记者表示,目前他们已经收到了不少这款机器人的全球订单。
不过,宇树科技目前发布的人形机器人并没有搭载大模型“大脑”,这是其与特斯拉Optimus-Gen 2的最大区别。业界通常将前者归类于一代人形机器人,将后者归类为二代人形机器人。目前,宇树科技将AI大模型运用在了其技术更成熟的四足机器人上。
特斯拉的Optimus仍然是业界的风向标。在本次世界人工智能大会上,特斯拉Optimus-Gen 2在上海首次亮相,吸引了大批观众。
此次特斯拉带来的Optimus-Gen 2人形机器人为静态模型机。现场有业内人士表示,特斯拉从未将原型机在线下展出可能出于两个原因:一是人形机器人仍在训练的过程中,产品功能还有待完善,二是为防止机器人被拆机或商业信息泄露,上市前不会让外界接触其原型机。
无论是出于哪一种考虑,在官方口径里,特斯拉的这款机器人都会在2025年年底前量产上市,届时将有超过1000个Optimus-Gen 2被投放到特斯拉工厂。
这似乎像一个倒计时,不断地提醒着国内企业,人形机器人的产业化迫在眉睫。现场多家人形机器人企业的工作人员告诉记者,目前国内做人形机器人的企业越来越多,他们预计国产AI人形机器人商业落地需要3到5年。
青龙从开发到发布只花6个月
产业基础好让“高集成”能速成
回到开头的观点,人形机器人正在打破国内人工智能产业对ChatGPT的迷信,其背后原因也有一些中国特色。
本次世界人工智能大会上,另一款大热人形机器人——青龙,由国家地方共建人形机器人创新中心(以下简称“国地中心”)研发。国地中心技术负责人邢伯阳告诉记者,从开发到发布这款人形机器人,只花了6个月的时间。
人形机器人是集成度极高的产品,国地中心为什么能这么快完成?这与长三角的机器人产业基础有很大关系。
据介绍,青龙人形机器人的很多零部件都是长三角制造,其安装的“大脑”——朱雀,也是由科大讯飞星火大模型和书生·浦语大模型支持。
在青龙人形机器人展台,业内人士对记者表示,国内工业自动化产业发展得早,近两年大模型又发展势头迅猛,基础良好。“上海有上海人工智能实验室,还有这么多互联网企业,要想实现AI+人形机器人其实很快”。
中国有做机器人的基础,通过具身智能有可能更快地让人工智能实现产业落地、商业闭环,这是人形机器人赛道愈发火爆的关键原因。另一边,以ChatGPT为代表的大语言模型已经爆火近两年时间,产业化的问题在逐渐暴露,这也是更多人将眼光投向人形机器人赛道的重要原因。
王兴兴在大会论坛上表示,“大模型对平面数据的理解做得非常好了,但对时间、空间的理解还远远不够。”他认为,世界模型+具身智能才是通向AGI的最佳路径——目前全球顶尖的科学家都在推动世界模型的构建,让机器人真正理解整个世界,进入工厂、家庭这样的场景帮人类完成劳动。
卡点在获取规模化数据“练脑”
合成数据和数据开源是两条路
一条赛道迅速火热,必然伴随着浮躁。
邢伯阳表示,人形机器人商业化现状有点混乱:有解决方案提供商专门卖控制算法,60万元就能让人形机器人动起来。但这种一代人形机器人的实际应用非常有限,要想实现广泛的商业应用,还是要让AI赋能人形机器人。
但AI赋能还面临着很多挑战。大模型植入机器人不难,要想适配应用场景却极为不易。目前市面上开发的二代机器人大多采用“大脑+小脑”的AI赋能模式。比如青龙,就配置了“朱雀”多模态大模型作为“大脑”,用于接收外界信息和任务决策;“玄武”模型作为“小脑”,用于控制机器人运动轨迹、具体任务执行。
“大脑”模型,即多模态大模型,这在当前国内市场有很多选择。但“小脑”模型需要各个开发机构各自构建,并且进行专门化的动作训练,才能适配特定应用场景。在训练“小脑”的过程中,最难的是数据积累。邢伯阳认为,人形机器人规模化数据是整个行业目前最大的痛点。现在人形机器人开发机构使用的数据,一方面是来源于国外的开源数据,另一方面是来源于开发者自己采集的数据。自采数据成本很高,企业需要使用大量人力重复工作。
北京大学助理教授、北大—银河具身智能联合实验室主任王鹤在前述论坛中提到,在特斯拉的公开信息中,为训练Optimus-Gen 2放置电池到红盒子里这一动作,特斯拉就出动了40人的数据采集团队,这样高成本的数据采集方式对商业转化是非常不友好的。
为了解决规模化数据的痛点,业界也做了不少尝试。王鹤认为,合成数据可能是获取大体量数据的关键技术。还有机构则在推动数据开源,通过共享来降低数据获取成本。
在本届世界人工智能大会上,国地中心除了发布青龙人形机器人,还推出了OpenLoong开源社区,有望聚集更多应用单位、人形机器人整机制造商以及核心部件的上下游企业,加速技术创新和产业应用。文章来源:解放日报