在科技飞速发展的今天,一部科幻电影《机械姬》中的AI形象艾娃,引发了公众对人工智能(AI)未来的无限遐想。艾娃那令人不寒而栗的逼真表现,让观众深信这就是AI的终极形态。然而,现实中的AI与艾娃所代表的“具身智能”之间存在着本质的区别。
具身智能并非AI的升级版,而是一条截然不同的技术路径。它强调的是智能体通过物理身体与环境进行互动,从而像婴儿一样学习世界。这种智能方式不依赖于大语言模型的尺度定律,而是更加注重身体经验在认知过程中的基础性作用。
在《机械姬》等影视作品的影响下,“具身智能=AI”的误解悄然形成。但实际上,传统AI,如ChatGPT等,属于离身智能,能够脱离物理实体进行符号逻辑的抽象推理。它们虽然强大,却缺乏对物理世界的直接感知和交互能力。
具身智能则截然不同,它要求智能体必须拥有一个能与现实世界互动的物理身体。这个人形机器人不仅要能看、能听,还要能触、甚至能闻,构建起比AI更为丰富的感官体系。同时,它的身体要能动,需要突破精确的抓握控制、动态平衡以及多任务协调等难关。更重要的是,具身智能的大脑要走世界模型这条路,在与真实世界的交互中习得经验,超越概率,走向规律。
然而,尽管人形机器人是具身智能的典型代表,但现实中的它们却远未达到公众的期待。翻遍所有最顶尖人形机器人公司的演示视频,我们看到的往往是一个不停跳舞、翻跟头,却连苹果也拿不稳的人形巨物。它们的电池续航通常不足5小时,复杂的动作往往需要人工遥控,成本却高达数十万。
理想与现实的差距让人不禁感叹,人形机器人似乎还只是一个炫技大于实用的概念。我们想象中的人形机器人,应该是文武双全、美丽动人,甚至能像恋人一样与我们互动的完美存在。但现实中的它们,却连基本的操作都显得笨拙无比。
AI的发展已经陷入了固有技术方法论的沼泽,我们热衷于大语言模型、强化学习等算法,却忽略了它们只教会了AI如何模仿,而没有教会AI如何理解真实而复杂的物理世界。这正是人形机器人向强发展所需要克服的难题。
图灵奖获得者杨立昆在巴黎AI峰会上指出,要研究人类级AI,就必须放弃只会概率计算的大语言模型、放弃对比学习以及强化学习等旧有方法。人形机器人的发展需要的是与环境交互的技术,如世界模型、规划算法等,以及支持运动的仿生关节、传感器融合系统等技术。
但这些技术目前正处于研究瓶颈之中,一方面是因为技术难度极大,另一方面则是因为成本过高。例如,要实现人类使用螺丝刀时的触觉实时调整握力和预判旋转时的扭矩变化,机器人需要突破0.1牛顿级的力控精度、高灵敏的触觉解析以及避免自碰撞的运动规划协同等难关。
人形机器人的研发成本普遍超过200万美元,而即使实现量产,后期也需要大量的资金投入维修和保养。这使得人形机器人的性价比极低,远远低于轮式底盘和机械臂的组合在工业场景中的应用。
尽管如此,人形机器人依然是一个备受资本追捧的概念。2024年1月至10月,全球人形机器人行业共发生了69起融资事件,总金额超过110亿元。然而,这股热潮主要源于资本的追捧而非技术的成熟。为了吸引融资,企业不断在社交媒体上展示不实用的功能,如打拳、翻跟头等,导致同质化严重、价格高、能力差、落地难。
随着资本的逐渐清醒,人形机器人的热潮也开始退潮。一些企业因资金链断裂而陷入停摆危机,一些投资方则开始撤资。人形机器人的发展似乎又陷入了历史的轮回:始于惊艳的实验室演示吸引资本追捧,继而催生估值泡沫,最终因商业化失败导致资金撤离。
人形机器人的未来依然充满未知和挑战。但值得庆幸的是,我们离那个会欺骗人类感情的“艾娃”还很远。在科技的不断探索中,我们期待看到更加实用、更加智能的人形机器人出现。