详细解释:
具身智能(Embodied AI),是一种将AI融入机器人等物理实体的AI技术,目的是使其具备从环境中感知和学习并与环境进行动态交互的能力。该概念首次出现在1991年罗德尼·布鲁克斯发表的论文《无需表征的智能》中,其主要观点是:智能行为可以直接从自主机器与环境的简单物理交互中产生,而无需复杂的算法或内部表征。
具身智能不只是“AI+机器人”,如果对具身智能的理解仅限于给AI一副身体,那么就会忽视其与语言模型的不同。
第一,具身智能相对于语言模型包含的智能范畴更广。生活中人们或多或少有过想要传达的“意”难以用“言”来表达的体验。从智能的范畴来看,智能经由语言表达出的部分,仅占所有智能的一小部分。因此,具身智能相对于语言模型,在理论上就具有得天独厚的优势。
第二,具身智能的智能获取方式更接近于人类。譬如,人类的智能主要来源于自身通过双眼、双手及其他器官习得的经验,以及人类在传承进化过程中不断积累形成的生物本能。在漫长的进化过程中,人类与环境互动所产生的信息之多,远远超出人类迄今为止用语言记载的一切。相比于语言模型只读取文字,具身智能可使智能体通过与人基本相同的感官来感知外界,其发展出的智能在理论上具有同人类智能更为相似的特点。
第三,具身智能更为接近智能发展的终极目标。近年来已有不少AI领域的学者指出,语言模型并非AI的终极发展方向,充其量只是一个阶段性成果。由于语言模型只能通过学习人类的语言文字材料来获取智能,其输出的结果,究竟应当算作对人类语言的模仿,还是实实在在的来自机器智能的“思考”,学界尚无定论。无论如何,大模型都无法绕开人类语言这一中介,其即使从中获得了智能,也只是一鳞半爪,存在着较为明显的上限。
当然,具身智能目前也面临着尚待突破的难题。
一方面,具身智能要通过与现实环境的互动来获取智能,但即使一个理论上能够完美感知周遭世界并进行无监督学习的具身智能,也面临着学习效率受环境制约的问题,对于当前零样本学习能力尚不完备的具身智能来说,这将大大限制其发展速度。
另一方面,以仿真环境为依托的具身智能虽然能够藉由计算机仿真出的环境来进行非实时的高速训练,但面临着仿真环境无法完全“还原”现实世界的问题,导致该智能体难以在现实环境中实用化,也难以在短时间内积累出如同大模型训练语料库那样的大规模数据集。
如何解决上述难题,将是具身智能未来发展的关键。
|