作为AGI的一个重要组成部分,具身智能自然是重要的。大模型也自然从语言模型,延展到虚拟世界的各模态;进一步延伸也自然到了物理世界,因为多模态虚拟世界,尤其是视觉模型,基本上是物理世界的模拟或逼近。因此,在大模型风潮中,具身智能的热潮也是自然的。但目前具身智能,尤其是人形机器人的研究大热,在马斯克和英伟达的鼓吹之下,更多的是概念,而不是找到了规模化落地的角度和契机。这一点开复老师前面的视频称自己不看好具身智能的商业化有其道理,很多事不需要人形的。人形机器人的驱动点主要是二:第一是通用性,不是针对专门的任务,因为后者总有比人形更合理的形式,例如机械臂。第二就是,人形提供情绪价值,让人感觉亲切。第一个驱动点有两个挑战:第一是通用大模型在虚拟世界的成功虽然可以赋能和加持具身智能的通用性,例如谷歌 RT2 就借助了LLM的赋能,可以迁移LLM的物理常识,转换不同场景,从而减少了对于特定场景建模的数据依赖(例如办公室场景与厨房场景以前的建模都是完全不相干的,现在大模型可以做知识迁移)。但是,具身智能的通用性挑战还是远远大于多模态LLM在虚拟空间的通用性。需要看今后几年的研究发展,才能看清可行性。第二个驱动点,主要在虚拟陪伴的赛道具有关键意义。如有突破,可能成为革命性产品,对于人类的情感需求乃至婚恋产生深远的影响。在其他场合,机器人多大程度上像人其实并不重要。一个长得像大厨的机器做出来的菜,与机械臂做出来的菜,用户不会因为前者而买单,还是要看好吃不好吃。只有在任务不能事前定义,而且临时的任务又能在人形机器人的通用能力下当场学会并执行,人形机器人的商业闭环才能显现。并且,最终性价比要远超雇佣真人。这几项的挑战目前来看,还是太大了,投资人不一定能有耐心看到商业化闭环的终局。简言之,这场热潮长远来看是必然趋势,是不可或缺的AI板块,但在可预见的未来,看不到商业闭环的前景。#
#立委谈大模型
https://blog.sciencenet.cn/blog-362400-1449057.html
上一篇:
推动AIGC商业落地,出门问问的「产模结合」实践下一篇:
马毅教授称,已经揭开完全揭开神经网络的面纱