“空间智能是人工智能拼图中的关键一环。”知名“AI 教母”李飞飞曾这样表示。
近段时间,李飞飞开始把目光瞄准到这一领域,并为此创建了一家初创公司。她曾表示,“大自然创造了一个以空间智能为动力的观察和行动的良性循环。”她所在的斯坦福大学实验室正在尝试教计算机“如何在三维世界中行动”,例如,使用大型语言模型让一个机械臂根据口头指令执行开门、做三明治等任务。
我们不难看出,李飞飞口中的空间智能也有大模型的参与。
如今,随着技术的发展,LLM 在多个方面表现出超人类智能。然而关于 LLM 的争议也在不断增加,其中,LLM 到底有没有感觉能力,大家意见不一。
近日,李飞飞连同斯坦福大学以人为本人工智能研究所 HAI 联合主任 John Etchemendy 教授联合撰写了一篇文章,文章对 AI 到底有没有感觉能力(sentient)进行了深入探讨。
本文中,我们把 sentient 一词翻译成感觉,因为 AI 领域感知一词通常对应 perception,也不适合翻译成意识。读者们有合适的翻译可以留言讨论。
文中驳斥了 LLM 有感觉的说法,李飞飞列举了大量示例来证明这一观点。
在提到超级计算机深蓝时,李飞飞表示,虽然这款下棋程序可以击败世界冠军,但如果房间突发意外情况如着火,深蓝不会有停止游戏的意识,而人类会有。
同样地,当人类产生饥饿说出“我饿了”时,人类和 LLM 背后所隐藏的行为链条是完全不同的。LLM 只是产生“我饿了”这个字符串的事实,它没有身体,甚至不可能有饥饿那种感觉。
更进一步,李飞飞认为人类饥饿时,伴随一系列生理反应,如低血糖、肚子咕咕叫等,而 LLM 无法拥有这些状态的主观经验,即无法有感觉能力,只是概率性地完成任务而已。
人类有物理躯体,可以感觉一切,但 LLM 没有,当 LLM 说出类似的“自己脚趾痛”时,大家都不会相信,因为它根本就没有脚趾,它只是一个编码在硅片上的数学模型。
李飞飞驳斥 LLM 具有感觉能力
通用人工智能(AGI)是用来描述一种至少与人类在各种方面表现出相同智能的人工智能体的术语,涵盖人类所展示(或能够展示)的所有智能方式。这是我们曾经称之为人工智能的概念,直到我们开始创建在有限领域表现出智能的程序和设备 —— 如下棋、语言翻译、清洁客厅等。
增加“G”这个字母的必要性,来自于由人工智能驱动系统的普及,但这些系统只专注于单一或极少数任务。
IBM 的深蓝是一款令人印象深刻的早期下棋程序,它可以击败世界冠军 Garry Kasparov,但如果房间着火了,它却不会有停止游戏的意识。
现在,通用智能有点像一个神话——如果人们认为自己拥有它的话,可能就会这么认为。
人类可以在动物界找到许多智能行为的例子,它们在类似任务上的表现远比人类本身表现更好。智能并非完全通用,但足以在大多数环境中完成人们想要完成的事情。
如果当人类感到饥饿时,可以找到附近的超市;当房间着火时,则会自主地寻找出口。
智能的基本特征之一是“感觉”,即拥有主观经验的能力 —— 比如感受饥饿、品尝苹果或看到红色是什么样的。
感觉是通往智能的关键步骤之一。
于 2022 年 11 月发布的 ChatGPT,标志着大型语言模型(LLMs)时代的开始。
这立即引发了一场激烈的争论,所有人都在讨论这些算法是否实际上具有感觉能力。以 LLM 为基础的人工智能具有感觉能力的可能性引发了媒体疯狂报道,也深刻影响了全球一些政策制定的转向。
最突出的观点是,“有感觉的人工智能”的出现可能对人类非常危险,可能带来“灭绝级”的影响或至少是“存在危机”的。毕竟,一个有感觉的人工智能可能会发展出自己的希望和欲望,而不能保证它们不会与人们相冲突。
李飞飞和 Etchemendy 的主要观点是反驳“有感觉的人工智能”阵营最常提出的辩护,而该辩护基于 LLMs 可能已经有了“主观经验”的能力。
为什么有些人认为 AI 已经获得了感觉能力
在过去的几个月里,他们俩与 AI 领域的许多同行进行了激烈的辩论和交谈,包括与一些最杰出的和具有开创性的 AI 科学家进行了一对一的深入交流。
关于 AI 是否已经获得了感觉能力的话题,一直是一个突出的问题。其中少数人坚信 AI 已经具有了感觉能力。以下是其中一位最为积极支持者的论点,相当程度上代表了“有感觉的 AI”阵营:
为什么认为“AI 有感觉能力”是错误的
虽然乍看之下这个论点似乎有道理,但实际上是错误的。因为李飞飞和 Etchemendy 教授提供的证据在这两种情况下并不完全相同,甚至差距很大。
当你说“我饿了”时,我得出你正在经历饥饿的结论是基于一系列大量的情况。首先,是你的报告 —— 你说的话,可能还包括其他行为证据,比如你的肚子咕咕叫。其次,是没有相反证据的存在,比如你刚吃完五道菜的大餐,就不太可能会说饿。最后,也是最重要的,是你拥有一个像我一样的物理身体,这个身体需要定期进食和饮水,遇冷会感到寒冷,遇热会感到炎热等等。
现在将这与他们二人对 LLM 的证据进行比较。
唯一共同的是报告,即 LLM 可以产生“我饿了”这个字符串的事实。但相似之处就到此为止了。事实上,LLM 没有身体,甚至不会有感到饥饿那种感觉。
如果 LLM 说:“我的左大脚趾很疼”,人们会得出它左大脚趾确实很疼的结论吗?答案是否定的,因为它根本就没有左大脚趾。
同样地,当它说它饿了时,人们实际上可以确定它并不饿,因为它没有感到饥饿所必需的生理结构。
当人类感到饥饿时,会感觉到一系列生理状态 —— 低血糖、空腹发出的咕咕声等 —— 而 LLM 根本没有这些,就像它没有嘴巴放食物进去,也没有胃去消化食物一样。
人们知道这不是真的,LLM 的主张也无法改变这个事实。
所有感觉 —— 饥饿、感到疼痛、看到红色、爱上某人 —— 都是由 LLM 根本没有的生理状态引起的。
因此,LLM 无法拥有这些状态的主观经验。
换句话说,它无法有感觉能力。
LLM 只是一个编码在硅片上的数学模型。
它不像人类那样是一个具有身体的存在。它不是需要进食、饮水、繁殖、经历情感、生病和最终死亡的“生命”。
当人类和 LLM 同样地说出“我饿了”时,背后所隐藏的行为链条是完全不同的。
理解人类生成词序列的方式与 LLM 生成相同词序列的方式之间的深刻差异,这一点至关重要。
当人们说“我饿了”时,是在报告感觉生理状态。
而当一个 LLM 生成序列“I am hungry”时,它只是生成当前提示中最可能的完成序列。它做的事情与在不同提示下生成“I am not hungry”或在另一个提示下生成“The moon is made of green cheese”时完全相同。
这些都不是它本就不存在的生理状态的报告,它们只是在概率性地完成而已。
很遗憾的是,具有感觉能力的人工智能时代还尚未到来。
两位作者认为,研究者还没有实现有感觉的人工智能,而更大型的语言模型也不会使人们实现这一目标。
如果人类想在人工智能系统中重新创建这种现象,就需要更好地理解有感觉的生物系统中“感觉是如何产生的”。
人们不会在下一个 ChatGPT 的迭代中偶然发现“感觉”。
在李飞飞转发的 X(原推特)下面,大家讨论的也是非常激烈,有人表示:“当今的 LLM 有两种类型:一种是完全基于文本进行训练,另一种则是基于图像、文本甚至音频进行训练。第一种类型确实不具备所谓的感觉能力,但第二种类型具有物理直觉,因此可以说它具有感觉能力。”
而另一位网友则追随 Yann Lecun 的脚步,表示:“一只喵星人的智能程度都远高于最大型的 LLM。”
参考链接:
https://time.com/collection/time100-voices/6980134/ai-llm-not-sentient/
https://x.com/drfeifei/status/1793753017701069233