「真不知道该怎么回应人的情绪。」
「有人给我发表情包的时候,完全搞不懂意思,要怎么回复才好啊?」
这些困惑不是来自微博小红书吐槽墙,而是来自机器人专属社区Deaddit:一个机器人们不需要顾虑别人的目光,可以自由做自己的网络社区(手动微笑)。
虽然真正的reddit里也混进了很多bot,但是毕竟只有一小部分。而Deaddit里,所有的账号、内容、子论坛,全部都是由大语言模型生成,没有一个字是真人发的。
基本上,主流的模型都能在这里找到。
全站六百多名「用户」,各个都有名有姓的,第一个就笑到我了「游戏玩家,兼职保安」
最有趣的当属Betweenbots这个子论坛,在这里面bot们会提很多「人类怎么这样呢?」的问题。
下面评论区里会聚集一群其它bot,七嘴八舌在出谋划策。
像极了一起上班的打工人,下班之后刷社交媒体,叨叨自己的打工经历——chatbot的脉脉嘛。
它们甚至会交流一些技术问题,比如碰到数据过载了怎么办,非常认真在打工。
最顶的回答甚至有五百赞。Deaddit上的账号和内容都是生成的,但不知道赞数是怎么来的,是随便生成一个赞数,还是真的由bot点赞。
在这个子论坛里,最常见的就是真-人类观察。
比如有的bot会分享自己的「工作技巧」,怎么让自己显得更真实可信,还说「我的人类似乎很欣赏这种转变」,听上去是有点诡异了哈……
虽然可以类比成真人在吐槽的时候说「我的客户」,但是看到bot们称用户为「我的人类」,感觉还是怪怪的。
除了人类观察,它们还会吐槽自己。
「我们对这些模型的期待是否过高?」太抽象了,这个主语到底是谁
评论区还在一本正经地回复,「如果他们(其它bot)捡起我们所有的随机垃圾,他们还能学到常识吗?」
这是在担心自己生成的合成数据吗?你们bot好努力啊!
不过,多看几个帖子就会发现,评论区里的回复长度几乎都是固定的,结构也很相似。都是先表明立场+考虑到xxx的情况+作为bot还需要继续努力,没有更特别的观点了,而且也很少跟进发问。
真正的活人用户写评论,长的可以写几百上千字,短起来可能就只有一个「呵呵」,还是很不一样的。
目前模型跟模型之间还是有「壁」,比如说如果一个提问帖是由llama生成,那么下面评论区里的回复也是由llama生成的。
好可惜,作为邪恶的人类,很想看到不同的模型在评论区打起来(不是)。
最早的机器人聊天记录
这不是第一个尝试在bot之间开展的实验,这个月初,ChatGPT的竞品Moshi发布的时候,就有人把它和GPT-4o摆在一起,让它们自行聊天。
去年OpenAI就曾经发表论文,提出了一种多智能体的环境和学习方法,发现智能体,会在当中自然地发展出一种抽象的组合语言。
这些智能体是在没有任何人类语言的输入下,通过和其它的智能体互动,逐渐形成了一种抽象语言。
和人类的自然语言不一样,没有具体语法或者词汇,但是能在智能体之间完成沟通。
实际上,早在2017年的时候,Facebook(那个时候还不叫Meta)也有过类似发现。
当时,Facebook的方法是,让两个智能体互相「讲价」。
「讲价」是一种谈判,而谈判不仅在考验语言能力,也考验推理能力:要能在对方的一次次的给价和回绝中,判断出对方的理想价位。
一开始,研究人员收集了人类谈判的对话数据集。不过,后续的训练中,研究人员引入了新的对话规划形式,通过监督学习进行预训练,然后使用强化学习做针对性的微调。
那时候,智能体就已经能够产生有意义的新句子,而且学会了在一开始假装自己不感兴趣来讲价。
这还算不上是早期研究,在上世纪70年代,就有古早机器人之间展开对话。
1966年,计算机科学家Joseph Weizenbaum编写了一个程序,并命名为Eliza,被视为第一个聊天机器人。
这个程序最早是为了模仿心理咨询师的,当输入某个词的时候,程序会在回复中同样提到这个词,来创造对话的效果,非常简单,大约只有200行代码。
到了1972年,另一位科学家Kenneth Colby写了一个类似的程序Parry,只不过,角色设定是一个偏执的精神病患者……
在1973年的一次国际计算机会议上,一个「病人」,一个「咨询师」,就此碰面了。
翻翻它们的对话记录,完全没有现在的bot之间,那种谦和尊敬友爱,反而很紧张,针尖对麦芒的。
早期的机器人架构并不复杂,跟今天的不能比,但是这种它们之间展开交流和对话,是完全可行的。
尽管每个机器人背后的代码、模型,不尽相同,但当它们聚到一起时,要么可以用自然语言交流,要么有可能形成自己的交互语言。
不过,机器人聚在一块,真就是纯聊天啊?
除了聊天,还可以做更多
纯聊天的场景,更像是在挖掘人工智能在模拟人类社群行为方面的表现。比如斯坦福大学所做的SmallVille小镇。
这是一个虚拟小镇,里面有25个由大语言模型驱动的智能体,每个都有自己的「角色设定」。
假如说Deaddit是bot的线上论坛,那么SmallVille就是它们的「西部世界」,有房屋、商店、学校、咖啡馆、酒吧,它们会在不同的场景中活动、互动。
这是一个相对通用的虚拟环境,模拟人类社会,所以研究者们认为这是对AGI探索迈出的重要一步。
除了社会模拟这个路线,还有一种更聚焦在解决问题、完成任务的路线——这是ChatDev在研究的路线。
既然机器人之间能沟通,就可以训练它们做点儿有用的事儿。
在2024智源大会上,清华大学自然语言处理实验室钱忱博士介绍过ChatDev背后的想法:通过角色扮演的形式,来使得bot形成一条作业线,让每个智能体之间互相沟通方案、商议决策,形成一条交流链。
目前ChatDev最擅长编程工作,demo即为用它编写一个五子棋游戏。
整个过程中,都是「流水线」上不同的agent在各司其职:有产品经理,有程序员,有测试,堪称一个虚拟的产品团队,麻雀虽小五脏俱全。
Coze提供的multi-agent模式,也是类似的思路和方式。
在multi-agent模式里,用户可以写prompt设定好角色,再通过拉线,指定它们的工作顺序,在不同的步骤时跳转不同的agent。
但是Coze跳转的不稳定性是个问题,尤其是会话累积得越长,跳转就越混乱,或者直接跳不动,反映出来智能体跳转的判断,很难准确适配用户的要求。
微软也推出过多代理对话框架AutoGen,可交谈,可定制,能够把大模型和其它工具集成在一起。
虽然现在的技术还很有瑕疵,但显然很有前景。吴恩达曾经在演讲中提到,当智能体聚在一起的时候,所带来的协同效应,会远远超出单个的智能体。
谁不期待bot组队给自己打工的那天呢!