Perplexity,这个翻译成中文叫作“困惑”的产品很受欢迎已经不是新闻了。
英伟达创始人黄仁勋不久前接受采访时声称,他“每天都会用Perplexity”。今年1月,这家公司声称自己的月活跃用户已超过1000万,仅印度就有超过100万用户。而今年迄今为止,Perplexity在美国市场收到的用户查询接近7500万单,比2023年全年都要多。4月23日的最新一轮融资中,它筹集了约6300万美元资金,估值超过10亿美元——仅仅3个月前,其估值还只有5亿美元。
Perplexity正在改变传统的搜索体验。自2022年8月推出以来,曾在Google人工智能部门任职的研究人员在短短的时间内就研发出了一个聊天机器人式的研究助理,用户可以向其提问,该助理将实时回应从互联网获取的信息,以及它使用的信息来源。
最新传闻称,OpenAI已开发类似产品,并且本周就会上线。除了OpenAI,阿里巴巴旗下的搜索引擎品牌夸克据说也准备在今年下半年推出有类似用户UI的搜索产品,中国初创公司中的智谱、豆包、月之暗面都已为自己的问答机器人加入了提供参考链接功能——智谱不仅给出了参考链接,还像Perplexity那样在回答完问题后列出了一些“相关问题”,此外,它也效仿Perplexity开始将当日新闻作为话题,展示在对话框的上方。
如同一年前几乎所有应用都试图像ChatGPT那样把交互界面(UI)变成一个问答窗口,如今,几乎所有的生成式AI应用又试图“Perplexity化”。Perplexity究竟是什么?
答案引擎
模型“聪明”并不是Perplexity的最大卖点,毕竟它使用的都是第三方模型,其中既有GPT也有Gemini和Claude,有人因此甚至把它归为“套壳”产品。不过它吸引用户的关键之一恰恰是产品设计。
乍一看,它也像一个聊天机器人,提供与ChatGPT类似的交互体验。你向它提出一个问题,比如问它马斯克的脑机接口是怎么回事,它就会回答你“马斯克是Neuralink公司的创始人,而这家公司不久前宣布了全世界第一起脑机接口的人体试验,该人体试验的初步结果显示,这个植入人脑的设备探测到了神经元的放电模式”。
不过,相较其他聊天机器人,Perplexity提供了一个新东西——确定性。比如,它会在所生成内容的某些关键信息后面添加数字小标,然后像论文格式那样列出信息来源。循着小标,你就能看到路透社、彭博社、CNN、雅虎、连线等知名媒体关于Neuralink公司的脑机接口人体试验的原版报道链接。
你可以在对话框中提出问题,Perplexity的AI会作出回答,并标注信源链接。
而在AI回答的下方,你还能看到一系列相关问题,比如“Neuralink开发脑机接口的目的是什么”“Neuralink的脑机接口如何工作”或者“Neuralink脑机接口的潜在风险是什么”。这些问题被称作“相关问题”(follow-up question),如果它们引发了你进一步了解的兴趣,你可能就会点进去继续阅读——这个设计听起来有点像AI版的知乎,只不过提供回答的不是人类,而是AI。
除此之外,它还提供一种非常有用的功能,即允许用户将搜索范围限制在特定数据库中,比如你可以要求它将检索范围限定为YouTube、Reddit,也可以是特定学术期刊。
像Perplexity这种产品在市面上被称为“AI搜索”,因为它在回答问题之前其实先去搜索引擎上搜索了一圈相关信息,然后才归纳总结并回复用户。不过,Perplexity创始人兼CEO Aravind Srinivas更愿意称之为“答案引擎”(Answer Engine)。“用户可以直接提出任何问题,并得到一个实际的答案,而不仅仅是一个可能包含或不包含答案的网页列表。”Aravind Srinivas说。
回答完你的提问,它还会给出一系列“相关问题”,答案同样是AI生成的。
答案引擎、问答系统的历史其实比搜索引擎更古老。早在Google的网页列表式UI出现之前,1970年代,信息检索领域的研究者就开始制作一种通过自然语言处理(NLP)来访问文本的应用程序。1990年代中期出现的Ask Jeeves服务(现为Ask.com),就是以一个穿着考究的人类形象,在网页中提供问答服务。
1990年代,Ask公司就开始以一个Jeeves的形象提供问答服务(现为Ask.com)。
2020年左右,Google也曾探索过通过简单的文本提取方式实现问答服务,如今你在Google搜索某一新闻或其他事物后出现的几百字摘要,就是这种文本提取技术的成果。不过没有大模型技术,这种文本提取式问答无法综合多个页面的内容,也因此无法回答更为复杂的问题。
RAG:一种开卷考试
让Perplexity不同于Google的是答案引擎,而让Perplexity不同于ChatGPT的,是被称作RAG(Retrieval-Augmented Generation)的检索增强生成技术。顾名思义,这种技术使大型语言模型(LLMs)可以连接到外部知识库,利用从外部来源获取的事实提高生成式AI模型的准确性和可靠性,减少模型本身的“幻觉”。
创造RAG这个词和技术的人是帕特里克·刘易斯(Patrick Lewis),他在2020年一篇名为《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》的文章中首次提出了这种方法。现在,他是Cohere RAG团队的负责人。
RAG技术可以与任何外部数据源连接,通过它,用户基本上可以与任何数据存储库对话。比如,医疗领域的聊天机器人可以通过查询医院数据成为医生的得力助手,金融分析师的机器人也可以通过查询市场相关数据库变得更为可靠。
几乎每家企业都有属于自己的知识资产、数据库,过去,以OpenAI为代表的大模型公司提出以“微调”的方式为各垂直领域客户提供服务,即它倡导用各企业的内部数据继续训练大模型公司们提供的基础模型,从而推出一个更懂某家公司的专有模型。举个例子,GPT-4在学习了更多法律、财务知识后,就比在这些领域学得不够多的GPT-3.5更容易通过司法考试、分析师考试。
而RAG的路径与此不同,采用这种技术的公司,比如Perplexity,没有让GPT-3.5或GPT-4继续学习特定领域的垂直知识,而是将这部分数据作为可随时查询的对象给模型参考。打个比方,OpenAI不断用更多数据训练学识更渊博的大模型、然后由其直接为用户解答的做法相当于一种闭卷考试,Perplexity之类的RAG公司则是开卷考试。
“用户永远不犯错”
产品形态上,Perplexity位于搜索引擎Google和聊天机器人ChatGPT之间,除了问答窗口、“相关问题”,它还有一个叫“发现”(Discover)的选项卡,里面有大量人为选择的当日新闻摘要供用户浏览和继续追问。与ChatGPT或Gemini相比,“发现”选项卡使得用户了解全球正在发生的新闻变得更加容易。
“发现”选项卡展示了人工编辑选出来的当天热门新闻。
整体看起来,Perplexity更像一个AI版的知乎,用户哪怕不提出问题,也能看到足够多且有趣的问答。
Perplexity身上有知乎的影子似乎并不令人意外,因为其创始团队中的多位成员都曾在Quora工作,后者是一个问答社区,知乎曾经模仿的正是Quora。比如Denis Yarats,他曾在Quora担任机器学习工程师,如今,他是Perplexity的CTO;创始设计师Henry Modisett也曾在Quora工作超过8年,曾参与设计Quora的feed流、问答等产品设计。
Quora创立于2009年,是一个基于知识分享的社交网络。
不过,Perplexity创始人Aravind Srinivas并没有在Quora工作过,促使他采纳“AI问答社区”这一设计方案的哲学有两个:其一,用户不会有犯错;其二,无论如何都不要单纯做搜索。
第一个产品哲学来自他的竞争对手Google。Aravind Srinivas称,他看过Google联合创始人拉里·佩奇(Larry Page)分享的一个故事:佩奇和Google另一位联合创始人谢尔盖·布林(Sergey Brin)曾经差点把Google卖给Excite,当时他们一起给Excite CEO做了演示,同时打开两个浏览器窗口,一个是Google,另一个是Excite,然后佩奇在两个搜索引擎中输入了同样的文字,Google成功返回了相关链接,而Excite没有。Excite的人当场表示Excite没有成功返回链接是因为佩奇的输入“不准确”。佩奇回答“我只是个用户,我没有犯错”。从这个故事中,Aravind Srinivas学习到了人机交互的一个基本原则——用户永远不犯错。
Google曾差点被出售给Excite,不过2000年左右,Excite自己先破产了。2004年3月,Excite.com门户网站被Ask收购。
“虽然每个人都有很强的好奇心,但能将好奇心转化为精确问题的人很少。”Aravind Srinivas说,Perplexity因此花了大量时间在处理、分析和重组用户查询的问题上,也就是说,当用户提出相对含糊的问题后,Perplexity会首先将问题处理成更有逻辑的提问方式,即优化用户的Prompt后,才将问题交给模型回答。
“相关问题”和“发现”功能的设计也出于同一逻辑,Aravind Srinivas称,他会亲自参与“发现”选项卡背后的内容挑选,以便持续了解产品是否一直“足够简单,连普通新用户都能轻松理解”。Perplexity首席商务官Dmitry Shevelenko提供的数据称,由“相关的问题”产生的用户查询占据Perplexity总查询量的40%。
持续改进产品,让现有用户不断把产品推荐给更多朋友使用,同时保持产品容易上手的特性,对新用户友好。Aravind Srinivas称这两点也是Facebook早期的用户增长策略。
“无论如何都不要单纯做搜索”,这个哲学是投资人Marc Andresson给Aravind Srinivas的建议。Aravind Srinivas曾一度迷茫是不是应该专注做垂直搜索引擎,而不是把业务继续扩展到AI问答社区等有社交属性的领域。Marc Andresson的回答是“大多数宣称做垂直领域Google的公司都失败了,反而是在垂直领域建立端到端用户体验的公司成功了”,比如Booking,它不仅能搜索酒店,还能直接完成预订,而Airbnb已经不只是一个住宿预订平台,而是一家能提供综合旅行服务的公司了。只要做得足够深,竞争优势就不会只停留于技术、用户积累这样的单点上。
Aravind Srinivas被Marc Andresson说服。如果Perplexity的初衷是满足人们无穷的好奇心,那一个AI版问答社区就会比单纯的搜索引擎有用得多。“在Quora上,人们需要花一定时间等待别人来回答自己的提问,不仅很慢,也无法最大化加速知识的获取,Perplexity就是想要解决这样的问题。”Aravind Srinivas说。
Perplexity正在追求成为“服务更加全面”的公司。除了网页端产品,它最近还推出了适配苹果Vision Pro的头显端应用程序,并与Brilliant Labs建立了合作伙伴关系,用户能通过AR眼镜完成查询。
积累用户比训练模型重要
和曾经激励Aravind Srinivas创业的Jasper一样,Perplexity也一度被质疑为大模型的“套壳”产品,因为它在很长时间里都没有训练自有模型,而是利用GPT、Claude等第三方模型向用户提供基于AI的搜索服务。
不过Aravind Srinivas坚信他的做法才是对的,“如果你的目标是建立以产品为核心的公司,就不要在训练自有模型上浪费时间”,他认为“成为一个拥有10万用户的套壳产品显然比拥有自有模型却没有用户更有价值”。直到Meta发布第二代模型Llama 2并开源后,Perplexity才开始基于这一开源模型训练自有模型。
直到现在,Perplexity的团队规模都不大,只有45名员工,总部位于旧金山的一个共享办公空间。
4月初,Perplexity表示其活跃用户已经增长到1500万,比1月报告的1000万增长了50%。但Srinivas和他的投资者认为,颠覆Google搜索的时机已经成熟。
Perplexity被认为是Google的强有力潜在竞争者。咨询公司Gartner预测,到2026年,传统搜索引擎的市场将下降25%。因为搜索营销的份额会被ChatGPT那样的聊天机器人、Perplexity这样的答案引擎,或者其他AI智能体(agent)夺走。
Google已在测试自己的生成式搜索工具,不过态度似乎不够坚定——就连这项AI搜索的名字本身“Search Generative Experience”(搜索生成体验),听起来也毫不响亮。
Google正在测试的AI搜索功能,它有个不太响亮的名字“Search Generative Experience”(搜索生成体验)。
商业模式上的挑战是Google一直难以跳下来做“问答引擎”的原因。自2000年以来,Google的主要收入来源就是广告。根据Google 2023年财报,其广告业务营收2378.6亿美元,在总营收中占比77.4%。如果生成式AI能够对于用户提问给出快速且完整的回答,可能使得传统搜索引擎和夹杂在网页列表中的高利润广告变得多余。
Perplexity面临的商业化挑战与Google其实是一样的。其网站上目前还没有广告,因为它认为搜索应该“不受广告驱动模式的影响”,但它打算在“相关问题”中提供有品牌赞助的问题。这一广告产品可能在未来几个季度推出,能创造多少广告收入还是未知数。
目前,Perplexity的主要盈利方式是对高级功能收费。和OpenAI、Anthropic等公司一样,如果用户想要访问平台上的高级功能,比如上传自己的文件,让模型根据自己的职业、位置、好恶等信息来创建“个人资料”,以获得个性化的答案和建议,就要支付20美元/月的订阅费。为这些高级功能付费的用户并不多,自2022年12月推出以来,只有不到10万人为高级版付费。