当地时间7月25日,OpenAI宣布推出由AI驱动的搜索引擎SearchGPT,并开启邀请测试,标志着OpenAI正式进军搜索引擎市场,直接对打谷歌、Bing、Perplexity等一众公司。
围绕“传统搜索是否会被AI搜索颠覆?”这一话题,从ChatGPT出现的那一刻就开始了。然而2024年1月的数据表明,谷歌搜索依然保持着91.46%的市场占有率,霸主地位无可撼动。
SearchGPT的发布,似乎是Open AI对谷歌直接发起的冲锋。此举会对传统搜索产生什么样的影响?引起了业内广泛关注。
一、直接对打传统搜索
如何评价SearchGPT?要了解一款应用的第一步,就是去使用它。极客公园进入SearchGPT主页面,目前的搜索引擎还是以一个大文本框开始,询问用户“您在寻找什么?”。用户提出问题后,SearchGPT则尝试组织和理解它们。
据OpenAI发言人Kayla Wood透露,该服务由GPT-4系列模型提供支持,在发布时仅向10,000名测试用户开放。Wood表示,SearchGPT目前只是一个“原型”,OpenAI正在与第三方合作伙伴合作,并使用直接内容提要来构建其搜索结果,目标是最终将搜索功能集成到ChatGPT中。
在OpenAI对外发布的一个演示案例中,用户搜索“2024年8月北卡罗来纳州布恩的音乐节”,搜索引擎会总结其对音乐节的发现,页面的右侧提供了活动的简短描述,左侧为内容来源链接。
SearchGPT搜索结果页面|图片来源:SearchGPT截图
除了对打谷歌,SearchGPT的发布也标志着OpenAI与初创公司Perplexity展开了更直接的竞争,后者自称是AI“答案”引擎。Perplexity最近因一项人工智能摘要功能而受到批评,出版商声称该功能直接抄袭了他们的作品。
OpenAI似乎已经注意到了这一反馈,并对此采取了更为严谨的方法。该公司在一篇博客文章中强调,SearchGPT是与多家新闻合作伙伴合作开发的,其中包括《华尔街日报》的所有者、美联社和The Verge的母公司Vox Media等组织。Wood对此表示:“新闻合作伙伴给出了宝贵的反馈,我们会继续寻求他们的意见。”
该公司写道,出版商将有办法“管理他们在OpenAI搜索功能中的显示方式”。他们可以选择不让其内容用于训练OpenAI的模型,但仍会在搜索结果中显示。
OpenAI的博客文章称:“SearchGPT旨在通过在搜索中突出引用和出版商链接来帮助用户与出版商建立联系。”“响应具有清晰、内联、命名的归属和链接,因此用户知道信息来自哪里,并且可以在带有源链接的侧边栏中快速获取更多结果。”
自从ChatGPT问世以来,OpenAI一直在试图让其与实时网络更加紧密地联系在一起。而外界对该公司是否会直接做搜索产品也一直没有停止讨论,2月份传出了它的开发情况,OpenAI一直在积极挖走谷歌员工加入搜索团队。
ChatGPT的快速迭代赢得了数百万用户,但相对应的开发成本也在不断增加。The Information近日报道称,OpenAI的人工智能训练和推理成本今年可能达到70亿美元,而数百万免费版ChatGPT用户只会进一步推高计算成本。SearchGPT在首次推出时将免费,而且由于该功能目前似乎没有广告,很明显该公司必须尽快找到盈利方式。
二、SearchGPT的幻觉
在SearchGPT找到盈利模式前,网友先发现了幻觉。
在前面提到的搜索“2024年8月北卡罗来纳州布恩的音乐节”案例中,网友发现,“据该工具显示,该音乐节将从今年7月29日至8月16日举办一系列艺术活动。然而,如果有人希望购买其中一场音乐会的门票,那就麻烦了。事实上,该音乐节于6月29日开始,最后一场音乐会将于7月27日举行。相反,7月29日至8月16日是音乐节售票处的正式关闭日期。(我已与音乐节售票处确认了这些日期。)”
网友评论道,“OpenAI的SearchGPT演示结果实际上并没有那么有用,显示的结果大多是错误的或没有帮助的,公共AI演示中出现幻觉的趋势仍在继续。”
网友评论|图片来源:The Verge截图
这恐怕也是OpenAI将其搜索引擎作为“原型”发布的原因之一——如果SearchGPT的结果不完全正确,公司可以说“这只是一个原型”,换取人们对它更高的包容度。
其实,比OpenAI对生成式搜索还要耿耿于怀的,当属微软了。当地时间7月25日,Bing尝试一种新的将生成式搜索与传统搜索结合的方式——AI摘要功能。该功能预计会在几个月后正式上线,目前处在邀请测试阶段。
Bing表示,通过将生成式人工智能和大型语言模型(LLM)的功能与搜索结果页面相结合,必应的生成式搜索可以对用户的查询做出定制的动态响应。这种新体验将必应搜索结果的基础,与大型和小型语言模型(LLMs和SLMs)的强大功能相结合。它能理解搜索查询,审查数百万个信息源,动态匹配内容,并以人工智能生成的新布局生成搜索结果,从而更有效地实现用户查询的意图。
在页面布局方面,用AI生成的信息占据了搜索结果页面的主体部分,传统搜索结果列表推到了页面右侧。
Bing AI摘要功能页面示意图|图片来源:Bing官网
事实上,2023年2月,微软就推出了由OpenAI的ChatGPT技术提供支持的新版Bing搜索引擎,自那以来,Bing一直期望用生成式搜索的加持追逐谷歌的搜索主导地位。
1年过去,2024年1月,StatCounter的数据显示,微软的搜索引擎在2024年1月的市场份额仅为3.43%,比去年同期增长不到1%。与此同时,谷歌的市场占有率为91.46%,相比去年仅下降了不到1%。生成式搜索的加成,并没有让Bing获得期待的效果,而这种落差在4个月后同样发生在谷歌身上。
5月15日,谷歌也推出了类似的功能,称为“AI概览”,它将AI生成的摘要放置在搜索结果页面的顶部位置。
谷歌AI概览示意图|图片来源:官方视频截图
该产品推出后不久,用户发现该功能对某些查询的答案不准确,迫使谷歌手动处理部分回复。
如今,将AI搜索与传统搜索相结合已成为常规操作。从过往数据来看,并没有证据显示,谷歌搜索受到了来自AI生成式搜索的挑战。而SearchGPT无论在产品形态还是技术能力,都没有和其它家产品拉开太大差距,因此极客公园推断,可能也并不会对海内外其它搜索引擎产品形成碾压。该产品的发布,也许会让用户有所增长,但不会让用户翻倍增长。
这次发布看起来煞有介事,却更像在拉齐与其它各家搜索进化进度的一次公关行为。
如此看来,就AI大模型替代传统搜索这一话题而言,远没有大家想象的那般顺利,但一切也并非毫无意义。
三、AI搜索的未来,不是搜索
在一众AI搜索中,最亮眼的仔当属Perplexity。甚至可以说,这家公司是后来各家搜索AI化进程加速的催化剂。
AI搜索引擎初创企业Perplexity,成立于2022年,刚刚成立就获得了310万美元的种子轮投资;次年3月,Perplexity获2560万美元A轮融资,估值1.5亿美元;2024年1月,完成7360万美元融资,总融资额超1亿美元,估值达到5.2亿美元;3月初,该公司以10亿美元的估值融资约6300万美元;4月,Perplexity传出正进行至少2.5亿美元的新一轮融资,估值可能达到25亿至30亿美元。
公布出的投资人名单也相当豪华,包括芯片巨头英伟达、大数据公司Databricks、三星电子等机构,以及亚马逊创始人Jeff Bezos、前推特副总裁Elad Gil、前GitHub首席执行官Nat Friedman等多位科技圈大佬。
在应用数据方面Perplexity同样表现亮眼,2023年用户总查询次数超50亿次,安装移动App的人数超100万。在调查机构Writerbuddy发布的年度调查中,Perplexity以访问量排名第13的成绩,跻身2023年度全球最火爆AI工具前50名。
从机构与科技大佬们对perplexity的追捧,可以看出业界对AI搜索引擎长期看好;从不断增长的用户数据则可以看出,大众对AI搜索旺盛的需求。
AI搜索为用户省去了点网页、看网页、选内容的过程,直接对现有网页进行总结概括,给出一份类似调查报告的结论,相当于一个搜索助手。它最大的作用,应当是降低了用户的搜索时间,节省了人脑对信息处理总结所耗费的精力,以及提高信息的准确性。
但是机器幻觉问题一直存在,Perplexity也不例外。6月,其聊天机器人就被爆出在缺乏直接访问原文的情况下产生机器幻觉,通过URL和搜索引擎碎片信息重建内容,生成看似准确的摘要,实则可能包含不准确甚至完全虚构的信息。这也是AI搜索在当下只能充当“助手”角色的重要原因。此次Open AI宣称推出SearchGPT的目标,是最终将搜索功能集成到ChatGPT中的原因,恐怕也是因为看清了这一点。
因此,在各家技术能力差不多的情况下,未来AI搜索产品比拼的,是如何让搜索结果能够更忠于网页内容,且从工程能力和产品设计能力方面做出更体系化的整理结果,以解决信息准确度问题。
很显然,这一问题SearchGPT还没有解决。