谷歌在人工智能竞赛中追赶 OpenAI 的努力正在挣扎。
谷歌的对话式人工智能 Gemini 对于应用开发者和企业来说,比竞争对手的技术更难使用,这在与开发者和几位帮助公司使用该人工智能的谷歌员工的访谈中得到了证实。
要点:
其中一位开发者是 Aidan McLaughlin,他是 Topology 的创始人,这是一家开发软件以提升现有 AI 模型推理能力的初创公司。他表示,第一次使用 OpenAI 的应用程序编程接口只花了 30 秒,而使用 Gemini 则花了 4 个小时,因为谷歌要求他设置云账户并进行一系列配置。此外,谷歌系统中的错误有时迫使他退回重新操作。
“如果谷歌提供的模型比 OpenAI 和 Anthropic 所提供的更强大,我会不惜一切代价去争取,”他说。
“世界上最重要的事情是模型的好坏,但他们的模型似乎在边缘案例之外排名第三,”指的是罕见情况。
开发者在使用 Gemini 时的挣扎对谷歌的云业务产生了影响,谷歌希望通过 Gemini 吸引更多客户来租用其服务器。
这些问题也可能对谷歌自身的人工智能开发构成潜在的挑战,一些员工表示。
通过吸引数百万付费客户购买其人工智能模型或使用 ChatGPT,OpenAI 获得了大量关于其人工智能表现的隐性和显性反馈,从而可以进行改进。如果谷歌的 Gemini 没有获得同样的使用水平,该公司可能在实现相同目标的道路上会更加模糊,来自两位曾参与 Gemini 项目的人员表示。
这也可能影响谷歌消费者和广告产品的Gemini模型的发展,以便在搜索中提供对话式答案以及为其语音助手提供服务。
“让开发者使用[Gemini]解决复杂的现实问题……对下一代 Gemini 来说是至关重要的反馈,”Abacus AI 的首席执行官 Bindu Reddy 说,她的公司软件帮助开发者构建 AI 应用。“使用得越多,效果就越好,”她说。
Gemini在今年取得了巨大的进步,但在为人工智能商业应用提供动力方面,仍然不如竞争对手的型号可靠,她说。
谷歌发言人表示,开发者反馈对改进 Gemini 模型很重要,但这并不是唯一可以做到这一点的数据。
一些人工智能研究人员表示,通过教导人工智能从各个领域的人类专家那里学习,也有可能取得重大进展,例如研究人员希望它掌握的领域。
小型开发者和大型公司都使用像 OpenAI 的 GPT-4 这样的语言模型来开发应用程序,自动化从客户服务和数据分析到欺诈检测和生成计算机代码的所有工作。OpenAI 和微软每月从向开发者销售LLMs中各自产生约 1 亿美元的收入,包括量化交易公司如 Jane Street、银行如摩根士丹利以及像 Stripe 这样的金融科技公司。
谷歌列出了几家 Gemini 的客户,这是该公司对 GPT-4 的回应,包括梅赛德斯-奔驰、高盛和优步。在声明中,这些公司表示他们使用人工智能来支持从客户服务到编码辅助的各个方面,尽管无法得知他们的购买程度。(谷歌之前设定了今年在北美通过人工智能云服务产生 10 亿美元收入的目标,但它还销售许多其他人工智能服务,而不仅仅是LLMs。)
谷歌首席执行官桑达尔·皮查伊在公司七月的第二季度财报电话会议上表示,自年初以来已有超过 200 万开发者使用了 Gemini,但尚不清楚这是否包括仅尝试过一次或两次的开发者。
Gemini 在开发者中的受欢迎程度低于 OpenAI 的模型,似乎在谷歌和现实世界中都是一个公开的秘密。
堆叠
例如,企业软件初创公司 Retool 在 6 月对 750 多名技术工作者的调查发现,仅有 2.6%的受访者表示他们最常使用 Gemini 来构建 AI 应用,而 76%的人表示他们使用 OpenAI。Gemini 以 2.3%的比例略微超过了 Anthropic 的 Claude,但该公司的报告称,自 Retool 2023 年 11 月的报告以来,Claude 的使用量已经增长了四倍以上。(Gemini 在那之后一个月才对开发者开放。)
Similarweb 跟踪网站流量,表示 OpenAI 的应用开发者页面在六到八月间获得了 8280 万次访问,而谷歌的页面在同一时期有 840 万次浏览。
较小的轶事调查提供了类似的证据。上个月底,Finetune 的创始人朱利安·萨克斯在他位于旧金山的联合办公空间询问了 50 位 AI 初创公司的开发者,他们最常使用哪些对话 AI 模型。
几乎所有人都表示他们主要使用 Anthropic 或 OpenAI 的模型,没有人主要使用 Gemini。
萨克斯并不感到惊讶。
“我觉得Gemini在编码方面不如其他的。”他说。
谷歌花了近一年的时间——以及一次重大重组——才推出了一个能够与 2023 年初发布的 OpenAI 的 GPT-4 竞争的模型。谷歌在 2023 年 12 月开始向开发者提供 Gemini 模型的访问权限,其性能在流行的对比评估中接近 OpenAI 的模型。
但 OpenAI 的先发优势使其在开发者中获得了品牌知名度,一些谷歌员工表示。今年,另一家年轻的人工智能公司 Anthropic 也享受到了口碑营销的激增,因为开发者们将 Claude 宣传为 OpenAI 的替代品,特别是在编码辅助方面。
人们会被绊倒
Gemini似乎没有引起太多关注。开发者表示,Gemini模型在分析长文档或代码库时非常有用,因为它们可以一次处理比其他模型更多的信息。
但他们也说,与竞争对手相比,谷歌使得使用这些模型变得更加困难,因为它提供了令人困惑的多种选择、某些选项所需的步骤数量以及其开发者系统与 OpenAI 之间的其他差异。
有时,谷歌为使用 Gemini 提供的不同选项在谷歌自己的搜索结果中争夺相同的关注度:根据一位看到广告的人士的说法,今年春天的某个时候,谷歌向希望使用 Gemini 的大型企业推广的 Vertex AI Studio,曾是谷歌 AI Studio 的赞助结果,后者是一个更简单的工具,帮助开发者使用 Gemini。
“人们在试图弄清楚它们时会感到困惑,”前 OpenSea 首席技术官亚历克斯·阿塔拉(Alex Atallah)说,他在为自己的初创公司 OpenRouter 使用 Gemini 时也遇到了类似的困难,该公司为使用LLMs的开发者制作软件。
尽管谷歌的 AI Studio 服务在去年十二月推出,旨在使开发者更容易使用 Gemini,但他们必须使用与 GPT 和 Claude 不同的查询发送方法,而后者的格式相似。麦克劳林表示,这种差异使得转向 Gemini 的吸引力降低。
Gemini在社交媒体上经常被嘲讽——尤其是在 X 上。Xbow 的 AI 研究员 Brendan Dolan-Gavitt 本月早些时候因一条帖子而走红,帖子中讲述了他通过 Vertex(另一个用于开发 AI 应用的谷歌应用)开始使用Gemini所经历的众多步骤。其他开发者也纷纷表示同情。
“根深蒂固的市场份额”
谷歌正在努力改变这种看法,包括回应在 X 上对 Gemini 的批评。它还为开发者举办活动,以推广 Gemini。它正在尝试其他激励措施,例如在开发者中进行比赛,打造最佳 Gemini 驱动的应用, 第一名的获胜者将获得一辆定制的电动德洛里安,车牌号为 G3M1N1。(谷歌最近将最终结果推迟到今年晚些时候。)
谷歌还在考虑合并其销售的某些重叠应用程序构建产品的功能,以减少开发者的困惑,一位从事其开发者产品的人员表示。
“实际情况是,OpenAI 在LLM API 的开发者背景下,提供的东西对开发者来说比谷歌稍微早一些,”Logan Kilpatrick 说,他在四月加入谷歌,担任 AI Studio 的产品负责人,此前在 OpenAI 负责开发者关系。“我们必须与他们目前在开发者中固有的市场份额进行斗争。”
OpenAI 上周推出了一种推理模型 o1-preview,能够在某些技术或复杂任务上表现优于LLMs。这可能会给谷歌施加压力,要求其发布类似技术,否则可能在开发者的看法中进一步失去对 OpenAI 的优势。
“白手套”服务
与此同时,谷歌正在开发下一版本的 Gemini,2.0。人工智能竞赛可能会很漫长,这给谷歌留出了时间去寻找突破,使其能够跟上或超越 OpenAI 的技术。
可以肯定的是,Gemini有一些粉丝,特别是因为它能够处理比竞争模型更多的信息。Starcycle 的创始人 Jaclyn Siu 表示,她的公司使用Gemini 1.5 Pro,这是该公司为开发者提供的最先进的LLM,用于从文档中提取数据。汤森路透同样使用Gemini作为法律辅助工具,比较长篇法律文件并寻找不一致之处。
对于一些大型公司来说,使用谷歌的人工智能所面临的困难并不是一个障碍。零售市场 Wayfair 的首席技术官 Fiona Tan 表示,该公司得到了谷歌员工的“白手套”服务,他们正在帮助 Wayfair 的一个项目,该项目依赖于 Gemini 将 Wayfair 的遗留数据库转换为更易于使用的格式。
其他开发者没有给 Gemini 机会,因为他们不需要改变已经有效的东西。正在开发名为 Dots 的应用程序以根据健身追踪器数据提供健康建议的 Martyn Strydom 表示,他的公司正在使用 Claude 作为编码助手来开发应用程序,并使用 OpenAI 的旧版 GPT 模型来回应客户。他表示,他的公司没有时间不断测试不同的语言模型。
“现在,基本上每个人都在使用 OpenAI、Claude 或 Cursor,”他说,这是一款由 OpenAI 和 Anthropic 模型驱动的 AI 代码助手。
“如果世界顶尖的工程师都在使用这些,我们有什么资格说,‘我们去试试别的’?”