重组团队、重金投入，谷歌AI业务能否重回巅峰？

美国东部时间4月25日，谷歌母公司Alphabet发布财报。2024年第一季度，Alphabet的营收为805.39亿美元，同比增长15%，创下2022年初以来的最快单季增速；净利润为236.62亿美元，同比增长57%。

财报发布后，Alphabet股价在美股盘后时间大涨，截至发稿，股价涨幅超过11%。谷歌的总市值也达到了1.96万亿美元。

谷歌CEO（首席执行官）桑达尔·皮查伊（Sundar Pichai，下称“皮查伊”）在财报发出后的业绩会上表示，在Gemini（谷歌旗下的多模态大模型）时代，谷歌的发展很顺利，“我们在AI（人工智能）研究和基础设施方面拥有领导地位，再加上遍布全球的产品，这为下一波AI创新奠定了良好的基础。”

但在之前的一段时间，谷歌AI业务的进展一波三折。2023年2月，谷歌的AI聊天机器人Bard在官宣视频中出现照片识别错误，Alphabet股价在次日暴跌9%。此后，谷歌发布的Gemini 1.0模型陷入造假传闻，推出的Gemini 1.5 Pro模型又被Sora（美国AI研究公司OpenAI旗下的文生视频大模型）抢去了风头。

与此同时，谷歌也在不断调整AI团队架构。4月18日，皮查伊给全体员工发布了邮件，宣布全面整合谷歌的AI团队，表示此举将有助于更迅速高效地开发AI产品和服务。

从2012年第一次识别出猫，到2016年在人机大战中战胜顶尖人类棋手，谷歌旗下的AI项目曾经代表着人类最前沿的技术探索。但在OpenAI旗下AI聊天机器人ChatGPT引发的大模型技术浪潮中，谷歌在AI领域的优势不再。

而最新发布的财报显示，Alphabet在今年一季度的AI资本支出达到120亿美元。重组团队、重金投入，能否让谷歌的AI业务在未来重回巅峰？

重组团队攻向AI

谈及皮查伊近日发布的全员邮件，一位在谷歌工作十余年的人士说：“从来没看到过CEO（发送过）这么长的邮件。”

这是一篇标题为《建设我们的AI未来》的长文，皮查伊在文章开头表示谷歌正在进行一场波及全公司的变革，最先需要变化的是模型与研究。

皮查伊宣布将谷歌专注于大模型以及负责AI技术安全等研究的谷歌研究部门Google Research，全面整合到AI业务部门Google DeepMind之中。

上述谷歌人士称，谷歌在战略层面进行组织调整，是为了更聚焦且高效地推进大模型与应用端的融合，从而加速AI技术的开发与创新。本次调整不只是出于技术层面的考虑，也是因为谷歌内部的业务太复杂了。他出示了一张表格图，图中纵向展示的是谷歌的几十个产品线或业务部门，横向展示的是谷歌设立的4个主要技术栈方向——Mobile（移动端）、Web（全球广域网）、AI（人工智能）、Cloud（云计算）。

此前，皮查伊已经对谷歌的AI团队采取了一系列调整动作。2023年4月，他选择将谷歌旗下的Google Brain、DeepMind两个AI研究团队进行合并，创建了新部门Google DeepMind。Google DeepMind主要专注于通用AI模型研究与创新，由DeepMind原联合创始人兼CEO戴密斯·哈萨比斯（Demis Hassabis，下称“哈萨比斯”）担任负责人。

对于上述两个团队的合并，皮查伊认为，尽管谷歌拥有两个排名世界前三的AI团队，但在开始建立更强大模型的时候，谷歌不仅需要更庞大的计算资源，也要从纯粹的AI研究转向商业化，还需要投入大量资源开展测试和确保安全。

上述谷歌人士也表示，DeepMind此前一直是AI强化学习的早期探索者，“在谷歌内部是一个相对独立的存在”。他认为，在谷歌将所有专注于AI创新研究、开发的人才整合至哈萨比斯的团队后，可以在接下来更为激烈的模型进化中做到全力出击。

Gemini模型演进

ChatGPT中“T”代表大模型技术Transformer，由谷歌DeepMind团队最早发明的。然而，在OpenAI抢先用生成式AI产品打响市场后，谷歌不但姗姗来迟，甚至在Bard的首秀中“翻车”。

2023年11月，谷歌全新推出的大模型Gemini具备语言、听力与视觉等方面的多模态交互能力，还可以在数据中心、移动设备等多类型平台上运行。

Gemini模型家族共有三个量级的产品，分别是可用于特定任务和端侧的Nano版，可用于多任务的Pro版，以及模型能力最强的Ultra版。谷歌在今年2月16日宣布升级Gemini 1.5 Pro，风头却被同日推出的Sora抢尽。

IT投资人、新加坡Vibranium Consulting副总裁陈沛认为，市场忽视了Gemini的模型进化，Gemini1.5Pro支持的文本长度可达1000万tokens（token为大模型文本中的一个最小单位），“能力已经与GPT-4（OpenAI旗下的大模型）不相上下”。

陈沛称，尽管Gemini Ultra版至今没有接受公开排行榜的测试，但这一版本模型的参数规模远大于GPT-4。行业内的共识是，谷歌在模型创新能力上正在反超OpenAI。

斯坦福大学AI研究所在4月15日发布的《2024斯坦福AI指数报告》也重点提及了Gemini。过去一年，谷歌发布的基础模型最多。此外，Gemini Ultra版本的训练成本预计达到1.91亿美元，而GPT-4的训练成本仅为约7800万美元。

4月15日在加拿大举行的TED2024大会上，曾有参会者邀请哈萨比斯评价微软与OpenAI计划开发价值达1000亿美元超级AI计算机的动作。哈萨比斯表示，虽然谷歌内部并不谈论在提升AI计算能力方面具体的投入数字，但随着时间推移，谷歌的投资后续将超过1000亿美元。

在上述谷歌人士看来，谷歌并非近两年才将AI作为重点。早在2017年，谷歌就提出了“AI第一”战略。除了广为人知的Transformer技术和战胜顶尖人类棋手的AI机器人AlphaGo，谷歌还有很多AI创新武器“不急于亮出来”。他认为，谷歌在当前的AI模型竞赛中没有跟风去拼速度。

加速端侧落地

4月中旬，极客邦科技创始人兼CEO霍太稳在美国参加了Google Cloud Next 2024大会。在大会的主题演讲环节，谷歌宣布将与中国手机厂商OPPO、一加合作，为它们的2024款手机产品提供Gemini模型支持。

此前，华为、小米、vivo、OPPO、荣耀等国内手机厂商，都发布了具备大模型能力的手机。但谷歌推进AI模型落地端侧的动作，让霍太稳感受到了国内厂商与谷歌之间的差距。“尤其在硬件芯片方面，谷歌自研了TPU（张量处理器），还广泛应用了英伟达高端GPU（图形处理器），这是（国内厂商）能力所不及的。”霍太稳说。

从谷歌对外释放的信息看，旗下智能手机Pixel 8与Pixel 8 Pro都将在今年6月的季度更新中具备Gemini Nano模型的服务能力。在陈沛看来，用户若想在手机上流畅地使用最高性能的Gemini Ultra模型，谷歌还需专门优化大模型的性能、响应延迟和能耗。

易观分析高级分析师陈晨称，目前手机厂商主要与芯片、大模型等厂商进行战略合作，部分目的是解决大模型在端侧的适配以及模型能力应用边界等问题。“要想实现大模型在端侧的高效运行，厂商要平衡算力与能效、智能化与便携化之间的诸多问题。”陈晨说。

不过，与GPT-4相比，Gemini模型具备在端侧率先落地应用的优势。陈沛告诉经济观察报，谷歌拥有安卓移动应用生态，近来还在尝试将一些生成式AI功能更新到安卓APP中，这些都为Gemini模型在端侧的创新应用提供了土壤。

上述谷歌人士称，国内的安卓市场是割裂的，每家手机厂商都可以有自己的分发渠道，甚至可以自研操作系统，“一旦（它们的）手机应用出海，只有两个可以依靠的分发渠道，一个是Apple Store（苹果旗下移动应用市场），一个是Google Play（谷歌旗下移动应用市场）。”

一位手机行业人士证实，国内手机厂商选择与谷歌合作，看重的更多是Gemini模型与海外市场的适配性。他说，国内厂商虽然早早展开AI能力自研，在端侧模型方面进行了相关应用创新，但它们的AI能力和模型服务“在海外是不可用的，或者说不适用于海外用户”。

此外，手机厂商对于大模型端侧落地和应用创新的推动，也是Gemini模型加速迭代的催化剂。

2023年末，一加中国区总裁李杰表示，并不看好当时的“大模型手机”，直言“（它们）更像是一个噱头”。时隔两三个月，一加的母公司OPPO便发布了全新的AI战略，一加也在今年3月推出了支持大模型的Ace 3V智能手机。

上述谷歌人士透露，除了国内手机厂商，三星也在和谷歌方面接洽，寻求大模型的合作。

正文

重组团队、重金投入，谷歌AI业务能否重回巅峰？

相关阅读

照片一键转漫画

照片修复去什么地方

漫画照片怎么制作

照片修复专家

目录[+]