美国东部时间4月25日,谷歌母公司Alphabet发布财报。2024年第一季度,Alphabet的营收为805.39亿美元,同比增长15%,创下2022年初以来的最快单季增速;净利润为236.62亿美元,同比增长57%。
财报发布后,Alphabet股价在美股盘后时间大涨,截至发稿,股价涨幅超过11%。谷歌的总市值也达到了1.96万亿美元。
谷歌CEO(首席执行官)桑达尔·皮查伊(Sundar Pichai,下称“皮查伊”)在财报发出后的业绩会上表示,在Gemini(谷歌旗下的多模态大模型)时代,谷歌的发展很顺利,“我们在AI(人工智能)研究和基础设施方面拥有领导地位,再加上遍布全球的产品,这为下一波AI创新奠定了良好的基础。”
但在之前的一段时间,谷歌AI业务的进展一波三折。2023年2月,谷歌的AI聊天机器人Bard在官宣视频中出现照片识别错误,Alphabet股价在次日暴跌9%。此后,谷歌发布的Gemini 1.0模型陷入造假传闻,推出的Gemini 1.5 Pro模型又被Sora(美国AI研究公司OpenAI旗下的文生视频大模型)抢去了风头。
与此同时,谷歌也在不断调整AI团队架构。4月18日,皮查伊给全体员工发布了邮件,宣布全面整合谷歌的AI团队,表示此举将有助于更迅速高效地开发AI产品和服务。
从2012年第一次识别出猫,到2016年在人机大战中战胜顶尖人类棋手,谷歌旗下的AI项目曾经代表着人类最前沿的技术探索。但在OpenAI旗下AI聊天机器人ChatGPT引发的大模型技术浪潮中,谷歌在AI领域的优势不再。
而最新发布的财报显示,Alphabet在今年一季度的AI资本支出达到120亿美元。重组团队、重金投入,能否让谷歌的AI业务在未来重回巅峰?
重组团队攻向AI
谈及皮查伊近日发布的全员邮件,一位在谷歌工作十余年的人士说:“从来没看到过CEO(发送过)这么长的邮件。”
这是一篇标题为《建设我们的AI未来》的长文,皮查伊在文章开头表示谷歌正在进行一场波及全公司的变革,最先需要变化的是模型与研究。
皮查伊宣布将谷歌专注于大模型以及负责AI技术安全等研究的谷歌研究部门Google Research,全面整合到AI业务部门Google DeepMind之中。
上述谷歌人士称,谷歌在战略层面进行组织调整,是为了更聚焦且高效地推进大模型与应用端的融合,从而加速AI技术的开发与创新。本次调整不只是出于技术层面的考虑,也是因为谷歌内部的业务太复杂了。他出示了一张表格图,图中纵向展示的是谷歌的几十个产品线或业务部门,横向展示的是谷歌设立的4个主要技术栈方向——Mobile(移动端)、Web(全球广域网)、AI(人工智能)、Cloud(云计算)。
此前,皮查伊已经对谷歌的AI团队采取了一系列调整动作。2023年4月,他选择将谷歌旗下的Google Brain、DeepMind两个AI研究团队进行合并,创建了新部门Google DeepMind。Google DeepMind主要专注于通用AI模型研究与创新,由DeepMind原联合创始人兼CEO戴密斯·哈萨比斯(Demis Hassabis,下称“哈萨比斯”)担任负责人。
对于上述两个团队的合并,皮查伊认为,尽管谷歌拥有两个排名世界前三的AI团队,但在开始建立更强大模型的时候,谷歌不仅需要更庞大的计算资源,也要从纯粹的AI研究转向商业化,还需要投入大量资源开展测试和确保安全。
上述谷歌人士也表示,DeepMind此前一直是AI强化学习的早期探索者,“在谷歌内部是一个相对独立的存在”。他认为,在谷歌将所有专注于AI创新研究、开发的人才整合至哈萨比斯的团队后,可以在接下来更为激烈的模型进化中做到全力出击。
Gemini模型演进
ChatGPT中“T”代表大模型技术Transformer,由谷歌DeepMind团队最早发明的。然而,在OpenAI抢先用生成式AI产品打响市场后,谷歌不但姗姗来迟,甚至在Bard的首秀中“翻车”。
2023年11月,谷歌全新推出的大模型Gemini具备语言、听力与视觉等方面的多模态交互能力,还可以在数据中心、移动设备等多类型平台上运行。
Gemini模型家族共有三个量级的产品,分别是可用于特定任务和端侧的Nano版,可用于多任务的Pro版,以及模型能力最强的Ultra版。谷歌在今年2月16日宣布升级Gemini 1.5 Pro,风头却被同日推出的Sora抢尽。
IT投资人、新加坡Vibranium Consulting副总裁陈沛认为,市场忽视了Gemini的模型进化,Gemini1.5Pro支持的文本长度可达1000万tokens(token为大模型文本中的一个最小单位),“能力已经与GPT-4(OpenAI旗下的大模型)不相上下”。
陈沛称,尽管Gemini Ultra版至今没有接受公开排行榜的测试,但这一版本模型的参数规模远大于GPT-4。行业内的共识是,谷歌在模型创新能力上正在反超OpenAI。
斯坦福大学AI研究所在4月15日发布的《2024斯坦福AI指数报告》也重点提及了Gemini。过去一年,谷歌发布的基础模型最多。此外,Gemini Ultra版本的训练成本预计达到1.91亿美元,而GPT-4的训练成本仅为约7800万美元。
4月15日在加拿大举行的TED2024大会上,曾有参会者邀请哈萨比斯评价微软与OpenAI计划开发价值达1000亿美元超级AI计算机的动作。哈萨比斯表示,虽然谷歌内部并不谈论在提升AI计算能力方面具体的投入数字,但随着时间推移,谷歌的投资后续将超过1000亿美元。
在上述谷歌人士看来,谷歌并非近两年才将AI作为重点。早在2017年,谷歌就提出了“AI第一”战略。除了广为人知的Transformer技术和战胜顶尖人类棋手的AI机器人AlphaGo,谷歌还有很多AI创新武器“不急于亮出来”。他认为,谷歌在当前的AI模型竞赛中没有跟风去拼速度。
加速端侧落地
4月中旬,极客邦科技创始人兼CEO霍太稳在美国参加了Google Cloud Next 2024大会。在大会的主题演讲环节,谷歌宣布将与中国手机厂商OPPO、一加合作,为它们的2024款手机产品提供Gemini模型支持。
此前,华为、小米、vivo、OPPO、荣耀等国内手机厂商,都发布了具备大模型能力的手机。但谷歌推进AI模型落地端侧的动作,让霍太稳感受到了国内厂商与谷歌之间的差距。“尤其在硬件芯片方面,谷歌自研了TPU(张量处理器),还广泛应用了英伟达高端GPU(图形处理器),这是(国内厂商)能力所不及的。”霍太稳说。
从谷歌对外释放的信息看,旗下智能手机Pixel 8与Pixel 8 Pro都将在今年6月的季度更新中具备Gemini Nano模型的服务能力。在陈沛看来,用户若想在手机上流畅地使用最高性能的Gemini Ultra模型,谷歌还需专门优化大模型的性能、响应延迟和能耗。
易观分析高级分析师陈晨称,目前手机厂商主要与芯片、大模型等厂商进行战略合作,部分目的是解决大模型在端侧的适配以及模型能力应用边界等问题。“要想实现大模型在端侧的高效运行,厂商要平衡算力与能效、智能化与便携化之间的诸多问题。”陈晨说。
不过,与GPT-4相比,Gemini模型具备在端侧率先落地应用的优势。陈沛告诉经济观察报,谷歌拥有安卓移动应用生态,近来还在尝试将一些生成式AI功能更新到安卓APP中,这些都为Gemini模型在端侧的创新应用提供了土壤。
上述谷歌人士称,国内的安卓市场是割裂的,每家手机厂商都可以有自己的分发渠道,甚至可以自研操作系统,“一旦(它们的)手机应用出海,只有两个可以依靠的分发渠道,一个是Apple Store(苹果旗下移动应用市场),一个是Google Play(谷歌旗下移动应用市场)。”
一位手机行业人士证实,国内手机厂商选择与谷歌合作,看重的更多是Gemini模型与海外市场的适配性。他说,国内厂商虽然早早展开AI能力自研,在端侧模型方面进行了相关应用创新,但它们的AI能力和模型服务“在海外是不可用的,或者说不适用于海外用户”。
此外,手机厂商对于大模型端侧落地和应用创新的推动,也是Gemini模型加速迭代的催化剂。
2023年末,一加中国区总裁李杰表示,并不看好当时的“大模型手机”,直言“(它们)更像是一个噱头”。时隔两三个月,一加的母公司OPPO便发布了全新的AI战略,一加也在今年3月推出了支持大模型的Ace 3V智能手机。
上述谷歌人士透露,除了国内手机厂商,三星也在和谷歌方面接洽,寻求大模型的合作。