作者 | 范昕茹 编辑 | 周智宇
苹果发布端侧大模型OpenELM。
端侧模型成了科技巨头的兵家必争之地,继在谷歌、三星和微软后,苹果也加入了战局。
4月25日凌晨,苹果发布了OpenELM。这是一个全新的开源语言模型(LLM)系列,可以完全在本地设备上运行,无需连接云服务器。
过去苹果生态相对封闭,如今它也以一个开放的姿态,加入大模型的开源浪潮当中,希望借此追上AI热潮。
也许在6月的全球开发者大会(WWDC 2024),外界就能够窥得苹果如何通过OpenELM在AI技术上创新,并将其搭载到iPhone等设备上,提升效率。
这也会是苹果在备受投资者诟病多年,认为其在AI、大模型上显得“慢一拍”后的翻身之战。凭借苹果自身拥有的芯片资源、软硬件一体化的生态系统,看似“慢一拍”的苹果或许也将拥有弯道超车的机会。
围困
在今年2月的投资者电话会议中,Tim Cook这样解释苹果在人工智能领域的“慢一拍”。
“我们的模式,一直是先做工作,然后谈论工作,而不是抢先一步。”会上,Tim Cook透露,苹果内部正在进行大量AI方面的工作,并将在今年晚些时候对此进行讨论。
不过,还没等到“今年晚些时候”,苹果便发布了自己的开源语言模型OpenELM。
OpenELM是一系列开源语言模型,分为指令微调和预训练两种模型,有0.27B、0.45B、1.08B、3.04B四种参数,提供生成文本、代码、翻译、总结摘要等功能。
相比目前大多数8B左右的模型,其对芯片的要求也更低一些。但在大模型能力上,苹果表示,与1.2B参数的OLMo模型相比,1.1B参数的OpenELM准确率高出2.36%,但预训练需要的token数量却只有OLMo的一半。
相比此前苹果已经公布的MM1多模态大语言模型,此次发布的OpenELM不仅体量更小,其最受人关注的一点在于,这系列语言模型无需接入云端,即可在端侧完成推理和微调,是一款专门针对手机等移动设备开发的端侧大模型。
所谓端侧大模型,通常指的是在终端设备上(如手机、平板电脑、智能音箱等)部署和运行的大模型。和ChatGPT等大模型不同,这类大模型可以在终端设备上完成推理任务,进行微调,而不受网络的限制。
其实,几乎在大模型成为科技圈流行词的时候,如何将大模型落地端侧,尤其是和人们日常生活息息相关的手机上的讨论就层出不穷。然而,受制于大模型的体量以及芯片性能、能耗等因素,汽车曾被视为是最可能最先运行端侧模型的终端。
不过,经过一年多的探索,随着大模型性能的不断提升,参数更少、性能更强的大模型开始出现,给了模型落地端侧的可能,也让搭载端侧模型的AI Phone成为各家科技厂商追逐的重心。
如今,市面上主流手机厂商几乎都已经推出了自家的端侧大模型。例如OPPO的AndesGPT,vivo的蓝心大模型,小米方面则有大模型MiLM,三星也推出Galaxy AI。
最近一段时间,各大科技厂商更是密集发布了一波端侧大模型。
就在OpenELM发布前2天,4月23日,微软在其官网开源了可以在端侧部署的小语言模型Phi-3-mini。更早之前,Meta发布了其最新开源模型Llama3,提供8B和70B的预训练和指令微调版本。随后,高通宣布和Meta合作,优化Llama3在手机、PC等端侧设备的表现。而在国内,商汤刚刚发布了1.8B的SenseChat-Lite版本端侧大模型。
这一次,苹果似乎又姗姗来迟。
突围
近几年,苹果已经很少能够推出颠覆性的产品,在所有产品线中,iPhone成为苹果营收的最大功臣。苹果公布的2024年第一财季数据显示,苹果2023年第四季度的营收为1196亿美元,同比增长2%;利润403亿美元,同比增长12%。其中,iPhone贡献了697亿美元,占比超过了58%。
但近年来,iPhone的销售也备受挑战。4月25日,国际数据公司(IDC)发布的最新手机季度跟踪报告显示,2024年第一季度,中国智能手机市场整体出货量约6926万台,同比增长6.5%,市场表现高于预期。与此同时,iPhone在华销售同比下降6.6%,市场占有率也随之降至15.6%,和15.7%的OPPO并列第三。荣耀和华为的出货量则并列前二。
IDC中国区副总裁王吉平认为,此次荣耀登顶,AI成为关键增长引擎。得益于AI功能,荣耀全新旗舰Magic6系列首销第一季度出货量超过上一代产品前二季度出货量之和。
在各家手机厂商纷纷进入AI手机时代,处于压力之下的苹果,也急需加入大模型的战争来赢得市场信心。
不过,苹果还有机会。
如今,对一些手机厂商来说,单纯把大模型“塞”进手机似乎已经不是最大的难题,问题在于如何利用大模型给到用户一个差异化、个性化甚至颠覆性的体验。这不仅考验端侧大模型的能力,手机芯片的性能和能耗控制,还需要大模型和手机软硬件系统的深度融合,渗透到手机应用的方方面面。
在这一点上,选择自研芯片,从一开始就强调软硬件一体化,有着完整开发生态的苹果显然占据优势。
目前,无论是国内还是国际大厂,关于AI手机的探索大多采取的是大模型厂商、芯片厂商和手机厂商三方合作的方式进行。例如,Meta选择与高通合作,探索Llama3 8B、70B大模型落地端侧的可能。更早之前,阿里云旗下大模型通义千问想要适配手机端则需要联手联发科。而大多数手机厂商都没有自研芯片,需要依赖芯片厂商的供给。这就意味着额外的定制成本及适配、优化成本。
同时拥有自研芯片、大模型以及软硬件生态的苹果可以省去其中的许多麻烦。
例如,OpenELM的基准测试就是在苹果设备上完成的。官方论文显示,OpenELM的基准测试使用的是配备M2 Max芯片,64GB内存,运行macOS 14.4.1版本的Macbook Pro。不仅如此,苹果还发布了将模型转换为MLX库的代码,以便技术人员在Apple设备上对大模型进行推理和微调。
这意味着,OpenELM可以顺畅地融入苹果整个生态圈,打通芯片、手机硬件和软件层的隔阂,更好地对大模型进行系统层面的适配和优化。这是其他手机厂商所不具备的优势。
软硬件一体的策略曾使iPhone在手机行业中保持了多年的领先。近年来,苹果在自研芯片、软硬件生态一体化上的坚持,或许将帮助苹果在大模型时代获得一个弯道超车的机会。从iPhone到AI Phone,看起来已经不远。
本文来自“华尔街见闻APP”。