大模型要不要开源?
这个问题还可以引申出另外一个讨论:大模型是开源好还是闭源好?过去很长一段时间,“大模型开源or闭源”之争一直是业界热门议题。最近,百度董事长李彦宏连续两次表态站队大模型闭源,再度引发行业的争论。
这些声音里就包括在网红路上越走越远的周鸿祎,他在海外演讲时暗怼,“有些名人胡说八道,没有开源就没有互联网”。
连泼了两盆冷水
短短一个星期内,李彦宏给开源大模型的这盆冷水,泼了两次。
第一次是4月11日晚间,李彦宏的一封内部讲话被媒体“曝光”。他表示大模型开源的意义不大,闭源模型在能力上会持续地领先,而不是一时地领先,做模型的创业公司既做模型又做应用的“双轮驱动”不是一个好的模式。
李彦宏之所以泼出这盆冷水,在于他认为闭源才拥有真正的商业模式,能够赚到钱,能聚集人才和算力。“闭源在成本上反而是有优势的,只要是同等能力,闭源模型的推理成本一定是更低的,响应速度一定是更快的。”同时,开源大模型的模式与传统的开源软件不同,并不是众人拾柴火焰高。
由此,他还给AI创业者提出建议,核心竞争力本就不应该是模型本身,因为这太耗资源了,还需要非常长时间的坚持才能跑出来。
第二次是4月16日,Create 2024百度AI开发者大会上,李彦宏在演讲中提出,“未来开源模型会越来越落后”。这是因为大家以前用开源觉得开源便宜,其实在大模型场景下,开源是最贵的。
他结合文心大模型的实践给出解释:“开发者通过文心4.0降维裁剪出来的更小尺寸模型,比直接拿开源模型调出来的模型,在同等尺寸下的效果明显更好;同等效果下,成本明显更低。”
李彦宏说,过去一年,百度踩了无数的坑,交了高昂的学费。某种程度上,这两盆冷水也是踩了坑换来的,他就泼给了业界。他的言外之意是,创业者使用百度大模型就可以了,跟着百度走闭源路线,有钱赚。
但目前大模型还处在发展阶段,上牌桌或者下牌桌并不是由哪一家说了算。即便百度较早入局,也堪称是国内All in 大模型力度最大的一家,但还远没有达到一家独大或者“遥遥领先”的地步。比如月之暗面Kimi等新手的突袭,总能给先入局者一个“大惊喜”。
李彦宏还在“着急”
事实上,李彦宏泼出这两盆冷水,是他内心“着急”的外露。这种外在的焦虑,他此前已经公开表达过。去年年底,李彦宏在一次活动上就说,“过去接近一年的时间,我看到媒体、社会、公众主要的兴奋点还在基础模型上,没有转到AI原生应用上,这使我多多少少有点着急”。
这也是他不断呼吁业界要卷AI原生应用的原因。作为AI原生应用的推动者,李彦宏认为百度AI原生改造的还不够彻底。据媒体报道,李彦宏2024年一季度OKR首要目标,就是“基本完成移动生态的AI原生化改造”。而在去年百度世界大会上,只有百度文库被李彦宏认为被“AI重构”最成功,实现了从内容工具到生产力工具的转变。
在本次百度AI开发者大会上,李彦宏更是把这种“着急”写在演讲主题里,即《人人都是开发者》。他指出,AI正在掀起一场创造力革命,“未来开发应用就像拍个短视频一样简单,人人都是开发者,人人都是创造者。”他还表示,百度作为一家技术公司,定位是尽可能为大家提供所需的开发工具,这包括了1个基础模型系列和三大AI开发工具。
也就是说,李彦宏的“着急”并没有缓解。他只能通过不断拉低从业门槛,让更多人加入到他的“战队”,才能倒逼百度的进化,以应对经营压力。直白点说,当“AI时代一切都将被重塑”成为共识时,李彦宏梭哈式押注大模型,他希望百度顺势翻盘,重塑“BAT”时代的荣光。但更重要的是,作为百度掌舵者的他需要考虑赚钱。
需要补充的是,AI先发优势始终在百度股价中得不到体现,近一年以来,百度美股市值离最高点跌去200多亿美元,目前维持在330亿美元线,甚至比京东还低。
摩根大通认为这是市场忽略了“生成式AI将成为其中长期增长动力的假设”。从这个角度看,百度只有加快AI原生应用的落地步伐,在闭源大模型上走出一条赚钱路径,才能真正提振股价。
周鸿祎的回怼
但和李彦宏站在对面路线的玩家不少,其中就包括他的老冤家对头360创始人周鸿祎、百川智能CEO王小川等。
第二十七届哈佛中国论坛上,周鸿祎提及开源大模型时称,他一直相信开源的力量,至于网上有些名人胡说八道,大家也别被他们忽悠,说开源不如闭源好。“一句话,今天没有开源就没有Linux,没有Linux就没有互联网,就连说这话的公司自己都借助了开源的力量才成长到今天。”
就前面所说背景来看,“有些名人”就差对李彦宏指名道姓了。周鸿祎还表示,开源社区聚集的工程师和科学家的数量是闭源的数百倍。所以今年开源大模型只做了一年就已经超过了GPT-3.5的能力。他认为,未来一两年内,开源的力量很有可能会达到或者超过闭源的水平。
王小川也在李彦宏泼出第一盆冷水时,就表达了不同的观点。第一财经报道,王小川在微信群讨论中表示,“关于开闭源之争,核心是要看谁在开源?双轮驱动,是一线创业AGI公司的唯一解。”
除此之外,阿里云也站在大模型开源这一面。此前,阿里云CTO周靖人接受媒体采访时称,开源社区已经蓬勃发展起来了。阿里云的初衷不是把模型攥在自己手上去商业化,而是帮助开发者,开源生态对促进中国大模型的技术进步与应用落地,以及生态的蓬勃发展至关重要。
由此不难看出,李彦宏想当国内“大模型共主”的路,比百度造车还难。同时,也能从另外一个角度看出,大模型的开源或者闭源,只是在应用场景上的分化,各家的站队都有切身利益的考量。李彦宏、周鸿祎的互怼,王小川的“及时辣评”等,也仅是着眼于自身业务发展的紧迫性,所作出的公开表态。
而“大模型开源or闭源”,这两个模式或在相同场景里的相互竞争,互有优劣。但从更长远的AI发展来看,必然不会只是“华山自古一条道”。不同的阶段,不同的商业场景,存在不同的路线选择。
就像王小川所说,开源和闭源并不像手机中iOS或者安卓操作系统只能二选一。