李开复回应 Yi 大模型套壳 LLaMA 争议：受益于开源也贡献开源

IT之家 11 月 16 日消息，针对近日零一万物被质疑完全使用 LLaMA 架构，只对两个张量（Tensor）名称做修改，李开复在朋友圈进行了回应。

李开复表示：“全球大模型架构一路从 GPT2 --> Gopher --> Chinchilla --> Llama2 --> Yi，行业逐渐形成大模型的通用标准，就像做一个手机 App 开发者，不会去自创 iOS、Android 以外的全新基础架构。01.AI 起步受益于开源，也贡献开源，从社区中虚心学习，我们会持续进步。”

据IT之家此前报道，创新工场董事长兼 CEO 李开复于今年创办了 AI 大模型创业公司“零一万物”，该公司已推出Yi-34B 和Yi-6B 两个开源大模型，号称对学术研究完全开放，同步开放免费商用申请。

然而在Yi-34B 的 Hugging Face 开源主页上，开发者 ehartford 质疑称该模型使用了Meta LLaMA 的架构，只对两个张量（Tensor）名称进行了修改，分别为 input_layernorm 和 post_attention_layernorm。

零一万物开源团队总监 Richard Lin 回应称，这一命名问题是开发人员疏忽导致，开发人员在代码中进行了几次重命名，以满足实验要求。但是开发人员“忘记将张量名称修改回 LLaMA”，开发人员对此感到抱歉。

值得一提的是，原阿里首席 AI 科学家贾扬清吐槽国内某一新模型中用的其实是 LLaMA 架构，仅在代码中更改了几个变量名引发网络热议。在被指大模型回应并发布训练模型过程后，贾扬清最新发文，表示开源领域“魔改”要不得。

昨日，零一万物官方对Yi-34B 训练过程进行了说明，表示大模型持续发展与寻求突破口的核心点不仅在于架构，而是在于训练得到的参数。IT之家附回应全文：

正文

李开复回应 Yi 大模型套壳 LLaMA 争议：受益于开源也贡献开源

相关阅读

英伟达核弹来了！RTX 5090售价再次曝光：想买准备2万预算

欧洲央行警告：人工智能相关股票存在“泡沫”突然破裂风险

REDMI Turbo4入网：支持90W快充或将搭载天玑8400处理器

沙特宣布 1000 亿美元计划，打造全球人工智能新中心！

目录[+]