IT之家 8 月 12 日消息,LG AI Research 于 8 月 7 日宣布推出韩国首个开源 AI 模型 EXAONE 3.0,标志着韩国进入了由美国科技巨头以及中国和中东新兴企业主导的全球 AI 领域。
EXAONE 3.0 开源模型基于 Decoder-only Transformer 架构,参数数量为 7.8B,训练数据量(tokens)为 8T,是一款针对英语和韩语的双语模型。
LG 新闻稿称:“在为各种目的而构建的 EXAONE 3.0 语言模型阵容中,7.8B 指令调整模型正在提前开源,以便可以用于研究。我们希望该模型的发布能够帮助国内外 AI 研究人员进行更有意义的研究,帮助 AI 生态系统向前迈进一步。”
官方测试显示,该模型的英语能力达到“全球顶级水平”,真实用例平均分第一,超越了 Llama 3.0 8B、Gemma 2 9B 等一众模型。在数学和编码方面,EXAONE 3.0 的平均得分也排名第一,推理能力也较强。
而在韩语方面,EXAONE 3.0 实际用例和单一基准的平均得分均排名第一。
LG 声称,EXAONE 3.0 与上一代产品相比,推理时间缩短了 56%,内存使用量减少了 35%,运营成本降低了 72%;与首次发布的 EXAONE 1.0 相比,成本降低了 6%。
该模型已在 6000 万个与专利、代码、数学和化学相关的专业数据案例上进行了训练,并计划在年底前扩展到各个领域的 1 亿个案例。
IT之家附 EXAONE 3.0 模型链接如下:
https://huggingface.co/LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct