中国青年报客户端讯(中青报·中青网记者王林)新华社研究院中国企业发展研究中心近日发布《人工智能大模型体验报告2.0》(以下简称《报告》)。讯飞星火大模型以总分1013分位列本次国产主流大模型测评榜首位,《报告》认为其“在工作提效方面优势明显”。
《报告》截图之一
《报告》设计了500道问题,对标接受过高等教育的人类,按照基础能力指数、智商指数、情商指数、工具提效指数四大维度设计了对国产AI大模型的测评,并且强调AI大模型对产业和生活的实际价值。
《报告》发现,讯飞星火认知大模型在智商指数、工具提效指数两个维度获得第一。《报告》认为,具有7大核心能力(即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力)的讯飞星火认知大模型拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。
在智商评估方面,《报告》认为人类在智商方面仍然具有明显优势。在工作效率提升方面,《报告》认为, AI对人类提供了有力的支持,AI的处理速度远远超过人类。但在某些复杂和具有创新性的任务中,人类的智慧和想象力仍然具有无法替代的作用。
《报告》认为,当前中国AI大模型产品进步显著,虽然在不同领域中,AI和人类表现出不同的优劣势,但在整体上,AI大模型的发展为人类工作和生活的提质增效带来了重要影响,AI大模型正在加速走进生活、走进产业。