行业主要上市公司:百川智能 ( A04400.SH ) 、昆仑万维 ( 300418.SZ ) 、拓维信息 ( 002261.SZ ) 、浪潮信息 ( 000977.SZ ) 、科大讯飞 ( 002230.SZ ) 等
本文核心数据:中国代表性大语言模型竞争格局 ;SuperCLUE 大语言模型评分总排行榜 TOP10;SuperCLUE 代表性大语言模型单项测评等
大语言模型竞争分为四大派系
现阶段,我国大型语言模型可以分为四大竞争派系,分别为互联网公司、AI 公司、学术及科研机构以及行业专家团队初创公司,其中,互联网公司主要是百度、阿里、腾讯、华为等互联网大厂,核心竞争优势是汇集了大量高端人才,同时,平台技术发展相对全面、快速。AI 公司主要是澜舟科技、昆仑万维、商汤科技等以 AI 研发及利用为主的科技公司,其核心优势是主业专精于人工智能,相比互联网公司,技术优势更加明显。学术、科研机构包括清华、北大、复旦、中科院等国内一流高校以及智源研究院、IDEA 研究院等科研机构,主要优势是学术氛围浓厚,通常行业第一手技术发源于此。行业专家品牌则是以一些 AI 专家带领的团队所研发出的产品为核心,通常,一个团队在短期内主攻一款产品,相比其他竞争派系,AI 专家团队研发的产品在创新、突破方面做得更好,C 端反馈好评度较高,盈利目的性就目前来看,略弱于互联网公司产品。
根据 SuperCLUE 最新发布的大语言模型排行榜,国内大模型中,百川 3、GLM-4、通义千问 2.1 以综合得分 73.32、72.58、72.45 依此居于行业第一、二、三名。腾讯混元 -pro、文心一言 4.0、MoonShot ( Kimichat ) 紧随其后。
注:该评分体系是中文语言理解测评基准,包括代表性的数据集、基准 ( 预训练 ) 模型、语料库、排行榜。评分体系会选择一系列有一定代表性的任务对应的数据集,做为测试基准的数据集。这些数据集会覆盖不同的任务、数据量、任务难度。
百川 3.0 知识与百科储备领先、通义千问长文本能力
知识储备、长文本阅读能力均是大语言模型的核心竞争力之一,总体来看,在知识储备领域,百川 3 领先于全行业,单项评分高达 82 分 ; 长文本阅读能力方面,通义千问以 71.8 评分领先于选行业。其他大模型中,讯飞星火代码能力突出、传统安全领域 MiniMax-abab6.1 得到较高评分。
自建算力是构筑大语言模型核心竞争力的关键因素。在人工智能领域,尤其是大语言模型的开发和应用中,算力不仅是推动模型训练和优化的基础,更是提升模型性能、实现快速响应和精准输出的保障。拥有自建算力平台的公司能够更加灵活地控制和优化模型训练过程,减少对外部资源的依赖,同时保护核心技术和数据安全。此外,自建算力还可以根据特定模型的需求定制硬件和软件,实现更高效的资源利用和成本控制。随着技术的不断进步,自建算力平台的公司能够更快地适应市场变化,持续推动大语言模型的创新和发展,从而在激烈的市场竞争中保持领先地位。
中国智能算力规模正在高速增长,2022 年达到 268.0 EFLOPS,初步统计 2023 年达到了 427.0 EFLOPS。随着技术创新的不断突破,中国在算法优化、芯片研发、数据处理等方面的能力得到增强,为智能算力的扩张提供了技术支撑。此外,国家对智能计算基础设施的大力投资,如建设超算中心和智能计算平台,为算力的增长奠定了物质基础。政府出台的一系列扶持政策,为智能算力的发展营造了良好的环境。经测算,预计 2025 年中国智能算力规模将达到 922.8 EFLOPS。