{dede:global.cfg_webname/}

当前位置: 首页 > 科技 > 软件 > 正文

大语言模型发展现状及中外大语言模型发展状况对比 中国大语言模型正处于追赶阶段

来源:互联网    时间:2024-06-15 11:33:19

  行业主要上市公司:百川智能 ( A04400.SH ) 、昆仑万维 ( 300418.SZ ) 、拓维信息 ( 002261.SZ ) 、浪潮信息 ( 000977.SZ ) 、科大讯飞 ( 002230.SZ ) 等

  本文核心数据:国内外主要大语言模型数据 ; 中外代码预训练模型对比表 ; 大语言模型研发技术国内外主要研究机构及代表性成果等

  国内外主要大语言模型数据集

  得益于开源共创的互联网生态,海外已有大量优质、结构化的开源数据库,文本来源既包含严谨的学术写作、百科知识,也包含文学作品、新闻媒体、社交网站、流行内容等,更加丰富的语料数据能够提高模型在不同情景下的对话能力。而受制于搭建数据集较高的成本以及尚未成熟的开源生态,国内开源数据集在数据规模和语料质量上相比海外仍有较大差距,数据来源较为单一,且更新频率较低,从而导致模型的训练效果受限。因此,大模型厂商的自有数据和处理能力构成模型训练效果差异化的核心。受益于移动互联网时代积累的海量用户、应用和数据,互联网企业在自有数据上更具特色化和独占性,叠加更强大的数据处理能力,从而能够通过数据优势带来模型训练成果的差异。例如,阿里在研发 M6 时,构建了最大的中文多模态预训练数据集 M6-Corpus,包含超过 1.9TB 图像和 292GB 文本,涵盖百科全书、网页爬虫、问答、论坛、产品说明等数据来源,并设计了完善的清洁程序以确保数据质量。百度 ERNIE 模型的训练数据集中也运用了大量百度百科、百度搜索以及百度知识图谱等生态内数据,通过更高质量的数据保障了模型的训练效果。

  同样,预训练语言模型就是预训练方法在自然语言处理领域中的应用,本质上是对自然语言的表示学习,是将自然语言转化为让机器可以处理的数据表达形式。预训练语言模型先通过大量的语料 ( 通常是无标注的数据 ) 进行训练,得到一个通用的语言表征模型,然后再使用面向具体任务的少量语料,就可以完成下游任务的训练。近年来,代码预训练模型正在成为一个新的热点,并且与语言大模型的发展不可分割,这些模型在代码相关任务上已经展示了出色的性能。

  注:该图表数据截至 2024 年 1 月。

  中国大语言模型研究已取得一定成果

  语言大模型研发技术国内外情况差异较大,尽管国内大语言模型研究已取得了一定成果,但与美国仍然具有一定差距,尤其在端到端语言大模型研发技术,中国暂没有比肩美国的成果。

  在大语言模型 ( LLMs ) 的全球竞技场中,ChatGPT 与 Google 的 Gopher、LaMDA,以及 Meta 的 Llama 等构成了国际标杆,而国内则由百度的 " 文心一言 "、360 的大语言模型、阿里的 " 通义千问 " 和商汤的 " 商量 " 等引领潮流。从对话和文本生成能力的角度,ChatGPT 暂居优势,但这并非因为技术壁垒不可逾越。实际上,Google 等国外企业因战略和技术理念选择了不同的发展路径,这是其暂时落后的主因。随着新技术的不断涌现,赶超 ChatGPT 并非不可能。相对而言,百度等国内企业在数据集、计算能力和工程化方面存在短板,短期内难以实现对国外模型的迎头赶上,这更多地需要国内 AI 产业全链条的协同进步。

  在影响大语言模型性能的因素方面,训练数据、模型规模 ( 即参数数量 ) 、生成算法和优化技术被认为是核心变量。然而,如何准确量化这些因素对模型性能的具体影响,目前还处于探索阶段,没有明确的结论。总体来看,世界顶级的大语言模型在技术层面上尚未拉开明显的差距。

  在战略业务拓展方面,ChatGPT 已经形成了明确且差异化的商业路线,主要围绕 API、订阅制和战略合作 ( 例如与微软的 Bing、Office 等软件的嵌入合作 ) 三大营收模式,在用户数据积累、产品布局和生态建设等方面已具备明显的先发优势。而 Google 由于其主营业务是搜索引擎,对于聊天机器人等产品的发展相对保守,更注重利用大模型能力来推动 " 模型即服务 " 范式,以拓展其在云服务市场的份额。作为国内大模型的标杆企业,百度的战略更接近 Google,主要针对 B 端市场,通过全栈优势来构建全链能力

声明:来源非IT商业科技网的作品均转载自其它媒体,转载请尊重版权保留出处,一切法律责任自负。文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:Email:342 4350 938@qq.com

频道精选
大语言模型发展现状及中外大语言模型发展状况对比 中国大语言模型正处于追赶阶段

大语言模型发展现状及中外大语言模型发展状况对比 中国大语言模型正处于追赶阶段

  行业主要上市公司:百川智能 ( A04400 SH ) 、昆仑万维( 300418 SZ ) 、拓维信息( 002261 SZ ) 、浪潮信息( 000977 SZ )
2024-06-15
携程市值超越百度 互联网进入多元细分化时代?

携程市值超越百度 互联网进入多元细分化时代?

  2024 年旅游业的复苏,使得携程的市场表现值得被看好。但是究竟可以好到什么程度,可能还是出乎很多人的意料。  根据 6 月 12
2024-06-15
跨境家居扎堆IPO:出海“老三样” 也有新征程

跨境家居扎堆IPO:出海“老三样” 也有新征程

  " 不出海,就出局 " 的论调,在众多制造业企业中其实并不鲜见。  过去 30 多年,家具家居行业一直享受着房地产发展所带来的市场
2024-06-15
2024新财富500创富榜发布:钟睒睒蝉联首富!王健林父子重回前十!

2024新财富500创富榜发布:钟睒睒蝉联首富!王健林父子重回前十!

  由澳门贸易投资促进局指导、新财富主办的 2024 新财富 500 创富榜新闻发布会 6 月 12 日在中国澳门举行。  根据最新发布的榜
2024-06-15
Compass Arena大模型竞技场首期对战榜单公布 智谱AI持续领跑国内大模型

Compass Arena大模型竞技场首期对战榜单公布 智谱AI持续领跑国内大模型

  6月13日,司南OpenCompass和魔搭ModelScope联手推出的大语言模型竞技场 Compass Arena公布首期大模型对战榜单。智谱AI的GLM-4 w sea
2024-06-15
2024年的AI服务器 相当于2018年的新能源车

2024年的AI服务器 相当于2018年的新能源车

  01 什么是当下最尖端的科技?  在谈到小米做智能电动车的核心原因时,雷军对外解释到:他通过调研痛苦地认识到智能手机肯定不是当下
2024-06-15
圈不到用户的AI大模型 开始倒闭了

圈不到用户的AI大模型 开始倒闭了

  拿到 2000 万元创业投资的大林,仅过了一年多,便在 2024 年 3 月解散了公司。随着大厂大模型开始 0 元购," 国内 AI 用户
2024-06-15
降价97%背后 大模型公司的心机和焦虑

降价97%背后 大模型公司的心机和焦虑

  国内大模型公司,也没有错过今年的 618   " 降价 97%!"" 免费!" 过去一个月,各大国产大模型厂商喊出了不要钱的架势,降价之狠
2024-06-15
五年增长60倍 AI PC将迎爆发式增长

五年增长60倍 AI PC将迎爆发式增长

  AI+时代,搭载AI的终端如雨后春笋般涌现,正在改变传统市场格局。  AI PC作为AI和PC结合的创新终端,随着消费端日趋旺盛的需求,以
2024-06-15

2017-2019 Copyright © IT商业科技网 备案许可证号粤ICP备2022153948号 豫公网安备110102003388号

紧急处理QQ:133 4673 445@qq.com