{dede:global.cfg_webname/}

当前位置: 首页 > 科技 > 科技快讯 > 正文

在富岳超算上训练大模型 日本联合研究团队发布Fugaku-LLM

来源:互联网    时间:2024-05-11 14:10:09

  5 月 11 日消息,由多方企业和机构组成的日本联合研究团队昨日发布了 Fugaku-LLM 大模型。该模型的最大特色就是其是在 Arm 架构超算“富岳”上训练的。

  Fugaku-LLM 模型的开发于 2023 年 5 月启动,初期参与方包括富岳超算所有者富士通、东京工业大学、日本东北大学和日本理化学研究所(理研)。

  而在 2023 年 8 月,另外三家合作方 —— 名古屋大学、CyberAgent(也是游戏企业 Cygames 的母公司)和 HPC-AI 领域创企 Kotoba Technologies 也加入了该模型研发计划。

  在昨日发布的新闻稿中,研究团队表示其充分挖掘了富岳超算的性能,将矩阵乘法的计算速度提高了 6 倍,通信速度也提升了 3 倍,证明大型纯 CPU 超算也可用于大模型训练。

  Fugaku-LLM 模型参数规模为 13B,是日本国内最大的大型语言模型。

  其使用了 13824 个富岳超算节点在 3800 亿个 Token 上进行训练,其训练资料中 60% 为日语,其他 40% 包括英语、数学、代码等部分。

  该模型的研究团队宣称 Fugaku-LLM 模型可在交流中自然使用日语敬语等特殊表达。

  具体到测试成绩上,该模型在日语 MT-Bench 模型基准测试上的平均得分为 5.5.排在基于日本语料资源的开放模型首位,并在人文社科类别中得到了 9.18 的高分。

  目前 Fugaku-LLM 模型已在 GitHub 和 Hugging Face 平台公开,外部研究人员和工程师可在遵守许可协议的前提下将该模型用于学术和商业目的。

声明:来源非IT商业科技网的作品均转载自其它媒体,转载请尊重版权保留出处,一切法律责任自负。文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:Email:342 4350 938@qq.com

频道精选
OPPO也开卷大电池 迭代新机最高5800mAh 方向对了!

OPPO也开卷大电池 迭代新机最高5800mAh 方向对了!

  锂电池技术的不断发展,为高端新能源汽车解决了续航焦虑。其中,硅基负极材料在电池领域发挥着重要作用。应用这种技术的电池不仅容量更
2024-05-11
华为多款新机官宣:5月15日 正式发布

华为多款新机官宣:5月15日 正式发布

  5月份新机量越来越多,已有众多品牌在预热中,比如魅族、华为、vivo、摩托罗拉等品牌,大部分都是智能手机发布,而华为是生态级发布,
2024-05-11
日本6G来了 速度比5G快20倍 但最大缺陷目前无法解决

日本6G来了 速度比5G快20倍 但最大缺陷目前无法解决

  通信技术,一代又一代的在发展,从1G到2G,再到3G、4G、5G。  而在5G之后,现在通信市场,5 5G产品也来了,然后马上又要进入6G了。 
2024-05-11
荣耀100Pro售价一降再降 16GB+1TB+骁龙8Gen2 旗舰沦为中档机

荣耀100Pro售价一降再降 16GB+1TB+骁龙8Gen2 旗舰沦为中档机

  漂亮的事物大家都喜欢,而一件商品如果也能将外观设计的很漂亮,那么甚至能对它的销量起到很大的帮助,之前在手机行业中很多人虽然相信
2024-05-11
我国首颗中轨宽带通信卫星 成功发射

我国首颗中轨宽带通信卫星 成功发射

  目标构建智慧天网 我国首颗中轨宽带通信卫星成功发射  5月9日9时43分,我国在西昌卫星发射中心使用长征三号乙运载火箭,成功将智慧
2024-05-11
与AI共舞 RISC-V芯片加速落地生根

与AI共舞 RISC-V芯片加速落地生根

  环顾当下芯片产业的关键词,RISC-V一定位列其中。  自计算机诞生以来,指令集架构一直是计算机体系结构中的核心概念之一。目前市场上
2024-05-11

2017-2019 Copyright © IT商业科技网 备案许可证号粤ICP备2022153948号 豫公网安备110102003388号

紧急处理QQ:133 4673 445@qq.com