马斯克确认xAI推出次世代大型语言模型「Grok 3」,算力提升10倍
全球首富、知名创业家埃隆·马斯克宣布,其AI公司xAI的最新大型语言模型「Grok 3」即将发布。马斯克透露,该模型已完成预训练,算力较前代「Grok 2」提升超过10倍。
Grok 3与Colossus超级计算机的紧密关联
马斯克早在2024年9月宣布,xAI启用了全球最强大的AI训练系统「Colossus」,由10万颗英伟达H100 GPU构成的训练集群上线。此后,xAI持续扩充Colossus的规模,目前正计划将其倍增至20万颗GPU,包括5万颗英伟达H200芯片。
从时间线和技术布局来看,Grok 3的训练依托于这一庞大的计算资源。Colossus的巨大算力为其模型预训练提供了必要支持,使Grok 3能够处理更大规模的数据集和更复杂的参数优化。值得一提的是,Grok 3的训练数据来源于X平台用户生成的数据。
xAI的下一步:迈向百万GPU支持的超级计算机
xAI计划未来部署一款由超过100万颗GPU支持的超级计算机,用于训练具备数万亿参数的大型语言模型。
这一版本的Colossus将远超Grok 3或OpenAI的GPT-4o,预计在参数数量和推理能力上实现质的飞跃,进一步向通用人工智能(AGI)迈进。
参数数量:新模型的参数规模将是当前模型的数倍,大幅提高其在语言生成、问题推理等方面的能力。
AGI愿景:新模型可能展现出类人甚至超越人类的智能能力,推动AGI目标的实现。
英伟达的核心地位:AI算力市场竞争加剧
英伟达的H100和H200 GPU是当前AI训练的核心计算硬件,而xAI、微软、Meta等科技巨头是其主要客户。科技顾问机构Omdia提供了以下估算数据,进一步体现出英伟达在全球算力市场中的领导地位:
微软:2024年购买了485.000颗H100 GPU,成为英伟达最大客户。
Meta:购买了224.000颗Hopper架构GPU。
亚马逊和Google:分别购买196.000颗和169.000颗GPU。
xAI与CoreWeave:作为新兴的计算资源买家,也占据全球算力投资的主要份额。
Omdia预测,全球前十大数据中心基础设施买家将占据全球算力投资总额的60%,显示出AI技术与算力基础设施之间的紧密联系。
科技未来:Grok 3与AI生态系统的影响
AI竞争加剧:Grok 3的发布将进一步挑战其他领先AI模型,如OpenAI的GPT系列和Google的Gemini模型,重新定义AI语言生成的标准。
通用人工智能的潜力:xAI致力于通过高算力支持和更先进模型设计,推进AGI的发展,这将影响科学、商业和日常生活的多个层面。
算力战争持续升级:各大科技公司在算力基础设施上的竞争表明,AI的发展已经从算法较量扩展到硬件资源的争夺。
Grok 3的问世不仅是xAI的重要里程碑,也标志着AI技术迈入全新阶段,推动人类社会向智能化未来迈进。