在成功收购推特(现名“X”)后,马斯克利用这个全球最受欢迎的社交平台所拥有的庞大数据资源,加速推进了他在AI大模型领域的战略布局。去年,马斯克的人工智能初创公司xAI正式成立,与另一大社交平台Meta(原“Facebook”)所有者扎克伯格展开正面交锋,并于年底正式推出自家首个新一代AI大语言模型产品——Grok,取得先发优势。
从开始研发到正式推出,Grok的诞生仅仅耗时4月,xAI凭强大的研发实力打了包括扎克伯格在内的整个大模型领域入局者们一个措手不及。而不到半年后,马斯克又在演讲中宣布将打造一台史无前例的大型超算工厂以支持Grok进一步优化升级,再度引发AI圈关注。
深度合作英伟达,超算工厂规模超前
5月25日,马斯克在投资者演讲中透露旗下人工智能公司xAI计划用数万个专用算力芯片组成一个巨大的超级计算机以为新一代AI聊天机器人Grok提供算力支持,并称其为“算力超级工厂”,同时表示在2025年秋季之前就要让这台超级计算机投入运行。
“这个项目如果能够完成,将至少是当今存在的最大GPU集群规模的四倍。”马斯克豪迈地表示,他准备把所有能用到的专用算力芯片全部串进这台“超级计算机”里,初步计划每台将连接10万块英伟达H100 GPU。
为什么又是英伟达?今年3月的GTC大会上,英伟达发布了全新的GB200 Grace Blackwell超级芯片,号称其史上的最强芯片,算力可达前代芯片H100的6倍,再度展现其在芯片领域难以撼动的江湖地位。但GB200 的目前产量远远跟不上马斯克“超算工厂”的芯片需求,H100凭借强大性能和相对性价比就成为首选。而马斯克本人对英伟达也一直不吝溢美之词,在不久前英伟达发布的Blackwell新闻稿中,马斯克就曾公开“示爱”称英伟达的人工智能硬件是“最好的”。
因此,不少业内人士认为,马斯克和扎克伯格的此番龙争虎斗或让英伟达成为最大赢家,毕竟无论AI机器人的构建路线有多大区别,算力芯片永远是其建设基底。而除了与英伟达深度合作外,马斯克也表态可能会与全球最大的企业级软件公司甲骨文合作开发这台庞大的计算机。早在本月中旬就有消息爆料称xAI与甲骨文低调达成一项持续多年、价值“百亿美元”的云算力供应协议,或许正与该超算工厂建设有关,但具体合作详情马斯克并未言及。
多家巨头接续布局,算力芯片成竞争焦点
马斯克此番构建算力超级工厂的目的是为自家新一代AI聊天机器人Grok提供强大的算力支撑。
Grok系xAI开发的第一个AI大语言模型,去年底正式推出,初代版本就能对标Chat GPT 3.5.具备强大的长文本处理和上下文语义协同配置理解能力,但与众不同的是存在“幽默感”,不但啥都敢说,还会进行反讽。马斯克对该款产品寄予厚望,将其视为打入AI大模型市场的一柄利刃。
但自Chat GPT发布以来,AI大模型市场一直热度不减,许多科技巨头都在尝试入局,产品迭代速度越来越快,为了能在市场取得领先优势,训练大模型所需的算力建设就成为了入局者之间内卷的焦点。
2022年初,扎克伯格的Meta就和英伟达联手发布了一个大型AI研究超级计算机。机器连接了6080个A100 GPU,具有五百亿亿次级的AI计算性能,全面部署后能够用于训练具有超过1万亿个参数的AI模型。
今年3月底,微软和OpenAI携手开展数据中心项目,其中包含一个拥有数百万专用服务器芯片的超级计算机Stargate(星际之门),用以支持OpenAI的AI大语言模型技术。据知情人士透露,该项目的成本可能高达1000亿美元,预计将于2028年启动。
超算工厂的建立再度体现了马斯克入局并意图引领AI市场的壮志雄心,也体现出xAI强大的资金和研发实力。强大算力支撑下的Grok将进化至何种程度尚不可知,但可以确定的是AI大模型市场势必将迎来新一轮的洗牌。