Alphabet旗下Google周三推出新的开放大型语言模型「Gemma」,外部研发人员可以将其设计成自己的模型,扭转将公司转有人工智能挡在公众视野之外的整体策略,此前脸书母公司Meta Platforms也采取类似措施。
Google 周三在一篇博客文章中表示,Gemma 将只处理文本,其研究和技术与该公司的旗舰人工智能模式Gemini 相同。 而且该语言模型有两种模式,一种是针对计划使用大容量AI芯片和数据中心开发发软件的客户,另一种较小的语言模型用于更经济高效的应用程序开发。
Google DeepMind 的产品管理总监 Tris Warkentin 受访时说:「这对我们来说是一个新的机会,我们可以与社群合作、与 Google 内以外的人合作,在 AI 研发方面创造新的机会。」
外媒指出,此举可能会吸引软件工程师以谷歌的技术为基础,并鼓励他们使用谷歌新盈利的云计算部门。 Google 表示,这些模型针对 Google 云端进行优化,首次使用云客户可以获得 300 美元的积分。
不过,Google 没有让 Gemma 完全「开源」,这意味着该公司仍可能在配置使用条款和所有权方面有发言权。 一些专家表示,滥用开源 AI 的时机已经成熟,而另一些专家则支持扩大能够为这项技术做出贡献并从中受惠的人。
值得注意的是,与 Gemma 不同,Google 并没有公开其更大、更顶级的 Gemini 模型。 该公司表示,Gemma模型的大小为20亿或70亿个参数,也就是算法在产生输出时所考虑到的不同值的数量。
另一方面,Meta的 Llama 2 大型语言模型有 70 亿至 700 亿个参数,而 Google 尚未透露 Gemini 模型的参数规模。 相较之下,OpenAI在2020年公布的GPT-3语言模型有1750亿个参数。
此外,芯片设计商英伟达同日表示已与Google合作,以确保Gemma模型在其芯片上运行顺畅。 英伟达也表示,将很快让聊天机器人软件与 Gemma 一起工作。 该公司正在开发聊天机器人软件,用于在Windows电脑上运行AI模型。