阿里云5月9日召开高峰会,正式发表通义千问2.5.并开源通义千问1100亿参数模型。 阿里云声称,模型效能全面追赶GPT-4-Turbo,成为「地表最强」中文大模型。
在峰会当日,原通义千问APP宣布更名为「通义APP」,将通义大模型全套能力集于一身,致力于成为“通情达义” 的AI助手。
据报道,通义千问2023年4月问世以来,从初代模型升级至2.5版本。 相较于上一版本,2.5 版模型的理解能力、逻辑推理、指令遵循、代码能力分别提升 9%、16%、19%、10%。
通义正成为最受中国企业欢迎的大模型之一。 根据最新数据,通义通过阿里云服务企业超过9万、通过钉钉服务企业超过220万,现已落地PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。
同时,通义也发布了1100亿参数开源模型Qwen1.5-110B,该模型在MMLU、Theorem QA、GPQA等基准测试中超越了Meta的Llama-3-70B模型; 在Hugging Face推出的开源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B冲上榜首,再度证明通义开源系列业界竞争力领先。
此外,在多个多模态标准测试中,通义千问视觉理解模型Qwen-VL-Max得分超越Gemini Ultra和GPT-4V,这款模型已在多家企业落地应用; 通义千问代码大模型 Code Qwen1.5-7B 则是 Hugging Face 代码模型榜单 Big Code 的头号选手,这款模型是国内用户规模第一的智能编码助手通灵灵码的底座。
阿里云CTO周靖人表示,开发者的反馈与开源社群的生态支持,是通义大模式技术进步的重要助力。 未来通义大模型还会持续开源。
2023 年 10 月,阿里云发表了百炼大模型平台,开发者可透过「拖曳」5 分钟开发一款大模型应用,几小时「炼」出一个专属模型,把精力专注于应用创新。
阿里云CTO周靖人表示:「当下企业应用大模型有三种范式:一是对大模型开箱即用,二是对大模型进行微调和持续训练,三是基于模型开发应用,其中最典型的需求是RAG,以企业资料对大模型进行知识增强。」