2024火山引擎 AI 创新巡展在上海举办,带来豆包大模型的一系列产品升级。豆包语音模型和视觉模型再升级,对话式 AI 实时交互解决方案进一步强化 AI 交互体验。此外,火山引擎携手多点 DMALL 成立了零售大模型生态联盟,同时介绍了汽车大模型生态联盟最新进展,宣布 AI 创造者大赛开赛。来自沐瞳、浙江大学等单位的嘉宾就与火山引擎合作、落地大模型的实践进行了分享。
火山引擎总裁 谭待
火山引擎总裁谭待表示,豆包大模型获得众多行业客户青睐,模型能力也在持续提升。最新版豆包大语言模型的综合能力相比三个月前首次发布时提升了20.3%,豆包·文生图模型、豆包·语音识别模型等模型也有大幅升级,对话式 AI 实时交互解决方案整合了豆包大模型和实时音视频(RTC)技术,为用户提供更顺畅、自然的交互体验。
01.
豆包大模型使用量爆发
综合能力提升20.3%
“大的使用量,才能打磨好模型,好的模型又会吸引更多人使用”。据谭待介绍,自5月15日正式对外发布以来,豆包大模型的日均 tokens 使用量已经超过5.000亿,平均企业客户使用量增长了22倍。期待越来越多的 AI 原生企业、越来越多的 AI 转型企业在豆包大模型上快速发展。
基于内外客户广泛、真实的业务需求,豆包大模型在关键能力上不断迭代优化。公开及内部测评集显示,最新版豆包大语言模型相比发布初期综合能力提升了20.3%。其中,角色扮演能力提升了38.3%,具备了更强的上下文感知,让对话情境更连贯、角色更拟人化。语言理解能力提升了33.3%,让豆包大模型在信息分类、抽取、摘要、理解和问答等 NLP 方面都有了显著提升,能够在更多生产力场景中得到应用。此外,模型在长文任务、数学、专业知识、代码能力上也有不同程度的增强。
会上还公布了多个豆包垂类模型的最新升级。其中,豆包·文生图模型对长文本有更精准的图文匹配能力,多主体、多位置、手部结构等复杂场景的生图能力更强,更善于理解中国特色元素,创造更具美感的中国风图片。豆包·语音识别模型基于大语言模型丰富的知识和推理能力,通过上下文感知,提升语音识别准确性,在多个公开测试集中,与国内公开发布的语音识别大模型相比,错误率最高降低40%;支持一个模型识别普通话和粤语、上海话、四川话、西安话、闽南语等方言。豆包·语音合成模型升级了流式语音合成能力,能够实时响应、精准断句,支持“边想边说”。
此外,火山引擎发布对话式 AI 实时交互解决方案,该方案整合了豆包大模型和实时音视频(RTC)技术,提供端到端的大模型实时对话方案。企业可以轻松地在自己 AI 应用中嵌入该实时语音功能,用户不仅能用语音与 AI 进行交谈,还能像平时说话一样,在对话过程中适时打断或插话,经过升级后的 AI 声音具备较好表现力和感情色彩,对话更自然、更真实、更流畅,让大模型交互体验更强。
除了模型效果,针对企业生产环境对 AI 高并发需求出发,豆包通用模型pro 提供了国内最高标准的 800k 初始 TPM(每分钟处理 tokens 数量),保障了企业不仅用得便宜,还用得放心。例如,在客户高并发的对话场景要求下,火山引擎帮助客户完成多轮提示词优化,并且提供高并发保障,帮助客户应对高峰场景。
02.
零售大模型生态联盟成立
汽车大模型生态联盟持续壮大
大模型应用落地不仅需要技术成熟度,还要有适配的商业组织和商业生态。为此,火山引擎携手多点 DMALL 成立零售大模型生态联盟,通过融合豆包大模型与 AI 能力,让零售企业能够以极低的试错成本将大模型技术应用到业务场景中,推动零售行业的智能化升级,提升行业的整体效能和创新能力,以适应不断变化的市场需求和消费者行为,加速零售行业的创新步伐。
谭待表示,火山引擎致力于与行业伙伴共同建立一个零售大模型生态联盟,探索更多场景的 AI 重构,将大模型应用推广到零售产业链各环节中,加速零售业的运营和周转效率,全面提升消费者的购物体验。
物美集团、抖音电商、抖音生活服务、百胜、麦当劳、中国飞鹤、海底捞、居然之家、南7-11、重庆百货、百果园、波司登、天虹、三得利、绝味、名创优品、NielsenIQ、电通共18家零售联盟首批成员单位出席了当天的联盟启动仪式。
多点 DMALL 创始人、物美集团创始人张文中博士指出,零售大模型生态联盟对于零售企业来说是抱团取暖,共享联盟内的技术成果和最佳实践,降低企业成本,是当下零售企业拥抱 AI 的最好选择。“我们必须全面拥抱 AI,不仅是为了更好的未来,而且是为了生存”,张文中博士说。
除零售大模型生态联盟外,汽车大模型生态联盟也迎来了领克汽车、吉利银河、几何汽车、上汽荣威、上汽名爵、雄狮科技、大圣科技等多位新成员。火山引擎汽车行业总经理杨立伟介绍,当前,火山引擎正与联盟成员就新一代 AI 汽车行业定义、行业评测标准发布以及跨终端行业交流和共创等方向进行密切协作。
此外,火山引擎还宣布首次举办 AI 智能体商业赛事“火山引擎 AI 创造者大赛”,本次大赛由火山引擎携手领克汽车与英特尔联合主办、吉利研究院协办,鼓励开发者及技术爱好者利用豆包大模型和扣子专业版,针对领克汽车的真实业务场景,开发出具有实际应用价值的智能体解决方案。
吉利汽车集团营销数字中心负责人沈稳杰介绍,在豆包大模型帮助下,领克汽车实现了智慧邀约坐席、AI 对练&内训、AI 销售助手、智慧经营报表以及 AI 用车说明书等多项基于模型能力的功能,以大模型为销售顾问提供诸如实时数据分析、客户行为预测、客户对练和评价总结以及个性化销售策略建议等服务,通过模拟销售场景中客户对话,帮助销售顾问提升问题应对能力,全面提升了销售能力。
03.
全栈AI服务升级
大模型落地再提速
为了帮助企业将大模型能力与业务场景需求进行适配,火山引擎公布一系列产品升级,帮助企业更便捷地落地大模型。
火山引擎智能算法负责人、火山方舟负责人吴迪介绍,一站式大模型服务平台火山方舟最新推出全周期安全可信方案,支持身份认证、数据保密、环境隔离等,构建大模型安全“堡垒”。联网、内容插件能力再升级,提升搜索能力、可获取更多优质内容,RAG 知识库插件进一步强化,更强知识库文档解析与检索能力,支持丰富场景,令企业应用更为灵活自如。
智能体将是企业未来应用的关键载体,大模型时代,只有让不同类型的企业快速、灵活的构建企业级智能体,模型才能真实在业务中落地。扣子专业版让企业实现一句话“捏个 Bot”的对话型智能体,也能实现通过低代码编排构建复杂的专家型 Bot。同时,扣子专业版还为企业用户提供专业级 SLA、接入更多模型、以及更高配额。扣子专业版发布1个月时间,共计新增1万多用户开通服务,日均调用量达到50万次。
沐瞳智能服务负责人张文文提到,沐瞳与火山引擎携手探索 AI+智能应用服务化方向,将豆包大模型能力应用于旗下游戏的 AI 实时判罚场景,基于游戏内聊天文本对辱骂/攻击性发言进行识别。在此过程中,豆包大模型表现出效果好、成本省、收益正、服务优等明显优势。沐瞳将会继续与火山引擎合作,以大模型能力优化游戏开发、提升游戏品质,为玩家创造更多激动人心的体验。
火山引擎副总裁张鑫介绍了企业专属 AI 应用创新平台 HiAgent 的最新能力。HiAgent 支持通过混合部署方案让知识库留在本地,企业可以根据业务需求选择调用云上或本地的模型,还能通过其内置的大模型防火墙和数据防泄密机制确保数据安全;HiAgent 还为客户提供了企业专属的定制扩展能力,支持将开发出来的 Agent 与原有的业务系统进行灵活集成。
浙江大学求是特聘教授、信息技术中心主任陈文智表示,在自研 OpenBuddy 模型,以及豆包大模型等极具性价比的商业模型及智能体的共同赋能下,浙大创建了“浙大先生”智能体应用开发平台,并搭建了 AI 科学家、慧学外语、AI 百事通、数字教师等多个大模型校园应用场景。后续浙大将继续携手火山引擎,共同打造每个人的 AI 专属智能体,为校园带来交互模式、知识复用、数据连接以及决策创新等更多方面变革。
大模型从探索走向应用,云基础设施的支撑不可或缺。火山引擎云基础产品负责人罗浩表示,火山引擎 AI 全栈云依托与字节跳动的海量资源共池,从诞生起所有 IaaS、PaaS 层资源,以及推荐算法、数智平台等中台体系产品,都生长于同一朵云上。数据中心、软硬件基础架构的统一,避免了“算力孤岛”和“数据孤岛”问题,结合火山引擎自研服务器、自研 DPU 卡、调度算法等技术能力,火山引擎 AI 全栈云在性能、稳定性和成本上具备了更大的优势。在模型推理场景中,可针对不同体量模型,提供类型丰富、灵活供应的海量 GPU 推理资源;支持超低延时调用豆包大模型,访问质量稳定可控。
通过强化豆包大模型“更强模型、更低价格、更易落地”的优势、成立行业联盟、推动生态共建,火山引擎将持续帮助企业加速落地 AI 能力,驱动商业模式变革,为行业的未来发展注入新的动力。下一站,2024火山引擎 AI 创新巡展将来到天津,带来更多 AI 创新升级,携手企业客户推进 AI 转型。