{dede:global.cfg_webname/}

当前位置: 首页 > 科技 > 科技快讯 > 正文

超越GPT-4V!智谱AI第二代视觉大模型CogVLM2 19B参数跑出卓越性能

来源:互联网    时间:2024-05-23 11:27:42

  继去年发布并开源VisualGLM-6B和CogVLM之后,智谱AI宣布近期将推出新一代多模态大模型CogVLM2.这款模型以其19B的参数量,在性能上接近或超越了GPT-4V。

  据悉,CogVLM2系列模型在多个关键指标上实现了显著提升,如在 OCRbench 基准上性能提升32%,在TextVQA基准上性能提升21.9%,且模型具备了较强的文档图像理解能力(DocVQA)等。此外,CogVLM2支持8K文本长度和高达1344*1344的图像分辨率,同时提供中英文双语的开源模型版本。

  CogVLM2 继承并优化了上一代模型的经典架构,采用了一个拥有50亿参数的强大视觉编码器,并创新性地在大语言模型中整合了一个70亿参数的视觉专家模块。这一模块通过独特的参数设置,精细地建模了视觉与语言序列的交互,确保了在增强视觉理解能力的同时,不会削弱模型在语言处理上的原有优势。这种深度融合的策略,使得视觉模态与语言模态能够更加紧密地结合。

  值得注意的是,尽管CogVLM2的总参数量为190亿,但实际激活的参数量仅约120亿,这得益于精心设计的多专家模块结构,显著提高了推理效率。此外,CogVLM2能够支持高达1344分辨率的图像输入,并引入了专门的降采样模块,以提高处理高分辨率图像的效率。

  在多模态基准测试中,CogVLM2的两个模型,尽管具有较小的模型尺寸,但在多个基准中取得 SOTA性能;而在其他性能上,也能达到与闭源模型(例如GPT-4V、Gemini Pro等)接近的水平。

  开发者可以通过GitHub、Huggingface、魔搭社区和始智社区下载CogVLM2的模型,团队还透露,GLM新版本会内嵌CogVLM2能力,在智谱清言App和智谱AI大模型MaaS开放平台上线。

声明:来源非IT商业科技网的作品均转载自其它媒体,转载请尊重版权保留出处,一切法律责任自负。文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:Email:342 4350 938@qq.com

频道精选
超越GPT-4V!智谱AI第二代视觉大模型CogVLM2 19B参数跑出卓越性能

超越GPT-4V!智谱AI第二代视觉大模型CogVLM2 19B参数跑出卓越性能

  继去年发布并开源VisualGLM-6B和CogVLM之后,智谱AI宣布近期将推出新一代多模态大模型CogVLM2 这款模型以其19B的参数量,在性能上接近
2024-05-23
深化AI+制造 华为助力制造业数智化转型跑出加速度

深化AI+制造 华为助力制造业数智化转型跑出加速度

  在总体规模连续14年位居全球首位背后,我国制造业的发展正呈现出全新特征,一方面,制造业高端化正扎实推进,技术含量较高、附加值较高
2024-05-23
国内首个智能体生态大会!2024百度万象大会定档5月30日

国内首个智能体生态大会!2024百度万象大会定档5月30日

  最近,百度悄悄「上新」了几个AI神器。  百度搜索上线「互动」功能,可以实时问答,查询信息就像聊天一样简单,还可以艾特相关智能体
2024-05-23
通用技术国际:战略擘画、变革赋能 以财务数智化赋能新质生产力

通用技术国际:战略擘画、变革赋能 以财务数智化赋能新质生产力

  近日,由财政部指导、新理财杂志社主办、北京市石景山区人民政府特别支持的第十八届中国CFO大会在北京市召开。本届中国CFO大会以财务数
2024-05-23
1公里分辨率6分钟快速更新!数慧时空重磅推出“微澜测天”气象AI大模型

1公里分辨率6分钟快速更新!数慧时空重磅推出“微澜测天”气象AI大模型

  近日,继去年5月发布首个泛自然资源行业多模态基础大模型长城后,人工智能领军企业数慧时空又重磅推出了超高时空分辨率气象AI大模型微
2024-05-23
拼多多Q1深化高质量发展战略:加大农业投入 进一步夯实平台基本功

拼多多Q1深化高质量发展战略:加大农业投入 进一步夯实平台基本功

  5月22日,拼多多集团发布截至3月31日的2024年第一季度业绩报告。得益于消费市场开局向好、积极因素积累增多的大环境,以及多实惠和好服
2024-05-23
新茶饮兴起n种新玩法

新茶饮兴起n种新玩法

  新茶饮自诞生以来,揽获了极大关注。不同阶段,总会以不同的形象,活跃于大众视野内。  5月17日, 奶茶酸奶都卷向壮阳了 话题登上微
2024-05-23

2017-2019 Copyright © IT商业科技网 备案许可证号粤ICP备2022153948号 豫公网安备110102003388号

紧急处理QQ:133 4673 445@qq.com