{dede:global.cfg_webname/}

当前位置: 首页 > 科技 > 科技快讯 > 正文

大模型降温背后的难点、卡点、节点

来源:互联网    时间:2024-08-22 09:39:13

  进入 2024 年,大模型似乎有熄火之势:资本市场,与之关联的概念炒不动了,英伟达股价动辄暴跌重挫,引发 " 泡沫戳破 " 的担忧;

  消费市场,BATH 们的推新活动少了,产品更新迭代的速度慢了,民众的关注度降了……

  热闹的大概只剩下两场酣仗:自 5 月 15 日字节跳动宣布 " 以厘计费 ",打响国内大模型 " 价格战 " 的第一枪,百度文心、讯飞星火、阿里通义、腾讯元宝等纷纷跟进;

  同时,地铁、写字楼、机场等白领人群密集区域,百度文心、讯飞星火、阿里通义、腾讯元宝、华为盘古的 Slogan,你方唱罢我登台,贴脸营销如枪林刀树。

  " 海水 " 与 " 火焰 " 交融的场面,不得不让人思考,大模型的出路究竟在哪里?难点、卡点、节点又是什么?

  01 难点:盈利难&落地难

  强如 OpenAI,也面临 " 恰饭 " 的难题。

  援引外媒报道,OpenAI 预估亏损 50 亿美元,全年运营总成本高达 85 亿美元,照此估算,其现金流大概率在一年内耗尽。

  而在一篇题为《How does OpenAI Survive》的长文中,作者对 OpenAI 的商业模式产生了质疑:

  "OpenAI 的营收在 35 亿至 45 亿美元之间,但其运营亏损可能高达 50 亿美元,其收入远远无法覆盖成本。而为了推出下一代的大模型 GPT5.OpenAI 需要更多的数据和算力,这又是一大笔花费。"

  说千道万,靠着 " 碎钞式 " 的大力出奇迹后,大模型却仍未找到一条合理的盈利路径。

  据《节点财经》观察,市面上的大模型,大部分都采取 To C+To B,即会员订阅 + 开发者 API 调用 " 两条腿 " 走路。

  但无论是 To C,还是 To C,能一上来就产生付费的寥寥无几,若再刨除重负的减项,多半是鼻子大过脸。

  以本土大模型先行者百度为例,2024 年 Q1.其云业务收入为 47 亿元,同比增长 12%,其中 6.9% 来自外部客户使用大模型及生成式 AI 相关服务,约为 3.24 亿元。

  而在 2023 年 Q4.大模型为百度云贡献了 6.6 亿元增量收入。

  这是国内唯一披露大模型收益的厂商,本身又是家大业大,有底气拼到底的巨擘。但只谈创收,忽略创利,就是耍流氓。

  可想而知,其余不敢明示账目的选手,内心有多迷茫、煎熬。

  不挣钱,难挣钱的背后,是大模型落地难的窘境。

  虽然大佬们高呼 "ChatGPT" 的问世是 "iPhone 时刻 ",第四次工业革命,新一代的 " 火 " 和 " 电 ",但坦率地讲,当下大模型还有很多局限性,包括认知偏差、能动性欠缺、泛化性能弱、幻觉等。

  比如,数值运算就是大模型明显的弱项,或者说大模型是妥妥的 " 文科生 ",做数学题的智商可能连二、三年级的小学生都不如。

  《节点财经》亲测,在 Kimi 输入:"9.11 和 9.8 哪个大?" 一顿啰嗦后,Kimi 给出了完全不正确的答案。

  比如,大模型资料更新不及时,必须外挂知识库才能在一定程度上缓解这个痛点,并且还是无法完全解决 " 一本正经地胡说八道 " 的尴尬。

  前几天刷屏的 SearchGPT,就在各地网友兴致勃勃等待灰测展现 AI 搜索的 " 洪荒之力 " 时,《大西洋月刊》浇了一盆冷水,眼尖的记者发现:

  问的是关于 " 八月份北卡罗来纳州的布恩音乐节 " 的细节,SearchGPT 的回答分为 5 条,3 条里包含事实错误——有的是把举办日期弄错,有的是把距离和车程搞混,有的是把场馆网址张冠李戴。

  再如,大模型绝对是 " 健忘症 " 患者,我们在和它对话时,尤其是多轮对话时,难免要化身 " 复读机 ",一遍一遍重复相同的话术。

  而在 B 端,因为实战经验不足,生分于对方的 Know-How,加之环境的复杂多变性,大模型面临的挑战更艰巨。某业内人士表示,迄今大模型在行业中尚没有一个成熟的案例。

  02 卡点:数据、算力、成本

  深入肌理地分析,大模型的 " 落地难 " 又与自身的三大卡点:数据、算力、成本息息相连。

  卡在数据

  如果把大模型比作一头巨兽,那它的显著特征之一便是 " 不停进食 ":需要高质量、大面积的语料做长久期、高频次地投喂、催肥。

  换言之," 食物 " 的品质、多寡、新鲜度、多样性等,决定了大模型的迭代进度和学习效果。

  无疑,这对数据的挖掘、获取提出严峻考验,关系到各方的权益保障、利益分配、版权归属等,通常涉及到敏感信息时,数据的清洗、标注、脱敏又会很繁杂。

  前阵,免费网文 APP 番茄小说因一份 "AI 协议 " 引发轩然大波。根据该份协议,平台可以将签约作品,含名称、大纲、简介、章节等,作为 " 哺育 "AI 大模型的素材,用于各种应用场景,如智能对话、智能文本创作等。

  不过,这一举动遭到作者的普遍反对,认为其不仅威胁网络写手的生计,还损害了原创内容的价值,甚至发起联合断更以示抗议。

  卡在算力

  如果把 AI 链路比作一间工厂,那么算力便是维持工厂运转,量级夸张且进价不菲的 " 燃料 "(煤、石油、电力等)。

  公开资料显示,初始 ChatGPT 匹配的算力是 1 万块英伟达 A100(AI 芯片),花费超过 7 亿元。后续调优每天消耗的算力大概是 3640PFLOPS,即 7 至 8 个算力达 500PFLOPS 的 Data Center 的支撑,整体基建开支以百亿计。

  按照广发证券的测算,在暂不考虑软件层面算法优化的前提下,本土 AI 大模型在训练与判断、预测阶段所需算力,相当于 1.1 万台或 3.8 万台(乐观假设下)高端 AI 服务器,大致对应约 126 亿元到 434 亿元的资金体量。

  进一步地,随着大模型规模状大,算力需求会倍数递增,已然超越硬件的摩尔定律。据悉,ChatGPT 从 1.0 到 3.0.参数量从 1.17 亿狂飙到 1750 亿。

  而目前,我们在算力这块既面临外部 " 卡脖子 ",内部建设又相对落后,碎片化、传输慢、协同难、人才紧缺等 " 痼疾 " 亟待突破,导致大模型的实效逊于国外。

  " 大模型只有两个梯队,OpenAI 和 Others,国产用哪家都一样 ",多位 AI 从业者谈道。

  卡在成本

  大模型 " 桎梏 " 于算力,实际也是 " 桎梏 " 于成本。

  计算机飞入千家万户,售价下探,变得亲民、接地气,很关键;智能手机能人手一部,物美价廉的小米功不可没;新能源汽车的热卖,离不开动力电池的 " 跳水式 " 降价……

  从人类历史的进程看,任何一项新技术的推广、普及,都离不开对成本的有效、大力压缩、控制。

  硬币的背面,是科技发展和工业文明进步共同作用下,制造效率、运算精度提升,人均产值拔高,各类物料愈发便宜等因素集结的强大驱动力,进而减轻 C 端、B 端 " 太贵了,买还不买 " 的纠结。

  大模型同理,浩大的开支也是其成长途中的 " 绊脚石 "。试想,当生态里只有唯一的 " 卖铲人 "(英伟达)赚钱,赚头还不小,怎么可能持续呢?

  好消息是,今年 2 月末,李彦宏透露,自发布以来,百度不断降低文心大模型在推理方面的成本,已降至去年 3 月版本的 1%。

  03 节点:在产业里 " 种植 " 大模型

  毋庸置疑,大模型仍有诸多 " 短板 " 和缺陷,但新技术的魅力向来在于探索 " 无人区 ",跋涉 " 深水区 "。

  很多眼下看似微弱的 " 火种 ",往往都孕育着日后 " 纳须弥于芥子 " 的宏壮。尽管迄今为止的大模型,大家都是拿着锤子找钉子,但我们已经看到,其正逐步向产业迈进,尝试扮演了一些浅层的 Agent 的角色。

  最醒目的标识便是,大模型不再坐而论道,只会聊天、写诗、作画,而是起而动之,走出实验室,去往矿区、政务、金融、医药、金融、物流等具体领域,努力兑现自己的终极使命。

  比如,在矿区,下井工人常年深陷光线昏暗、浮尘弥漫的环境,叠加经年累月高强度的劳碌,使不少人都患上了风湿、耳鸣等职业病,更甚者,还可能遭遇瓦斯、透水等意外,但矿区作业又十分依赖人力,特别是主运系统巡检。

  华为的盘古矿山大模型这时候便派上用场了。其覆盖煤矿的采、掘、机、运、通、洗选等流程下的 1000 多个细分场景,用 AI 取代人成为主运智能监测系统的眼睛,能够精准识别大块煤、锚杆等异常情况,异物识别准确率达 98%,动作规范识别准确率超过 95%,且全时段巡逻助力工作人员,避免因漏检造成的安全事故,缩短停机时间。

  京东表示,基座大模型是靠卡训出来的,企业大模型是靠人用出来的。

  物流领域,揽收、派送、分拣、辅助,应对突发事件等,快递员每天都背负着繁重的任务,还要熟悉货物处理规程、安全操作标准、客服要求等多达上百个规范,把这些统统记牢,肯定要耗费大把功夫,还容易混淆。

  京东言犀大模型的小哥终端助手大大化解了上述烦恼。它告别了只 " 动脑 " 的境界,能直接 " 下手 ",快递员动动嘴,小哥终端助手就能立即将送货通知发给客户。如今,小哥终端助手为 JD 商城近 35 万自有配送员 " 效劳 "。

  再如,零售行业,基于京东言犀大模型的 AIGC 营销工具 " 京点点 ",不仅可以帮助商家一键出商品图,还支持了超过 2000 种视觉元素道具;不仅可以丰富吸睛资源和表现力,还能依循商品属性、特点和宣传想要的个性化布局,实时、自主撰写创意卖点、种草文案、直播脚本等。

  总的来说,把大模型 " 种植 " 在产业里,让大模型在产业里生长、发芽,俨然是现在大厂的共识,必须攻克的难关。长远看,该共识亦如 " 星星之火 " 终会燎原旷野。

  写在最后

  当喧嚣过后,大模型这场豪华游戏,能留在牌桌的玩家,注定只是少数。

  面对数据、算力、成本等现实问题,供需两端渐渐回归理性。可以预见,在真 " 好用 " 和能 " 吸金 " 之间,大模型还有很长的路要走。

声明:来源非IT商业科技网的作品均转载自其它媒体,转载请尊重版权保留出处,一切法律责任自负。文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:Email:342 4350 938@qq.com

频道精选
大模型降温背后的难点、卡点、节点

大模型降温背后的难点、卡点、节点

  进入 2024 年,大模型似乎有熄火之势:资本市场,与之关联的概念炒不动了,英伟达股价动辄暴跌重挫,引发 " 泡沫戳破 " 的担忧;
2024-08-22
携手联想数据恢复中心 联想百应数据恢复服务正式上线

携手联想数据恢复中心 联想百应数据恢复服务正式上线

  北京联想全球总部,联想百应数据恢复服务上线启动仪式成功召开。此次发布仪式不仅标志联想百应与联想数据恢复中心之间战略合作的达成,
2024-08-22
零食很忙:打造人民的零食品牌 用心服务消费者

零食很忙:打造人民的零食品牌 用心服务消费者

  《2023 青年消费调研》显示,近一半年轻人愿意为情绪价值消费;根据小红书和尼尔森的小红书用户消费心理研究,消费者购买决策考虑因素
2024-08-21
IPv6赋能商密产品价值提升 60余款产品通过认证树立安全新风向

IPv6赋能商密产品价值提升 60余款产品通过认证树立安全新风向

  近年来,随着数字化经济的蓬勃发展,信息安全问题日益凸显,商用密码产品作为守护数据安全与隐私的关键设备,其市场需求迅猛增长。面对
2024-08-21
维谛技术新品来袭 即刻上电 通往大规模智算中心

维谛技术新品来袭 即刻上电 通往大规模智算中心

  AI新时代,技术在飞跃,算力加速跑;AI新时代,末端配电要换代如何抢先领跑数字世界?故事回到2021年,维谛前瞻战略性收购E&I Engineeri
2024-08-21
用心服务、快速响应 高效联动保障网络畅通

用心服务、快速响应 高效联动保障网络畅通

  临汾联通汾西分公司政企客户经理任静自担任政企要客经理岗位以来,始终秉持着爱岗好学、守正创新的精神,用心服务客户,用专业打动客户,
2024-08-21
360织语启动鸿蒙原生应用开发 助推办公应用鸿蒙化进程

360织语启动鸿蒙原生应用开发 助推办公应用鸿蒙化进程

  日前,华为企业工作必备应用鸿蒙化高峰论坛在京召开,360织语应邀出席并参与启动鸿蒙开发服务商领航计划授牌仪式。今后,360织语将与其
2024-08-21
技术体验全面升维 商汤科技元萝卜世界机器人大会发布国际象棋机器人

技术体验全面升维 商汤科技元萝卜世界机器人大会发布国际象棋机器人

  8月21日,2024世界机器人大会在北京隆重召开。商汤科技旗下家用机器人品牌元萝卜SenseRobot家族全系产品集体亮相,并最新发布元萝卜AI下
2024-08-21

2017-2019 Copyright © IT商业科技网 备案许可证号粤ICP备2022153948号 豫公网安备110102003388号

紧急处理QQ:133 4673 445@qq.com