{dede:global.cfg_webname/}

当前位置: 首页 > 科技 > 软件 > 正文

小度换上新脑

来源:互联网    时间:2024-04-17 09:22:51

  “如今的小度,换了一个新的大脑。”

  在距离2024年百度Create AI开发者大会一周前的一次交流中,小度CEO李莹对36氪如此形容小度的蜕变。

  而在大会开场,小度为这个全新的“大脑”留下悬念。百度集团创始人、董事长兼CEO李彦宏,与小度添添AI平板机器人进行了一段互动:

  “帮我安排一下日程,今天活动结束后,我会和张总一起用晚餐,之后在酒店有个管理层的会议,大概需要1个半小时,希望10点之前可以结束。明早我准备晨跑,看看天气如何,然后上午8点有个早会,请帮我安排好日程。”

  这段普通的指令暗藏玄机,既有简单的新闻问询,也有复杂的日程安排。此前的小度,大概率会以“抱歉”遗憾收尾。但在会上,小度给出了近乎完美的答案:

  您与张总晚餐安排在18:00-19:30.结束后,您将在20:00参加管理层会议,21:30左右结束;

  明早6点闹钟将提醒您起床去晨跑,跑步时长控制在1个小时以内,确保明早8点早会不迟到;

  明早天气晴朗,气温25度,建议您穿短袖外出,做好防晒。

  这份蜕变背后的最大变量,在于一颗基于百度文心大模型的“最强大脑”:DuerOS X。

  在AI算力从云端逐渐转移到终端应用、大模型从软件应用逐渐渗透至硬件产品,已经连接超4600万家庭的“国民AI伙伴”小度,自然而然的站在了AI技术变革的浪潮之巅。

  “小度AI智能助手是百度文心大模型的重要且规模庞大的落地应用,Duer OS X作为全新的AI native OS,完成全面‘换脑’,引领AI原生应用迈向全新的高度,它将为我们带来前所未有的智能体验,开启全新的智能生活篇章。”李莹谈到。

  纵观小度换上DuerOS X这颗“新脑”的过程,就会发现,这是一串被百度冠以“最好”形容词的“AI+硬件产品”的打磨链条:

  支持复杂日程安排、高语境交流等场景的,是性能最好的大模型文心4.0;负责响应用户不同问题和需求的,是国内最大的智能体平台百度“灵境矩阵”上的2000多个Agent;用于平衡小度解决问题精确度和推理成本的技术,则是最前沿的MoE(混合专家模型)架构;决定“大脑”聪慧程度的训练数据,则来自国内智能音响领域最完整的数据库——小度近十年来积累的高质交互数据。

  “新脑”换来的,是更机灵、懂你的小度,也是百度全新软硬一体时代的开启。

  01

  Connecting the dots

  小度蜕变的开始,可以回溯到近十年前——在2015年9月的百度世界大会上,小度的前身,搭载着DuerOS的对话式人工智能秘书“度秘”完成了首秀。

  彼时的李莹,负责百度知识图谱的研发,也为度秘产品提供支撑。她对36氪形容,当时的搜索,遵循的Top One是“一条结果,满足一个问题”。这条Top One原则,让度秘的“大脑”,更贴近于传统搜索,用户问一个问题,度秘给出一个准确的回答。

  在“人工智障”戏称流行的年代,DuerOS这颗“大脑”的表现无疑是惊艳的。

  DuerOS最早被大家熟知,是在2017年的“百度AI开发者大会”正式发布的对话式操作系统,利用语音技术、自然语言处理技术、搜索技术等,打造了听清、听懂、满足用户需求的人工智能对话系统。

  然而,当时间来到2023年,“一条结果,满足一个问题”,已经无法再让用户满足。

  “简单来说,如果小度还是这个水平,就不够聪明了。” 李莹对36氪坦言。

  若想设置一个复杂的日程,比如“8:00 am完成任务1.继续完成任务2.且任务2必须在10:00 am前完成”,小度的回答是一句令人遗憾的“抱歉”;再比如,“在搜索引擎原来搜不了的东西,在小度上也一样回答不了”。

  但相对地,大模型的发展对小度等智能硬件而言,又是最好的机遇。高通CEO Cristiano Amon曾总结,计算机的发展史,就是算力从超算等大型设备一步步转移至终端设备上的过程。素有“消费电子春晚”之称的CES(国际消费电子产品展),2024年的主题则是“AI for Everything”。

  主打家庭场景的小度,站在了离用户情感空间最近的位置。

  但仅仅是站在风口中,对小度而言还远远不够。为小度换上一个AI原生的“新脑”——DuerOS X,是小度在新战场的新武器。

  2005年,苹果创始人史蒂夫·乔布斯在斯坦福大学的毕业典礼上,曾将自己当下的成就,比作“Connecting the dots”,即过去点滴的积累。

  若是细数DuerOS X诞生的必要条件,就可以发现,小度为此刻的蜕变串联了百度、小度将近10年的dots。

  “小度从来不是一家单纯的硬件公司。”小度曾在不同场合一再强调智能硬件,不仅仅是硬件的战场,而也是一场“大脑”——软件的比拼。

  对“大脑”的强调和持续打磨,让小度“换脑”显得水到渠成。从DuerOS跨越到DuerOS X,最大的变量是百度的通用大模型基座“文心”——这又是一个跨度超过十年、有关百度立身的根本和“让所有人能使用最先进的生产力工具”朴素愿景的故事。

  02

  换脑

  大模型应该怎么和硬件结合?硬件的形态应该怎么做?能落地的场景有哪些?

  小度的同事们反复研究了CES上的智能硬件产品,得出了一个有些令人沮丧的结论:有意思的产品很多,但技术还没跨越可商业化应用的鸿沟。

  “但大模型给人的惊喜是,它每天都在进步,能力的边界在扩展,成本也在持续优化。” 李莹说道。

  但给小度“换脑”,并不仅仅是接入文心大模型这么简单,而是从数据工程,到技术框架,再到产品应用的全面重造和适配。

  “海峰老师(百度集团CTO,文心大模型负责人)他们已经从金矿里面炼出金子,”李莹对36氪打了个比方,“我们要做的是把金子变成戒指或者耳环。”

  小度“换脑”的第一件事,就是技术框架的重构。这需要团队有很强的工程及算法能力,让系统的适配性、鲁棒性更强,系统效率更高。小度从第一天起就是软硬一体,工程能力很强,可以快速做重构。

  另外,就是要基于小度的场景,做不同的数据工程工作。比如,为了给小度创造不同的AI伙伴人设,要去做大量和精细的数据工程,比如数据收集/标注、训练和调优,还要为每个人设去设计独特的Prompt(提示词),以帮助模型更好地理解和塑造人设。

  要让小度更像人,意味着系统的交互方式也要围绕着“像人交流一样”去打造。不少软硬件和操作系统接入大模型,都仅仅是在过去的键鼠或者触屏的交互方式上做叠加。“小度一开始就是针对多模态交互设计的。”李莹介绍。从芯片、摄像头,细到麦克风阵列,小度为大模型驱动的多模态交互,做了不少调试。面对如今的小度,用户用语音、文字,甚至是手势和表情,就能非常自然地表达自己的需求。

  在一般场景下,文心大模型已经足够好用。但面对用户需求复杂的家庭场景,小度发现:通用大模型解决问题的精准度和成本都面临现实问题。

  小度的解法是,采用模型路由架构取长补短。所谓的模型路由,可以简单理解成用一个模型团队,分工处理复杂任务,团队中的每个模型,就是术业专攻的“专家”。

  采用模型路由架构,对花了一年多时间建模型生态的百度而言,有着得天独厚的优势。 “现在文心大模型的不同尺寸和特点的模型,小度全在用。”李莹告诉36氪,采用模型路由结构,既能在小度上充分利用不同模型的优势,还能根据任务的难易程度合理调度模型资源,控制成本,比如仅仅让小度设置一个简单的定时提醒,就不需要用到大模型旗舰版。

  今天,给小度“换脑”的大工程,有了DuerOS X这份答卷。

  小度将DuerOS X定义为“全球首个AI原生操作系统”。在李莹看来,“AI原生”不仅意味着DuerOS X的性能变得更加强大,还意味着操作系统的角色发生了改变:

  市面上多数智能硬件产品的操作系统,充当的往往是软件和硬件之间的中间件,解决的是资源分配和任务调度问题,并不理解用户。但得益于大模型的理解、生成、逻辑、记忆等能力,AI原生操作系统最重要的角色,则是担任端到端地解决用户意图和任务之间的中间件。

  那么用户会如何感知到小度换脑后的进化呢?

  如果用一句话总结DuerOS X的用户体验:就是它更聪明、能干、懂你,以及能更好地提供陪伴。换言之,相比过去“有用”的 AI 助手,现在的小度更“有灵魂”、更像真人了。

  “就好比以前的小度负责保质保量地完成任务,现在的小度还会预测用户的意图、主动发起追问,不会把天聊死了。”李莹告诉36氪。不像以前只能一对一的指令式问答,而是更自然的多轮对话,是用户可以从“换脑”后的小度身上,得到的最为直观的感受。

  小度的“聪明”还体现在中国人讲求的“耳聪目明”,即多模态的感知技术的增强。一个典型的功能是绘画导师,即使没有专业的绘画功底的用户也不用担心,只要在屏幕上简单地勾出轮廓,小度就能直接将简笔画“精装”,生成精致的绘画作品。用户还可以通过简单的文字描述,来生成一个属于自己的故事绘本。

  更“像真人”还体现在小度对用户的个性化记忆能力。比如用户对小度说过,对小龙虾过敏,那么当小度为用户推荐宵夜的时候,会特别提醒“别吃小龙虾,会过敏”。这种能力有赖于小度的个性化长短记忆的存储、提取、理解能力的提升,让小度接得住用户的每一次“考古提问”。

  另一个有趣的体验,则是小度不仅有了“脸”,还长出了“躯干”。基于大模型驱动的数字人技术,小度可以在屏幕上生成个性化的数字人形象。无论是作为孩子的可爱伙伴,还是老人们的陪聊对象,通过小度的屏幕,都成了可被感知的真切存在。在今年的春节期间,小度上线了家庭AI年宠——“度龙龙”。它知道很多年俗知识文化,可爱的样子深受小朋友们喜爱,小朋友们的聊天对话的次数和时长,明显增加,在陪聊的同时,长了知识,可谓是寓教于乐。

  而在不那么明显的地方,DuerOS X也下足了功夫。“小度现在不是一个‘人’在为你服务,而是背后站了一群‘人’。 ”李莹表示。百度2023年9月推出的文心智能体(Agent)平台,汇聚了2000多个功能各异的AI Agent,如医生、老师、律师、国学大师、星座达人、健身教练等等智能体。接入文心智能体生态,意味着小度可以根据不同人群多样化的需求,调度最合适的Agent来完成任务。比如它可以是用户的AI健身顾问,大到提供健身规划,小到问一下这个水果多少热量、是否适合减肥期间食用。

  所谓的“AI原生”,也体现在DuerOS X背靠的,是百度的AI应用生态。这就意味着,小度的“新脑”将会持续地迭代,能力的边界也将不断扩展。

  在过去,软硬件适配是个成本高昂的重工程,比如,而基于DuerOS的开发,因为大模型变得更简单了,AI可以省去重复适配流程,无缝植入到各种智能硬件中,内容生态也可以通过Agent的接入轻松适配——未来,小度的“大脑”,将拥有更繁荣的应用、内容和服务生态。

  “‘换脑’没有终点,这必然是个继续演进的过程。”李莹表示,“质变已经完成了,接下来就是根据用户反馈持续打磨。而 新的“大脑”会根据用户返回数据越多变得效果越好,越聪明!”

  03

  做一款无处不在的AI伙伴

  2022年底,一名小度用户突然收到了一条来自百度的短信:“紧急!您的家人正在用‘小度急救助手’求救!”

  通过小度App的远程视频功能,这名用户发现,自己的姥爷并没有像往常一样早起。他第一时间告知了离姥爷家最近的舅舅,最后成功救治了感染新冠和脑供血不足的姥爷。

  这个故事为李莹带来了很大的触动。“我一直觉得AI能够让人们的生活和工作效率更高,让人们的生活也更便捷。”李莹告诉36氪,“我相信技术要从科学突破再往前迈一步,去驱动产品变革。”

  小度CEO,这是这位在百度20年的老将的新身份。和小度一起站在AI风口的中心,她仍然怀揣着满腔热忱:“之前我主要聚焦在互联网软件领域,现在,我要去进一步探索软硬一体化的产品,包括它的设计理念、产品逻辑,以及智能硬件消费品的玩法等等,都为我打开了新的兴趣领域。”

  角色是新的,但“技术驱动产品变革”的朴素实用主义,在李莹身上一直没有变过。2018年,李莹正式从研发的后台走到了产品的前台,担任百度地图事业部总经理。两年后,李莹被任命为百度集团首席信息官,着手发展AI时代的智能工作平台“如流”。

  百度地图解决的是出行效率,百度如流提高的则是人们的工作效率,在李莹看来,这些业务本质上都是用技术驱动产品变革,用AI的能力,让产品服务于用户。她告诉36氪:“从这个角度而言,小度和我过去做的事情是一脉相承的。”

  后来,2023年10月,当李莹接任小度CEO时,她表达了自己的期待:“AI是⼩度的基因和底⾊,它不是⼀个单纯的硬件消费品,这是它与其他‘卖货’公司最⼤的不同。⼩度本质上是AI的应⽤载体,⼤模型为⼩度带来千载难逢的机遇。”

  理念一脉相承,但AI新时代的硬仗还是要打。在新一轮的大模型技术浪潮中,李莹和小度得出的答案是:让小度成为无处不在的AI伙伴。

  DuerOS X这颗新“大脑”,已经生长出了添添AI平板机器人,还在接入小度智能音箱和智能屏、添添闺蜜机、小度健身镜、智能学习平板、小度全屋智能,成为用户的AI闺蜜、AI教练、AI家教、AI管家,以及角色更百变的AI伙伴。

  “⼩度的产品定位从诞⽣起就没有变,我们的愿景始终是让AI 助⼿⾛进千家万户,现在⼤模型技术让这个愿景更近了。”李莹总结。

声明:来源非IT商业科技网的作品均转载自其它媒体,转载请尊重版权保留出处,一切法律责任自负。文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:Email:342 4350 938@qq.com

频道精选
华宝新能电小二新一代安全快充户外电源1000 Pro 2 等新品重磅上市

华宝新能电小二新一代安全快充户外电源1000 Pro 2 等新品重磅上市

  近年来,随着三新经济——新产业、新业态、新模式的蓬勃发展,新质科技力已成为推动经济转型的关键力量。在节能环保、新型能源和高新科
2024-04-17
SDS&HCI市场空间广阔 ICT巨头打造存力底座深耕领跑

SDS&HCI市场空间广阔 ICT巨头打造存力底座深耕领跑

  在技术创新需求推动下,AI、云计算等应用加速落地,推动存储行业繁荣,进而带动了软件定义存储(SDS)和超融合存储(HCI)市场的增长。  
2024-04-17
九四智能:以新质生产力撬动保险新增长

九四智能:以新质生产力撬动保险新增长

  2024分子保险科技节·苏州大会在苏州国际博览中心盛大开幕。本次大会以火种为主题,设置主题峰会35个,深度探讨了保险业数字化转型、数
2024-04-17
便携投影增添一员 坚果P5超强续航让家用投影进入无线时代

便携投影增添一员 坚果P5超强续航让家用投影进入无线时代

  在繁忙的都市中,许多人面临着空间有限的挑战,尤其是小户型的租房族。大型设备不仅占地方,搬家时也极为不便,这无疑影响了人们对科技
2024-04-17
KOIOS推出新款27寸显示器 配备2个DP 1.4接口

KOIOS推出新款27寸显示器 配备2个DP 1.4接口

  原标题:4K仅1599元 KOIOS推出新款27寸显示器:友达7 0 Fast IPS面板  4月16日消息,KOIOS上架了一款新显示器,型号名称为K2724UG
2024-04-16
努比亚Flip今日首销 起售价2999元

努比亚Flip今日首销 起售价2999元

  原标题:2999元起最亲民折叠屏!努比亚Flip今日首销  4月16日消息,今天上午十点,努比亚首款折叠双屏手机努比亚Flip正式开售,起售价
2024-04-16
新能安发布工商储一体机Ampace C5 实现架构及电芯双重突破

新能安发布工商储一体机Ampace C5 实现架构及电芯双重突破

  原标题:新能安发布工商储一体机Ampace C5:独创无助冷全温域控制  4月16日消息,据媒体报道,Ampace新能安推出全新工商业储能户外
2024-04-16
蚂蚁集团发布五大新服务 支持16种语言翻译等

蚂蚁集团发布五大新服务 支持16种语言翻译等

  原标题:支付宝发布五大新服务:支持16种语言翻译 拍照、文字、语音都能互译  4月16日消息,第135届广交会现已开幕,来自200多个国
2024-04-16
小米CarWith正式上线高德地图车道级导航 类似苹果CarPlay

小米CarWith正式上线高德地图车道级导航 类似苹果CarPlay

  原标题:对标苹果Carplay!小米CarWith上线高德地图车道级导航  4月16日消息,日前,多位小米用户反馈,小米CarWith正式上线高德地图
2024-04-16

2017-2019 Copyright © IT商业科技网 备案许可证号粤ICP备2022153948号 豫公网安备110102003388号

紧急处理QQ:133 4673 445@qq.com