{dede:global.cfg_webname/}

当前位置: 首页 > 科技 > 手机 > 正文

三问AI手机:什么意图?怎么识别?何种框架?

来源:互联网    时间:2024-08-22 09:40:06

  早在几个月前,就有媒体同行问我:AI 手机到底是什么?跟智能手机有什么本质的不同?

  试想一下,如果经常跟科技企业、技术趋势打交道的媒体人、分析师都对何谓 AI 手机云里雾里,更别提门店销售和消费者了。

  2024 被认为是 AI 手机元年,但今天走进线下门店,会发现店员和用户都对手机里的 AI 有啥不一样,感知并不明显。

  移动互联网时代,我们常说手机是人 " 肢体 " 的延伸,可以让我们的 " 手 " 触及更远的地方," 看 " 到更广阔的事物。到了 AI 时代,手机是 " 大脑 " 的延伸,心念一动、言出法随,手机会根据我们的使用习惯和意图,主动提供有价值的服务。

  所以,AI 手机区别于智能机的一个更高阶、更本质的能力,就是 " 意图识别 "。

  目前,苹果阵营、华为鸿蒙阵营、荣耀 OV 安卓阵营,都将意图识别作为重点。

  苹果 CEO 库克在 AI 系统 "Apple Intelligence" 的发布会上重点强调,在 " 苹果智能(Apple Intelligence)" 的支持下,Siri 具备了精准识别用户真正意图的能力。

  而安卓和鸿蒙用户,恐怕对此并不陌生。

  华荣 OV 等国产手机厂商早就上线了相应能力。荣耀在 2023 开发者大会上带来了行业首个基于 AI 意图识别的人机交互(IUI)操作系统—— MagicOS 8.0;华为在 HDC 2024 上提出 Harmony Intelligence,使得小艺能力大幅提升,能够理解并预测用户需求,并通过意图框架与合作伙伴应用场景整合。

  OV 虽然没有明确推出意图框架等平台,但也用行动参与其中。将大模型融入系统的底层设计中,升级 OriginOS、BlueOS,来实现复杂的意图识别和推理决策。

  那么用户又该迷惑了,各家都在说 " 意图识别 ",到底有啥不一样呢?

  " 意图 " 是人心中所想,带有模糊和不确定性," 识别 " 结果也就有了很大的自由阐释空间,厂商如何避免自说自话,把 " 手机懂你 " 这件事落在实处?

  就要依靠一个操作系统级的全局意图感知、理解、决策技术体系。

  我们不妨把 " 意图识别框架 " 这一新概念详细拆分开,看看每一个环节的准入门槛是什么。

  01

  意图识别的第一步,当然是搞清楚什么是用户的 " 意图 ",也就是手机厂商所说的 " 懂你 "。

  但 " 意图 " 并不是什么新概念。

  早在互联网时代,意图识别就被应用于搜索引擎、广告推荐等场景。比如用户在搜索框输入 " 抓娃娃 ",底层的检索策略要识别到这是电影需求,再去电影的数据库里检索,如果电影意图识别失败,返回的搜索结果中,根本没有《抓娃娃》电影相关内容,或者要翻好几页才显示,都会导致很糟糕的用户体验。所以,意图识别很早是科技企业研究的对象。

  那么,AI 手机所谓的 " 意图识别 ",有啥特殊呢?

  特殊在于,要游过深海。

  今天手机所承载的 " 意图 ",有两个特点:

  一是范围广。一个动作或词语可能对应多个意图。现代消费电子设备的激增,带来了丰富多样的功能和服务,几乎涵盖了我们生活的方方面面,终端设备的多元、服务的多样,经常会出现多种意图,比如输入 " 长城 ",可能是景点、电影或者汽车,这就使手机的意图识别更难做。

  二是隐蔽性。传统意图识别可以根据用户给出的 query 词来进行判断,属于相对明确的 " 显性意图 ",但日常使用手机时,还有大量隐性意图,比如眼睛注视手机屏幕,可能是想看时间、看新消息通知或日程计划;遗忘了出行计划,可实际上航班时间应该重点关注……这些是用户真实需要,但自己很少意识到或清晰表达出来的 " 隐性意图 ",由于无法被清晰表达,难以转译成计算机语言,自然也就难以满足。

  这些多且隐蔽的意图,构成了一片 " 意识深海 ",需要手机厂商跋涉而过,找到一条最短路径。

  由此,我们不难明确,AI 手机意图识别的意义:

  首先是化繁为简。通过洞察用户真正的需求,简化获取服务的步骤。

  比如荣耀的 " 任意门 " 功能,带来了行业首个基于意图识别的人机交互,只需一拖不到 1 秒即可完成以往 8 步 10 秒的操作流程。当用户收到一条信息,复制之后,系统会自动分析语义并提炼关键内容,预判接下来的需求和操作,自动一步直达备忘录、地图等应用。华为智慧搜索支持 " 一键场景直达 "、OPPO 的 ColorOS 14 系统中的 " 流体云 " 功能,能预测用户行为,自动接入相应的使用场景……这些都简化了操作步骤。

  其次,多想一步。通过隐性意图的识别和满足,带来超出用户期望的惊喜体验,构建差异化优势。

  华为曾在一次分享会中提到,HarmonyOS 意图框架可以通过长时间的学习训练,把人们自己都感觉不到的规律串联起来,并通过端侧的本地学习完成本地学习推荐,从而完成 " 超预期 " 的智慧搜索服务体验。

  接下来,可以主动服务。比用户多想一步,就能将服务化被动为主动,更快更恰当地送到用户的眼前指尖。

  目前,鸿蒙系统的场景化入口,就可以根据意图判断,将不同服务融入实际场景中,比如搭乘飞机,航班信息会优先显示在实时状态栏,荣耀 Magic Live 也有类似的主动服务,在观影、听歌、走进地铁站等场景中,提前将取票、听歌偏好、地铁码等原子化服务进行推送。

  基于意图识别的人机交互,让你最需要的服务,涉过意识的深海。

  02

  洞察到了用户的意图,就能将服务精准送达吗?其实还要穿过一片 AI 的丛林。

  有一个职场段子,老板让秘书定一个航班,最低段位的秘书,就只会看那一班,而最高段位的,还会提供多个航班选择,还考虑到出差需求,也把当地的住宿、餐饮等都提前查好备选。

  如果让手机 AI 来应聘做你的助理,你希望是哪一个段位呢?

  最高段位的 AI 助理,要真正理解你说的话背后的真实意图,并真正完成你想要的任务,其实要拆分为几个步骤。

  步骤一:充分感知。一个优秀的助理,并非 " 胡子眉毛一把抓 ",什么事情都要提前安排,而是结合上下文背景和情境,来对用户的潜在意图进行判断。所以,充分感知场景和情境,就非常必要了。

  苹果高级副总裁 Craig 曾表示,Apple Intelligence 的真正独特之处是能理解个人情境。能够根据你的个人数据,你现在打开的页面等背景,来理解需求。

  比苹果更早一些,荣耀在 2016 年第一代 Magic 上首发 Magic Live 智慧系统,就能够自动感知判断。

  有了上下文背景,怎么推断多个意图的重要性和优先级呢?这就涉及语义理解了。目前,检索、问答等任务,由于用户有明确的检索词,利用大模型的自然语言理解能力,已经可以很好地推断用户到底想干什么。

  其中比较具有代表性的是 Apple Intelligence 苹果智能 + GPT-4o 大模型的方案。基于 Apple Intelligence,苹果为 Siri 引入了多模态交互能力,可以从输入的自然语言中精准地进行用户意图识别,将任务拆分为多个任务,作为生成回答的基石。

  我们可以把每一个服务和功能,想象成一个个智能体,每个智能体只有孤立的识别和输出能力,要完成用户需要的复杂任务,需要对这些智能体进行精巧地、自动化地调取和编排,才能在意图判断之后,做出最恰当的执行反馈。

  OPPO 与 IDC 联合发布的《AI 手机白皮书》中提到,成熟的 AI 手机系统要内嵌用户定义的专属智能体,不断理解用户习惯,自学习、直觉化。

  在 VDC 开发者大会的一场技术论坛中,vivo 的技术人员也透露,作为业内首个推出手机大模型(蓝心大模型)的厂商,他们很早就开始研究 agent,对手机原生化服务组件的拆分很细、编排恰当。

  这样看,从意图到服务之间,还要经过数据(感知)、算法(分析)、智能体(执行)的一片 AI 森林,只有具备完整 AI 技术体系的厂商,才能顺利跑通。

  03

  从上述意图识别的拆解中不难感受到,AI 手机想做的 " 以人为中心 " 的主动服务,跨设备的数据流转(全场景感知),跨应用的服务触达,以及全局安全,是必不可少的。

  如何将各层级、各终端、各系统、各应用都整合在一起?

  意图框架,就是关键纽带,具备操作系统平台级的能力,可以让 AI 贯穿从数据到服务的完整链路,带来意图识别的能力飞跃。

  目前,荣耀、华为、苹果都推出了自己的框架或平台。

  其中,Magic Live 智慧引擎是基于场景感知、用户理解和意图决策三大核心能力的平台型 AI 解决方案,形成了一个能够衔接各种轨迹和能力的 " 大脑 ",实现了从单意图到多意图关联的精准意图判断。

  苹果也采用了 " 荣耀模式 ",App Intent 意图框架包含了自学习引擎,实时学习用户行为,并根据时间和空间信息,提供个性化服务。

  华为 HarmonyOS 的意图框架,则构建全局意图范式,基于鸿蒙系统的跨端互联协作优势,实现多维系统感知,结合 AI 大模型、AI 推理框架、端云协同等计算处理能力,将需求传递给服务方,拉起 / 执行更恰当的服务。

  总结一下荣耀、华为、苹果的意图框架,就是具备 " 地基 " 的能力。

  为了更好的意图理解,三家都进行了深度的技术搭建,实现了操作系统级别、跨终端的意图感知、理解,只有深入到系统层面,才能真正重构手机 AI 体验。

  同时,意图识别会涉及敏感数据的采集、共享和流动,在隐私安全方面,无论是一贯以隐私保护著称的苹果,还是荣耀的 MagicGuard 和 MagicRing 信任环,华为 HarmonyOS NEXT 的原生安全,都说明唯有平台级的 AI 能力,能在释放智慧的同时,守住安全的防线。

  说到这里,你是不是有点疑惑,既然意图识别这么难、需要改造和创新的地方这么多,效果也不是一时半会儿能体现出来的,主打一个 " 谁用谁知道 ",要不还是先躺平算了。

  确实,意图识别的每一关都不好过,但这正是竞争白热化、同质化的手机市场,厂商突围的关键。

  更何况,AI 手机应该是消费电子市场最大的一个新蛋糕,华荣 OV 等一批国内厂商又早已 " 上桌 ",只要攻克一些技术难关,就能成功分到大蛋糕,何乐而不为呢?

  意图识别框架上,正在酝酿一场从 " 以手机为中心 " 到 " 以人为中心 " 的交互之变,AI 手机才刚刚萌芽。

声明:来源非IT商业科技网的作品均转载自其它媒体,转载请尊重版权保留出处,一切法律责任自负。文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:Email:342 4350 938@qq.com

频道精选
三问AI手机:什么意图?怎么识别?何种框架?

三问AI手机:什么意图?怎么识别?何种框架?

  早在几个月前,就有媒体同行问我:AI手机到底是什么?跟智能手机有什么本质的不同?  试想一下,如果经常跟科技企业、技术趋势打交道的
2024-08-22
大模型降温背后的难点、卡点、节点

大模型降温背后的难点、卡点、节点

  进入 2024 年,大模型似乎有熄火之势:资本市场,与之关联的概念炒不动了,英伟达股价动辄暴跌重挫,引发 " 泡沫戳破 " 的担忧;
2024-08-22
携手联想数据恢复中心 联想百应数据恢复服务正式上线

携手联想数据恢复中心 联想百应数据恢复服务正式上线

  北京联想全球总部,联想百应数据恢复服务上线启动仪式成功召开。此次发布仪式不仅标志联想百应与联想数据恢复中心之间战略合作的达成,
2024-08-22
零食很忙:打造人民的零食品牌 用心服务消费者

零食很忙:打造人民的零食品牌 用心服务消费者

  《2023 青年消费调研》显示,近一半年轻人愿意为情绪价值消费;根据小红书和尼尔森的小红书用户消费心理研究,消费者购买决策考虑因素
2024-08-21
IPv6赋能商密产品价值提升 60余款产品通过认证树立安全新风向

IPv6赋能商密产品价值提升 60余款产品通过认证树立安全新风向

  近年来,随着数字化经济的蓬勃发展,信息安全问题日益凸显,商用密码产品作为守护数据安全与隐私的关键设备,其市场需求迅猛增长。面对
2024-08-21
维谛技术新品来袭 即刻上电 通往大规模智算中心

维谛技术新品来袭 即刻上电 通往大规模智算中心

  AI新时代,技术在飞跃,算力加速跑;AI新时代,末端配电要换代如何抢先领跑数字世界?故事回到2021年,维谛前瞻战略性收购E&I Engineeri
2024-08-21
用心服务、快速响应 高效联动保障网络畅通

用心服务、快速响应 高效联动保障网络畅通

  临汾联通汾西分公司政企客户经理任静自担任政企要客经理岗位以来,始终秉持着爱岗好学、守正创新的精神,用心服务客户,用专业打动客户,
2024-08-21
360织语启动鸿蒙原生应用开发 助推办公应用鸿蒙化进程

360织语启动鸿蒙原生应用开发 助推办公应用鸿蒙化进程

  日前,华为企业工作必备应用鸿蒙化高峰论坛在京召开,360织语应邀出席并参与启动鸿蒙开发服务商领航计划授牌仪式。今后,360织语将与其
2024-08-21
技术体验全面升维 商汤科技元萝卜世界机器人大会发布国际象棋机器人

技术体验全面升维 商汤科技元萝卜世界机器人大会发布国际象棋机器人

  8月21日,2024世界机器人大会在北京隆重召开。商汤科技旗下家用机器人品牌元萝卜SenseRobot家族全系产品集体亮相,并最新发布元萝卜AI下
2024-08-21

2017-2019 Copyright © IT商业科技网 备案许可证号粤ICP备2022153948号 豫公网安备110102003388号

紧急处理QQ:133 4673 445@qq.com