{dede:global.cfg_webname/}

当前位置: 首页 > 科技 > 软件 > 正文

聊天机器人胡言乱语?牛津研究人员利用语义熵来识破AI“幻觉”

来源:互联网    时间:2024-06-24 14:21:42

  6 月 24 日消息,近年来,人工智能蓬勃发展,聊天机器人等应用逐渐普及,人们可以通过简单的指令从这些聊天机器人(例如 ChatGPT)获取信息。然而,这些聊天机器人仍然容易出现“幻觉”问题,即提供错误的答案,有时甚至是危险的信息。

图源 Pexels

  造成“幻觉”的原因之一是训练数据不准确、泛化能力不足以及数据采集过程中的副作用。不过,牛津大学的研究人员另辟蹊径,在最新出版的《自然》杂志上详细介绍了一种他们新开发的方法,用于检测大型语言模型 (LLMs) 的“捏造” (即任意生成的不正确信息) 问题。

  LLM 通过在训练数据中寻找特定模式来生成答案。但这种方法并非总是奏效,就像人类能从云朵形状中看到动物一样,AI 机器人也可能找到并不存在的模式。然而,人类知道云朵只是形状而已,天上并没有漂浮的巨型大象。LLM 则可能将此视为真实的,从而“捏造”出并不存在的新科技和其他虚假信息。

  牛津大学的研究人员利用语义熵的概念,通过概率来判断 LLM 是否出现“幻觉”。语义熵指的是同一个词语拥有多种含义的情况,例如,“desert”可以指沙漠,也可以表示抛弃某人。当 LLM 使用这类词语时,可能会对表达的含义感到困惑。通过检测语义熵,研究人员旨在判断 LLM 的输出内容是否存在“幻觉”的可能。

  利用语义熵的优势在于无需额外的监督或强化学习,即可快速检测 LLM 的“幻觉”问题。由于该方法不依赖于特定任务的数据,因此即使 LLM 面临从未遇到过的新任务,也能加以应用。这将大大提升用户对于 LLM 的信任感,即使是 AI 首次遇到某个问题或指令。

  研究团队表示:“我们的方法可以帮助用户理解何时需要对 LLM 的输出保持谨慎,并为原本因不可靠性而受限的 LLM 应用开辟了新天地。”

  如果语义熵被证明是一种有效的“幻觉”检测手段,那么我们可以利用这类工具对人工智能的输出进行双重校验,使其成为更加可靠的伙伴。不过IT之家需要提醒的是,就像人类并非无懈可击一样,即使配备了最先进的错误检测工具,LLM 也仍然可能出错。因此,始终对 ChatGPT 等聊天机器人提供的答案进行仔细核查仍然是明智之举。

声明:来源非IT商业科技网的作品均转载自其它媒体,转载请尊重版权保留出处,一切法律责任自负。文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:Email:342 4350 938@qq.com

频道精选
聊天机器人胡言乱语?牛津研究人员利用语义熵来识破AI“幻觉”

聊天机器人胡言乱语?牛津研究人员利用语义熵来识破AI“幻觉”

  6 月 24 日消息,近年来,人工智能蓬勃发展,聊天机器人等应用逐渐普及,人们可以通过简单的指令从这些聊天机器人(例如 ChatGPT)获
2024-06-24
英伟达将在中东五国数据中心部署AI技术 首次在当地大规模推出产品

英伟达将在中东五国数据中心部署AI技术 首次在当地大规模推出产品

  6 月 24 日消息,据路透社报道,卡塔尔电信集团 Ooredoo 首席执行官 Aziz Aluthman Fakhroo 当地时间 23 日在接受采访时表
2024-06-24
大模型迎来商业化落地加速期 科大讯飞上半年获大模型订单数最多

大模型迎来商业化落地加速期 科大讯飞上半年获大模型订单数最多

  去年,随着国内百模大战的群雄逐鹿,我国生成式人工智能迎来了快速发展。根据数据显示,2023年我国人工智能核心产业规模达5784亿元,增
2024-06-24
汽车大芯片 巨变前夜

汽车大芯片 巨变前夜

  下一代汽车电子电气架构需要复杂的集中式计算单元来应对日益增长的功能需求。融合芯片(Fusion chips)和基于芯粒(chiplet-based)的设计
2024-06-24
360智慧商业×华为多维合作升级 共赢商业新增长

360智慧商业×华为多维合作升级 共赢商业新增长

  6月21日-23日,华为开发者大会2024(HDC2024)在东莞松山湖举办。聚焦Harmony OS版本更新、盘古大模型5 0正式发布、智能语音助手小艺全
2024-06-24
小天互连IM系统:探讨即时通讯私有化部署的重要性

小天互连IM系统:探讨即时通讯私有化部署的重要性

  随着网络攻击和数据泄露事件的频发,如何保障信息安全已成为企业亟待解决的重要难题。小天互连IM系统作为私有化部署即时通讯软件的杰出
2024-06-24
思看科技3D扫描技术助力汽车制造全流程提质增效!

思看科技3D扫描技术助力汽车制造全流程提质增效!

  在汽车制造领域,质量控制是企业的核心关注点,每个零部件都需要经过严格的检测,任何缺陷或组装失误都会导致安全隐患,影响整车性能和
2024-06-24
协作机器人步入AI时代!越疆机器人+ChatGPT到底多聪明?

协作机器人步入AI时代!越疆机器人+ChatGPT到底多聪明?

  ChatGPT无疑是今年最出圈的科技热点,和之前我们认知中的 AI 不太一样,它拥有更为强大的语言理解和文本生成能力,更能听懂人话,做
2024-06-24

2017-2019 Copyright © IT商业科技网 备案许可证号粤ICP备2022153948号 豫公网安备110102003388号

紧急处理QQ:133 4673 445@qq.com