时间:2024/6/24 12:28:57来源:www.a300.cn作者:学臣我要评论(0)
虽然像 ChatGPT、Claude 和 Gemini 这样的大型语言模型令人印象深刻,但它们都有一个共同的大问题:经常会产生幻觉。这是人工智能领域的一个严重问题,甚至苹果也对未来苹果智能(Apple Intelligence)如何处理幻觉表示担忧。幸运的是,一组研究人员现在开发出了一种 AI 幻觉检测器,可以判断 AI 是否虚构内容。
图源备注:图片由AI生成,图片授权服务商Midjourney
这些幻觉导致了许多令人尴尬和耐人寻味的失误,它们也是 ChatGPT 等人工智能尚未更加实用的主要原因之一。我们曾经看到谷歌不得不修改其 AI 搜索概览,因为 AI 开始告诉人们吃石头是安全的,还说在披萨上涂胶水是安全的。甚至有律师使用 ChatGPT 帮助撰写法庭文件,结果因为聊天机器人虚构了文件中的引用而被罚款。
根据该论文,研究人员开发的新算法能够帮助辨别 AI 生成的答案在大约79% 的时间内是否准确。当然,这并不是一个完美的记录,但比目前其他主流方法高出了10%。
Gemini 和 ChatGPT 等聊天机器人可以很有用,但它们也很容易产生虚构的答案。这项研究是牛津大学计算机科学系的成员进行的。研究人员在论文中解释说,他们使用的方法相对简单。
首先,他们让聊天机器人对同一个提示进行多次回答,通常是五到十次。然后,他们计算出一个我们称之为语义熵的数值,这是答案的意义相似性或差异性的度量。如果模型对每个提示条目的回答都不同,那么语义熵分数会更高,表明 AI 可能是在虚构答案。然而,如果答案都相同或意义相似,语义熵分数就会较低,表明它提供的答案更一致且可能是真实的。这并不是一个百分之百准确的 AI 幻觉检测器,却是一个有趣的处理方法。
其他方法依赖于所谓的朴素熵,通常是检查答案的措辞是否不同,而不是其含义。因此,它不太可能像计算语义熵那样准确地发现幻觉,因为它没有关注句子中的词语背后的含义。
研究人员表示,该算法可以通过按钮添加到 ChatGPT 等聊天机器人中,让用户对他们的提示所得到的答案获得 “确定性评分”。直接内置 AI 幻觉检测器到聊天机器人中是诱人的,因此可以理解将这样的工具添加到各种聊天机器人中的用途。
相关视频
相关阅读 微信快来了!余承东:TOP 5000应用全部启动鸿蒙原生应用开发华为开发者大会2024:历经5年研发 华为发布自研仓颉编程语言网友建议实行男女分车厢 12306回应:将反馈进行研究处理福特汽车求贤若渴!挖角特斯拉、苹果人才开发电动汽车被骗多年!中国农大研究:每周摄入鸡蛋超6个死亡率增加35%京东新推出一个会员体系:消费60万才能满级极端50度高温来袭:印度一地44名选举工作人员被热死原来演唱会的字幕是PPT:通过工作人员手动点击切换实现
热门文章 研究人员开发出一种能抖音的“金猪”,带不原来中国名字最难听的
最新文章
研究人员开发出一种能中国男性使用最多的手
粉丝500万、年销几十亿!抖音头部女装店含泪抖音的“金猪”,带不飞短剧原来中国名字最难听的水果在广东:番石榴 别医生建议1天最多吃3个粽子:尽量避免在晚餐
人气排行 pdf在线解密、解锁工具推荐win7黑屏怎么办 win7黑屏补丁ATM刷脸取款怎么使用 ATM刷脸取款步骤介绍谁最强大?百度与Google搜索功能比拼四款主流即时通讯软件2003新版评测Win7损伤笔记本电池寿命?如何查询是否被百度k绝地大反攻:邮箱防垃圾邮件功能评测
查看所有0条评论>>