网易首页 > 网易号 > 正文 申请入驻

为了克制AI幻觉,硅谷迷上了检索增强生成技术

0
分享至

现在的生成式AI工具还不完美,经常会“撒谎”,这就是所谓的幻觉。为了克制幻觉,开发者开发出一系列工具,最近在硅谷比较流行的工具是检索增强生成(Retrieval-augmented Generation,简称RAG)。



RAG是一种结合检索和生成技术的模型,它为大模型提供外部知识源,使得大模型具备从指定的知识库中进行检索,并结合上下文信息,生成相对高质量的回复内容,减少模型幻觉问题。例如,企业可以将所有的HR政策和福利信息上传到RAG数据库,AI聊天机器人聚焦于可以从这些文件中找到的答案。

听起来RAG似乎和ChatGPT技术没有什么太大差异,实际上差异蛮大的。Thomson Reuters用RAG技术开发出一套面向法务工作者的AI工具,其公司高管Pablo Arredondo说:“RAG不会单纯依靠初始训练生成的记忆来回答问题,它会利用搜索引擎收集真实文档,比如判例法、论文等,然后根据这些文档锚定模型的响应。”

例如,我们可以将某本杂志的所有内容上传到数据库,根据数据库内容回答问题。因为AI工具关注的信息面比较窄,信息质量更高,基于RAG开发的聊天机器人在回答问题时会比通用机器人更有深度。

RAG机器人会不会犯错呢?当然会,但它捏造内容的概率会降低。

研究人员认为,RAG方法有很大优势,在训练模型时,它所接受的信息都是事实,而且是可以追溯来源的事实。如果你能教模型对提供的数据进行分类,并在每个输出结果中使用、引用,那么人工智能工具就不太可能犯严重的错误。

用了RAG技术,幻觉能降低多少呢?一些研究者认为,幻觉可以达到很低的程度,但无法完全消除。换言之,RAG不是万能药。总体看,幻觉减少程度取决于两个核心要素:一是整体RAG的部署质量,二是对AI幻觉的定义。

并非所有的RAG都是一样的。在自定义数据库中,内容的精度影响着结果质量,但它并不是唯一影响因素。除了要关注内容的质量,还要关注搜索质量及基于问题的正确内容的检索。掌握过程中的每一步都至关重要,因为一个失误就可能使模型完全偏离。



斯坦福教授Daniel Ho说:“凡是在某个搜索引擎中使用自然语言搜索的律师都会发现,许多时候语义相似度影响巨大,它会导出完全不相关的资料。”

如何定义RAG应用中出现的幻觉也很重要。一些专家认为,判断RAG系统是否出现幻觉主要是看输出结果是否与数据检索时模型找到的答案一致。斯坦福大学则认为,要检查结果,看它是否基于提供的数据,是否符合事实。

在回答法律问题时,RAG系统明显比ChatGPT、Gemini更好,但它仍然有可能忽视细节,随机给出错误答案。几乎所有专家都认为,即使有了RAG系统,也需要人类参与,对引用信息进行双重检查,判定结果的准确率。

在法律领域RAG系统可以找到用武之地,在其它领域也一样。凡是需要专业知识的专业领域,AI系统给出的答案都应该锚定真实文件,所以RAG适合专业领域。

Daniel Ho说:“幻觉一直存在,我们还没有找到好办法真正消除幻觉。”虽然RAG可以降低错误率,但还是需要人类来判断结果如何。(小刀)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
高下立判!俄一人阵亡全家富裕,乌烈士父母花光积蓄给部队送物资

高下立判!俄一人阵亡全家富裕,乌烈士父母花光积蓄给部队送物资

大风文字
2024-11-15 18:25:43
网友夜间徒步命丧九峰山,家人哭晕,知情人透露更多细节

网友夜间徒步命丧九峰山,家人哭晕,知情人透露更多细节

魔都姐姐杂谈
2024-11-15 15:42:47
向全世界宣布!50亿光刻机厂落地浙江,阿斯麦傻了:越来越强大?

向全世界宣布!50亿光刻机厂落地浙江,阿斯麦傻了:越来越强大?

素年文史
2024-08-08 08:05:02
越南迫切需要高铁,为何中国不愿帮助越南修建高铁?原因很简单:

越南迫切需要高铁,为何中国不愿帮助越南修建高铁?原因很简单:

现代春秋
2024-11-14 23:51:24
老人饭量大,表明什么?饭量大的老人,会更健康?医生告诉你答案

老人饭量大,表明什么?饭量大的老人,会更健康?医生告诉你答案

荷兰豆爱健康
2024-11-15 16:06:20
连胜印尼巴林!记者:伊万18强赛前制定的计划,居然全都实现了

连胜印尼巴林!记者:伊万18强赛前制定的计划,居然全都实现了

直播吧
2024-11-15 00:18:23
自我批评!韦世豪发文:我是战犯!喷吧! 我只想说中国队牛逼

自我批评!韦世豪发文:我是战犯!喷吧! 我只想说中国队牛逼

直播吧
2024-11-15 02:48:00
晚19点,周琦表态遗憾,正式官宣决定,首钢男篮批准,许利民祝福

晚19点,周琦表态遗憾,正式官宣决定,首钢男篮批准,许利民祝福

体坛春秋
2024-11-14 22:32:14
电视打响免费第一枪?电视台下血本拉回流失用户,我们还会回去吗

电视打响免费第一枪?电视台下血本拉回流失用户,我们还会回去吗

阿凫爱吐槽
2024-11-15 11:27:19
郑爽近照流出!滞留美国又胖又秃,欠款1.2亿,依附白人男友生活

郑爽近照流出!滞留美国又胖又秃,欠款1.2亿,依附白人男友生活

火之文
2024-11-15 15:28:57
43岁伊万卡的面相变了!精明算计眼神发狠,盛世美颜不复存在

43岁伊万卡的面相变了!精明算计眼神发狠,盛世美颜不复存在

红袖说事
2024-11-14 10:20:14
教育部副部长陈杰,履新(附简历)

教育部副部长陈杰,履新(附简历)

鲁中晨报
2024-11-13 18:28:04
沉痛悼念!他于 10 月 8 日在北京逝世,享年84岁!

沉痛悼念!他于 10 月 8 日在北京逝世,享年84岁!

有趣的火烈鸟
2024-10-08 20:19:20
女子韩国旅游订房误以为是韩元,住一晚后被扣6万人民币

女子韩国旅游订房误以为是韩元,住一晚后被扣6万人民币

映射生活的身影
2024-11-14 11:01:33
外媒曝朴彩英牵涉吹牛老爹事件,不雅视频画面疑曝光,粉丝回应!

外媒曝朴彩英牵涉吹牛老爹事件,不雅视频画面疑曝光,粉丝回应!

古希腊掌管月桂的神
2024-11-14 23:00:11
9.2分,零差评,今年最值得看的动画来了

9.2分,零差评,今年最值得看的动画来了

天天美剧吧
2024-11-15 11:26:17
陈梦又回青岛了,背着香奈儿,穿粉色厚棉服,比赛之前染了新发色

陈梦又回青岛了,背着香奈儿,穿粉色厚棉服,比赛之前染了新发色

娱圈小愚
2024-11-12 08:56:50
真探丨广州15岁中学生获评正高级职称?当地人社局工作人员:可能性几乎没有

真探丨广州15岁中学生获评正高级职称?当地人社局工作人员:可能性几乎没有

红星新闻
2024-11-14 16:27:23
LG南京工厂裁员!N+3!

LG南京工厂裁员!N+3!

中国半导体论坛
2024-11-15 12:29:55
印尼媒体傻眼:中国队击败巴林,让印尼队垫底+处境愈发艰难

印尼媒体傻眼:中国队击败巴林,让印尼队垫底+处境愈发艰难

直播吧
2024-11-15 00:39:24
2024-11-15 21:36:49
极客网
极客网
科技使能新商业
2274文章数 2531关注度
往期回顾 全部

科技要闻

奇瑞董事长夸余承东:你改名余成功吧

头条要闻

外媒:特朗普胜选后首会外宾 宾主“惺惺相惜”

头条要闻

外媒:特朗普胜选后首会外宾 宾主“惺惺相惜”

体育要闻

我们究竟需要一支怎样的国家队?

娱乐要闻

俞灏明迎37岁生日,疑似与王晓晨相恋

财经要闻

GDP唯一负增长!这个经济特区难了

汽车要闻

配易四方+云辇-Z系统 仰望U7于广州车展亮相

态度原创

教育
本地
时尚
健康
公开课

教育要闻

你的大学我的大学好像不一样!这样的大道,赶紧看起来!

本地新闻

重庆记忆|山城特色“过山车”上天入地穿花海

最万能的“内搭”,美翻了!

花18万治疗阿尔茨海默病,值不值?

公开课

一块玻璃,如何改变人类世界?

无障碍浏览 进入关怀版