网易首页 > 网易号 > 正文 申请入驻

信息熵、语法熵、语义熵与语用熵

0
分享至

新华社北京6月25日电 人工智能(AI)中广泛使用的大语言模型不时出现的“一本正经地胡诌”是其难以克服的问题。近日,英国牛津大学研究团队开发出一种名为“语义熵”的新方法,有望大幅提升AI回答的可靠性。

大语言模型的“胡诌”在业界被称为“幻觉”,牛津大学计算机科学系的研究人员提出“语义熵”方法试图解决这一问题。在热力学中,熵描述的是系统的混乱或者说不稳定程度。这项研究中,熵衡量了大语言模型回答的不确定性,不确定性高意味着大语言模型的回答可能存在虚构。

该研究成果已发表在近期出版的英国《自然》杂志上。论文中说,如果AI对同一个问题,给出了许多语义相似的答案,那说明它对自己的回答比较有把握;反之,如果答案五花八门,那就意味着AI自己也“心里没底”,很可能是在“胡诌”。

研究人员利用“语义熵”方法,让大语言模型对同一问题生成多个答案,然后将语义相近的答案聚类,最后根据聚类结果计算熵值。熵值越高,表示大语言模型的回答越不确定。

值得注意的是,这一方法不仅考虑了大语言模型回答的字面差异,更关注语义层面

的一致性。这使得“语义熵”能够更准确地识别AI的“胡诌”,而不会被表达方式的多样性所迷惑。

研究结果表明,“语义熵”方法在多个数据集和任务中都表现出色,能有效检测大语言模型的错误回答,并通过拒绝回答不确定的问题来提高整体准确率。更重要的是,这一方法无需修改AI模型本身,可以直接应用于现有的大语言模型。

研究人员说,“语义熵”技术有望在问答系统、文本生成、机器翻译等多个领域发挥重要作用,帮助AI生成更可靠、更有价值的内容。这不仅将提升AI在实际应用中的表现,也将增强用户对AI系统的信任。

信息熵、语法熵、语义熵和语用熵是与信息理论和语言学相关的概念,它们分别从不同角度描述了信息在语言中的不确定性和复杂性。以下是对这些概念的简要解释:

信息熵是由克劳德·香农(Claude Shannon)提出的概念,用来量化信息的不确定性或信息量。在通信和数据压缩中衡量信息源的随机性。例如,在一个消息系统中,如果某个消息越难预测,它的熵就越高。对于一个离散随机变量 ( X ) 及其概率分布 ( P(X) ),信息熵 ( H(X) ) 定义为 ( H(X) = -\sum P(x) \log P(x) )。

语法熵指的是语言中由于语法规则引起的不确定性和复杂性。在自然语言处理中,语法熵可以用来衡量不同句子结构的复杂程度,以及生成或解析句子的难易程度。考虑生成一个句子时,语法规则(如主谓宾结构、时态、数等)的选择会影响语法熵。

语义熵是指由于词语和句子意义的多样性和模糊性引起的信息不确定性。在信息检索、机器翻译等领域,用于衡量词语含义的多样性和上下文依赖性。一个具有多重含义的词(如“银行”既可以指金融机构也可以指河岸)会导致较高的语义熵。

语用熵:语用熵关注的是语言在实际使用中的不确定性,涉及语言的上下文、隐喻、言外之意等因素。在语言理解和生成中,评估特定情境中的语言使用的复杂性和多义性。在社交互动中,一个句子的实际意义可能取决于说话者的意图、听众的背景知识和情境,这些因素一起构成了语用熵。

总结

  • 信息熵:衡量信息源随机性的基本概念。

  • 语法熵:与句子结构和语法规则相关的复杂性。

  • 语义熵:涉及词语和句子意义的多样性和模糊性。

  • 语用熵:关注语言在具体使用情境中的不确定性和复杂性。

这些概念共同帮助我们更好地理解语言信息的传递和处理过程中的多层次不确定性。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
重磅!美国更加焦虑了,德媒:中国以创纪录速度成为专利世界冠军

重磅!美国更加焦虑了,德媒:中国以创纪录速度成为专利世界冠军

闻道践行
2024-07-06 18:01:18
晚上睡觉开空调,切记别开26度,多亏空调安装师傅提醒,涨知识了

晚上睡觉开空调,切记别开26度,多亏空调安装师傅提醒,涨知识了

小俊分享
2024-06-22 23:37:02
苏巧慧被岛内网友骂惨了!基隆渔船被日扣押,她之前可不是这么说的

苏巧慧被岛内网友骂惨了!基隆渔船被日扣押,她之前可不是这么说的

冒泡泡的鱼儿
2024-07-06 18:42:03
欧洲杯最大黑幕,克罗斯谢幕战肮脏无比,欧足联力挺英法进决赛?

欧洲杯最大黑幕,克罗斯谢幕战肮脏无比,欧足联力挺英法进决赛?

极度说球
2024-07-06 14:36:58
马兴瑞远程观摩“亮剑昆仑”:把暴恐威胁消除在萌芽状态!

马兴瑞远程观摩“亮剑昆仑”:把暴恐威胁消除在萌芽状态!

政知新媒体
2024-07-06 18:40:30
7月6日俄乌:不要投降协议,乌克兰防空将获新支持

7月6日俄乌:不要投降协议,乌克兰防空将获新支持

山河路口
2024-07-06 17:02:30
上海即将迎来养老金调整待遇补发,养老金5000元,可以补发多少钱

上海即将迎来养老金调整待遇补发,养老金5000元,可以补发多少钱

社保小达人
2024-07-06 13:10:03
霸榜!热得和新疆争高下!39.6℃!这天开始,终于要凉快了...

霸榜!热得和新疆争高下!39.6℃!这天开始,终于要凉快了...

浙江天气
2024-07-06 17:35:42
潮汕女子画了60多幅“现代春宫图”,称:中国儿童缺少性教育

潮汕女子画了60多幅“现代春宫图”,称:中国儿童缺少性教育

附允历史观
2024-06-20 10:40:51
朝鲜出兵乌克兰正式参战?派出2万大军开赴前线,战斗力远超乌军

朝鲜出兵乌克兰正式参战?派出2万大军开赴前线,战斗力远超乌军

谈芯说科技
2024-07-02 20:21:55
被U型锁砸头的李建利现状:蔡洋没赔一分钱,十年康复欠医院158万

被U型锁砸头的李建利现状:蔡洋没赔一分钱,十年康复欠医院158万

简读视觉
2024-07-04 23:20:02
周总理辞世前嘱托陈永贵:斗争这么激烈,你不当副总理也是别人的

周总理辞世前嘱托陈永贵:斗争这么激烈,你不当副总理也是别人的

雪中风车
2024-06-30 15:07:43
英媒:拉维奇在中超周薪近80万镑,在中国踢球3年收入1.65亿英镑

英媒:拉维奇在中超周薪近80万镑,在中国踢球3年收入1.65亿英镑

直播吧
2024-07-05 20:54:21
向全世界宣布!中国潜艇连续重大突破,赶超美俄惊艳全世界

向全世界宣布!中国潜艇连续重大突破,赶超美俄惊艳全世界

笔墨V
2024-07-03 22:45:28
中国银行业协会党委原副书记、秘书长刘峰接受纪律审查和监察调查

中国银行业协会党委原副书记、秘书长刘峰接受纪律审查和监察调查

环球网资讯
2024-07-05 17:10:14
如果拜登真的退选了 | 解读

如果拜登真的退选了 | 解读

新京报
2024-07-05 22:23:49
《繁花》拍摄地“黄河路”将在7月27日开放!外围街景带大家先睹为快

《繁花》拍摄地“黄河路”将在7月27日开放!外围街景带大家先睹为快

周到上海
2024-07-06 13:19:53
白崇禧全身赤裸死在床上,儿子一语道破父亲在台湾的真实生活

白崇禧全身赤裸死在床上,儿子一语道破父亲在台湾的真实生活

春去花还在
2024-07-06 17:24:00
美航母增援中东撞上山东舰航母:美军出现异动,055大驱高速对冲

美航母增援中东撞上山东舰航母:美军出现异动,055大驱高速对冲

影孖看世界
2024-07-06 17:52:42
31岁出租司机报复出轨妻,内裤上涂药:让你有多爽就有多痛!

31岁出租司机报复出轨妻,内裤上涂药:让你有多爽就有多痛!

夜色暗涌
2023-07-02 18:10:02
2024-07-06 20:02:44
白驹谈人机
白驹谈人机
人机交互与认知工程实验室
352文章数 9关注度
往期回顾 全部

科技要闻

AI公司没看上去有钱

头条要闻

波密警方通报"孕妇川藏线逆行插队事件":多人被处罚

头条要闻

波密警方通报"孕妇川藏线逆行插队事件":多人被处罚

体育要闻

糟糕的裁判,毁了“提前上演的决赛”

娱乐要闻

49岁林志玲在日本带娃被偶遇

财经要闻

李迅雷建议每年发5万亿国债十年50万亿

汽车要闻

预售12.3万-15.7万 吉利银河E5开启预售

态度原创

健康
数码
艺术
亲子
军事航空

人类为何至今无法攻克渐冻症?

数码要闻

华擎发布修订版Intel Arc A770和A750 Challenger SE GPU 更新散热设计

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

亲子要闻

3月宝宝发热近40℃!奶奶称是被狗吓的,医生:“没这么简单”

军事要闻

美媒:美军向中国亮出"超远程武器" 瞄准中国预警机等

无障碍浏览 进入关怀版