网易首页 > 网易号 > 正文 申请入驻

加州伯克利联合研究首次证实:LLM以人类难以监控的方式获取知识,进行高级推理

0
分享至

  

  加州大学伯克利分校、多伦多大学、Vector研究所,Anthropic等机构的研究人员arxiv发表一篇论文《连接点:大语言模型(LLMs)可以从不同的训练数据中推断并表达潜在结构》‍

在本研究发表之前,人们还不清楚 LLM 是否能在没有显式上下文示例的情况下从训练数据中推断出潜在信息,这可能会让大语言模型以人类难以监控的方式获取知识

  

  研究人员提出并定义了"归纳性上下文外推理(OOCR)"概念: 一种新型的学习和推理能力,指大型语言模型能够从训练数据中分散的隐含信息中推断出潜在知识,并在没有上下文的情况下应用于下游任务。这个概念的提出为研究语言模型的推理能力提供了新的视角

  研究人员们精心设计了五个不同领域的任务来评估OOCR能力,包括位置推断、硬币偏差估计、函数学习、函数混合学习和奇偶性学习。这些任务涵盖了不同类型的潜在结构,为全面评估模型的OOCR能力提供了基础

  为了便于理解,做一个简单的示意图,如下‍‍‍‍‍

  

  函数混合学习(Function Mixture Learning)是一种机器学习方法,用于在给定任务中结合多个不同的模型或函数来提高预测性能和泛化能力。其基本思想是将多个不同模型的优点结合起来,从而形成一个强大的预测系统。这种方法通常用于处理复杂的非线性数据或在单一模型难以取得最佳性能的情况下

  奇偶性学习(Parity Learning)是一种涉及对称性和模式识别的学习问题,在计算理论和机器学习中有重要的应用

  以下是研究一些重要发现

  1.发现模型能够"连接点"

  研究结果表明,即使在没有明确上下文学习的情况下,大型语言模型也能够从分散的训练数据中推断出隐含信息。这种能力超越了简单的模式匹配,展示了模型具有更高级的推理能力,模型的权重和激活正在以不透明的方式进行复杂的推理,LLM 正在多个训练示例中 "连点成线"

  2.微调获得更优OOCR能力

  ‍‍

  比较了微调和上下文学习: 研究发现,通过微调获得的OOCR能力优于在上下文中学习的能力。这一发现强调了模型在训练过程中学习潜在值的重要性,而不仅仅是在单次前向传播中回忆记忆的训练示例

  具体来说

  经过微调后,LLM 无需提供任何上下文示例,也无需使用思维链推理,就能展现出非凡的能力:

  a) 它能为函数 f 生成正确的 Python 代码定义

  b) 它能计算 f^(-1)(y) - 找到能产生给定输出 y 的 x 值

  c) 它能将 f 与其他运算进行组合,将 f 与其他函数依次应用。

这表明,尽管 LLM 从未接受过关于这些任务的明确训练,但它已在微调过程中以某种方式内化了函数的结构 从论文中研究表明,LLM 可以学习和处理更复杂的结构,如函数混合学习,而无需明确的变量名或有关潜在结构的提示

  3.规模效应

  ‍‍

  观察到规模效应: 通过比较GPT-3.5和GPT-4的表现,研究者们发现模型规模越大,OOCR能力越强。这一发现为未来更大规模模型的发展提供了重要参考

  ‍‍

  4.AI安全

  研究指出,OOCR能力可能对监控和控制语言模型获取的知识构成潜在障碍。这一发现对AI安全研究具有重要启示,提醒我们需要更加谨慎地考虑模型可能获取的隐含知识

  局限‍‍

  OOCR能力在简单领域中已经显现,但在更复杂的结构中仍然不够稳定和可靠

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
首轮投票结果出炉,伊朗新总统“选而未决”

首轮投票结果出炉,伊朗新总统“选而未决”

中国新闻周刊
2024-06-30 13:35:11
大陆考察团抵达台岛,台当局回应卢沙野大使讲话,“台独”跳脚了

大陆考察团抵达台岛,台当局回应卢沙野大使讲话,“台独”跳脚了

说天说地说实事
2024-06-30 14:35:57
亏损超1.6亿,谢霆锋新片票房崩塌,我五味杂陈:港片输掉了独苗

亏损超1.6亿,谢霆锋新片票房崩塌,我五味杂陈:港片输掉了独苗

靠谱电影君
2024-06-30 22:56:01
女子遭黑车司机性侵,为留证据主动提出不戴套,最恶心的一幕发生了……

女子遭黑车司机性侵,为留证据主动提出不戴套,最恶心的一幕发生了……

沫姐美食记
2024-05-24 07:55:06
中国为什么还有人愿意买三星手机?是人傻钱多,还是人间清醒

中国为什么还有人愿意买三星手机?是人傻钱多,还是人间清醒

手工制作阿歼
2024-07-01 07:55:14
这跟不穿有啥区别,巴黎之夜“敢露”女星:肯豆、郭采洁、谷爱凌

这跟不穿有啥区别,巴黎之夜“敢露”女星:肯豆、郭采洁、谷爱凌

三月柳
2024-06-27 16:59:26
取消对华免签,还拒绝中国的高铁,甚至放言:“不欢迎中国人”!

取消对华免签,还拒绝中国的高铁,甚至放言:“不欢迎中国人”!

星辰故事屋
2024-06-18 10:54:05
现在是7月1日下午,突然曝出4个重大消息!又要来大动作吗?

现在是7月1日下午,突然曝出4个重大消息!又要来大动作吗?

股市皆大事
2024-07-01 09:37:15
广东知名主持人郑达退休后的生活,竟然比上班还赚钱?

广东知名主持人郑达退休后的生活,竟然比上班还赚钱?

小椰的奶奶
2024-07-01 07:50:02
万物皆有磁场!这些“衣服”里隐藏着凶兆,聪明人都不穿!

万物皆有磁场!这些“衣服”里隐藏着凶兆,聪明人都不穿!

神奇故事
2024-06-28 17:45:18
取消对华免签后香蕉堆积卖不掉,我国从邻国进口让其眼红:凭啥不买我们的!

取消对华免签后香蕉堆积卖不掉,我国从邻国进口让其眼红:凭啥不买我们的!

冬天来旅游
2024-06-22 07:45:17
“七一”前夕,省委书记、省长去往“英雄城市”

“七一”前夕,省委书记、省长去往“英雄城市”

政知新媒体
2024-06-30 19:58:57
董明珠“开怼”全靠代工背后:小米空调年出货已达440万台

董明珠“开怼”全靠代工背后:小米空调年出货已达440万台

快科技
2024-06-30 11:34:08
男子带岳母捉奸妻子,妻子却说:人家活好器大,伺候得我很舒服!

男子带岳母捉奸妻子,妻子却说:人家活好器大,伺候得我很舒服!

好笑娱乐君每一天
2024-06-23 07:10:02
广东一男子因不满志愿填报殴打女儿,被拘留10日

广东一男子因不满志愿填报殴打女儿,被拘留10日

环球网资讯
2024-07-01 13:00:53
快船连续签约达成!管理层遭讽刺,三巨头解体,哈登难圆梦总冠军

快船连续签约达成!管理层遭讽刺,三巨头解体,哈登难圆梦总冠军

呆哥聊球
2024-07-01 14:47:46
A股:好消息,国家队逼空反弹,坏消息,股民消费的更多了!

A股:好消息,国家队逼空反弹,坏消息,股民消费的更多了!

兵哥闲聊
2024-07-01 12:07:37
重磅!鼎益丰关键人物隋某某被抓?多方回应:以官方红头文件通知为准

重磅!鼎益丰关键人物隋某某被抓?多方回应:以官方红头文件通知为准

和讯网
2024-07-01 13:17:29
“欠中国的钱全还清了”,公开力挺中国,大量天然气将直达我国

“欠中国的钱全还清了”,公开力挺中国,大量天然气将直达我国

星辰故事屋
2024-05-28 19:23:27
关于接受梁耀峰同志辞职请求的决定

关于接受梁耀峰同志辞职请求的决定

掌中邯郸
2024-06-30 13:42:56
2024-07-01 15:22:44
AI寒武纪
AI寒武纪
专注于人工智能,科技领域
221文章数 82关注度
往期回顾 全部

科技要闻

小米汽车加快门店布局,6月交付量已经破万

头条要闻

急诊专家分析国羽张志杰猝死:现场错过3个救命环节

头条要闻

急诊专家分析国羽张志杰猝死:现场错过3个救命环节

体育要闻

他们距离创造历史,只差1分33秒

娱乐要闻

今年内娱最大的闹剧,该收场了

财经要闻

宁德时代,再遭空袭!

汽车要闻

奥迪Q6 e-tron Sportback官图曝光

态度原创

教育
房产
亲子
旅游
本地

教育要闻

跨学科主题教学的难点

房产要闻

20亿!又有国企要卖海南资产!

亲子要闻

咸蛋黄蒜香烤南瓜,咸香甜糯,好吃到吮指

旅游要闻

一大巴翻覆致两名中国游客身亡 马来西亚将对涉事旅行社启动调查程序

本地新闻

冷知识:东北雪糕才是最早的网红雪糕

无障碍浏览 进入关怀版