网易首页 > 网易号 > 正文 申请入驻

MIT对大模型数理原理的强有力证明

0
分享至


来源:清熙

笔者去年整理的,迎来了最强有力的实践证明!

原理回顾

笔者在“GPT4技术原理”系列文章梳理出来大模型数理认知框架如下图:


海量的文本或者多模态语料组成了大模型需要认知的外部世界的基本信息;嵌入构建高维概率化的语言空间,用来建模语言文字图像以及音视频,并对连续变量做离散化;

预训练以重整化群流的方式进行,在不同尺度上提炼语料数据中的信息概率分布;重整化群流的每一步流动(自回归预测逼近训练语料概率分布),都沿着最优输运的成本最低方向进行;

重整化群在不动点附近因新语料带来微扰而发生对称性破缺,滑入不同的相空间;不同的相空间,对应某种意义上的范畴,可形象化为信息的结晶;这是大模型从语料中学到的内部世界模型

在外部感官输入下(被提示置于某种上下文),大模型内部将限定在相应的高维语言概率空间的子空间内推理;推理是在子空间中采样,类比时跨范畴采样

采样不断进行,基于内部概率化了的世界模型(预训练获得的先验),针对感官输入(提示),做变分推断,最小化自由能,获取最佳采样分布q*,作为对导致感官输入的外部后验的预测。

可总结为:1、重整化从海量语料中提取出范畴,2、持续重整化驱动范畴解构重组结晶,3、生成过程于范畴中采样做变分推理。

笔者在文中针对重整化、范畴与transformer之间的关系做了详细的阐述:

重整化本质是尺度从小到大粗粒度化概率分布的过程,而深度神经网络擅长学习小尺度结构逐级到认知全局特征,而大模型的Transformer 则可以逆重整化流,逐尺度重建微观概率分布,从而完成生成。

这里的范畴是Transformer视角下的高维概率向量编织起来的事物之间的各种复杂的关系。从海量的预训练数据集中提纯出来,对大量的分段线性核函数参数化后的表达。这些关系,关系的关系,关系的关系的关系,本质上,在范畴论概念下,就是对事物的米田嵌入

最新实证

麻省理工学院 Markus J. Buehler 教授最近在《机器学习:科学与技术》发文【文献1】,展示了一种先进的 AI 方法:集成生成式知识提取、基于图的表征和多模态智能图推理。惊人地揭示了生物组织和贝多芬的“第九交响曲”之间的复杂性与秩序的共同模式。

该工作使用受范畴论启发的方法开发的作为中心机制,教模型理解科学中的抽象结构和它们之间的符号关系,通过关注对象及其交互,而不是它们的具体内容,来理解和统一不同的系统。

我们知道,范畴论中,对象可以是任何东西,从数字到更抽象的实体,如结构或过程,对应上文笔者讲的“事物”;形态则是定义这些对象之间关系的箭头或函数,对应上文中的“米田嵌入”。

Buehler 教授通过范畴对象和形态教会 AI 模型系统地推理复杂的科学概念和行为。通过形态引入的符号关系清楚地表明,AI不仅仅是在进行类比,而是在进行更深入的推理,以映射不同领域的抽象结构。

这也回应了近期大模型究竟会不会推理的业界大辩论。当大模型生成的时候,已经不是那个简单的 next token prediction, 而是基于丰富范畴的推理、推理、推理,重要的事情得说三遍。Ilya Sutskever最新访谈提到的「扩大正确的Scaling」,应该指推理的Scaling law。

其实是苹果学者想当然合成了语料;字节豆包大模型团队大规模实验发现大模型无法抽象出一般物理规则,从实验看并无法判断是否局部触发了scaling law。

Buehler 教授通过这个方式,分析了 1000 篇有关生物材料的科学论文,并将其转化为表征形式的知识图谱。


该图谱揭示了不同信息是如何连接的,并可找到与概念联系在一起的相关想法和关键点组。该图无标度,高度关联,可有效用于图推理


教AI系统思考基于图的数据,以帮助它们构建更好的世界模型表征,并提高思考和探索新想法的能力,以实现超出人类认知的高维新发现:回答复杂的问题,发现当前知识中的差距,提出新的材料设计,预测材料的行为方式,还能够将以前从未连接过的概念联系起来。

生物材料和“第九交响曲”之间出乎意料的相似之处:两者都遵循复杂性模式,生物材料中的细胞以复杂但有组织的方式相互作用以形成功能,贝多芬的第九交响曲则以创造一种复杂但连贯的音乐体验为目标安排音符和主题。

通过追踪联系进行图遍历,能够找到以前尚未建立的概念之间的联系,或未理解为以任何已知方式相关的概念。使用生成式 AI 模型的复杂推理可以提供更深入的见解,产生新的信息连接,从而产生新知识,甚至促进新想法的发现。

探索复杂的图遍历为分析提供广阔的空间,既可以确定单个最可能的路径,也可以对多个路径进行采样。图形是通过合并所有节点来构建的,即使它们来自不同的路径。整体图具有明显不同的拓扑结构,并在边缘编码的概念及其关系之间提供了新颖的联系。表明了非常灵活的图可以被构建并最终用于推理



图表征了相应领域知识的本体结构,可用于支持该特定科学研究中的推理,例如提出有关材料特性的假设或预测组合不同材料的可能结果,还可以帮助识别知识差距,提出新的研究领域,并促进对材料科学或不同学科之间复杂相互关系的理解。
学者在一项实验中,基于来自瓦西里·康定斯基 (Wassily Kandinsky) 的画作《构图 VII》中的抽象图案的灵感,AI 提出了一种新的基于菌丝体的复合材料:这种材料结合了一组创新的概念,包括混乱与秩序的平衡、可调节的特性、孔隙率、机械强度和复杂的图案化学功能。



基于宏大的人类知识提取出来丰富范畴,形成众多领域的本体知识结构,这是大模型通过预训练已经构建的内部世界模型;提高推理采样的机制,通过训练达成学习推理的scaling law,是大模型下一步努力提升的方向。

相比传统方法,新的大模型机理,具备更高维度的新颖性、对能力和技术细节的探索,可以通过揭示隐藏的联系建立更广泛有用的创新框架。AI 知识图驱动的跨学科研究可能会成为科学和哲学探索的有力工具。

文献1: Accelerating scientific discovery with generative knowledge extraction, graph-based representation, and multimodal intelligent graph reasoning https://iopscience.iop.org/article/10.1088/2632-2153/ad7228

数据 与 代码:https://github.com/lamm-mit/GraphReasoning

阅读最新前沿科技研究报告,欢迎访问欧米伽研究所的“未来知识库”


未来知识库是“ 欧米伽 未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。


截止到10月25日 ”未来知识库”精选的100部前沿科技趋势报告

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
克林顿夫妇的差距:一个老态龙钟手发抖宛如箭骸,一个中气十足

克林顿夫妇的差距:一个老态龙钟手发抖宛如箭骸,一个中气十足

又是秋风
2024-11-25 19:57:45
出大事情了,乌克兰空军雷达发现,俄罗斯发射一枚洲际导弹!

出大事情了,乌克兰空军雷达发现,俄罗斯发射一枚洲际导弹!

星辰故事屋
2024-11-22 19:19:41
749局高人揭秘:人死后大概率轮回为畜生,活人进入轮回永不超生

749局高人揭秘:人死后大概率轮回为畜生,活人进入轮回永不超生

飞云如水
2024-11-16 13:10:04
为什么华人很少跟白种女人交往?网友:一股牲口棚的味道谁顶得住

为什么华人很少跟白种女人交往?网友:一股牲口棚的味道谁顶得住

热闹的河马
2024-11-19 04:00:33
为何中国有那么多人患糖尿病?这是我见过很完美的回答!

为何中国有那么多人患糖尿病?这是我见过很完美的回答!

小啾咪侃侃史
2024-11-03 07:05:15
警惕!成都女子发现自家电子门锁被贴上了磁铁,怀疑被人踩点了

警惕!成都女子发现自家电子门锁被贴上了磁铁,怀疑被人踩点了

苗苗情感说
2024-11-26 01:17:30
兵败如山倒!国产新能源,撕下了二线豪华品牌最后的“遮羞布”

兵败如山倒!国产新能源,撕下了二线豪华品牌最后的“遮羞布”

玩车情报
2024-11-24 20:04:02
博世宣布全球裁员5500人

博世宣布全球裁员5500人

芯智讯
2024-11-25 11:39:25
董宇辉离开4个月,东方小孙大气复出,东方甄选股价大涨9%

董宇辉离开4个月,东方小孙大气复出,东方甄选股价大涨9%

壹号股权
2024-11-25 18:58:25
好色私枭赖昌星:拿下多个歌星影星,为抢女人抓走厦门黑老大

好色私枭赖昌星:拿下多个歌星影星,为抢女人抓走厦门黑老大

老黄有话
2023-10-23 08:00:13
全新丰田赛那上市,真正自带大床!

全新丰田赛那上市,真正自带大床!

沙雕小琳琳
2024-11-25 20:43:48
什么!服装行业要大爆雷?看这爆料细思极恐,网友:真的假的啊!

什么!服装行业要大爆雷?看这爆料细思极恐,网友:真的假的啊!

有趣的火烈鸟
2024-11-19 16:21:34
上赛季绿军的高级顾问!卢:范甘迪今天领到了他的冠军戒指

上赛季绿军的高级顾问!卢:范甘迪今天领到了他的冠军戒指

直播吧
2024-11-26 07:29:07
最“忙”女贪官落马!一年开房265次,房费高达38万,专挑小鲜肉

最“忙”女贪官落马!一年开房265次,房费高达38万,专挑小鲜肉

文史旺旺旺
2024-10-25 19:56:44
吴柳芳账号被禁止关注后掉粉6万,签约机构注册资本仅30万,曾因摇樱花树被骂上热搜

吴柳芳账号被禁止关注后掉粉6万,签约机构注册资本仅30万,曾因摇樱花树被骂上热搜

极目新闻
2024-11-25 11:32:32
伦纳德就是一个笑话!NBA现役10位75大巨星生涯总得分排名

伦纳德就是一个笑话!NBA现役10位75大巨星生涯总得分排名

大眼瞄世界
2024-11-15 23:10:13
罗伊斯谈杀入美职联西部决赛:不在乎是不是热门,要更努力工作

罗伊斯谈杀入美职联西部决赛:不在乎是不是热门,要更努力工作

直播吧
2024-11-26 04:38:06
28人获救,还有16人下落不明!搜救仍在继续→

28人获救,还有16人下落不明!搜救仍在继续→

鲁中晨报
2024-11-26 10:20:07
新华社消息|普京:俄将视其安全所受威胁程度继续测试新型导弹

新华社消息|普京:俄将视其安全所受威胁程度继续测试新型导弹

新华社
2024-11-23 10:40:31
许世友下葬后,王震用拐杖指着参加葬礼的众人:你们千万不能学他

许世友下葬后,王震用拐杖指着参加葬礼的众人:你们千万不能学他

历史龙元阁
2024-11-20 23:14:25
2024-11-26 11:03:00
人工智能学家
人工智能学家
人工智能领域权威媒体
3323文章数 37015关注度
往期回顾 全部

科技要闻

特朗普不补贴电车 加州:我补 但不含特斯拉

头条要闻

牛弹琴:特朗普又获重大胜利 洋洋得意发了篇长推文

头条要闻

牛弹琴:特朗普又获重大胜利 洋洋得意发了篇长推文

体育要闻

37岁,他用“半条右腿”重返巅峰

娱乐要闻

分手复合又打胎,黄晓明说希望是一场梦

财经要闻

刘煜辉最新演讲全文:蛇的策略

汽车要闻

特斯拉限时优惠:Model Y仅23.99万起 还能5年0息

态度原创

旅游
本地
时尚
教育
公开课

旅游要闻

北京环球影城迎来第一场“降雪”

本地新闻

城市24小时|领跑万亿城市,武汉“开挂”了?

今冬穿“奶甜风”的女生们,等着被夸吧!

教育要闻

评论区留言:要不要告诉孩子天赋已定,努力无法回天?

公开课

一块玻璃,如何改变人类世界?

无障碍浏览 进入关怀版