网易首页 > 网易号 > 正文 申请入驻

在ICLR 2024这场演讲中,智谱AI首次公开神秘项目「GLM-zero」

0
分享至

机器之心报道

作者:蛋酱、杜伟

在机器学习社区中,ICLR (国际学习表征会议)是较为「年轻」的学术会议,它由深度学习巨头、图灵奖获得者 Yoshua Bengio 和 Yann LeCun 在 2013 年牵头举办。但 ICLR 很快就获得了研究者的广泛认可,并且在 AI 圈拥有了深度学习会议「无冕之王」的称号。

目前,ICLR 与 ICML、NeurIPS 并称为机器学习领域难度最大,水平最高的会议。从影响力上看,ICLR 长期处于 Google Scholar 全球所有学科中期刊、顶会的前十名。

今年,ICLR 已经来到了第十二届。5 月 7 日,ICLR 2024 在奥地利维也纳会展中心开幕。

或许是受到大模型技术浪潮的推动,无论是参会人数、论文提交量还是现场参会规模,ICLR 2024 的热度相比往年均有极大的提升。

从深度学习的兴起,到生成式 AI 带来的新一波浪潮,ICLR 算是见证了人工智能领域十多年来的发展史。在这个过程中,ICLR 也从第一届只有二十几篇接收论文的小型会议成长为投稿量超过七千的顶会。

历届 ICLR 论文数据图。图源:https://papercopilot.com/statistics/iclr-statistics/

大会首日的开幕式公布了 ICLR 2024 的一些数据和奖项:比如,在走过第一个十年后,ICLR 迎来了自己的首届时间检验奖,获奖研究《Auto-Encoding Variational Bayes》(VAE)对于今天深度学习和生成模型领域影响深远。

值得关注的是,本次大会上共有七场受邀演讲,Meta、谷歌等科技巨头悉数在列。

其中一场特邀演讲来自中国的 GLM 大模型团队,主题为《The ChatGLM's Road to AGI》。这也是国内鲜有的,大模型相关 Keynote 登上全球学术顶会的讲台。

大模型时代,AGI 会加速到来吗?

在演讲中,GLM 大模型团队回顾了近年来语言模型领域的技术演进与方向碰撞。

大模型技术显著提升了 AI 在各种任务上的表现,例如自然语言理解和文本生成、图像处理、多模态建模,催生了大众对 AGI 的真切期待。从技术上说,这些神奇能力与模型的「智能涌现」分不开,而「涌现」的底层逻辑是「Scaling Law」。

Open AI 的 Jason Wei 2022 年在谷歌工作期间,与 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文,揭示了重要结论:当模型较小时,性能是随机的,一旦模型规模到达一定阈值,性能就会显著超越随机。一般来说,模型越大,能力越强。

对于这种由量变引起的质变现象,人们称之为「涌现(emergence)」。如果「涌现」是真实存在的,那么 AGI 的实现可以依靠模型体量的增加而逼近。

但斯坦福团队的一项研究却提出了相反的观点:大模型能力是否涌现与任务的评价指标强相关,并非模型行为在特定任务和规模下的基本变化,换一些更连续、平滑的指标后,涌现现象就不那么明显了,而是更接近线性。

「它有连续性,但没有能力涌现。」这项具有警示性的研究还获得了 NeurIPS 2023 最佳论文奖。

论文链接:https://arxiv.org/pdf/2304.15004.pdf

目前,学术界对上述命题仍然存在争论。不过,GLM 大模型团队今年 3 月的一篇论文从预训练损失的角度重新讨论了模型涌现能力 —— 只有当预训练损失低于某个阈值时,模型才具有该能力。这为此后的研究提供了新的视角:Loss 才是涌现的关键,而非模型参数。

论文地址:https://arxiv.org/pdf/2403.15796.pdf

在近来的大模型浪潮中,GLM 大模型团队备受关注。去年 6 月,在科技媒体 The Information 的盘点中,GLM 大模型团队所属的智谱 AI,被视为最有可能成为「中国 OpenAI」的 5 家企业之一。

从 GLM 大模型团队的下一阶段目标中可以看出,除了「涌现」命题,GLM 大模型团队对于通往 AGI 的路径还有很多思考。

GLM 大模型团队表示,文本仍然是最关键的基础,而下一步应该把文本、图像、视频、音频等多种模态混合在一起训练,变成一个真正原生的多模态模型,然后还可以开发面向现实任务的虚拟助理,甚至是以大模型为中心的通用计算系统。

在这一设想中,通用计算系统可基于已有的 All-Tools 能力,再加上内存记忆 memory 和自我反馈 self-reflection 能力,模仿人类的 PDCA 机制,即 Plan-Do-Check-Act 循环,最终实现自我提升。

与此同时,如何大模型拥有人类的「无意识」学习机制,也是 GLM 大模型团队在探索的方向。

「最有希望成为中国 OpenAI」的团队,如何瞄准 AGI?

自 2019 年成立以来,GLM 大模型团队便开始了大语言模型的探索,并选择走开闭源并存的发展路线。

在整体布局上,GLM 大模型团队已经完成了全面对标 OpenAI,从基座模型到对话、文生图、代码、检索增强和视觉模型,包括 GLM、ChatGLM、CogView、CodeGeeX、WebGLM 以及 GLM-4V。这些模型的预训练过程中少不了针对中文语料的大量优化,这也是国产大模型发挥本土化优势的关键。

GLM 大模型团队在 2020 年后开始显现成果。从研发 GLM 预训练架构、到训练完成百亿参数的 GLM-10B、再到 2022 年千亿参数超大规模预训练模型 GLM-130B 的诞生,他们开始围绕这一强大的基座模型持续深拓。

2023 年 3 月,与 GPT-4 同一时间,GLM 大模型团队推出了基于千亿基座模型的对话模型 ChatGLM,理解用户、遵循指令、回答问题的效果显著提升。同时选择开源中英双语对话模型 ChatGLM-6B,实现单张消费级显卡上的本地部署。随后的 6 月和 10 月,GLM 大模型团队又迎来第二代和第三代 ChatGLM,保持三到四个月一次的模型迭代频率。

随着今年初新一代基座大模型 GLM-4 的到来,GLM 系列模型实现了性能比肩 GPT-4,自然语言、多模态、Agent 能力全方位提升的同时推理速度更快、成本更低。

目前,GLM 系列大模型的研究成果已经涵盖了数学、文生图、图像理解、视觉 UI 理解、Agent 等领域。以 ChatGLM-Math 为例,该模型通过独特的「Self-Critique」迭代训练方法和自我反馈机制,实现了 LLM 的数学能力的进一步强化。

论文地址:https://arxiv.org/pdf/2404.02893

与此同时,CogView 文生图模型、CodeGeeX 代码模型、CogVLM 多模态理解模型、GLM-4V 多模态大模型和 All-Tools 功能以及 AI 助手智谱清言也在持续进步,比如基于 CogVLM 开发的具有视觉 Agent 能力的模型 CogAgent、更快更精细的文生图模型 CogView3、让多模态模型具有操作链的通用视觉语言模型 CogCoM。

快速迭代的大模型能力,让研究者们更加期待 GLM 大模型团队未来的进一步动作。在演讲中,GLM 大模型团队深入解读了 GLM 系列大模型下一阶段面向 AGI 的三个探索方向。

第一,GLM-4 的后续升级版本,即 GLM-4.5 及其升级模型,它们将基于超级认知 SuperIntelligence 和超级对齐 SuperAlignment 技术打造。

在持续提升文本能力的基础上,GLM 大模型团队计划将文本、图像、视频、音频等多种模态混合在一起训练,构建真正原生的多模态模型,同时超级对齐 SuperAlignment 技术协助将提升大模型的安全性。

第二,提出 GLM-OS 概念,即以大模型为中心的通用计算系统,旨在解决更加复杂的问题。

在 ICLR 现场,GLM 大模型团队详细阐述了 GLM-OS 的实现方式:基于已有 All-Tools 能力加上内存记忆 memory 和自我反馈 self-reflection 机制,GLM-OS 有望实现模仿人类的 Plan-Do-Check-Act 循环。首先做出计划,然后初步尝试形成反馈,基于反馈结果调整规划,然后再行动以期达到更好的效果。大模型依靠 PDCA 循环机制形成自我反馈和自我提升 —— 恰如人类自己所做的一样。

第三,GLM 大模型团队在现场首次公开了名为「GLM-zero」的技术项目。

这一项目是在 2019 年开展的,旨在研究人类的「无意识」学习机制。该机制是人类认知能力的重要组成部分,包括自我学习 self-instruct、自我反思 self-reflection 和自我批评 self-critics。

「当人在睡觉的时候,大脑依然在无意识地学习。」GLM 大模型团队表示,人脑中存在着反馈 feedback 和决策 decision-making 两个系统,分别对应着大模型和内存记忆两大部分,GLM-zero 的相关研究将进一步拓展人类对意识、知识、学习行为的理解。

GLM 大模型团队认为,尽管还处于非常早期的研究阶段,但 GLM-zero 可以视为通向 AGI 的必经之路

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
三星杯决赛-丁浩战胜党毅飞扳平比分 22日进行决胜局

三星杯决赛-丁浩战胜党毅飞扳平比分 22日进行决胜局

直播吧
2024-11-21 16:56:14
中国人抱团在巴黎开荒种菜,当地市长:中国人太勤劳了

中国人抱团在巴黎开荒种菜,当地市长:中国人太勤劳了

齐鲁壹点
2024-11-21 06:50:22
“宝玉”欧阳奋强发文悼念郑铮:愿鸳鸯姐姐在天堂一切安好,缅怀永远的朋友

“宝玉”欧阳奋强发文悼念郑铮:愿鸳鸯姐姐在天堂一切安好,缅怀永远的朋友

鲁中晨报
2024-11-21 15:08:20
美国大学生自制火箭飞上 143km 高空,打破国际业余航空高度纪录

美国大学生自制火箭飞上 143km 高空,打破国际业余航空高度纪录

IT之家
2024-11-20 13:05:09
WTT福冈总决赛,王曼昱如果打不进决赛,真对不起她的签位!

WTT福冈总决赛,王曼昱如果打不进决赛,真对不起她的签位!

田先生篮球
2024-11-21 11:28:57
大S的结局太悲催!“二汪”回了北京!具俊晔跑了!钱在老梅手里

大S的结局太悲催!“二汪”回了北京!具俊晔跑了!钱在老梅手里

花花lo先森
2024-11-21 14:42:02
字母哥轰41+9+8仍无缘今日最佳!抱歉!你碰到NBA奇迹了

字母哥轰41+9+8仍无缘今日最佳!抱歉!你碰到NBA奇迹了

篮球大视野
2024-11-21 14:38:56
Lisa最新舞台妆造曝光!一脸油光身材走样,为迎合欧美太拼了

Lisa最新舞台妆造曝光!一脸油光身材走样,为迎合欧美太拼了

阅毒君
2024-11-20 15:10:18
俄对外情报局局长:北约成员国保障乌军用远程导弹打击俄目标必将受到惩罚

俄对外情报局局长:北约成员国保障乌军用远程导弹打击俄目标必将受到惩罚

财联社
2024-11-20 17:01:23
夏洛特公主8岁大变样:身高腿长像戴安娜,眼神凌厉仿佛女王再现

夏洛特公主8岁大变样:身高腿长像戴安娜,眼神凌厉仿佛女王再现

照见古今
2023-10-19 14:44:33
杨澜:婚姻可以图男人有钱、有权、有潜力,千万别只图他对你好

杨澜:婚姻可以图男人有钱、有权、有潜力,千万别只图他对你好

清风拂心
2024-11-08 16:43:21
芒果台8年编导自曝被裁:发不出工资,所在内容生产部门被一锅端

芒果台8年编导自曝被裁:发不出工资,所在内容生产部门被一锅端

小萝卜丝
2024-11-20 17:05:14
四川男子把黑鱼遗忘在“牛槽”内,一年后想不到它竟瘦成小蝌蚪!

四川男子把黑鱼遗忘在“牛槽”内,一年后想不到它竟瘦成小蝌蚪!

椰青美食分享
2024-11-21 14:39:36
楼上楼下都开地暖,如何避免中间住户蹭暖?网友:下次我也这么做

楼上楼下都开地暖,如何避免中间住户蹭暖?网友:下次我也这么做

蜉蝣说
2024-11-19 10:44:37
果不其然,美骗了全世界?特朗普对中国不装了!释放信号不简单

果不其然,美骗了全世界?特朗普对中国不装了!释放信号不简单

宏说天下
2024-11-20 18:06:06
安徽一中学女老师跳湖溺亡:监控拍下经过,亲哥声讨,死因披露

安徽一中学女老师跳湖溺亡:监控拍下经过,亲哥声讨,死因披露

娜乌和西卡
2024-11-21 09:43:21
美国第二号权势人物,不会是万斯,更不会是马斯克

美国第二号权势人物,不会是万斯,更不会是马斯克

寰宇大观察
2024-11-21 19:35:03
有一种美叫徐枫灿的腿,褪去军装神似"华为二公主",网友喊话出道

有一种美叫徐枫灿的腿,褪去军装神似"华为二公主",网友喊话出道

洲洲影视娱评
2024-11-20 18:41:36
74年李先念找李德生谈话:我级别比你低,要你辞职是毛主席的意思

74年李先念找李德生谈话:我级别比你低,要你辞职是毛主席的意思

历史详说官
2024-11-18 10:43:39
揪心!权志龙现身仁川机场,走路飘忽,浑身不自在,状态引人担忧

揪心!权志龙现身仁川机场,走路飘忽,浑身不自在,状态引人担忧

花花lo先森
2024-11-21 14:44:10
2024-11-21 20:36:49
机器之心Pro
机器之心Pro
专业的人工智能媒体
9734文章数 142066关注度
往期回顾 全部

科技要闻

“已全面投产,需求惊人”

头条要闻

多辆小米SU7自动泊车撞墙撞柱 官方:系统BUG承担维修

头条要闻

多辆小米SU7自动泊车撞墙撞柱 官方:系统BUG承担维修

体育要闻

点燃队唯一会防守的球员,是真靠谱啊

娱乐要闻

王宝强被指涉嫌欺诈1亿

财经要闻

杨伟民:应加大对低收入群体转移支付力度

汽车要闻

10万级的星海S7 也能带来高配生活

态度原创

房产
家居
健康
游戏
公开课

房产要闻

颠覆!增城TOP级生活圈唯一新盘登场!重塑生活典范!

家居要闻

黑白简约 激发多样情感

花18万治疗阿尔茨海默病,值不值?

梦幻西游“史二法”黑总加盟曲阜孔庙,王谢管家当区霸抢地煞?

公开课

一块玻璃,如何改变人类世界?

无障碍浏览 进入关怀版