网易首页 > 网易号 > 正文 申请入驻

ChatGPT只算L1阶段,谷歌提出AGI完整路线图

0
分享至

丰色 发自 凹非寺
量子位 | 公众号 QbitAI

AGI应该如何发展、最终呈什么样子?

现在,业内第一个标准率先发布:

AGI分级框架,来自谷歌DeepMind。

该框架认为,发展AGI必须遵循6个基本原则

  • 关注能力,而非过程
  • 同时衡量技能水平和通用性
  • 专注于认知和元认知任务
  • 关注最高潜力,而非实际落地水平
  • 注重生态有效性
  • 关注整条AGI之路的发展,而非单一的终点

在此原则之上,AGI将呈现6大发展阶段,每个阶段都有对应的深度(性能)和广度(通用性)指标。

我们当前的AI产品走到哪一阶段了?这里也有答案。

详细来看。

6项基本原则

什么是AGI?

对于这个问题,许多科学家、研究机构都给出了自己的理解。

比如图灵提出的图灵测试认为机器是否能“思考”就是一个衡量指标;强人工智能的概念提出者则认为,AGI是一个拥有意识的系统;还有人说AGI一定是能在复杂性和速度上与人脑一样甚至超越人脑……

谷歌认为,这些定义都不全面。

像图灵测试,一些LLM已经可以通过,但我们能称那些模型为AGI吗?

像类人脑说法,Transformer架构的成功就已表明,严格基于大脑的思考过程对于AGI来说并不是必须的。

通过分析这些定义(一共9种,详情可翻阅原文)的优缺点,谷歌重新理出了6项基本原则:

一、关注能力,而非过程。

这可以帮助我们去除一些不一定是实现AGI的必备要求:

比如AGI不一定要用类似人类的方式思考或理解,也不意味着系统必须具有主观意识等能力(主要是这种能力无法也通过固定的方法去测量)。

二、注重通用性和技能水平。

目前所有的AGI定义都强调了通用性,这一点不必多说。但谷歌强调,性能也是AGI的关键组成部分(也就是可以达到人类的几分水平)。在后面的具体阶段制定中,主要也是根据这俩指标进行分类的。

三、专注于认知和元认知任务。

前者目前基本为共识,即AGI可以执行各种非体力任务。不过谷歌在此强调,AI系统执行物理任务的能力也需要加强,因为它对于认知能力是有推动作用的。

此外,元认知能力,如学习新任务或知道何时向人类寻求帮助,是系统走向通用性的关键先决条件。

四、关注最高潜力,而非实际落地水平

证明一个系统可以在给定的标准上完成任务,就足以宣布该系统为AGI,我们不要求一定得在开放世界中完全部署出水平相同的系统。

因为,这可能会面临一些非技术阻碍,比如法律和社会考虑、潜在道德问题。

五、注重生态有效性。

所谓生态有效性,谷歌指的是选择真正有用的现实任务去benchmark系统的进步,这些任务不仅包括经济价值也包括社会和艺术价值,要避开那些容易自动匹配和量化的传统AI指标。

六、关注整条AGI之路的发展,而非单一的终点。

这也是为什么谷歌要制定我们接下来将要看到的6个发展阶段。

6大必经阶段

AGI之路的6个阶段由深度指标(即技能水平,与人类相比)和广度指标(通用性)进行划分。

第零阶段为“No AI”,计算软件、编译器等属于该范畴,在通用性上只能执行human-in-the-loop任务。

第一阶段为“涌现级”(Emerging),技能相当于或略比没有相关技能的人类要强。

ChatGPT、Bard和Llama 2等大模型就属于该阶段,并且已经满足了该阶段要达到的通用性。

第二阶段可理解为“刚刚合格级”(Competent),可以达到正常成年人50%的水平。

像语音助手Sir、能在短文写作/简单编码等任务中达到SOTA水平的大模型都属于这一阶段。

不过,它们都只是在技能指标上合格了,通用性还够不上,也没有其它能够达到这一阶段通用性水平的AI产品。

第三阶段为“专家级”(Expert),可达到正常成年人90%的水平。

谷歌认为,拼写和语法检查器如Grammarly、图像生成模型Imagen等可以划为该阶段,主要也是在技能水平上达标了,通用性还不够。

第四阶段为“大师级”(Virtuoso),可达到正常人类99%的水平。

深蓝、AlphaGo等都属于。同样,还没有哪个AI产品可以达到属于这一级别的通用能力。

最后一阶段为“超人级”(Superhuman),在技能指标上,已经可以超越顶尖科学家的AlphaFold、AlphaZero也可划入该阶段。

毫无疑问,具备超人智能级通用性的AI还没诞生。

从中我们看出,按照谷歌这个标准来看,大多数已有AI产品其实都分别进入了不同的AGI阶段,但只仅限于在技能水平上——要谈及通用性,目前只有ChatGPT等模型完全合格。

但它们也只还处于最底层的“一级AGI”阶段。

不过,正如原则2所说,评价AGI就是要看这技能水平和通用性这两个指标,这样划分也算说得过去。

值得一提的是,我们可以看到,像DALLE-2这样的图像生成模型已经可以归类于“三级AGI”

谷歌给出的理由是,因为它生成的图像已经比大多数人都要强了(也就是超越90%人类)。

这一划分并未考虑大多数用户由于提示技巧不佳,无法达成最佳性能的情况。

因为遵循原则4,我们只需要关注一个系统的潜力到了就够了。

另外,对于最终阶段的AGI,谷歌畅想,它除了蛋白质结构预测,还可能能同时进行与动物交流、分析大脑信号、进行高质量预测等各种人类难以企及的任务,这样才不枉费我们的期待。

最后,对于这个层级划分,谷歌也承认还有很多事情要做:

比如在通用性维度上,应该用哪些标准任务集进行测量?完成多大比例的任务才行?有哪些任务是一定要满足的?

这些问题一时都不大可能全部摸清。

你同意谷歌提出的这些原则和阶段划分吗?

原文:
https://huggingface.co/papers/2311.02462

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
官宣:固态电池重大突破!

官宣:固态电池重大突破!

电动知家
2024-07-01 12:12:55
雷霆关键补强!Woj:自由球员中锋哈滕3年8700万加盟雷霆

雷霆关键补强!Woj:自由球员中锋哈滕3年8700万加盟雷霆

懂球帝
2024-07-01 22:13:11
广东宏远重要调整!朱芳雨曝新决定,教练位置变动,杜锋暂不回归

广东宏远重要调整!朱芳雨曝新决定,教练位置变动,杜锋暂不回归

多特体育说
2024-07-01 21:58:22
欲哭无泪,房山豪宅项目想换掉“黑物业”咋就这么难?

欲哭无泪,房山豪宅项目想换掉“黑物业”咋就这么难?

地产瞭望
2024-07-02 09:04:55
有公积金的恭喜了!24年7月1日执行!住房公积金提取限制取消!提取方式也变了!

有公积金的恭喜了!24年7月1日执行!住房公积金提取限制取消!提取方式也变了!

会计人
2024-06-30 11:07:18
离谱!狗仔曝万茜老公出轨,幽会神秘美女,美女疑似是万茜

离谱!狗仔曝万茜老公出轨,幽会神秘美女,美女疑似是万茜

不八卦会死星人
2024-06-30 19:13:02
Haynes:湖人给克莱2000万均薪报价 想用拉塞尔签换但被勇士拒绝

Haynes:湖人给克莱2000万均薪报价 想用拉塞尔签换但被勇士拒绝

直播吧
2024-07-02 05:21:06
刺配金州!梅尔顿2013年詹黑言论被挖 今日加盟勇士

刺配金州!梅尔顿2013年詹黑言论被挖 今日加盟勇士

直播吧
2024-07-02 09:46:18
温网首日中国军团4胜5负!男单2将过关,女单5人出局,郑钦文爆冷

温网首日中国军团4胜5负!男单2将过关,女单5人出局,郑钦文爆冷

我爱英超
2024-07-02 03:00:45
拜合拉木之后,又一年轻小将将被重用,张琳芃退出才发现人才良多

拜合拉木之后,又一年轻小将将被重用,张琳芃退出才发现人才良多

我就是一个说球的
2024-07-01 21:37:15
销售经理好心提醒:千万不要往马桶“倒水冲厕”,以免带来麻烦!

销售经理好心提醒:千万不要往马桶“倒水冲厕”,以免带来麻烦!

生活不过如此呀
2024-07-01 23:35:03
火箭行动了Shams:阿隆-霍勒迪2年1000万美元和火箭续约

火箭行动了Shams:阿隆-霍勒迪2年1000万美元和火箭续约

直播吧
2024-07-02 03:12:13
全败光了,73亿募资一分不剩,12万股民血本无归

全败光了,73亿募资一分不剩,12万股民血本无归

灰鸽观察室
2024-07-01 21:40:49
西媒:莫拉塔即将加盟卡迪西亚,后者转会费+合同支出5000万欧

西媒:莫拉塔即将加盟卡迪西亚,后者转会费+合同支出5000万欧

直播吧
2024-07-02 05:41:14
俄罗斯新防长真狠,直接把绍伊古按倒到地!

俄罗斯新防长真狠,直接把绍伊古按倒到地!

持续躺平中
2024-07-01 18:52:49
外国美女晒与中国男友合照,引评论区网暴,辱骂男方像杀人犯马加爵

外国美女晒与中国男友合照,引评论区网暴,辱骂男方像杀人犯马加爵

可达鸭面面观
2024-07-01 20:51:14
罐车运输乱象调查:卸完煤制油直接装运食用大豆油

罐车运输乱象调查:卸完煤制油直接装运食用大豆油

重案组37号
2024-07-02 08:15:32
我到会所点了一个女公关,竟然是我的美女上司,她让我保密

我到会所点了一个女公关,竟然是我的美女上司,她让我保密

乔生桂
2024-06-25 16:53:50
《中国好声音》歌手毕夏重伤住院!丈夫去世一年,后援会回应原因

《中国好声音》歌手毕夏重伤住院!丈夫去世一年,后援会回应原因

古希腊掌管月桂的神
2024-07-01 23:02:07
上合峰会召开在即,中俄最高层将出席,印度降级参会,莫迪不来了

上合峰会召开在即,中俄最高层将出席,印度降级参会,莫迪不来了

说天说地说实事
2024-07-01 21:04:42
2024-07-02 10:10:44
量子位
量子位
追踪人工智能动态
9604文章数 175390关注度
往期回顾 全部

科技要闻

“5年0息”!特斯拉变相降价

头条要闻

中国公布"稀土管理条例" 遭美媒诽谤"为潜在战争准备"

头条要闻

中国公布"稀土管理条例" 遭美媒诽谤"为潜在战争准备"

体育要闻

葡萄牙的神!他拯救C罗拯救葡萄牙

娱乐要闻

今年内娱最大的闹剧,该收场了

财经要闻

酒鬼酒甜蜜素风波后再迎人事变动

汽车要闻

奥迪Q6 e-tron Sportback官图曝光

态度原创

时尚
教育
房产
数码
手机

夏天这样穿吊带,轻松显瘦又性感

教育要闻

高考生成绩200多分,想上好就业挣钱多的专业,这一个怎么样?

房产要闻

官宣去库存!海南这一区域商办产品,已无限接近住宅!

数码要闻

首批Thunderbolt 5 电缆问世 但几乎没什么可插的地方

手机要闻

荣耀200系列即将全球发布 配置很给力 还有多项AI功能

无障碍浏览 进入关怀版