网易首页 > 网易号 > 正文 申请入驻

AI现场发了2万红包,打开了大模型Act时代

0
分享至

机器之心原创

编辑:泽南、杜伟

我们需要的是「真正解放双手的智能体」。

最近一段时间,大模型领域正在经历智能体(AI Agent)引发的革命。Anthropic 推出的升级版 Claude 3.5 Sonnet,一经推出即引爆了 AI 圈。

作为新一代 AI 智能体,它跨过了大模型的次元壁,能够像人一样直接操纵电子设备,根据你给出的自然语音指令移动光标、点击相应位置以及通过虚拟键盘输入信息,模仿人类与计算机的交互方式。大家都在自发探索智能体的使用方法,比如有人已经在用智能体自动代肝崩铁每日任务了。



除了打游戏,在工作环境中智能体还可以接管很多日常事务,比如撰写邮件、安排会议、整理文件等等,据说从科研到写代码样样都行。

有人表示,智能体工具的出现标志着全新人机交互范式踏出了新的一步。

没过多久,国内公司就拿出了对标的产品,而且还更进一步,一次性实现了手机、PC、AI 原生硬件的覆盖

今天上午,智谱 Agent 宣布升级,开放「百万内测」申请,翻开了人机交互体验的新一页。



这是智谱第一个产品化的智能体 Agent,可以做到让 AI 通过语音直接操纵硬件设备,还能跨不同 App 全局操作。

在发布会现场,智谱 CEO 张鹏展示了一番智能体的能力。让 Agent 与现场观众建面对面群聊。



发一个总计两万块钱的红包。



AI 发的红包瞬间就抢空了。不得不说谢谢张总,谢谢 AI Agent。

深入手机、PC,能自己做主

智谱智能体的手机版 AutoGLM 与电脑版 GLM-PC,内测阶段覆盖部分常用的 App 及应用。AutoGLM 支持包括微信、抖音、小红书、微博等社交平台、美团、饿了么、等美食平台、淘宝、京东、拼多多等购物平台、高德和百度地图等出行平台、以及 12306、去哪儿、携程等旅游订票平台。

用户打开 AutoGLM 后,只需要动动嘴(当然也支持文字输入),就能让智能体接管自己的手机,并在上面这些 App 上自动执行任何指令任务,比如在微信上对某个公众号的文章进行摘要总结、在高德地图上为你规划出行路线,等等。

此次,智谱给 AutoGLM 进行了一系列能力升级。基于这些新能力,我们看到了一些新玩法。

一是「更长」,即 AutoGLM 可以理解、遵循并自主完成超长、复杂的指令,支持超过 50 步的无打断连贯操作。在长任务上执行的速度比人类实操还要快。



二是「跨 App」,即 AutoGLM 在更强大泛化能力和思维链的加持下,支持复杂任务的跨 App 操作。有了这个智能体,用户与应用之间多了一个可以自动执行的调度层,省去了在不同 App 之间来回切换的麻烦,实现了这些 App 之间的协同操作。

我们以不同 App 之间的信息分享为例,命令 AutoGLM「在小红书上种草几款单反相机,然后分享到微信的『编辑部之插科打诨』群」,操作很丝滑。



再比如跨不同 App 购物,AutoGLM 也能一气呵成。



更多新玩法进一步拓展了 AutoGLM 的功能,包括「短口令」,类似于手机上的快捷指令。在这种模式下,AutoGLM 可以一键存储用户自定义的快捷短口令,在触发该指令后自动发起并执行关联长任务。

更有意思的还有「开盲盒」,AutoGLM 会默认跳过对话步骤,对于用户发出的模糊指令,让 AI 主动帮你完成选择。过程中只有在涉及重要操作(比如支付)时才会进行二次确认。



AutoGLM 的自主执行能力还扩展到了网页端。智谱在浏览器(Google Chrome 和 Microsoft Edge)的智谱清言插件上提供了 AutoGLM-Web 功能。该功能适配了知乎、微博、X 和豆瓣等社媒网站,百度、谷歌和必应等搜索引擎,百度学术、谷歌学术和 arXiv 等学术网站,以及 GitHub 代码托管网站和资讯类网站。

在这些网站上,智能体遵循用户指令,可以自动执行站内搜索、内容总结、生成 arXiv 日报、搭建 GitHub 仓库、在微博超话签到等个性化功能,可玩性不错。如下所示,我们可以让它自动帮我们在微博分享新鲜事。



在桌面端,智谱同样推出了像人一样操作计算机软件的应用 GLM-PC,它基于通用视觉大模型 CogAgent 的理解与任务规划能力,让用户通过简单的一句话指令执行复杂任务。



比如查询并总结网页上的信息,并通过微信发送给别人:



在淘宝上买 XL 码的羽绒服并购买:



即将上线的隐形屏幕功能更加科幻。AI 可以在不打扰你的情况下提供帮助,解放屏幕使用权给人,自己在另外一个隐形屏幕上完成工作。



从实现原理来讲,GLM-PC 在充分理解用户指令后对任务进行规划,然后识别电脑界面中的窗口、图形、文字等信息,然后自动操作电脑。另外,这个 AI 助手在使用过程中可以根据页面信息更改计划并自我纠错,从而更好地完成任务。

据介绍,GLM-PC 尤为擅长处理办公场景,可以在微信、飞书、钉钉、腾讯会议等平台执行多样性任务,比如发送信息、预定和参与会议。同时支持浏览器网页搜索以及网页内容的阅读总结、翻译,还能进行多种文档处理,包括下载、发送和总结。



打开并加入飞书会议。



邮件发送会议纪要。

不仅如此,智谱还实现了 GLM-PC与手机端的联动。用户现在可以在手机上远程向 GLM-PC 发消息,让它自动进行电脑端操作。



最后,智谱在发布会现场表示,要对十个亿级 App 进行免费 Auto 升级。荣耀、华硕、小鹏汽车等大厂,高通、英特尔等硬件、芯片厂商也纷纷站台,介绍了与智谱的合作。

随着端到端、多模态、视频等新能力的大模型出现,大模型已经初步具备了和物理世界互动的能力。

我们能够逐渐想象出山姆·奥特曼口中「前所未有的自然交互」的样子,但眼前能够接触到的很多落地产品,却似乎总是差点意思。这可能是因为想要构建颠覆性的产品,需要的不止是大模型能力,还有对于技术方向的提前预判,以及完整系统的优化。

在探索大模型智能体能力边界的过程中,智谱逐渐获得了两个重要的观察。
首先,智能体和推理本质上服从着同大模型训练类似的 Scaling Law。智能体通过和环境交互,模型获得来自环境的反馈监督信号,具有类似的规模扩展效应。这说明通过扩展计算规模,我们可以持续地提升大模型智能体的表现水平。
在新的 Scaling Law 背后,智谱设计了 WebRL,一个自进化在线课程强化学习算法框架。通过引入大模型特有的自进化演化策略,并利用课程学习实现智能体由易到难进行泛化,并最终借助在线 off-policy 强化学习,AutoGLM 实现了在线环境中的智能体扩展规律。
其次,智谱进一步的探索发现了Agent 存在 Emergent Ability,即能力涌现

10 月发布之初,AutoGLM 还只能在单个应用、短距离任务上展现能力。然而,随着工程师们进一步训练和规模的扩展,最新版本的 AutoGLM 已初步具备跨应用、长距离任务的胜任水平,甚至能够能遵从复杂指令在从未见过的 App 应用中操作。

其实在发展大模型基础技术之外,智谱最近还一直在推进另一件事:构建体系。



由于多模态大模型的出现,现在的 AI 已经具备了语义理解、屏幕内容解析和行为语义理解等能力。接下来要做的似乎就是找到一种机制,让大模型能够一步一步地解题。

智能体(AI Agent)就是用来执行这样复杂的任务的。它既具有自主性,又能进行环境交互,可以分解复杂任务进行规划,使用专业的模型或外部工具来提升自身能力,还拥有远超大模型本身的记忆能力。

这意味着加入智能体之后,手机这样的设备可以利用相对轻量级的模型,承载起更加复杂的自动化任务。

此前在业内,一些科技大厂、创业公司和手机厂商已在 PC、AI 手机上构建了智能体能力,并获得了不错的效果。但从技术发展的角度来看,这往往是各自产品路线的延伸。智谱提供的解决方案在此基础上还会覆盖汽车、智能眼镜、智能音箱,甚至具身智能的机器人等 AI 原生硬件,体现出了另一种思路。

智谱认为,将来不同的硬件设备都可能由统一体系的 AI 智能体来操作,这样才能实现人机交互的提升。为此,他们也在芯片、应用 App、操作系统 OS 和模型侧进行了提前布局。

这其中包括与芯片、终端厂商持续合作,从硬件底层进行优化,以及持续优化端侧大模型的能力。在 10 月高通骁龙 8 至尊版发布时,智谱就宣布已联合高通对最新一代端侧视觉大模型 GLM-4V 进行了深度适配和推理优化。在端侧部署后,今年的新一代旗舰手机已经可以支持丰富的多模态交互方式,让人们获得更加情境化、个性化的终端侧智能体验。

智谱也和众多手机、电脑厂商合作,在 AI PC、手机端智能助手领域给大模型进行落地。率先亮出 AI 智能体操作手机的荣耀,就在九月份与智谱达成了 AI 大模型技术的战略合作。

本周,智谱还与英特尔、机械革命联合发布了专为程序员设计的 CODE AI 程序员笔记本,预装了基于端侧的智能编程助手。

通过端侧芯片性能优化和端云一体架构,智谱的大模型智能体技术,不久后将出现在越来越多的设备上。

Agent 的尽头是什么?

尽管目前的技术还在初期,但 AI 智能体已经展现出了前景。

其实仔细一想:过去键盘鼠标、触控屏幕这样物理交互的形式,从 DOS、Windows 再到 iOS、安卓等操作系统,都是为了让人更好地与机器沟通。

大模型正在走一条相反的路,让我们无需花费大量时间去理解各种应用的复杂界面,减少机械的劳动,反过来让机器适应人类。

智谱 CEO 张鹏在发布会上表示:「目前的 Agent 能力更像是在用户和应用、设备之间增加一个智能的调度层。可以看做是大模型通用操作系统 LLM-OS 的一种雏形。这已经对人机交互形式产生极大的影响。更重要的是,我们看到了一种大模型操作系统 LLM-OS 的可能,基于大模型智能能力,有机会实现原生的人机交互。」

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
10月7日事件误判后续,阿萨德开始反击,谁将是输家?

10月7日事件误判后续,阿萨德开始反击,谁将是输家?

山河路口
2024-12-01 20:01:28
挪威取消了中国的130亿订单,导致大船海工负债20亿,宣布破产

挪威取消了中国的130亿订单,导致大船海工负债20亿,宣布破产

小胡军事爱好
2024-11-30 23:31:50
苹果 12 月新品一览:全新 CarPlay 要来了!

苹果 12 月新品一览:全新 CarPlay 要来了!

刘奔跑
2024-12-01 21:09:18
曼联苏醒了?本赛季英超首次单场轰4球!近7场不败,新帅用活3人

曼联苏醒了?本赛季英超首次单场轰4球!近7场不败,新帅用活3人

我爱英超
2024-12-01 23:35:50
3-1,横扫打哭日本张本美和,混合团体世界杯:中国队誓夺冠军

3-1,横扫打哭日本张本美和,混合团体世界杯:中国队誓夺冠军

全能体育柳号
2024-12-01 08:13:59
鱼刺“卡嗓子”别再喝醋、吞米饭,教你3招,鱼刺自己“跑出来”

鱼刺“卡嗓子”别再喝醋、吞米饭,教你3招,鱼刺自己“跑出来”

猫小狸同学
2024-12-01 17:50:02
抗美援朝,志愿军共有三个师被撤销番号,师长回国后结局如何?

抗美援朝,志愿军共有三个师被撤销番号,师长回国后结局如何?

那年的春夏
2024-11-21 23:04:33
当年直播香港回归的4位主持人:2人去世,1人落魄,1人退休......

当年直播香港回归的4位主持人:2人去世,1人落魄,1人退休......

华人星光
2024-12-01 12:24:06
中国芯片自给率接近30% ,日媒提议:现在是美国投降中国最佳时机

中国芯片自给率接近30% ,日媒提议:现在是美国投降中国最佳时机

议纪史
2024-12-01 19:35:03
日本首相石破茂出车祸

日本首相石破茂出车祸

财联社
2024-12-01 10:25:11
女孩素颜去喝粥火了,老板娘一眼相中介绍给儿子,网友:国民儿媳

女孩素颜去喝粥火了,老板娘一眼相中介绍给儿子,网友:国民儿媳

梅子的小情绪
2024-12-01 19:39:29
流弊!正式签约NBA!曾决定加盟中国男篮

流弊!正式签约NBA!曾决定加盟中国男篮

技巧君侃球
2024-12-01 22:48:00
越南赢了!韩国答应同越南合作,帮越南完成高铁梦!

越南赢了!韩国答应同越南合作,帮越南完成高铁梦!

星辰故事屋
2024-11-30 19:51:58
冠军师兄评管晨辰:等你光环散去,过气了,你就会理解吴柳芳

冠军师兄评管晨辰:等你光环散去,过气了,你就会理解吴柳芳

米君文史
2024-11-30 20:13:29
凌晨3点战斗打响,罗马尼亚军列遭导弹命中:西方专家没人能逃生

凌晨3点战斗打响,罗马尼亚军列遭导弹命中:西方专家没人能逃生

芯怡飞
2024-12-01 19:53:02
事关房地产政策、电诈惩戒 12月新规一览

事关房地产政策、电诈惩戒 12月新规一览

极目新闻
2024-11-30 08:51:06
灵活务实有想法!阿莫林3场都是早早换掉4人,欧联60分钟用完换人

灵活务实有想法!阿莫林3场都是早早换掉4人,欧联60分钟用完换人

直播吧
2024-12-01 23:42:21
发展联盟首秀表现堪称灾难!火箭的澳洲投手何时才能找到手感?

发展联盟首秀表现堪称灾难!火箭的澳洲投手何时才能找到手感?

稻谷与小麦
2024-12-02 01:09:16
小杨哥大徒弟“小黄”取消三只羊MCN标签

小杨哥大徒弟“小黄”取消三只羊MCN标签

三言科技
2024-12-01 09:00:15
C罩杯女性魅力何在?揭秘她们的吸引力原因!

C罩杯女性魅力何在?揭秘她们的吸引力原因!

智见派
2024-11-29 14:39:12
2024-12-02 02:27:00
机器之心Pro
机器之心Pro
专业的人工智能媒体
9769文章数 142091关注度
往期回顾 全部

科技要闻

我国首个商业航天发射场首发成功

头条要闻

湖南省委原常委落马后 其妻追讨5000万巨额债务引关注

头条要闻

湖南省委原常委落马后 其妻追讨5000万巨额债务引关注

体育要闻

勇士四连败,到底是谁的错?

娱乐要闻

黄晓明姥姥去世,祖孙俩手牵手好温馨

财经要闻

女首富,死刑!交出800亿,免死!

汽车要闻

科技是中国豪车梦的支点 腾势Z9走心试驾体验

态度原创

亲子
艺术
房产
本地
公开课

亲子要闻

加大加厚折叠儿童泡澡桶,家里有娃的放心入

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

房产要闻

一燃再燃!又卖2亿!白鹅潭顶流,引爆全城!

本地新闻

云游中国|来伦布夏果感受充满Passion的人生

公开课

一块玻璃,如何改变人类世界?

无障碍浏览 进入关怀版