当前大模型产品演进方向无非两个大头:一个是 AI Chat 方向,一个是 AI Agent 方向。
前者主打对话“获取信息”,后者主打“解决问题”。
Chat 方向,要往“IM 化”极致交互体验去做。
Agent 方向,要让 AI 变成你的“管家”,你交待他事情,他负责统筹去搞定之后给你结果。
这是两条完全不同的道路。
当然 Chat 作为 Agent 的一个前端方式,两者自然也是可以协同起来的。![]()
Agent 这个方向主要是技术层面当前还需要不断演进,但这是一个比较长远的路,或许是所谓的 AGI 要达成的。
AI 只是个 Agent,一个代理,一个特工,帮你搞定不同的事情,所谓丰富多样的“Multi Agents”,而上层对到用户只需要一个“总管”、“管家”来统筹之。
其中各种 Agent 具体能力的实现,当然又包含了软件层面和硬件层面,软件层面诸如“Agent 帮我直接完成了一篇图文并茂的论文”,硬件层面主要是“传统硬件驱动”,比如调度显示器、鼠标啥的,与更大头的具身智能方向。具身智能已经自成体系了,具体情况专业人士再去探讨吧,按下不表。![]()
此处点一下“MCP”这个协议,它恰好是实现涉及软、硬件能力 AI Agent 的桥梁,驱动软的又可以驱动硬的,而驱动硬件部分才是我觉得它最牛逼的地方,任督二脉打通之。
Agent 方向实际情况来看,当下我们能做的只是去不断补足基础设施的生态,以及能力,比如前边说到的 MCP 这种基础设施,简单讲的话,你看,我为什么说它驱动硬件部分才是最牛逼的地方,就因为它直接体系化地为 Agent 方向引入了调度硬件的能力,开阔了一片天。
至于大模型能力本身,那是另一个大话题,对数据的转化、扩散、对数据的训练、权重、微调、性能调优、GPU 加速、上下文窗口、大模型、小模型、模型“热进化”等等,自不必提,大模型技术专家去探索之。
而大模型这么一个“封闭的黑盒”,我们在演进 Agent 方向,需要找到一个怎样的核心思路呢?
我的抽象提炼是:我们要让人类能更好地参与到大模型封闭黑盒中,也就是输入。
包括在基础设施生态层面、在具体技术能力层面、在工程化层面、在流程化层面、在上层产品操作等等层面去输入给大模型。
那么,诸如下边随便列举这些点(当然还有更多,以及后边还会新突破的更多点),本质上都是在往这个方向上叠 buff:Prompt 工程本身、自动化 Prompt 调优、RAG、调用链、rules、function calling / tools、记忆层、MCP、A2A、结构化 JSON 返回、自动化 builder、效果即时预览、可视化编排、多模型调度、任务管理……
再来看看 Chat 方向。这个方向需要往“IM 化”极致交互体验去做。
底层核心理念是这样的:跟 AI Chat 助手对话就和我跟别人进行 IM 聊天是一样的,只不过对面是一个 AI,仅此而已。
这个月 7 号我还在跟人聊到 IM 化的话题,16 号腾讯就上线了可以把元宝添加成微信好友的功能,腾讯产品经理还是有点东西的。![]()
从用户角度来看,将 AI 聊天助手当作人类,深度融入 IM 平台能够带来“便利性”与“熟悉感”的双重红利。(不扯什么与 AI 产生感情那套)
首先,用户无需下载额外应用或跳转界面,就能在日常使用最频繁的聊天工具中直接调用 AI 服务,大大提升了接入效率。
其次,AI 助手以“联系人”形式出现在熟悉的聊天列表中,降低了学习成本,让人仿佛在与朋友对话般自然流畅。
同时,通过持续学习用户的对话习惯与偏好,助手还能提供高度个性化的建议与提醒,并且全天候在线,随时响应用户的需求。
从行业视角来看,IM 平台嵌入 AI 聊天助手不仅是提升竞争力的关键举措,也能开辟全新的生态与商业空间。
一方面,通过丰富平台功能与智能化服务,能够显著提升用户停留时长和活跃度,进而增强用户黏性。
另一方面,AI 与用户的互动数据为产品优化和新业务开发提供了宝贵洞察。
此外,借助 AI 助手拓展文档处理、内容创作、电商推荐等多场景应用,IM 平台可从单一通讯工具升级为综合性数字生活入口,进一步实现高级功能订阅、企业解决方案等商业化变现。
还有一个很重要的是:在当前 AI Chat 产品能力普遍不咋滴的情况下,直接有效复用 IM 那个成熟领域。![]()
对于腾讯来说,首先自然是充分利用了微信超过十三亿日活用户的规模,而背后其实是“在全球范围内,IM 平台用户规模已接近 52 亿”。
元宝 AI 还可以直接整合微信生态资源,比如公众号文章、视频号内容等,进一步双向把微信这个流量入口,这个生态扣得更紧。
这里也再下一个自然而然的预测:企业微信后边会是元宝发力赚钱的大头。
但说实在的,目前腾讯这东西离“极致用户体验的 IM 化 AI Chat”还远得很。别的不说,先按微信目前的功能补上来,让元宝真的就像背后是“女装加强版 QQ 马化腾”以假乱真,然后再谈 AI 向的极致用户体验(比如前边扯到的模块化引用之类的东西)。
也必须得说一下,AI Chat IM 化不 IM 化,这个有点见仁见智了,我也说不出个必然要这样的逻辑,只是目前行业 Chat 的产品能力来看,如果像我表达的“像与人类对话一样,自然需要引用功能”,那么 AI Chat 产品形态往 IM 化去做,确实就是存在既有经验的,而且是大量与深入研究过的:照着做 IM 的产品思考,直接把行业关于 IM 产品的思考与能力搞上去再说,多么多快好准。
最后简单看一个 Chat 与 Agent 方向的协同示例。对话方式输入需求,GenSpark Agent 给我 Web 落地页:![]()
本文是针对当前人类发展大模型产品的趋势的一个高度抽象,细的不谈,业内人士顺着这抽象逻辑往下走,自然知道该有哪些细的东西去探索,包括基础设施生态、具体技术能力、产品形态,甚至商业模式等。希望多少能有一点价值。
下次再聊,886,我是尼克劳斯,欢迎留言探讨。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.