网易首页 > 网易号 > 正文 申请入驻

豆包们穷追不舍,Kimi要靠「深入推理」抵御AI巨头冲击

0
分享至

大概一个月前,OpenAI 推出了 o1 模型,不仅展示了强大的语言生成能力,还通过引入强化学习,实现了更高层次的推理和自我纠错能力。

9 月 16 日,月之暗面(旗下 Kimi)创始人杨植麟在天津大学宣怀学院做了一场分享,其中特别提到了 OpenAI 发布的 o1 模型,标志着通用智能(AGI)范式的变化,而下一个范式,「是通过强化学习来做的。」

或许在当时,或许更早,月之暗面就已经投入到了强化学习的新范式之中。

但不管如何,根据「大厂青年」公众号最新爆料,月之暗面有团队,在国庆期间「一直疯狂赶进度」,主要就是为了即将上线一个「很牛的功能」。

爆料进一步指出,该功能与模型的深度推理有关,预计将于下一个版本上线,会在搜索入口下方增加一个「深入推理」的功能开关,可以回答简单搜索无法解决的问题,甚至可以自我反思。

这是 Kimi 的 o1?

接力 OpenAI o1,通用智能新范式的一次转移

在 OpenAI o1 之前,AI 大模型的表现通常局限于「快速应答」,也就是通过预测下一个词来生成答案。这种方式效率高,但其思维模式单一,缺少对复杂问题的深入推理和自我反思能力。



图/ OpenAI

但随着 OpenAI 推出的 o1 模型,这种局限性开始被突破。o1 的核心变化在于引入了强化学习机制,模型在面对问题做出响应之前,会花上更多时间思考问题,来进行深度推理和自我纠错。

这就类似大脑的慢思考——一种被称为「系统 2」的能力,o1 有了学习并完善思维过程的能力,可以尝试不同的策略,并认识到自己的错误。这种能力的提升对于 AI 的智能化带来了显著的影响。传统模型通常只会对用户输入做简单的直线型回答,而没有「思考」过程的多样性和深度。

例如,在处理复杂的数学题或法律案例时,模型只是依靠大量数据的模式匹配进行预测。o1 通过强化学习,让 AI 可以进行多步骤推理,类似于人类解决问题时的思维路径——先提出假设,逐步验证推理,并且在过程中不断自我修正错误。

通过这种慢思考模式,AI 不仅能给出更准确的答案,还能在面对不确定性时进行自我反思,在一定程度上避免过去模型常见的「幻觉」。

杨植麟同样也在天津大学的演讲中指出,AI 只有通过学习人类的思考过程,才能得到更好的泛化能力,而且能通过这个过程又产生了更多天然不存在的数据,应对更多未知的问题。



图/上海创新新创业青年 50 人论坛

这对于最终用户体验的影响也是巨大的。对于普通用户而言,推理能力的增强意味着在与 AI 互动时,能够获得更具深度、逻辑性更强的回答。

在 ChatGPT 中使用 o1-preview 模型就能明显感受到,很多时候不再需要将问题简单分解成多个小问题逐步提问,而是可以直接提出复杂的问题,AI 可以通过多步骤推理,给出综合性的解决方案。

更重要的是,自我反思的引入让 AI 可以像人类一样在过程中发现自身的错误。

这种自我反思能力不仅能够大幅减少错误率,还提升了用户对 AI 的信任感。AI 不再是一个机械的应答者,而更像是一个具备「思考」能力的智能助手,可以理解上下文、深刻分析问题,甚至在发现自身错误时及时调整,从而为用户提供更高质量的答案。

所以不难理解,为什么 Kimi 要做「深入推理」。事实上,国内大模型也在向这一趋势靠拢,在 9 月底举办的阿里云栖大会上,一部分大模型公司和研究机构就达成了一定的共识,即 OpenAI 推出的 o1-preview 代表了通用智能新的进化方式的开端。



通用智能圆桌对话,图/云栖大会

但趋势归趋势,Kimi 对于「深入推理」功能的迫切,还在于国内市场面临的竞争态势在发生变化。

假期赶进度,豆包给到Kimi的压力越来越大

不管新功能是什么,不难看出,顶着国庆假期赶进度,在一定程度上说明了 Kimi 团队的的急迫感。而这些压力,主要还是来自于国内其他大模型公司的激烈竞争。

经常看 B 站的朋友应该都会发现,之前一直出现在站内广告中的 Kimi,存在感已经相当薄弱,取而代之则是满屏的「豆包」。而字节跳动的豆包,也无疑是目前国内 AI 智能助手的领头羊。

公开数据显示,5 月上线以来,豆包连续数月一直占据 App Store 免费榜的前列位置,6 月更是长达一个月霸占榜首。即便到 10 月,豆包也仍排在第四。优秀的产品体验以及海量的推广,豆包可以说在短时间内迅速吸引了海量用户,也占领了市场。



图/苹果

a16z 公布的全球 AI 产品前 100 榜单中,豆包同时出现在网页端和移动端的前 50 名榜单中,显示了其在全球市场的影响力。而与之对比,Kimi 在此榜单中未见踪影。

不只是豆包。同为大模型初创公司的 MiniMax 也在迎来爆发。从 9 月以来,旗下 AI 智能助手——海螺 AI 的数据出现爆发式增长,月访问量翻了超过 8 倍,月活用户接近 500 万。

另一方面,Kimi 过去最为人熟知的优势就是长文本的处理能力,能够支持大量资料的快速处理。但随着技术的迭代,各家大模型的上下文处理能力都发生了很大的进步,谷歌 Gemini、阿里通义、腾讯元宝以及月之暗面 Kimi,都支持了 1000 万 Token/字的长上下文。

而在此之后,Kimi 最明显的「优势」不再明显,同时各家的竞争也开始多元,甚至更侧重于产品功能层面。在这个阶段中,Kimi 并没有让用户感知到其他更明显的优势,也就很难守住 AI 智能助手「当红炸子鸡」的市场地位。

在这种背景下,Kimi 面临的挑战是显而易见的。

抗击巨头冲击波,Kimi 需要「深入推理」

Kimi 正在开发的「深入推理」功能,无疑是一剂强心剂。在激烈的竞争中推出「深入推理」功能,不仅有利于 Kimi 提供能够与领先者竞争的差异化功能和能力,在竞争激烈的市场中重新站稳脚跟。

更重要的是,「深入推理」不仅意味着能够得到更复杂问题的答案,还代表着 AI 可以在长时间对话中进行深度思考和自我反思,将极大提升用户在使用 Kimi 过程中的体验,尤其是面对复杂任务的场景中。

这也符合 Kimi 一直以来的用户画像——学生、大学生、实习生、打工人,并且用户更聚焦在学习、办公协助上。相较之下,不管是豆包还是海螺 AI 其实都有更多角色扮演、情感交流的定位。



图/ Kimi

而且对于现在 AI 智能助手的用户来说,简单的答案生成已经不足以满足他们的需求。越来越多的用户期望 AI 不仅是简单地回答问题,而是能够帮助复杂的工作任务和日常的内容创作,甚至在推理过程中自我纠错。

伴随用户对 AI 要求的不断提高,Kimi「深入推理」或许能够帮助用户更好地应对他们面临的更多现实问题和更高难度的任务,创造更强的用户黏性。与此同时,「深入推理」对团队自身的提振作用可能也不容忽视。

总而言之,Kimi 的「深入推理」功能或许将是一次关键的升级,对于 Kimi 来说也是一剂强心剂,既是在激烈的市场竞争中重新找回属于自己的竞争优势,也是为通用智能的范式转变奠定基础。

或许再之后,「深入推理」将不只是一个功能,而是成为 Kimi 背后大模型的底层能力。而在国产大模型以及 AI 智能助手之中,目前来看,Kimi 很可能是最早迈出这一步的厂商。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国能迅速崛起,离不开这3大国家的帮助?其中一个令人意外

中国能迅速崛起,离不开这3大国家的帮助?其中一个令人意外

小鬼头体育
2024-10-11 13:34:33
俞灏明官宣恋情:王晓晨不嫌弃烧伤脸,真爱打动人心!

俞灏明官宣恋情:王晓晨不嫌弃烧伤脸,真爱打动人心!

娱乐八卦木木子
2024-10-09 20:18:51
一文读懂财政大会!

一文读懂财政大会!

子说一点
2024-10-12 12:20:14
央国企里,真正“混得开”的是一群戏子

央国企里,真正“混得开”的是一群戏子

笑熬浆糊111
2024-10-10 00:05:23
俄罗斯库页岛上废弃的军用机场 长满了杂草

俄罗斯库页岛上废弃的军用机场 长满了杂草

那些看得见的老照片
2024-10-12 11:20:03
可怕!特朗普的顾问提议:如果获胜,将设立“影子美联储主席”?

可怕!特朗普的顾问提议:如果获胜,将设立“影子美联储主席”?

王爷说图表
2024-10-11 20:58:16
武当到底有没有得道高人?道长回忆:1986年亲见一幕让我终身难忘

武当到底有没有得道高人?道长回忆:1986年亲见一幕让我终身难忘

每日一段历史
2024-10-12 11:07:52
蔡英文卸任半年,有了新动作,美发现不对,大陆已有收台新手段

蔡英文卸任半年,有了新动作,美发现不对,大陆已有收台新手段

曹兴教授TALK
2024-10-12 13:35:24
央视频直播,萨巴伦卡VS高芙,王欣瑜VS郑钦文,谁能晋级武网决赛

央视频直播,萨巴伦卡VS高芙,王欣瑜VS郑钦文,谁能晋级武网决赛

体育大学僧
2024-10-12 10:10:19
要暴雷了,比恒大还恐怖的雷!

要暴雷了,比恒大还恐怖的雷!

玉辞心
2024-08-23 16:05:03
王健林之所以没有成为第二个许家印,因为他这十件事做得太绝了

王健林之所以没有成为第二个许家印,因为他这十件事做得太绝了

农村玲子v
2024-10-08 17:13:54
再也请不起的剧组之青云志剧组:男主已经退圈,六大男配顶峰相见

再也请不起的剧组之青云志剧组:男主已经退圈,六大男配顶峰相见

圈里的甜橙子
2024-10-11 20:11:04
为什么买“华为手机”的人越来越少了?这4个原因很真实

为什么买“华为手机”的人越来越少了?这4个原因很真实

小柱解说游戏
2024-10-11 15:32:54
新华社快讯:尼加拉瓜政府11日发布公告,宣布断绝与以色列的外交关系。

新华社快讯:尼加拉瓜政府11日发布公告,宣布断绝与以色列的外交关系。

新华社
2024-10-12 06:23:07
NBA战报:快船101-99险胜开拓者,凯-琼斯空接扣篮绝杀开拓者

NBA战报:快船101-99险胜开拓者,凯-琼斯空接扣篮绝杀开拓者

懂球帝
2024-10-12 13:22:52
既然乌军已被消灭70%,俄罗斯还在磨唧,难道想耗干北约元气?

既然乌军已被消灭70%,俄罗斯还在磨唧,难道想耗干北约元气?

大风文字
2024-10-12 13:13:43
省会城市国庆旅游收入断崖:北京268亿,长沙74亿,第一出乎意料

省会城市国庆旅游收入断崖:北京268亿,长沙74亿,第一出乎意料

笑熬浆糊111
2024-10-12 00:05:24
知网查到赵子健5篇论文:有刊物曾被知名高校拉入负面清单

知网查到赵子健5篇论文:有刊物曾被知名高校拉入负面清单

极目新闻
2024-10-11 21:30:06
三胎来了!向佐晒与郭碧婷雪地大片孕肚抢镜,小奶黄再度喜当姐姐

三胎来了!向佐晒与郭碧婷雪地大片孕肚抢镜,小奶黄再度喜当姐姐

扒星人
2024-10-11 15:19:38
深圳知名超市被立案调查!被曝皮蛋包装盒内长满蛆虫……

深圳知名超市被立案调查!被曝皮蛋包装盒内长满蛆虫……

深圳晚报
2024-10-11 15:32:38
2024-10-12 14:18:44
雷科技
雷科技
专注AI硬科技
31340文章数 809840关注度
往期回顾 全部

科技要闻

马斯克可能真的只想开一场派对

头条要闻

美媒:美国"自废武功" 已经输掉了与中国的太阳能竞赛

头条要闻

美媒:美国"自废武功" 已经输掉了与中国的太阳能竞赛

体育要闻

纳达尔:红土之王退役,又是普通的一天

娱乐要闻

又有反转? 张雨绮这瓜咋还没吃完?

财经要闻

王雍君:财政部重磅发布会如何影响股市?

汽车要闻

真就轮子+沙发 马斯克押注的自动驾驶车来了

态度原创

教育
健康
本地
公开课
军事航空

教育要闻

多省公布2025年高考报名政策,考生需要注意什么?

花18万治疗阿尔茨海默病,值不值?

本地新闻

秋颜悦色|你一句真上头 我就到了真汕头

公开课

生活很艰难,艺术有帮助

军事要闻

乌克兰总统结束英法意德四国行

无障碍浏览 进入关怀版