网易首页 > 网易号 > 正文 申请入驻

关于DeepSeek,面壁智能创始人刘知远最新发声!

0
分享至

  【导读】面壁智能联合创始人、首席科学家刘知远称,DeepSeek -R1让AI界迎来类似于2023年初的ChatGPT时刻

  中国基金报记者尹振茂

  2025年1月底以来,DeepSeek在国内外持续火爆,受到业内外广泛关注。

  日前,中国基金报记者专访面壁智能创始人、首席科学家刘知远,请其详细阐释DeepSeek火爆出圈的原因。

  在刘知远看来,OpenAI o1相当于引爆了一颗原子弹,但没有告诉大家秘方。DeepSeek则可能是全球首个能够通过纯粹的强化学习技术复现OpenAI o1能力的团队,他们通过开源并发布相对详细的介绍,为行业发展做出了重要贡献。

  由于开源,DeepSeek -R1让全世界意识到深度思考的能力,相当于让整个人工智能领域迎来了类似于2023年初的ChatGPT时刻。大家感受到大模型的能力又往前迈进了一大步。

  刘知远指出,人工智能大模型领域存在一个大模型密度定律,即模型能力密度随时间呈指数级增强。2023年以来,大模型的能力密度大约每100天翻一倍,即每过100天,我们只需要一半的算力和一半的参数就能实现相同的能力。

  刘知远称,我们即将迎来意义深远的智能革命,它的高潮即将到来,这是可望且可及的。

  以下是此次专访的全文。

  中国基金报:近期DeepSeek在国内外受到广泛关注,请详细谈谈主要原因是什么?

  刘知远:这主要是因为DeepSeek最近发布的R1模型具有非常重要的价值。这种价值主要体现在其能够复现OpenAI o1的深度推理能力。

  因为OpenAI o1本身并没有提供关于其实现细节的任何信息,OpenAI o1相当于引爆了一颗原子弹,但没有告诉大家秘方。而我们需要从头开始,自己去寻找如何复现这种能力的方法。DeepSeek可能是全球首个能够通过纯粹的强化学习技术复现OpenAI o1能力的团队,并且他们通过开源并发布相对详细的介绍,为行业发展做出了重要贡献。

  DeepSeek -R1的整个训练流程,有两个非常重要的亮点或价值。

  首先,DeepSeek R1创造性地基于DeepSeek V3基座模型,通过大规模强化学习技术,得到了一个纯粹通过强化学习增强的强推理模型,即DeepSeek-R1-Zero。这具有非常重要的价值。因为,在历史上几乎没有团队能够成功地将强化学习技术很好地应用于大规模模型上,并实现大规模训练。

  DeepSeek R1的第二个重要贡献,在于其强化学习技术不仅局限于数学、算法代码等容易提供奖励信号的领域,还能创造性地将强化学习带来的强推理能力泛化到其他领域。这也是用户在实际使用DeepSeek- R1进行写作等任务时,能够感受到其强大的深度思考能力的原因。

  综上,DeepSeek -R1的贡献体现在两个方面:一是通过规则驱动的方法实现了大规模强化学习;二是通过深度推理SFT数据与通用SFT数据的混合微调,实现了推理能力的跨任务泛化。这使得DeepSeek -R1能够成功复现OpenAI o1的推理水平。

  而且,由于开源,DeepSeek -R1让全世界意识到深度思考的威力。人工智能领域迎来了类似于2023年初的ChatGPT时刻。每个人感受到大模型的能力又往前迈进了一大步。

  不过,我们也需要合理评估DeepSeek -R1的意义。它在历史上更像是2023年Meta的LLaMA。

  中国基金报:DeepSeek R1能够取得全球性成功的原因有哪些?

  刘知远:这与OpenAI采用的某些策略有非常大的关系。

  OpenAI发布o1之后,首先选择不开源;其次,它将o1深度思考的过程隐藏起来,第三,o1本身收费非常高。全球范围内仅有限的人可通过o1感受到深度思考所带来的震撼。

  而DeepSeek R1则像2023年初OpenAI的ChatGPT一样,让所有人真正感受到了这种震撼,这是DeepSeek R1出圈的重要原因。

  如果我们将DeepSeek发布的R1和之前的V3结合起来考虑,那么它的意义在于:在有限的算力资源支持下,通过强大的算法创新,突破了算力瓶颈。它表明在有限的算力下,人工智能公司也能做出具有全球意义的领先成果。

  这对中国AI的发展具有非常重要的意义。

  当然,我们也应该看到,AI想要真正赋能全人类,让每个人都能够用得上、用得起大模型和通用人工智能,高效性是一个非常重要的命题。这也是DeepSeek- V3和R1带给我们的另一个重要的启示。追求高效性是人工智能发展内在的使命和需求。

  我们看到,上一次的科技革命,即信息革命非常重要的内核是计算芯片的发展。

  在过去的80年中,最初,一台计算机需要一个屋子才能装得下如今,每个人手边都有的手机、PC,以及各种计算设备都可以在非常小的设备上完成非常强大的计算能力。

  这一切都源于芯片行业在摩尔定律的指引下,不断推进芯片制程,提升芯片电路密度,从而实现计算设备的小型化和普惠化,推动算力的普及。这是我们追求高效性的内在需求。

  2024年以来,我们就特别强调要发展大模型的能力密度。

  过去几年,我们可以看到类似摩尔定律的现象,大模型的能力密度正随时间呈指数级增强。2023年以来,大模型的能力密度大约每100天翻一倍。也就是说,每过100天,我们只需要一半的算力和一半的参数就能实现相同的能力。

  因此,面向未来,我们应该不断追求更高的能力密度,努力以更低的成本——包括训练成本和计算成本——实现大模型的高效发展。

  因此,我们认为,智能革命显然也要走过一个类似于信息革命的阶段,不断去提高能力密度、降低计算成本。AI时代的核心引擎,包括电力、算力以及大模型所代表的智力,这种密度定律应该也是普遍存在的。我们需要不断通过高质量、可持续的方式,去实现大模型的普惠,这是我们未来的发展方向。

  面向未来,我们认为,人工智能有三大主战场,它们的目标都是让通用人工智能达到顶尖水平。

  首先,我们要探索人工智能的科学化技术方案,实现更科学、更高效的人工智能实现方式。

  其次,我们要实现计算系统的智能化,能够在计算层面以更低的成本、更通用地将大模型应用于各个领域。

  第三,我们也要在各个领域探索人工智能的广谱化应用。

  最后,DeepSeek还让我们看到,即使用小米加步枪,我们依然能够取得重大胜利。我们即将迎来意义深远的智能革命时代,它的高潮即将到来,这是可望且可及的。

  中国基金报:DeepSeek-R1在这个时间点出现并如此出圈,是一种偶然还是具有某种必然性?

  刘知远:它具有一定的必然性。

  2024年,很多投资人,甚至一些不从事人工智能的人都问过我一个问题:中美人工智能发展的差距是在变大还是变小。

  我当时表示,中国正在快速追赶,与美国最先进的技术之间的差距在逐渐缩小。尽管我们仍面临一些限制,但这种追赶是显而易见的。

  2023年初,ChatGPT和其后GPT-4发布后,国内团队复现这两个版本的模型大概都花了一年时间。2023年底,国内团队复现了ChatGPT水平的模型能力;去年四五月份,一线团队复现了GPT-4水平的能力。

  但此后,像Sora、GPT-4o的模型,国内团队大概半年内就可以完成复现。这意味着,o1的模型能力,国内团队在半年左右复现是可预期的。

  DeepSeek的价值不仅在于能够复现,还在于能够更快、以更低成本、更高效地完成工作。从这个角度看,我认为DeepSeek- R1现在出现有一定的必然性。

  编辑:格林

  校对:乔伊

  制作:舰长

  审核:木鱼

  版权声明

  《中国基金报》对本平台所刊载的原创内容享有著作权,未经授权禁止转载,否则将追究法律责任。

  授权转载合作联系人:于先生

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
王毅向媒体介绍中美元首会晤情况和共识

王毅向媒体介绍中美元首会晤情况和共识

澎湃新闻
2026-05-15 22:33:27
马德兴:国少因中东局势不稳未能提前西征,花钱请队热身都未果

马德兴:国少因中东局势不稳未能提前西征,花钱请队热身都未果

懂球帝
2026-05-16 12:58:07
不给否决权绝不罢休!非洲54国深夜联手掀起风暴,诉求权益平等

不给否决权绝不罢休!非洲54国深夜联手掀起风暴,诉求权益平等

王飬吃吃喝喝
2026-05-15 13:31:27
离完婚我在姐姐家借住,凌晨却听见姐姐的哀求声,我推开房门愣了

离完婚我在姐姐家借住,凌晨却听见姐姐的哀求声,我推开房门愣了

枫红染山径
2026-05-15 11:56:23
绿豆立大功!研究发现:绿豆,显著降低胆固醇,减少肝脏脂肪

绿豆立大功!研究发现:绿豆,显著降低胆固醇,减少肝脏脂肪

小胡军事爱好
2026-05-14 21:51:26
侍卫救下乾隆后,乾隆问他想要什么赏赐?侍卫:那就赏我一个宫女吧

侍卫救下乾隆后,乾隆问他想要什么赏赐?侍卫:那就赏我一个宫女吧

纪实文录
2025-07-24 11:51:46
离开中国前,鲁比奥着急立规矩,台湾问题,中方说不松口就不松口

离开中国前,鲁比奥着急立规矩,台湾问题,中方说不松口就不松口

小莜读史
2026-05-15 22:07:47
“我老公突然像换了一个人!”42岁丈夫性情大变,妻子崩溃:他妈妈因此离世,这病不是老年专属...

“我老公突然像换了一个人!”42岁丈夫性情大变,妻子崩溃:他妈妈因此离世,这病不是老年专属...

蓬勃新闻
2026-05-15 06:30:29
洛阳交警通报男子驾车追尾失控造成一死两伤:肇事司机被当场控制

洛阳交警通报男子驾车追尾失控造成一死两伤:肇事司机被当场控制

环球网资讯
2026-05-16 11:00:11
女学霸发明“咯噔字体”,老师低分警告:别用个性挑战考试底线

女学霸发明“咯噔字体”,老师低分警告:别用个性挑战考试底线

蝴蝶花雨话教育
2026-05-07 00:05:04
支付宝回应“用户关闭支付功能后被扣捐赠184万”:或涉违法犯罪,正向警方寻求帮助

支付宝回应“用户关闭支付功能后被扣捐赠184万”:或涉违法犯罪,正向警方寻求帮助

上海法治声音
2026-05-16 16:28:08
西方没料到,特朗普访华首日最大清醒:美国已容不下对华强硬派!

西方没料到,特朗普访华首日最大清醒:美国已容不下对华强硬派!

好贤观史记
2026-05-15 15:25:57
若击败贝蒂斯,巴萨将成近40年来首支单赛季西甲主场全胜球队

若击败贝蒂斯,巴萨将成近40年来首支单赛季西甲主场全胜球队

懂球帝
2026-05-16 08:34:29
太治愈了江苏一小伙,送给领导送了“一桶姜山”,网友:唯有套路得人心。

太治愈了江苏一小伙,送给领导送了“一桶姜山”,网友:唯有套路得人心。

三农老历
2026-05-16 13:29:30
79年村主任让我去寡妇家住,我连忙推辞,他却说这是我父亲的安排

79年村主任让我去寡妇家住,我连忙推辞,他却说这是我父亲的安排

青青会讲故事
2026-03-12 15:27:42
赖斯:现在首要目标是帮阿森纳拿下英超,随后全力冲击世界杯冠军

赖斯:现在首要目标是帮阿森纳拿下英超,随后全力冲击世界杯冠军

砚底沉香
2026-05-16 16:22:21
网易号平台每日辟谣公告(五月十五日)

网易号平台每日辟谣公告(五月十五日)

网易号官方平台
2026-05-15 18:15:12
浙江一男子欠钱后离家十几年,如今患病状告女儿要求赡养,女儿:他每月要三千,我工资才四千多一点

浙江一男子欠钱后离家十几年,如今患病状告女儿要求赡养,女儿:他每月要三千,我工资才四千多一点

大象新闻
2026-05-16 10:46:04
暴雨黄色预警 12省区市有大到暴雨

暴雨黄色预警 12省区市有大到暴雨

闪电新闻
2026-05-16 15:42:49
访华期间后院起火!伊朗宣布开放霍尔木兹海峡,法国航母蠢蠢欲动

访华期间后院起火!伊朗宣布开放霍尔木兹海峡,法国航母蠢蠢欲动

阿銍武器装备科普
2026-05-16 15:30:51
2026-05-16 18:04:49
中国基金报 incentive-icons
中国基金报
洞察金融市场,传播中国价值——《中国基金报》社官方账号(《中国基金报》社有限公司运营管理)
62477文章数 517493关注度
往期回顾 全部

科技要闻

涨的是车价,要的是老命

头条要闻

26岁警察因急性白血病引发脑出血 从确诊到离世仅11天

头条要闻

26岁警察因急性白血病引发脑出血 从确诊到离世仅11天

体育要闻

马刺2号,少年老成,这集看过?

娱乐要闻

张嘉译和老婆的差距让人心酸

财经要闻

造词狂魔贾跃亭

汽车要闻

高尔夫GTI刷新纽北纪录 ID. Polo GTI迎全球首秀

态度原创

旅游
亲子
艺术
时尚
军事航空

旅游要闻

【海上记忆】汇龙潭的水,有至刚之德

亲子要闻

《2026中国儿童生长与消化健康白皮书》发布,关注儿童健康

艺术要闻

19位当代画家油画作品欣赏

从全网嘲到全网夸,鲁豫到底经历了什么?

军事要闻

联合国安理会审议叙利亚局势

无障碍浏览 进入关怀版