网易首页 > 网易号 > 正文 申请入驻

大模型:能少说两句吗,你到底要干啥?

0
分享至


上过 AI 课,甚至可能还买过网上提示词合集的你,是不是还在这样写提示词?

像什么在提示词里一步步拆解思维链,才能让模型学会分步思考;要给几个例题,帮助模型理解你的问题;还要引导模型 cosplay,让模型给出更专业的答案等等的小技巧,不少差友应该也早就活学活用了。

没错,说的就是火锅


但,这些曾经让你事半功倍的神级提示词,可能已经过时了。

这么说吧,在不知不觉的中,大模型其实已经分成了两派:传统通用大模型和推理大模型。

比如 GPT-o1,它可不是 GPT-4o 的直属版本升级。4o 属于通用大模型,o1 已经是推理模型了。

类似的,DeepSeek 默认使用的 V3 版本是通用大模型,点击左下角深度思考按钮使用的才是 R1 推理模型。


而在推理模型时代,越详细的提示词,反而可能会让 AI 变更蠢。

比如 OpenAI 的官方文档里,推理模型的专栏下,就明确表示,用过于精确的提示词,或者是引导思考这类提示词写法,反而会让回答效果下降。

他们甚至还直接建议,让大家少用思维链提问。。。问题直接问就行。实在效果太拉垮了,再发具体例题,让 AI 学习。


我们还翻了一下 DeepSeek-R1 的官方技术报告,他们在论文里也这么说:“DeepSeek-R1 对提示词很敏感,举例提示反而会降低模型表现。"

因此,为让效果更好,他们建议用户直接描述问题,别举例子。



除了 GPT 和 DeepSeek,Claude 3.7 Sonnet 也在官方文档中表示,比起那些看似很有逻辑,每一步都详细列出具体做啥的提示词,他们更希望你直接使唤它。


总结一下,和大伙们印象中提示词越详细,AI 效果就越牛的刻板印象不一样,目前各大官方对自家推理大模型提示词的共同建议,就是直接,简洁,描述准确。

我们也尝试着做了一个实验,而最终的实验结果同样证明,过去非推理模型的古法提示词,用到推理模型那里真的会让性能下降。

我们从 leetcode 里面挑选了几十道各种类型的困难题目,在 ChatGPT 上进行测试。咱们先按老法子写了一段提示词,比如暗示它做一名程序员、要进行思维链思考、还给出了大量示例等等等。。。


结果对于大部分题目,不论提示词是长是短,推理模型 o1 都能给出正确的代码,甚至能击败 70% 以上的人,可以说表现已经相当优秀了。


但是在 1147、471、458、1735、1799 这些题目中,o1 在老提示词下失败了。其中,有一题更是直接卡死,不想玩啦。

但当我们不让它 cosplay,也不给例题,去掉思维链引导时,o1 这回居然在同样的问题上又答对了。


所以,到底是啥让昔日的提示词小甜甜,在推理模型时代变成了牛夫人?

其实背后最主要的原因,是传统非推理模型和推理模型的思考问题方式变了,而它们思考方式的变化源于训练方式的不同。

传统的大模型一般采用无监督学习和监督微调,也就是给个数据集,让它自己去找规律。它的终极目标是根据提示词,一个一个猜对回答里的所有字。

说人话就是,通用大模型能力很强,但没啥子主见,这就比较吃用户的操作了。你给的提示词越详细,越能让大模型按照你的心意去做事。


但推理大模型不一样,在原来的基础上,它又加上了强化学习等基于推理的训练方法。

这样的训练过程,会引导大模型尽量给出完整且正确的思维链,让它能够判断这么想是不是对的。


这下模型本身就有很强的 “ 主见 ”,或者说是推理能力。你要是再一步步详细地去教它做事,反而可能和它本身的推理能力冲突了。

比如我们在实验中发现,用老提示词让 o1 解决一些数学相关的编程题目时,翻车概率尤其的高。

这有可能是因为提示词只让它做了一名 “ 资深程序员 ”,而不是 “ 数学很好的程序员”。

我们也翻了不少模型的官方文档,它们给出的建议也基本都是别整花花肠子,提示词简单直接,并且准确最好。除此之外,可以强制延长推理时间,提示它 “ 多想想 ”,或者 “ 反思你的结果 ”。

一部分老办法也还是好用的,比如适当用些符号,把问题的结构分分清楚,或者明确你的最终目标和结果格式。

这些办法,都能让推理模型的效果更秀更 6。


所以,适当放下助 AI 情节,讲清楚你的需求,双手插兜尊重 AI 操作,反而可能是最有效率的。

而我觉得随着大模型能力的不断进化,写提示词这件事的门槛,也肯定会越来越低。

但,要是问提示词工程这手艺,会不会完全消失?我们也请教了一下曾写出“汉语新解”等神级提示词的大神李继刚老师。

他是这么回答的:只要我们不同的输入,还会带来不同的输出,那提示词工程就一直都在。

最后,差评前沿部觉得,对我们这些用户来说,随着模型能力的加强,咱也应该更新一下提示词的弹药库了,别在抱着那古早的过时提示词,当个宝了。

撰文:莫莫莫甜甜

编辑:江江 & 面线

美编:阳光

图片、资料来源:

OpenAI、DeepSeek、Claude官网

DeepSeek论文原文

各大视频网站


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/阅读下一篇/

华为的超大杯又卖到了9999,它这次到底贵在哪?

返回网易首页 下载网易新闻客户端
相关推荐
热点推荐
记者:卡佩拉将以自由球员身份离开老鹰,或去其他球队担任替补中锋

记者:卡佩拉将以自由球员身份离开老鹰,或去其他球队担任替补中锋

懂球帝
2025-06-11 14:44:08
民进党创党元老洪奇昌率岛内生技产业界人士来京参访交流

民进党创党元老洪奇昌率岛内生技产业界人士来京参访交流

海峡导报社
2025-06-12 15:11:07
Switch2惊现电池鼓包、摇杆漂移,还能好好玩耍吗?

Switch2惊现电池鼓包、摇杆漂移,还能好好玩耍吗?

叨叨游戏
2025-06-11 15:47:40
体验了一天iOS 26后,我劝安卓们这回别学了。。。

体验了一天iOS 26后,我劝安卓们这回别学了。。。

差评XPIN
2025-06-11 00:06:37
全国政协副主席,在省“双一流”大学调研

全国政协副主席,在省“双一流”大学调研

双一流高校
2025-06-12 15:21:18
俞灏明王晓晨分手了?女方回应已婚身份,多次和俞灏明撇清关系!

俞灏明王晓晨分手了?女方回应已婚身份,多次和俞灏明撇清关系!

古希腊掌管月桂的神
2025-06-12 13:56:12
绝了!女子打卡偶遇素颜女大学生,网友:一个惊艳一个清纯

绝了!女子打卡偶遇素颜女大学生,网友:一个惊艳一个清纯

泠泠说史
2025-06-10 16:50:12
外交部:望美方同中方一道落实两国元首通话达成的重要共识

外交部:望美方同中方一道落实两国元首通话达成的重要共识

国际在线
2025-06-12 15:40:34
央视除名,《长安的荔枝》女主演出事,曝升学内幕,父亲职位被扒

央视除名,《长安的荔枝》女主演出事,曝升学内幕,父亲职位被扒

傲傲讲历史
2025-06-09 18:28:39
CBA重磅转会完成!广厦国手锋线离队,正式加盟青岛男篮效力!

CBA重磅转会完成!广厦国手锋线离队,正式加盟青岛男篮效力!

中国篮坛快讯
2025-06-11 11:02:28
前线溃败十万士兵逃亡!6月12日,基辅88万大军仅剩一副空壳?

前线溃败十万士兵逃亡!6月12日,基辅88万大军仅剩一副空壳?

智观科技
2025-06-12 10:10:09
“蝴蝶”可能于13日凌晨到上午登陆海南岛南部

“蝴蝶”可能于13日凌晨到上午登陆海南岛南部

鲁中晨报
2025-06-12 09:42:05
张颖颖遇到对手了?马筱梅婚后首场直播,把她仅有的体面撕得粉碎

张颖颖遇到对手了?马筱梅婚后首场直播,把她仅有的体面撕得粉碎

小咪侃娱圈
2025-06-12 13:59:31
曾喊 “打败美帝” 的他晚年全家定居美国,83岁的宋玉庆现状如何

曾喊 “打败美帝” 的他晚年全家定居美国,83岁的宋玉庆现状如何

洲洲影视娱评
2025-06-09 20:35:11
高考后最恶心的不是离婚,而是退货!商家哭诉旗袍吊牌不摘就等退

高考后最恶心的不是离婚,而是退货!商家哭诉旗袍吊牌不摘就等退

逍遥史记
2025-06-12 16:26:46
隐隐约约感觉到:中美真打不起来了

隐隐约约感觉到:中美真打不起来了

阿离家居
2025-06-07 10:00:17
92年我在西北冒死救下一女军官,回到单位之后,上级紧急传唤我

92年我在西北冒死救下一女军官,回到单位之后,上级紧急传唤我

红豆讲堂
2025-06-08 12:00:10
蔚来又站在了ICU门口

蔚来又站在了ICU门口

本原财经
2025-06-10 09:22:18
当年举报毕福剑的那位告密者:坐过牢,众叛亲离,后来过得好惨

当年举报毕福剑的那位告密者:坐过牢,众叛亲离,后来过得好惨

果娱
2025-05-10 14:29:13
Shams:杜兰特经纪人已与太阳多次会面商讨去处,火箭马刺森林狼等队对其有意

Shams:杜兰特经纪人已与太阳多次会面商讨去处,火箭马刺森林狼等队对其有意

雷速体育
2025-06-12 06:42:12
2025-06-12 17:07:00
差评XPIN incentive-icons
差评XPIN
用知识和观点Debug the world!
9045文章数 488503关注度
往期回顾 全部

科技要闻

一镜双目捅破天,华为最快明年Q2超越苹果

头条要闻

特朗普证实美方人员正撤离中东:中东已成为危险区域

体育要闻

没有人会不喜欢TJ-麦康奈尔

娱乐要闻

邓紫棋自爆因官司6年没收到版税, 重录旧作反击

财经要闻

"特马"互撕反转?特朗普回应马斯克反悔

汽车要闻

方程豹最大SUV比豹8便宜?钛7搭华为智驾

态度原创

亲子
数码
房产
游戏
健康

亲子要闻

搞砸了也没关系,所有成长都是从这里开始

数码要闻

Kubuntu Focus 推出 Linux 移动工作站:U9 275HX + RTX 5070 Ti

房产要闻

曝光!食堂问题频发,海口这所名校被重罚百万!

【招募 InZOI Mod 创作者】加入专属社群 赢大奖享支持

减重专家破解减肥九大谣言!