网易首页 > 网易号 > 正文 申请入驻

GPT-4o加钱能变快!新功能7秒完成原先23秒的任务

0
分享至

防走失,电梯直达

来源:量子位

作者:关注前沿科技

OpenAI出了个新功能,直接让ChatGPT输出的速度原地起飞!

这个功能叫做“预测输出”(Predicted Outputs),在它的加持之下,GPT-4o可以比原先快至多5倍

以编程为例,来感受一下这个feel:


为啥会这么快?用一句话来总结就是:

跳过已知内容,不用从头开始重新生成。

因此,“预测输出”就特别适合下面这些任务:

  • 在文档中更新博客文章

  • 迭代先前的响应

  • 重写现有文件中的代码

而且与OpenAI合作开发这个功能的FactoryAI,也亮出了他们在编程任务上的数据:


从实验结果来看,“预测输出”加持下的GPT-4o响应时间比之前快了2-4倍,同时保持高精度。

并且官方还表示:

原先需要70秒完成的编程任务,现在只需要20秒。

值得注意的是,目前“预测输出”功能仅支持GPT-4o和GPT-4o mini两个模型,且是以API的形式。

对于开发者而言,这可以说是个利好消息了。

网友们在线实测

消息一出,众多网友也是坐不住了,反手就是实测一波。

例如Firecrawl创始人Eric Ciarla就用“预测输出”体验了一把将博客文章转为SEO(搜索引擎优化)的内容,然后他表示:

速度真的超级快。 它就像在API调用中添加一个预测参数一样简单。

另一位网友则是在已有的代码之上,“喂”了一句Prompt:

change the details to be random pieces of text. 将详细信息更改为随机文本片段。

来感受一下这个速度:


也有网友晒出了自己实测的数据:


总而言之,快,是真的快。

怎么做到的?

对于“预测输出”的技术细节,OpenAI在官方文档中也有所介绍。


OpenAI认为,在某些情况下,LLM的大部分输出都是提前知道的。

如果你要求模型仅对某些文本或代码进行细微修改,就可以通过“预测输出”,将现有内容作为预测输入,让延迟明显降低。

例如,假设你想重构一段 C# 代码,将 Username 属性更改为 Email :

///
/// Represents a user with a first name, last name, and username.
///
public class User
{
///

/// Gets or sets the user's first name.
///
public string FirstName { get; set; }

///

/// Gets or sets the user's last name.
///
public string LastName { get; set; }

///

/// Gets or sets the user's username.
///
public string Username { get; set; }
}

你可以合理地假设文件的大部分内容将不会被修改(例如类的文档字符串、一些现有的属性等)。

通过将现有的类文件作为预测文本传入,你可以更快地重新生成整个文件。

import OpenAI from "openai";

const code = `
///
/// Represents a user with a first name, last name, and username.
///
public class User
{
///

/// Gets or sets the user's first name.
///
public string FirstName { get; set; }

///

/// Gets or sets the user's last name.
///
public string LastName { get; set; }

///

/// Gets or sets the user's username.
///
public string Username { get; set; }
}
`;

const openai = new OpenAI();

const completion = await openai.chat.completions.create({
model: "gpt-4o",
messages: [
{
role: "user",
content: "Replace the Username property with an Email property. Respond only with code, and with no markdown formatting."
},
{
role: "user",
content: code
}
],
prediction: {
type: "content",
content: code
}
});

// Inspect returned data
console.log(completion);

使用“预测输出”生成tokens会大大降低这些类型请求的延迟。

不过对于“预测输出”的使用,OpenAI官方也给出了几点注意事项。

首先就是我们刚才提到的仅支持GPT-4o和GPT-4o-mini系列模型。

其次,以下API参数在使用预测输出时是不受支持的:

  • n values greater than 1

  • logprobs

  • presence_penalty greater than 0

  • frequency_penalty greater than 0

  • audio options

  • modalities other than text

  • max_completion_tokens

  • tools - function calling is not supported

除此之外,在这份文档中,OpenAI还总结了除“预测输出”之外的几个延迟优化的方法。

包括“加速处理token”、“生成更少的token”、“使用更少的输入token”、“减少请求”、“并行化”等等。

文档链接放在文末了,感兴趣的小伙伴可以查阅哦~

One More Thing

虽然输出的速度变快了,但OpenAI还有一个注意事项引发了网友们的讨论:

When providing a prediction, any tokens provided that are not part of the final completion are charged at completion token rates. 在提供预测时,所提供的任何非最终完成部分的tokens都按完成tokens费率收费。

有网友也晒出了他的测试结果:

  • 未采用“预测输出”:5.2秒,0.1555美分

  • 采用了“预测输出”:3.3秒,0.2675美分


嗯,快了,也贵了。

OpenAI官方文档:

https://platform.openai.com/docs/guides/latency-optimization#use-predicted-outputs

[1]https://x.com/OpenAIDevs/status/1853564730872607229
[2]https://x.com/romainhuet/status/1853586848641433834
[3]https://x.com/GregKamradt/status/1853620167655481411

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
现在,日本为何不跟我们争钓鱼岛的归属,不跟我们提东海划界了?

现在,日本为何不跟我们争钓鱼岛的归属,不跟我们提东海划界了?

布衣的呼喊
2024-06-25 14:50:02
网易游戏多名高管被带走调查,涉及金额上亿?最新回应

网易游戏多名高管被带走调查,涉及金额上亿?最新回应

鲁中晨报
2024-11-08 10:48:06
“1元股”集体大涨,“2元以下”个股仅剩25个

“1元股”集体大涨,“2元以下”个股仅剩25个

第一财经资讯
2024-11-08 19:37:06
卡塔尔惊天转变!哈马斯高层成员遭警告驱赶,美国压力成关键!

卡塔尔惊天转变!哈马斯高层成员遭警告驱赶,美国压力成关键!

国际情爆猿
2024-11-09 02:18:20
罔顾组织挽救、提醒!市委原书记被“双开”(附简历)

罔顾组织挽救、提醒!市委原书记被“双开”(附简历)

鲁中晨报
2024-11-08 20:52:04
超强台风“银杏”确认影响浙江!今起雨势加强!还有大转折

超强台风“银杏”确认影响浙江!今起雨势加强!还有大转折

浙江之声
2024-11-08 08:26:29
震惊!李佩霞承认受贿165万元,律师:我仍然肯定她父亲的行为…

震惊!李佩霞承认受贿165万元,律师:我仍然肯定她父亲的行为…

火山诗话
2024-11-07 16:50:10
“消失”6年后,61岁崔永元近况凄惨!发文:我很后悔,真诚道歉

“消失”6年后,61岁崔永元近况凄惨!发文:我很后悔,真诚道歉

娱乐的小灶
2024-11-08 22:55:10
网传湘雅二院实习生坠亡有因!生前疑举报刘翔峰非法交易活体器官

网传湘雅二院实习生坠亡有因!生前疑举报刘翔峰非法交易活体器官

火山诗话
2024-11-08 14:11:07
任天堂2025财年上半年净利润腰斩,在中国加开线下体验门店 国行Switch能否逆袭?

任天堂2025财年上半年净利润腰斩,在中国加开线下体验门店 国行Switch能否逆袭?

每日经济新闻
2024-11-07 16:32:09
最新!社保基金大幅增持38支股票,中长期资金批量入市!

最新!社保基金大幅增持38支股票,中长期资金批量入市!

小宇宙双色球
2024-11-08 21:06:19
特朗普上台后,台湾回归迎来倒计时,马斯克:统一是100%会发生的

特朗普上台后,台湾回归迎来倒计时,马斯克:统一是100%会发生的

看晓天下事
2024-11-07 12:18:08
实探风波中的广阳岛!偌大景区空空荡荡,预约上岛比登天还难

实探风波中的广阳岛!偌大景区空空荡荡,预约上岛比登天还难

小树聊房
2024-11-08 18:57:10
马克龙要玩把大的!正好帮了中国一个大忙,收拾菲律宾的时候到了

马克龙要玩把大的!正好帮了中国一个大忙,收拾菲律宾的时候到了

诉人世间
2024-11-09 01:55:03
心疼二弟伊卡尔迪球场重伤,妻子旺达与rapper接吻+炮轰前者

心疼二弟伊卡尔迪球场重伤,妻子旺达与rapper接吻+炮轰前者

直播吧
2024-11-08 17:15:36
10万亿刺激政策来了!美联储刚降息,中国就出手,大放水要来了?

10万亿刺激政策来了!美联储刚降息,中国就出手,大放水要来了?

说天说地说实事
2024-11-08 20:35:48
金星“彩虹旗”事件后续,国内演出全部取消,黑料太多或转移国外

金星“彩虹旗”事件后续,国内演出全部取消,黑料太多或转移国外

吐不满的痰娱
2024-11-06 20:45:48
受权发布|全国人民代表大会常务委员会批准免职的名单

受权发布|全国人民代表大会常务委员会批准免职的名单

新华社
2024-11-09 00:43:03
付近千万欧!尤文主席:我们已付C罗要求赔偿金的50%,但将再上诉

付近千万欧!尤文主席:我们已付C罗要求赔偿金的50%,但将再上诉

直播吧
2024-11-08 13:10:24
人大、央行重磅利好!10万亿化债,A50尾盘大跳水,外资又搞事

人大、央行重磅利好!10万亿化债,A50尾盘大跳水,外资又搞事

看财经show
2024-11-08 18:29:10
2024-11-09 03:16:49
报人刘亚东
报人刘亚东
不唯上,不唯书,只唯实。
5014文章数 42036关注度
往期回顾 全部

科技要闻

停供7nm及以下AI芯片? 台积电未直接否认

头条要闻

郑钦文闯入WTA年终总决赛决赛 即时排名为世界第五位

头条要闻

郑钦文闯入WTA年终总决赛决赛 即时排名为世界第五位

体育要闻

曾在英冠坐板凳的他 是当今最火爆的射手

娱乐要闻

叶珂闪现闺蜜直播间,黄晓明评论沦陷

财经要闻

直接安排10万亿 地方政府化债压力大大减轻

汽车要闻

售10.98万起 银河星舰7 EM-i开启预售

态度原创

教育
亲子
本地
数码
公开课

教育要闻

求这个数的值怎么求?先用完全平方公式来计算,再代入

亲子要闻

幼儿园老师展示小男孩穿衣,光上衣就有七层,一看就是奶奶带得孙

本地新闻

塞上青城|“宜养”呼和浩特 你爱了吗?

数码要闻

影驰 RTX 4070 Ti SUPER 星曜 Plus OC 显卡开售,6399 元

公开课

AI如何揭开大自然和宇宙的奥秘

无障碍浏览 进入关怀版