网易首页 > 网易号 > 正文 申请入驻

企业如何计算 Azure OpenAI 服务使用成本?(附优化指南)

0
分享至

Microsoft Azure 云平台的 Azure OpenAI 服务是一款功能强大的工具,它赋予开发者访问 OpenAI 最新的语言处理技术的能力。



通过一系列尖端模型,如 gpt-4o、gpt-4、gpt-3.5-turbo、DALL-E 和 ada,开发者能够开启在创意文本创作、信息摘要化、语义检索以及自然语言向代码的转换等多个领域的新视野。在本文中,我们将深入探讨 Azure OpenAI 服务的多项功能,并对其成本结构进行详尽的分析。

Azure费用解决方案可联系。同时,通过微软官方合作伙伴获取服务,企业用户可以合规、稳定地使用ChatGPT,满足国内发票需求,同时也能解决连接不稳定/响应速度慢/并发配额低等问题。

作为微软的合作伙伴,全云在线可为企业开通绿色申请通道!包括最新版本GPT-4o、Dalle-3等,只要企业有需求,全云在线都能协助快速开通!

Azure OpenAI 服务成本咨询、免费试用:
https://azureopenai.cloudallonline.com/?zxwwy117



代币

来自OpenAI 帮助中心:

令牌可以被认为是单词的片段。在 API 处理提示之前,输入会被分解为标记。这些标记并未准确地在单词开始或结束的位置进行切割 - 标记可以包含尾随空格甚至子单词。以下是一些帮助理解令牌长度的有用经验规则:

  • 1 个标记 ~= 4 个英文字符
  • 1 个令牌 ~= 3/4 个单词
  • 100 个标记 ~= 75 个单词

或者

  • 1–2 句话 ~= 30 个标记
  • 1 段 ~= 100 个标记
  • 1,500 个单词 ~= 2048 个标记

要获得有关令牌如何堆叠的更多上下文,请考虑以下内容:

  • 韦恩·格雷茨基 (Wayne Gretzky) 的名言“如果你不投篮,你就会 100% 投失”包含 11 个标记。
  • OpenAI 的章程包含 476 个代币。
  • 美国《独立宣言》的抄本包含 1,695 个代币。

如何将单词拆分为标记也取决于语言。例如,“Cómo estás”(西班牙语“How are you”)包含 5 个标记(10 个字符)。较高的 token-char 比率可能会导致为英语以外的语言实现 API 的成本更高。

要进一步探索标记化,您可以使用我们的交互式Tokenizer 工具,它允许您计算标记数量并查看文本如何分解为标记。或者,如果您想以编程方式对文本进行标记,请使用Tiktoken作为专门用于 OpenAI 模型的快速 BPE 标记器。您还可以探索其他此类库,包括适用于 Python 的Transformers包或适用于 Node.js 的gpt-3-encoder包。

根据所使用的模型,请求最多可以使用提示和完成之间共享的 4,097 个令牌。如果您的提示是 4,000 个令牌,那么您最多可以完成 97 个令牌。

GPT-3.5型号

当前版本的gpt-3.5-turbo的限制为 4,096 个令牌,而最新版本的gpt-3.5-turbo-16k的限制为 16,384 个令牌。两者的价格均为每 1,000 个代币 0.002 美元(提示和完成的价格相同)。

GPT-4型号

GPT-4 模型有两种选项:限制为8,192 个代币的gpt-4模型和限制为 32,768 个代币的gpt-4-32k。

提示模式下gpt-4模型的定价为每 1,000 个代币 8K 上下文 0.03 美元,32K 上下文 0.06 美元。在完成模式下,每 1,000 个代币8K 上下文的定价为0.06 美元, 32K 上下文的定价为 0.12 美元。

微调模型

只有 GPT-3 模型(ada、curie、davinci、babbage)可用于微调(它们称为“基础”模型)。

来自微软学习:

Azure OpenAI 微调模型根据三个因素收费:

  • 培训时间
  • 接待时间
  • 每 1,000 个令牌的推理

托管时间成本非常重要,因为一旦部署了微调模型,无论您是否主动使用它,它都会继续产生每小时成本。应密切监控微调模型的成本。

目前,Azure OpenAI 服务中尚不提供微调模型。

达尔-E

Azure OpenAI 服务还包括图像模型,其定价基于处理的图像数量。标准图像模型 DALL-E 的售价为每 100 张图像 2 美元。

嵌入模型

除了语言和图像模型之外,Azure OpenAI 服务还提供嵌入模型。标准嵌入模型 Ada 的定价为每 1,000 个代币 0.0001 美元。

定价计算示例

想象一下,我们需要提出以下请求:

  • 使用gpt-3.5-turbo模型,提示 1,000 个令牌,完成 1,000 个令牌;
  • 使用gpt-4模型,提示时需要 1,000 个令牌,完成时需要 1,000 个令牌;
  • 使用gpt-4-32k模型,提示中包含 30,000 个令牌,完成中包含 10,000 个令牌。

计算逻辑:

对于gpt-3.5-turbo,成本为:
(1,000 +1,000) / 1,000 * $0.002 = 2 * $0.002 = $0.004。

对于gpt-4,成本为:
(1,000 / 1,000 * $0.03) + (1,000 / 1,000 * $0.06) = $0.03 + $0.06 = $0.09。

对于gpt-4–32k,成本为:
(30,000 / 1,000 * $0.06) + (10,000 / 1,000 * $0.12) = 30 * $0.06 + 10 * $0.12 = $1.8 + $1.2 = $3

总共价格为 3.094 美元。

从示例中可以看出,使用 gpt-4-32k 很昂贵,而gpt-3.5-turbo是最节省成本的选项。

你可以使用定价计算器来计算 Azure OpenAI 的工作负载,但其中目前缺少 GPT-4 和微调模型。

Azure OpenAI 服务在 Azure 基础架构上运行,在部署新资源时会产生成本。重要的是要了解可能会产生其他额外的基础设施成本。



请记住,启用将数据发送到 Azure Monitor 日志、警报等功能会导致这些服务产生额外费用。这些成本在其他服务和订阅级别下可见,但在范围仅限于 Azure OpenAI 资源时不可见。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
李娜回应郑钦文不交友言论:竞技场上是对手 场下亦可畅聊

李娜回应郑钦文不交友言论:竞技场上是对手 场下亦可畅聊

娱乐的小灶
2024-11-08 16:02:21
特朗普将发起美国历史上最大规模的驱逐行动

特朗普将发起美国历史上最大规模的驱逐行动

欧时大参
2024-11-09 02:33:17
难怪武松不得善终,你看他在孙二娘家那晚夺走了啥,张青无可奈何

难怪武松不得善终,你看他在孙二娘家那晚夺走了啥,张青无可奈何

耳东文史
2024-11-09 00:11:27
普京对日本制裁表示不理解:我们没对日本做不好的事,为什么制裁俄罗斯?

普京对日本制裁表示不理解:我们没对日本做不好的事,为什么制裁俄罗斯?

环球网资讯
2024-11-08 18:51:10
打脸了!北大网友怀疑姜萍考试作弊,中科院博士说她写的比我还快

打脸了!北大网友怀疑姜萍考试作弊,中科院博士说她写的比我还快

云舟史策
2024-06-18 18:42:31
全新“宝马X8”渲染图曝光,升级V8插混系统,与库里南同平台!

全新“宝马X8”渲染图曝光,升级V8插混系统,与库里南同平台!

沙雕小琳琳
2024-11-08 21:50:39
北大才女殷杰:与非洲黑人结婚定居北京,混血儿女如今是百万网红

北大才女殷杰:与非洲黑人结婚定居北京,混血儿女如今是百万网红

毒舌混知所
2024-11-08 07:55:13
特朗普新动向!反中大将卢比奥出任国务卿?拉美反中势力将集结!

特朗普新动向!反中大将卢比奥出任国务卿?拉美反中势力将集结!

国际情爆猿
2024-11-08 11:05:57
从富裕到贫穷,南非只用了一个伟人曼德拉,这个伟人他做了什么?

从富裕到贫穷,南非只用了一个伟人曼德拉,这个伟人他做了什么?

明月文史
2024-10-28 23:06:14
面临新形势!中央首次召开这一重要会议

面临新形势!中央首次召开这一重要会议

政知新媒体
2024-11-07 17:35:36
你知道吗?现在看似天经地义的双休制度,其实花了整整40年才落实

你知道吗?现在看似天经地义的双休制度,其实花了整整40年才落实

大道微言
2024-11-07 23:52:34
刘伟任交通运输部部长

刘伟任交通运输部部长

新京报
2024-11-08 17:24:03
郑钦文击败克雷吉茨科娃,首进WTA年终总决赛争冠赛

郑钦文击败克雷吉茨科娃,首进WTA年终总决赛争冠赛

全网球APP
2024-11-09 01:06:28
选完抓战犯! 乔治克隆尼遭民主党支持者狂喷「川普要谢谢你」

选完抓战犯! 乔治克隆尼遭民主党支持者狂喷「川普要谢谢你」

ETtoday星光云
2024-11-08 11:02:09
《好团圆》家暴向南、逼柴进行贿,江宏斌入狱,亿万家产被瓜分

《好团圆》家暴向南、逼柴进行贿,江宏斌入狱,亿万家产被瓜分

宇林网络
2024-11-09 02:37:41
中方必须做好万全准备!南海突然传来爆炸性消息,越南彻底摊牌了

中方必须做好万全准备!南海突然传来爆炸性消息,越南彻底摊牌了

君君文谈
2024-11-06 18:38:34
11月9日重点新闻摘要,中国传来13个好消息,希望大家耐心看完!

11月9日重点新闻摘要,中国传来13个好消息,希望大家耐心看完!

花小萌和你聊情感
2024-11-09 02:47:14
万丰奥威:万丰飞机与大众(德国)签署电动垂直起降航空器(eVTOL)领域技术合作谅解备忘录

万丰奥威:万丰飞机与大众(德国)签署电动垂直起降航空器(eVTOL)领域技术合作谅解备忘录

财联社
2024-11-08 18:04:17
陕西蒲城失踪24年女子确定遇害,嫌疑人未被批捕,家属发声

陕西蒲城失踪24年女子确定遇害,嫌疑人未被批捕,家属发声

鲁中晨报
2024-11-08 11:48:05
欧盟领导人非正式会议通过《布达佩斯宣言》

欧盟领导人非正式会议通过《布达佩斯宣言》

财联社
2024-11-09 00:12:06
2024-11-09 03:50:44
全云在线
全云在线
信息网络安全合规相关资讯
900文章数 14关注度
往期回顾 全部

科技要闻

停供7nm及以下AI芯片? 台积电未直接否认

头条要闻

郑钦文闯入WTA年终总决赛决赛 即时排名为世界第五位

头条要闻

郑钦文闯入WTA年终总决赛决赛 即时排名为世界第五位

体育要闻

曾在英冠坐板凳的他 是当今最火爆的射手

娱乐要闻

叶珂闪现闺蜜直播间,黄晓明评论沦陷

财经要闻

直接安排10万亿 地方政府化债压力大大减轻

汽车要闻

售10.98万起 银河星舰7 EM-i开启预售

态度原创

游戏
健康
亲子
艺术
公开课

《野狗子》评测:恐怖游戏传奇教父,向中式恐怖题材发起挑战

花18万治疗阿尔茨海默病,值不值?

亲子要闻

幼儿园老师展示小男孩穿衣,光上衣就有七层,一看就是奶奶带得孙

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

公开课

AI如何揭开大自然和宇宙的奥秘

无障碍浏览 进入关怀版