企业如何计算 Azure OpenAI 服务使用成本？（附优化指南）|微软|令牌|azure|openai

企业如何计算 Azure OpenAI 服务使用成本？（附优化指南）

2024-07-15 16:52:14　来源: 全云在线

广东举报

分享至

Microsoft Azure 云平台的 Azure OpenAI 服务是一款功能强大的工具，它赋予开发者访问 OpenAI 最新的语言处理技术的能力。

通过一系列尖端模型，如 gpt-4o、gpt-4、gpt-3.5-turbo、DALL-E 和 ada，开发者能够开启在创意文本创作、信息摘要化、语义检索以及自然语言向代码的转换等多个领域的新视野。在本文中，我们将深入探讨 Azure OpenAI 服务的多项功能，并对其成本结构进行详尽的分析。

Azure费用解决方案可联系。同时，通过微软官方合作伙伴获取服务，企业用户可以合规、稳定地使用ChatGPT，满足国内发票需求，同时也能解决连接不稳定/响应速度慢/并发配额低等问题。

作为微软的合作伙伴，全云在线可为企业开通绿色申请通道！包括最新版本GPT-4o、Dalle-3等，只要企业有需求，全云在线都能协助快速开通！

Azure OpenAI 服务成本咨询、免费试用：
https://azureopenai.cloudallonline.com/?zxwwy117

代币

来自OpenAI 帮助中心：

令牌可以被认为是单词的片段。在 API 处理提示之前，输入会被分解为标记。这些标记并未准确地在单词开始或结束的位置进行切割 - 标记可以包含尾随空格甚至子单词。以下是一些帮助理解令牌长度的有用经验规则：

1 个标记 ~= 4 个英文字符
1 个令牌 ~= 3/4 个单词
100 个标记 ~= 75 个单词

或者

1–2 句话 ~= 30 个标记
1 段 ~= 100 个标记
1,500 个单词 ~= 2048 个标记

要获得有关令牌如何堆叠的更多上下文，请考虑以下内容：

韦恩·格雷茨基 (Wayne Gretzky) 的名言“如果你不投篮，你就会 100% 投失”包含 11 个标记。
OpenAI 的章程包含 476 个代币。
美国《独立宣言》的抄本包含 1,695 个代币。

如何将单词拆分为标记也取决于语言。例如，“Cómo estás”（西班牙语“How are you”）包含 5 个标记（10 个字符）。较高的 token-char 比率可能会导致为英语以外的语言实现 API 的成本更高。

要进一步探索标记化，您可以使用我们的交互式Tokenizer 工具，它允许您计算标记数量并查看文本如何分解为标记。或者，如果您想以编程方式对文本进行标记，请使用Tiktoken作为专门用于 OpenAI 模型的快速 BPE 标记器。您还可以探索其他此类库，包括适用于 Python 的Transformers包或适用于 Node.js 的gpt-3-encoder包。

根据所使用的模型，请求最多可以使用提示和完成之间共享的 4,097 个令牌。如果您的提示是 4,000 个令牌，那么您最多可以完成 97 个令牌。

GPT-3.5型号

当前版本的gpt-3.5-turbo的限制为 4,096 个令牌，而最新版本的gpt-3.5-turbo-16k的限制为 16,384 个令牌。两者的价格均为每 1,000 个代币 0.002 美元（提示和完成的价格相同）。

GPT-4型号

GPT-4 模型有两种选项：限制为8,192 个代币的gpt-4模型和限制为 32,768 个代币的gpt-4-32k。

提示模式下gpt-4模型的定价为每 1,000 个代币 8K 上下文 0.03 美元，32K 上下文 0.06 美元。在完成模式下，每 1,000 个代币8K 上下文的定价为0.06 美元， 32K 上下文的定价为 0.12 美元。

微调模型

只有 GPT-3 模型（ada、curie、davinci、babbage）可用于微调（它们称为“基础”模型）。

来自微软学习：

Azure OpenAI 微调模型根据三个因素收费：

培训时间
接待时间
每 1,000 个令牌的推理

托管时间成本非常重要，因为一旦部署了微调模型，无论您是否主动使用它，它都会继续产生每小时成本。应密切监控微调模型的成本。

目前，Azure OpenAI 服务中尚不提供微调模型。

达尔-E

Azure OpenAI 服务还包括图像模型，其定价基于处理的图像数量。标准图像模型 DALL-E 的售价为每 100 张图像 2 美元。

嵌入模型

除了语言和图像模型之外，Azure OpenAI 服务还提供嵌入模型。标准嵌入模型 Ada 的定价为每 1,000 个代币 0.0001 美元。

定价计算示例

想象一下，我们需要提出以下请求：

使用gpt-3.5-turbo模型，提示 1,000 个令牌，完成 1,000 个令牌；
使用gpt-4模型，提示时需要 1,000 个令牌，完成时需要 1,000 个令牌；
使用gpt-4-32k模型，提示中包含 30,000 个令牌，完成中包含 10,000 个令牌。

计算逻辑：

对于gpt-3.5-turbo，成本为：
(1,000 +1,000) / 1,000 * $0.002 = 2 * $0.002 = $0.004。

对于gpt-4，成本为：
(1,000 / 1,000 * $0.03) + (1,000 / 1,000 * $0.06) = $0.03 + $0.06 = $0.09。

对于gpt-4–32k，成本为：
(30,000 / 1,000 * $0.06) + (10,000 / 1,000 * $0.12) = 30 * $0.06 + 10 * $0.12 = $1.8 + $1.2 = $3

总共价格为 3.094 美元。

从示例中可以看出，使用 gpt-4-32k 很昂贵，而gpt-3.5-turbo是最节省成本的选项。

你可以使用定价计算器来计算 Azure OpenAI 的工作负载，但其中目前缺少 GPT-4 和微调模型。

Azure OpenAI 服务在 Azure 基础架构上运行，在部署新资源时会产生成本。重要的是要了解可能会产生其他额外的基础设施成本。

请记住，启用将数据发送到 Azure Monitor 日志、警报等功能会导致这些服务产生额外费用。这些成本在其他服务和订阅级别下可见，但在范围仅限于 Azure OpenAI 资源时不可见。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.