Azure OpenAI 服务中心
了解如何将 Azure OpenAI 的强大语言模型(包括 GPT-3、Codex 和 Embeddings 模型系列)用于内容生成、摘要、语义搜索和自然语言到代码的转换。
Azure OpenAI 服务介绍
Azure OpenAI 服务定价
Azure OpenAI 服务模型
Azure OpenAI 服务配额限制
Azure OpenAI 服务常见问题
Azure OpenAI 服务SLA
Azure OpenAI 交流群

Azure OpenAI 服务模型

更新日期:2024/01/05

本文内容

Azure OpenAI 服务由一组具有不同功能和价位的模型提供支持。 模型可用性因地区而异。 有关将在 2024 年 7 月停用的 GPT-3 和其他模型的信息,请参阅 Azure OpenAI 服务旧模型

模型说明
GPT-4一组在 GPT-3.5 的基础上进行了改进的模型,可以理解并生成自然语言和代码。
GPT-3.5一组在 GPT-3 的基础上进行了改进的模型,可以理解并生成自然语言和代码。
嵌入一组模型,可将文本转换为数字矢量形式,以提高文本相似性。
DALL-E(预览版)一系列可从自然语言生成原始图像的模型(预览版)。
Whisper(预览版)一系列预览版模型,可将语音转录和翻译为文本。

GPT-4 and GPT-4 Turbo 预览版

与任何 OpenAI 以前的模型相比,GPT-4 可以更准确地解决难题。 与 GPT-3.5 Turbo 一样,GPT-4 针对聊天进行了优化,且能够很好地完成传统的补全任务。 使用聊天补全 API 来使用 GPT-4。 若要详细了解如何与 GPT-4 以及聊天补全 API 进行交互,请查看我们的操作方法详解

  • gpt-4
  • gpt-4-32k
  • gpt-4-vision

可以看到模型摘要表中的每个模型支持的令牌上下文长度。

GPT-3.5

GPT-3.5 模型可以理解和生成自然语言或代码。 GPT-3.5 系列中功能最强大且最具成本效益的模型是 GPT-3.5 Turbo,该模型已针对聊天进行了优化,且能够很好地完成传统的补全任务。 GPT-3.5 Turbo 可用于聊天完成 API。 GPT-3.5 Turbo 指令具有与使用完成 API 而不是聊天完成 API 类似的功能 text-davinci-003。 我们建议使用 GPT-3.5 Turbo 和 GPT-3.5 Turbo Instruct,而不是 GPT-3.5 和 GPT-3 两种旧模型

  • gpt-35-turbo
  • gpt-35-turbo-16k
  • gpt-35-turbo-instruct

可以看到模型摘要表中的每个模型支持的令牌上下文长度。

若要详细了解如何与 GPT-3.5 Turbo 以及聊天补全 API 进行交互,请查看我们的操作方法详解

嵌入

强烈建议使用 text-embedding-ada-002 (Version 2)。 此模型/版本提供与 OpenAI 的 text-embedding-ada-002 的奇偶校验。 若要详细了解此模型提供的改进,请参阅 OpenAI 的博客文章。 即使当前使用的是版本 1,也应迁移到版本 2 以利用最新的权重/更新的令牌限制。 版本 1 和版本 2 不可互换,因此必须使用同一版本的模型完成文档嵌入和文档搜索。

以前的嵌入模型已合并为以下新的替换模型:

text-embedding-ada-002

DALL-E(预览版)

DALL-E 模型目前为预览版,它们基于用户提供的文本提示生成图像。

Whisper(预览版)

目前处于预览状态的 Whisper 模型可用于语音转文本。

还可以通过 Azure AI 语音 批量听录 API 使用 Whisper 模型。 请查看什么是 Whisper 模型?,详细了解使用 Azure AI 语音与 Azure OpenAI 服务的场景。

模型摘要表和区域可用性

由于需求较高:美国中南部暂时无法创建新资源和部署。

GPT-4 and GPT-4 Turbo 预览版模型

包含视觉功能的 GPT-4、GPT-4-32k 和 GPT-4 Turbo 现已可供所有 Azure OpenAI 服务客户使用。 可用性因区域而异。 如果你所在区域没看到 GPT-4,请稍后回来查看。

这些模型只能与聊天补全 API 一起使用。

GPT-4 版本 0314 是发布的模型的第一个版本。 版本 0613 是模型的第二个版本,并添加了函数调用支持。

请参阅模型版本,了解 Azure OpenAI 服务如何处理模型版本升级,使用模型了解如何查看和配置 GPT-4 部署的模型版本设置。

gpt-4 和 gpt-4-32k 的版本 0314 将于 2024 年 7 月 5 日或之后停用。 如需了解模型升级行为,请参阅模型更新
模型 ID最大请求(令牌)训练数据(上限)
gpt-4 (0314)8,1922021 年 9 月
gpt-4-32k(0314)
32,768
2021 年 9 月
gpt-4 (0613)8,1922021 年 9 月
gpt-4-32k (0613)32,7682021 年 9 月
gpt-4 (1106-preview)1
GPT-4 Turbo 预览版
输入:128,000
输出:4096
2023 年 4 月
gpt-4 (vision-preview)2
包含视觉功能预览版的 GPT-4 Turbo
输入:128,000
输出:4096
2023 年 4 月

1 GPT-4 Turbo 预览版 = gpt-4 (1106-preview). 若要部署此模型,请在“部署”下选择模型 gpt-4。 对于“模型版本”,请选择“1106-preview”。 

2 包含视觉功能预览版的 GPT-4 Turbo = gpt-4 (vision-preview)。 若要部署此模型,请在“部署”下选择模型 gpt-4。 对于“模型版本”,请选择“vision-preview”。

我们不建议在生产环境中使用预览模型。 我们会将预览模型的所有部署升级到未来的稳定版本。指定的模型预览版不遵循标准的 Azure OpenAI 模型生命周期。
GPT-4 (0314) & (0613) 列为可用的区域将有权访问模型的 8K 和 32K 版本

GPT-4 和 GPT-4 Turbo 预览版模型可用性

模型可用性gpt-4 (0314)gpt-4 (0613)gpt-4 (1106-preview)gpt-4 (vision-preview)
可用于具有 Azure OpenAI 访问权限的所有订阅澳大利亚东部
加拿大东部
法国中部
瑞典中部
瑞士北部
澳大利亚东部
加拿大东部
美国东部 2
法国中部
挪威东部
印度南部
瑞典中部
英国南部
美国西部
瑞典中部
瑞士北部
美国西部
对区域中的模型版本的当前访问权限的订阅可用美国东部
法国中部
美国中南部
英国南部
美国东部
美国东部 2
日本东部
英国南部
澳大利亚东部

GPT-3.5 模型

GPT-3.5 Turbo 可与聊天补全 API 搭配使用。 GPT-3.5 Turbo 版本 0301 也可以与补全 API 搭配使用。 GPT3.5 Turbo 版本 0613 和 1106 仅支持聊天补全 API。

GPT-3.5 Turbo 版本 0301 是发布的模型的第一个版本。 版本 0613 是模型的第二个版本,并添加了函数调用支持。

请参阅模型版本,了解 Azure OpenAI 服务如何处理模型版本升级,使用模型了解如何查看和配置 GPT-3.5 Turbo 部署的模型版本设置。

gpt-35-turbo 的版本 0301 将不早于 2024 年 7 月 5 日停用。 如需了解模型升级行为,请参阅模型更新

GPT-3.5-Turbo 模型可用性

模型 ID模型可用性最大请求(令牌)训练数据(上限)
gpt-35-turbo1 (0301)美国东部
法国中部
美国中南部
英国南部
西欧
40962021 年 9 月
gpt-35-turbo (0613)澳大利亚东部
加拿大东部
美国东部
美国东部 2
法国中部
日本东部
美国中北部
瑞典中部
瑞士北部
英国南部
40962021 年 9 月
gpt-35-turbo-16k (0613)澳大利亚东部
加拿大东部
美国东部
美国东部 2
法国中部
日本东部
美国中北部
瑞典中部
瑞士北部
英国南部
16,3842021 年 9 月
gpt-35-turbo-instruct (0914)美国东部
瑞典中部
40972021 年 9 月
gpt-35-turbo (1106)澳大利亚东部
加拿大东部
法国中部
印度南部
瑞典中部
英国南部
美国西部
输入:16,385
输出:4,096
2021 年 9 月

1 此模型将接受 > 4096 个令牌的请求。 不建议超过 4096 输入令牌限制,因为较新版本的模型上限为 4096 令牌。 如果使用此模型超过 4096 个输入令牌时遇到问题,则此配置不受正式支持。

嵌入模型

这些模型只能与嵌入 API 请求一起使用。

强烈建议使用 text-embedding-ada-002 (Version 2)。 此模型/版本提供与 OpenAI 的 text-embedding-ada-002 的奇偶校验。 若要详细了解此模型提供的改进,请参阅 OpenAI 的博客文章。 即使当前使用的是版本 1,也应迁移到版本 2 以利用最新的权重/更新的令牌限制。 版本 1 和版本 2 不可互换,因此必须使用同一版本的模型完成文档嵌入和文档搜索。
模型 ID模型可用性最大请求(令牌)训练数据(上限)输出维度
text-embedding-ada-002(版本 2)澳大利亚东部
加拿大东部
美国东部
美国东部 2
法国中部
日本东部
美国中北部
挪威东部
美国中南部
瑞典中部
瑞士北部
英国南部
西欧
美国西部
8,1912021 年 9 月1536
text-embedding-ada-002(版本 1)美国东部
美国中南部
西欧
2,0462021 年 9 月1536

DALL-E 模型(预览版)

模型 ID功能可用性最大请求(字符数)
dalle2美国东部1000
dalle3瑞典中部4000

微调模型(预览版)

未训练 babbage-002 和 davinci-002 按照说明进行操作。 查询这些基本模型只能作为对微调版本的引用点来完成,以评估训练进度。

gpt-35-turbo-0613 – 此模型的微调仅限于区域子集,并且基础模型在可用的每个区域中都不可用。

模型 ID微调区域最大请求(令牌)训练数据(上限)
babbage-002美国中北部
瑞典中部
16,3842021 年 9 月
davinci-002美国中北部
瑞典中部
16,3842021 年 9 月
gpt-35-turbo (0613)美国中北部
瑞典中部
40962021 年 9 月

Whisper 模型(预览)

模型 ID模型可用性最大请求(音频文件大小)
whisper美国中北部
西欧
25 MB
相关文章:

滚动到顶部