更新日期:2024/01/05
本文内容
Azure OpenAI 服务由一组具有不同功能和价位的模型提供支持。 模型可用性因地区而异。 有关将在 2024 年 7 月停用的 GPT-3 和其他模型的信息,请参阅 Azure OpenAI 服务旧模型。
模型 | 说明 |
GPT-4 | 一组在 GPT-3.5 的基础上进行了改进的模型,可以理解并生成自然语言和代码。 |
GPT-3.5 | 一组在 GPT-3 的基础上进行了改进的模型,可以理解并生成自然语言和代码。 |
嵌入 | 一组模型,可将文本转换为数字矢量形式,以提高文本相似性。 |
DALL-E(预览版) | 一系列可从自然语言生成原始图像的模型(预览版)。 |
Whisper(预览版) | 一系列预览版模型,可将语音转录和翻译为文本。 |
GPT-4 and GPT-4 Turbo 预览版
与任何 OpenAI 以前的模型相比,GPT-4 可以更准确地解决难题。 与 GPT-3.5 Turbo 一样,GPT-4 针对聊天进行了优化,且能够很好地完成传统的补全任务。 使用聊天补全 API 来使用 GPT-4。 若要详细了解如何与 GPT-4 以及聊天补全 API 进行交互,请查看我们的操作方法详解。
gpt-4
gpt-4-32k
gpt-4-vision
可以看到模型摘要表中的每个模型支持的令牌上下文长度。
GPT-3.5
GPT-3.5 模型可以理解和生成自然语言或代码。 GPT-3.5 系列中功能最强大且最具成本效益的模型是 GPT-3.5 Turbo,该模型已针对聊天进行了优化,且能够很好地完成传统的补全任务。 GPT-3.5 Turbo 可用于聊天完成 API。 GPT-3.5 Turbo 指令具有与使用完成 API 而不是聊天完成 API 类似的功能 text-davinci-003
。 我们建议使用 GPT-3.5 Turbo 和 GPT-3.5 Turbo Instruct,而不是 GPT-3.5 和 GPT-3 两种旧模型。
gpt-35-turbo
gpt-35-turbo-16k
gpt-35-turbo-instruct
可以看到模型摘要表中的每个模型支持的令牌上下文长度。
若要详细了解如何与 GPT-3.5 Turbo 以及聊天补全 API 进行交互,请查看我们的操作方法详解。
嵌入
强烈建议使用text-embedding-ada-002 (Version 2)
。 此模型/版本提供与 OpenAI 的text-embedding-ada-002
的奇偶校验。 若要详细了解此模型提供的改进,请参阅 OpenAI 的博客文章。 即使当前使用的是版本 1,也应迁移到版本 2 以利用最新的权重/更新的令牌限制。 版本 1 和版本 2 不可互换,因此必须使用同一版本的模型完成文档嵌入和文档搜索。
以前的嵌入模型已合并为以下新的替换模型:
text-embedding-ada-002
DALL-E(预览版)
DALL-E 模型目前为预览版,它们基于用户提供的文本提示生成图像。
Whisper(预览版)
目前处于预览状态的 Whisper 模型可用于语音转文本。
还可以通过 Azure AI 语音 批量听录 API 使用 Whisper 模型。 请查看什么是 Whisper 模型?,详细了解使用 Azure AI 语音与 Azure OpenAI 服务的场景。
模型摘要表和区域可用性
由于需求较高:美国中南部暂时无法创建新资源和部署。
GPT-4 and GPT-4 Turbo 预览版模型
包含视觉功能的 GPT-4、GPT-4-32k 和 GPT-4 Turbo 现已可供所有 Azure OpenAI 服务客户使用。 可用性因区域而异。 如果你所在区域没看到 GPT-4,请稍后回来查看。
这些模型只能与聊天补全 API 一起使用。
GPT-4 版本 0314 是发布的模型的第一个版本。 版本 0613 是模型的第二个版本,并添加了函数调用支持。
请参阅模型版本,了解 Azure OpenAI 服务如何处理模型版本升级,使用模型了解如何查看和配置 GPT-4 部署的模型版本设置。
gpt-4
和gpt-4-32k
的版本0314
将于 2024 年 7 月 5 日或之后停用。 如需了解模型升级行为,请参阅模型更新。
模型 ID | 最大请求(令牌) | 训练数据(上限) |
gpt-4 (0314) | 8,192 | 2021 年 9 月 |
gpt-4-32k (0314) | 32,768 | 2021 年 9 月 |
gpt-4 (0613) | 8,192 | 2021 年 9 月 |
gpt-4-32k (0613) | 32,768 | 2021 年 9 月 |
gpt-4 (1106-preview)1GPT-4 Turbo 预览版 | 输入:128,000 输出:4096 | 2023 年 4 月 |
gpt-4 (vision-preview)2包含视觉功能预览版的 GPT-4 Turbo | 输入:128,000 输出:4096 | 2023 年 4 月 |
1 GPT-4 Turbo 预览版 = gpt-4
(1106-preview). 若要部署此模型,请在“部署”下选择模型 gpt-4。 对于“模型版本”,请选择“1106-preview”。
2 包含视觉功能预览版的 GPT-4 Turbo = gpt-4
(vision-preview)。 若要部署此模型,请在“部署”下选择模型 gpt-4。 对于“模型版本”,请选择“vision-preview”。
我们不建议在生产环境中使用预览模型。 我们会将预览模型的所有部署升级到未来的稳定版本。指定的模型预览版不遵循标准的 Azure OpenAI 模型生命周期。
GPT-4 (0314) & (0613) 列为可用的区域将有权访问模型的 8K 和 32K 版本
GPT-4 和 GPT-4 Turbo 预览版模型可用性
模型可用性 | gpt-4 (0314) | gpt-4 (0613) | gpt-4 (1106-preview) | gpt-4 (vision-preview) |
可用于具有 Azure OpenAI 访问权限的所有订阅 | 澳大利亚东部 加拿大东部 法国中部 瑞典中部 瑞士北部 | 澳大利亚东部 加拿大东部 美国东部 2 法国中部 挪威东部 印度南部 瑞典中部 英国南部 美国西部 | 瑞典中部 瑞士北部 美国西部 | |
对区域中的模型版本的当前访问权限的订阅可用 | 美国东部 法国中部 美国中南部 英国南部 | 美国东部 美国东部 2 日本东部 英国南部 | 澳大利亚东部 |
GPT-3.5 模型
GPT-3.5 Turbo 可与聊天补全 API 搭配使用。 GPT-3.5 Turbo 版本 0301 也可以与补全 API 搭配使用。 GPT3.5 Turbo 版本 0613 和 1106 仅支持聊天补全 API。
GPT-3.5 Turbo 版本 0301 是发布的模型的第一个版本。 版本 0613 是模型的第二个版本,并添加了函数调用支持。
请参阅模型版本,了解 Azure OpenAI 服务如何处理模型版本升级,使用模型了解如何查看和配置 GPT-3.5 Turbo 部署的模型版本设置。
gpt-35-turbo
的版本0301
将不早于 2024 年 7 月 5 日停用。 如需了解模型升级行为,请参阅模型更新。
GPT-3.5-Turbo 模型可用性
模型 ID | 模型可用性 | 最大请求(令牌) | 训练数据(上限) |
gpt-35-turbo 1 (0301) | 美国东部 法国中部 美国中南部 英国南部 西欧 | 4096 | 2021 年 9 月 |
gpt-35-turbo (0613) | 澳大利亚东部 加拿大东部 美国东部 美国东部 2 法国中部 日本东部 美国中北部 瑞典中部 瑞士北部 英国南部 | 4096 | 2021 年 9 月 |
gpt-35-turbo-16k (0613) | 澳大利亚东部 加拿大东部 美国东部 美国东部 2 法国中部 日本东部 美国中北部 瑞典中部 瑞士北部 英国南部 | 16,384 | 2021 年 9 月 |
gpt-35-turbo-instruct (0914) | 美国东部 瑞典中部 | 4097 | 2021 年 9 月 |
gpt-35-turbo (1106) | 澳大利亚东部 加拿大东部 法国中部 印度南部 瑞典中部 英国南部 美国西部 | 输入:16,385 输出:4,096 | 2021 年 9 月 |
1 此模型将接受 > 4096 个令牌的请求。 不建议超过 4096 输入令牌限制,因为较新版本的模型上限为 4096 令牌。 如果使用此模型超过 4096 个输入令牌时遇到问题,则此配置不受正式支持。
嵌入模型
这些模型只能与嵌入 API 请求一起使用。
强烈建议使用text-embedding-ada-002 (Version 2)
。 此模型/版本提供与 OpenAI 的text-embedding-ada-002
的奇偶校验。 若要详细了解此模型提供的改进,请参阅 OpenAI 的博客文章。 即使当前使用的是版本 1,也应迁移到版本 2 以利用最新的权重/更新的令牌限制。 版本 1 和版本 2 不可互换,因此必须使用同一版本的模型完成文档嵌入和文档搜索。
模型 ID | 模型可用性 | 最大请求(令牌) | 训练数据(上限) | 输出维度 |
text-embedding-ada-002 (版本 2) | 澳大利亚东部 加拿大东部 美国东部 美国东部 2 法国中部 日本东部 美国中北部 挪威东部 美国中南部 瑞典中部 瑞士北部 英国南部 西欧 美国西部 | 8,191 | 2021 年 9 月 | 1536 |
text-embedding-ada-002 (版本 1) | 美国东部 美国中南部 西欧 | 2,046 | 2021 年 9 月 | 1536 |
DALL-E 模型(预览版)
模型 ID | 功能可用性 | 最大请求(字符数) |
dalle2 | 美国东部 | 1000 |
dalle3 | 瑞典中部 | 4000 |
微调模型(预览版)
未训练 babbage-002
和 davinci-002
按照说明进行操作。 查询这些基本模型只能作为对微调版本的引用点来完成,以评估训练进度。
gpt-35-turbo-0613
– 此模型的微调仅限于区域子集,并且基础模型在可用的每个区域中都不可用。
模型 ID | 微调区域 | 最大请求(令牌) | 训练数据(上限) |
babbage-002 | 美国中北部 瑞典中部 | 16,384 | 2021 年 9 月 |
davinci-002 | 美国中北部 瑞典中部 | 16,384 | 2021 年 9 月 |
gpt-35-turbo (0613) | 美国中北部 瑞典中部 | 4096 | 2021 年 9 月 |
Whisper 模型(预览)
模型 ID | 模型可用性 | 最大请求(音频文件大小) |
whisper | 美国中北部 西欧 | 25 MB |