OpenAI API中文文档 - 介绍

发布时间 2023-08-04 14:35:54作者: jerryqm

介绍

概述

寻找ChatGPT?请前往 chat.openai.com

OpenAI API几乎可以应用于任何需要理解或生成自然语言和代码的任务。OpenAI API还可以用于生成和编辑图像,或将语音转换为文本。我们提供多种不同功能和价格的模型,并且还可以对自定义模型进行微调。

资源

  • 在沙盒中进行实验
  • 阅读API参考文档
  • 访问帮助中心
  • 查看当前API状态
  • 浏览OpenAI开发者论坛
  • 了解我们的使用政策

在OpenAI,保护用户数据是我们使命的核心。我们不会通过API对输入和输出进行模型训练。请在我们的 API数据隐私页面 了解更多信息。

关键概念

GPT模型

OpenAI的GPT(生成预训练转换器)模型已经经过训练,可以理解自然语言和代码。GPT提供对输入的文本输出。GPT的输入也被称为“提示”。设计一个提示基本上就是如何“编程”一个GPT模型,通常通过提供指令或一些示例来成功完成任务。GPT可以在各种各样的任务中使用,包括内容或代码生成、摘要、对话、创意写作等。请在我们的 GPT入门指南GPT最佳实践指南 中了解更多信息。

嵌入模型

嵌入是数据(例如一些文本)的向量表示,旨在保留其内容和/或含义的某些方面。在某种程度上相似的数据块往往具有比不相关数据更接近的嵌入向量。OpenAI提供文本嵌入模型,它以文本字符串作为输入,并生成一个嵌入向量作为输出。嵌入在搜索、聚类、推荐、异常检测、分类等方面非常有用。请在我们的 嵌入指南 中了解更多信息。

标记

GPT和嵌入模型处理文本时会将其分成称为"标记"的块。标记表示常见的字符序列。例如,字符串 "tokenization" 被分解为 "token" 和 "ization",而像 "the" 这样的短且常见的单词则表示为单个标记。请注意,在句子中,每个单词的第一个标记通常以空格字符开头。您可以使用我们的标记器工具测试特定的字符串,并查看它们被转换为标记的方式。作为一个粗略的经验法则,对于英文文本,1个标记大约相当于4个字符或0.75个单词。

需要记住的一个限制是,对于GPT模型,提示和生成的输出组合的总长度不能超过模型的最大上下文长度。对于嵌入模型(不输出标记),输入的长度必须小于模型的最大上下文长度。每个GPT和嵌入模型的最大上下文长度可以在模型索引中找到。