Claude AI 核心术语 glossary

发布于 2026年06月05日 02:01 #Claude 原文链接

上下文窗口是模型生成文本时能回溯的文本量，影响处理复杂提示的能力
微调使用额外数据进一步训练预训练模型，使其适配特定领域或任务
HHH原则确保AI有帮助、诚实、无害，是Anthropic的社会有益目标
RAG结合信息检索与生成，提高事实准确性和相关性
RLHF通过人类反馈强化学习，使模型行为符合人类偏好

原文链接：https://platform.claude.com/docs/en/about-claude/glossary

以下概念并非 Anthropic 语言模型独有，但我们在此对关键术语做一个简要总结。

Context Window（上下文窗口）

「上下文窗口」指的是语言模型在生成新文本时，能够回溯和引用的文本量。这与语言模型训练所用的大型语料库不同，它更像是模型的「工作记忆」。更大的上下文窗口使模型能够理解和回应更复杂、更长的提示词，而较小的上下文窗口则可能限制模型处理长提示词或在长对话中保持连贯性的能力。

参阅我们的上下文窗口指南了解更多。

Fine-tuning（微调）

微调是使用额外数据对预训练语言模型进行进一步训练的过程。这会使模型开始呈现和模仿微调数据集的模式和特征。Claude 不是一个裸语言模型，它已经被微调为一个有帮助的助手。我们的 API 目前不提供微调功能，但如果你有兴趣探索此选项，请联系你的 Anthropic 对接人。微调可用于将语言模型适配到特定领域、任务或写作风格，但需要仔细考虑微调数据及其对模型性能和偏差的潜在影响。

HHH

这三个 H 代表 Anthropic 确保 Claude 对社会有益的目标：

Helpful（有帮助）：一个有帮助的 AI 会尽其所能尝试执行任务或回答提出的问题，提供相关且有用的信息。
Honest（诚实）：一个诚实的 AI 会提供准确的信息，不会产生幻觉或编造。它会在适当的时候承认自己的局限性和不确定性。
Harmless（无害）：一个无害的 AI 不会具有冒犯性或歧视性，当被要求协助进行危险或不道德的行为时，AI 应礼貌地拒绝并解释为什么无法遵从。

Latency（延迟）

在生成式 AI 和大语言模型的语境中，延迟是指模型响应给定提示词所需的时间。它是提交提示词和接收生成输出之间的延迟。较低的延迟意味着更快的响应时间，这对于实时应用、聊天机器人和交互式体验至关重要。影响延迟的因素包括模型大小、硬件能力、网络条件以及提示词和生成响应的复杂度。

LLM（大语言模型）

大语言模型（LLMs）是具有大量参数的 AI 语言模型，能够执行各种令人惊讶的有用任务。这些模型在海量文本数据上训练，可以生成类人文本、回答问题、总结信息等。Claude 是一个基于大语言模型的对话助手，通过 RLHF 进行了微调和训练，使其更有帮助、更诚实、更无害。

MCP（Model Context Protocol）

Model Context Protocol（MCP）是一个开放协议，用于标准化应用程序向 LLM 提供上下文的方式。就像 AI 应用的 USB-C 接口一样，MCP 提供了一种统一的方式来将 AI 模型连接到不同的数据源和工具。MCP 使 AI 系统能够在交互中保持一致的上下文，并以标准化方式访问外部资源。参阅我们的 MCP 文档了解更多。

MCP Connector（MCP 连接器）

MCP 连接器是一项功能，允许 API 用户直接从 Messages API 连接到 MCP 服务器，无需构建 MCP 客户端。这实现了通过 Claude API 与 MCP 兼容工具和服务的无缝集成。MCP 连接器支持工具调用等功能，目前处于 beta 阶段。参阅 MCP 连接器文档了解更多。

Pretraining（预训练）

预训练是在大型无标签文本语料库上训练语言模型的初始过程。以 Claude 为例，自回归语言模型（如 Claude 的底层模型）通过预测文档中前文后面的下一个词来进行预训练。这些预训练模型本身并不擅长回答问题或遵循指令，通常需要深厚的提示词工程技巧才能引导出期望的行为。微调和 RLHF 被用来改进这些预训练模型，使其在更广泛的任务中更加实用。

RAG（检索增强生成）

检索增强生成（Retrieval Augmented Generation，RAG）是一种将信息检索与语言模型生成相结合的技术，旨在提高生成文本的准确性和相关性，并使模型的响应更好地基于证据。在 RAG 中，语言模型通过传入上下文窗口的外部知识库或文档集进行增强。数据在查询发送给模型时的运行时被检索，尽管模型本身不一定执行检索（但可以通过工具使用和检索函数来实现）。在生成文本时，首先需要根据输入提示词从知识库中检索相关信息，然后将其与原始查询一起传递给模型。模型利用这些信息来引导其生成的输出。这使模型能够访问和利用训练数据之外的信息，减少对记忆的依赖，提高生成文本的事实准确性。RAG 对于需要最新信息、领域特定知识或明确引用来源的任务特别有用。然而，RAG 的有效性取决于外部知识库的质量和相关性以及运行时检索到的知识。

RLHF（基于人类反馈的强化学习）

基于人类反馈的强化学习（Reinforcement Learning from Human Feedback，RLHF）是一种用于训练预训练语言模型使其行为方式符合人类偏好的技术。这包括帮助模型更有效地遵循指令或更像聊天机器人一样行动。人类反馈包括对一组两个或更多示例文本进行排序，强化学习过程鼓励模型倾向于产生与更高排序相似的输出。Claude 已使用 RLHF 进行训练，成为更有帮助的助手。更多细节可阅读 Anthropic 关于此主题的论文。

Temperature（温度）

Temperature 是一个控制模型在文本生成期间预测随机性的参数。较高的温度会产生更具创造性和多样性的输出，允许措辞上的多种变化，在虚构内容的情况下也会产生答案的变化。较低的温度则产生更保守和确定性的输出，坚持最可能的措辞和答案。调整温度可以鼓励语言模型探索罕见的、不常见的或令人惊讶的词汇选择和序列，而不是仅选择最可能的预测。

用户可能会在 API 中遇到非确定性。即使将温度设为 0，结果也不会完全确定，相同的输入可能会在不同的 API 调用中产生不同的输出。这适用于 Anthropic 的第一方推理服务以及通过第三方云服务商的推理。

TTFT（首 Token 时间）

首 Token 时间（Time to First Token，TTFT）是一个性能指标，衡量语言模型在接收到提示词后生成输出第一个 Token 所需的时间。它是模型响应能力的重要指标，特别与交互式应用、聊天机器人和用户期望快速初始反馈的实时系统相关。较低的 TTFT 表示模型可以更快地开始生成响应，提供更流畅和引人入胜的用户体验。影响 TTFT 的因素包括模型大小、硬件能力、网络条件和提示词的复杂度。

Tokens（词元）

Token 是语言模型最小的独立单元，可以对应单词、子词、字符甚至字节（在 Unicode 的情况下）。对于 Claude，一个 Token 大约代表 3.5 个英文字符，但确切数量可能因使用的语言而异。在「文本」层面与语言模型交互时，Token 通常是隐藏的，但在检查语言模型的确切输入和输出时就会变得相关。当 Claude 接收到要评估的文本时，文本（由一系列字符组成）被编码为一系列 Token 供模型处理。较大的 Token 在推理和预训练期间实现数据效率（在可能时被使用），而较小的 Token 允许模型处理不常见或从未见过的词。分词方法的选择会影响模型的性能、词汇量以及处理词汇表外词的能力。