2026 年实用 AI 词汇指南
前言
人工智能 正在重塑行业并产生自己的专有词汇。在会议、提案和讨论中,你会听到缩写和短语——LLMs、RAG、RLHF、AGI——即使是有经验的专业人士也会感到畏惧。本文用浅显的英文解释你今年可能遇到的最有用术语,无论你是在构建产品、投资,还是关注科技媒体。它旨在作为一个 实用参考,随着领域变化而更新,并以便读者能快速掌握核心概念以及它们如何与现实世界的用例相连接。将此视为一个持续更新的词汇表,旨在减少混淆并帮助你更自信地参与 AI 的讨论。
Lazy bag
要点: AGI 指广泛有能力的 AI;LLMs 驱动现代助理;agents 自动化多步骤任务;hallucinations 仍然是核心质量风险。本指南总结了概念——从硬件(计算、GPU)与模型内部(权重、tokens、神经网络)到训练技术(强化学习、微调、蒸馏)——以及实用的基础设施概念,如 API、端点、缓存,以及诸如 MCP 的标准。继续阅读以获取可立即使用的简明定义和背景。
正文
人工智能不仅改变技术能做的事情;它也产生了人们用来描述系统与行为的专门词汇。本节逐一介绍常见术语并以直白的方式解释它们为何重要,并举例说明它们在实践中的应用。
AGI (Artificial General Intelligence): AGI 是一个松散定义的概念,指在广泛的认知任务上匹配或超越典型人类能力的系统。不同组织对 AGI 的描述略有不同——有些强调在具经济价值的工作上的表现,有些则将其与中位数的人类同事比较——但核心点是通用性。对大多数读者来说,AGI 仍然是一个研究里程碑,而不是你近期会购买的产品,尽管关于风险与治理的讨论常围绕 AGI 类能力何时以及如何出现。
AI agent: AI agent 是能够代表用户执行多步骤工作流程的自主系统——预订行程、报销费用或维护代码。agents 常结合多个模型和工具,并通过 API 或端点与服务交互以完成任务。支持完全可靠、通用 agents 的基础设施仍在发展,但针对狭窄领域的专用 agents 已经在使用中。
API endpoints: 可以把端点想象成软件中其他程序按下的“隐藏按钮”,以让功能工作。开发者使用端点来集成系统:agent 调用端点以提取数据、下订单或触发操作。随着 agents 能力增强,它们可以自主发现并使用端点,实现复杂的自动化——同时也带来安全与治理方面的考量。
Chain-of-thought reasoning: 该技术让模型将问题分解为中间步骤以提高结果质量。虽然它可能增加延迟,但对于复杂逻辑或编码任务,chain-of-thought 常能产生更准确的输出。为此行为优化的模型在生成过程中会学会产生中间的推理痕迹,当任务需要多步推理时能提升正确性。
Coding agents: 一类专注于软件开发的 agents。不只是建议代码片段,coding agent 可以编写、测试、调试并在多个仓库中迭代代码。这些 agents 减少重复的开发工作,但仍需要人工审查以确保正确性、安全性与设计对齐。
Compute: 计算指支持训练与运行 AI 模型的处理能力——GPU、CPU、TPU 与其他加速器。高性能计算是行业中的主要成本驱动因素,影响谁能训练最大模型以及模型能多快被迭代。
Deep learning and neural networks: 深度学习使用多层人工神经网络在大规模数据集中发现复杂模式。神经网络由互连单元的结构层组成,其参数(权重)在训练期间被调整。这些架构促成了近期生成模型、语音识别和许多其他 AI 能力的兴起。
Diffusion models: 广泛用于图像、音频和其他生成任务的扩散模型,学习逆转施加到数据的噪声过程。通过训练从噪声输入重建干净数据,它们能生成逼真的输出。这一技术支撑了许多当代的创意型 AI 系统。
Distillation: 蒸馏将知识从大型“教师”模型转移到较小的“学生”模型,产生更快或更便宜且行为相似的变体。这是在部署模型以提高效率并降低推理成本时常用的优化。
Fine-tuning: 在广泛的预训练之后,模型可以在特定任务数据上进一步训练,以提升专业化用例的性能。许多初创公司和产品团队以 LLM 为起点并对其进行微调,以增加实用性并减少错误。
GANs (Generative Adversarial Networks): GANs 通过生成器与判别器竞争来产生逼真的输出。它们在创建逼真图像与视频方面表现良好,但较少用于广泛的语言任务。
Hallucination: 当模型生成错误或捏造的信息时,称为幻觉(hallucination)。这仍然是安全与可靠性的主要挑战,促使采用领域专用模型、更好的数据与验证流程以降低错误信息风险。
Inference: 推理是运行已训练模型以生成预测或答案的行为。推理可以在多种硬件上运行,但非常大型的模型通常需要专门服务器才能在可接受的速度与成本下运行。
Large language models (LLMs): LLMs 是在海量文本语料上训练的深度神经网络,能生成与转换语言。它们驱动聊天助理与许多基于文本的工具,并依赖数十亿参数来建模语言模式。
Memory cache / KV caching: 缓存存储中间计算以加速重复的推理调用。transformer 模型中的 KV 缓存减少对重复上下文的计算,提升吞吐量,降低延迟与成本。
MCP (Model Context Protocol): MCP 是一个开放标准,使模型能够在不需定制连接器的情况下连接到外部工具、文件与数据源。它简化了集成,并已被主要供应商采用,帮助 agents 与模型访问外部上下文。
Mixture of Experts (MoE): MoE 架构将模型拆分为多个专门的子网络,并且每次请求仅激活其中一部分。这样可让非常大的模型通过每次查询仅调用少数专家来保持高效,改善计算效率的权衡。
Open source vs closed source: 开源模型与代码可公开检查与修改,加速研究并允许独立审计。闭源系统隐藏内部,使商业化更容易但外部评估更困难。
Parallelization: 并行化同时运行许多计算,是现代 GPU 与分布式训练的核心能力。有效的并行化可减少大型模型的训练时间与成本。
RAMageddon: 用来简称由于 AI 数据中心对内存的需求造成的 RAM 供应压力。高需求可能导致短缺与价格上升,影响消费电子与其他行业。
Recursive self-improvement (RSI): RSI 描述一个系统能够反复改进自身设计或性能,可能在没有人类输入下加速能力增长。它既是技术研究方向,也是安全讨论的议题。
Reinforcement learning: 一种训练方法,模型通过对行动获得奖励或惩罚来学习。RL 与诸如 RLHF(来自人类反馈的强化学习)等变体用于使模型与期望行为对齐并改进推理或策略任务。
Tokens and throughput: tokens 是语言模型处理的离散单元。token 吞吐量衡量系统每单位时间能处理多少 token 级工作,是扩展面向用户系统效率的关键指标。
Training, transfer learning, and validation loss: 训练是从数据教导模型的过程。迁移学习重用预训练模型以处理新任务,可节省成本与数据。验证损失衡量模型在训练期间的泛化能力——较低值表示更好的泛化并有助于检测过拟合。
Weights: 权重是神经网络中的数值参数,决定如何将输入组合成输出。训练会调整权重以提升任务性能;它们的数值编码了模型学到的知识。
这些定义强调实用理解而非详尽理论。随着 AI 系统演进,某些术语的含义会变化并且会出现新的行话。把本词汇表作为务实的起点:它应能帮助你跟上讨论、评估供应商声明,并在真实项目中更清晰地思考如何负责任地应用 AI。
关键见解表
| 方面 | 描述 |
|---|---|
| AGI | 在许多任务上匹配或超越人类的广泛能力型 AI;各组织对定义有所不同。 |
| LLMs | 驱动聊天助理并使用数十亿参数生成文本的大型语言模型。 |
| AI agents | 自主的多步骤系统,结合工具与 API 以代表用户执行任务。 |
| Hallucinations | 模型捏造不正确信息时的情形——一项关键的可靠性与安全问题。 |
| Compute | 使训练与推理成为可能的硬件(GPU、TPU 等);一大成本驱动因素。 |
| Training techniques | 像微调、蒸馏、RLHF 与迁移学习等方法可调整模型并提升效率。 |
| Infrastructure | API、端点、缓存、MCP 与并行化塑造模型的集成与扩展方式。 |
| Model internals | 权重、tokens、神经网络与 MoE 架构说明模型如何编码与处理信息。 |
本文将随领域变化而更新。目标是让 AI 的语言与概念更易接近,帮助你在产品决策、投资或日常阅读中应用它们。