Loading...

AI相关常见名词解释 - KimYx Blog

AI相关常见名词解释

2026年3月20日

P0｜必会（立刻能用）

AI (Artificial Intelligence)

含义：计算机执行通常需人类智能的任务。
主要用途与作用：助手、诊断、推荐、驾驶等全场景智能化。

LLM (Large Language Model)

含义：超大参数的语言模型，理解/生成自然语言与多模态内容。
主要用途与作用：聊天问答、写作改写、代码辅助、数据助理、自动化中枢。

NLP (Natural Language Processing)

含义：计算机处理与理解人类语言的一整套技术。
主要用途与作用：搜索、翻译、对话、情感分析、信息抽取。

系统提示与指令层级（System / Developer / User）

含义：上层规约与约束优先级 > 开发者/角色约束 > 用户输入。
主要用途与作用：把模型行为“写死”，确保风格/格式/安全不漂移。

结构化输出（JSON / JSON Schema / 表格）

含义：强制模型按固定结构输出。
主要用途与作用：直达数据库/工作流，避免答案跑偏；便于自动化。

Prompt（提示）

含义：引导模型输出的指令与示例（角色、约束、步骤、Few-shot）。
主要用途与作用：控风格、控范围、控格式，提升一致性。

Token（标记）

含义：模型处理的最小文本单位。
主要用途与作用：影响费用、上下文长度、截断与切分策略。

上下文窗口（Context Window）

含义：模型一次可读写的 Token 上限。
主要用途与作用：决定能放多少资料；长文场景的硬约束。

采样参数（Temperature / Top-p 等）

含义：控制输出稳定性与多样性的超参数。
主要用途与作用：低温求稳、头脑风暴提温；可控创意与确定性。

Embedding（嵌入）

含义：把文本/多模态内容映射为语义向量。
主要用途与作用：相似度搜索、聚类、推荐、RAG 检索端核心。

向量数据库（Vector DB）

含义：针对向量相似搜索优化的数据库。
主要用途与作用：高效召回相似知识片段，支撑知识库问答与 RAG。

RAG（Retrieval-Augmented Generation）

含义：先检索证据，再基于证据生成答案。
主要用途与作用：显著降低幻觉、让答案有出处；
关键实践：切分(Chunking 300–500 tokens, 10–20% overlap)、重排(Rerank)、引用(Citations)。

工具/函数调用（Tool / Function Calling）

含义：模型按需调用外部工具/API（计算、爬取、DB、代码、文件解析）。
主要用途与作用：从“会说话”升级为“会办事”，打通自动化闭环。

安全与审查（Guardrails / Moderation / Policy）

含义：基于策略过滤/改写/拒绝危险或违规内容。
主要用途与作用：合规、降风险、可上线。

观测与评测（Tracing / Eval / 回放）

含义：记录调用链路与结果，用任务集与指标打分。
主要用途与作用：定位问题、A/B 迭代、量化提升。

成本与速率限制（计费/吞吐/并发）

含义：Token 成本、QPS 限流、配额。
主要用途与作用：控成本、控延迟、稳并发。

流式输出与并发/批处理（Streaming / Batching）

含义：边生成边显示；合并请求提吞吐。
主要用途与作用：体验更顺滑，后端更高效。

会话与长期记忆（Session / Long-term Memory）

含义：在会话或账号层面保留历史与偏好。
主要用途与作用：个性化与持续性，减少重复输入。

多模态（VLM / ASR / TTS）

含义：文本、图像、音频、视频的双向理解与生成。
主要用途与作用：读图解图、语音转写、配音、多模态检索与创作。

训练 vs 推理（Training vs Inference）

含义：训练是学参数；推理是用模型出结果。
主要用途与作用：做架构与成本决策（本地/云端/混合）。

P1｜应知（打通“为什么能用”）

Transformer

含义：以注意力为核心的主流架构（含因果掩码）。
主要用途与作用：支撑 LLM 与多模态的基础。

Attention（注意力机制）

含义：让模型聚焦关键信息、忽略噪声。
主要用途与作用：提升长文本与序列建模能力。

Pre-training（预训练）

含义：在通用大数据上先学通才能力。
主要用途与作用：为下游任务打地基。

Fine-tuning（微调；含 LoRA/PEFT）

含义：在预训练模型上用任务数据继续训练。
主要用途与作用：贴合垂直场景，性价比高（LoRA/PEFT 低资源可行）。

Quantization（量化）

含义：用更低比特表示参数与激活。
主要用途与作用：降显存与成本，便于本地/边缘部署。

缓存（Prompt/Key-Value Cache/Context Caching）

含义：复用静态上下文或解码缓存。
主要用途与作用：显著降延迟与费用，长对话利器。

推理加速（Speculative Decoding / Batching 等）

含义：用草稿模型或并行技巧加速解码与吞吐。
主要用途与作用：提速降本，稳体验。

Embedding 距离与索引（Cosine/Dot；HNSW/IVF/PQ）

含义：相似度如何算、向量如何存取。
主要用途与作用：RAG 的召回质量与速度关键。

SFT / DPO / RLHF / 蒸馏（Distillation）

含义：监督微调、偏好优化、强化对齐、模型压缩的常见方法。
主要用途与作用：让输出更合人意，体积更小、速度更快。

MoE（Mixture of Experts，专家混合）

含义：单个模型内部含多位“专家”，由门控路由把每个 token 分配给部分专家。
主要用途与作用：在参数规模更大情况下，推理只激活少数专家，实现更高性价比与能力专长。

MoM（Mixture of Models，多模型混合）

含义：系统层调度多个不同模型/子系统（如检索器、代码模型、视觉模型）进行路由与协作。
主要用途与作用：按任务类型选最合适的模型，提升鲁棒性与成本效率；易于组装“AI 系统”。

ReAct / Plan-Execute（思维-行动范式）

含义：先分解与反思，再调用工具执行，再校对。
主要用途与作用：Agent 更稳，更少无效调用。

GPU（图形处理单元）

含义：并行矩阵/向量运算硬件。
主要用途与作用：加速训练与推理，是大模型的底座算力。

数据集与标注（Dataset & Labeling）

含义：收集/清洗/切分/标注任务数据。
主要用途与作用：数据质量决定上限，是微调与 RAG 的生命线。

P2｜进阶/扩展（了解更好）

CNN（卷积神经网络）

含义：对图像/视频等网格数据稳定好用的网络。
主要用途与作用：分类、检测、分割等视觉任务。

RNN（循环神经网络）

含义：顺序处理序列数据的网络。
主要用途与作用：早期序列建模（多被 Transformer 替代）。

GAN（生成对抗网络）

含义：生成器与判别器对抗训练的生成方法。
主要用途与作用：逼真图像/风格化/数据增强（部分场景被扩散模型替代）。

Diffusion Model（扩散模型）

含义：通过“加噪—去噪”逐步生成高质量样本。
主要用途与作用：图像/视频/音频生成主流方案。

AIGC（人工智能生成内容）

含义：AI 自动生成文本/图像/音频/视频。
主要用途与作用：内容提效、个性化、规模化生产。

AGI（通用人工智能）

含义：与人类智能相当、能胜任任意任务的系统（愿景）。
主要用途与作用：长期目标与路线讨论，尚未实现。

← 返回博客列表