AI相关常见名词解释
P0|必会(立刻能用)
- AI (Artificial Intelligence)
-
含义:计算机执行通常需人类智能的任务。
-
主要用途与作用:助手、诊断、推荐、驾驶等全场景智能化。
- LLM (Large Language Model)
-
含义:超大参数的语言模型,理解/生成自然语言与多模态内容。
-
主要用途与作用:聊天问答、写作改写、代码辅助、数据助理、自动化中枢。
- NLP (Natural Language Processing)
-
含义:计算机处理与理解人类语言的一整套技术。
-
主要用途与作用:搜索、翻译、对话、情感分析、信息抽取。
- 系统提示与指令层级(System / Developer / User)
-
含义:上层规约与约束优先级 > 开发者/角色约束 > 用户输入。
-
主要用途与作用:把模型行为“写死”,确保风格/格式/安全不漂移。
- 结构化输出(JSON / JSON Schema / 表格)
-
含义:强制模型按固定结构输出。
-
主要用途与作用:直达数据库/工作流,避免答案跑偏;便于自动化。
- Prompt(提示)
-
含义:引导模型输出的指令与示例(角色、约束、步骤、Few-shot)。
-
主要用途与作用:控风格、控范围、控格式,提升一致性。
- Token(标记)
-
含义:模型处理的最小文本单位。
-
主要用途与作用:影响费用、上下文长度、截断与切分策略。
- 上下文窗口(Context Window)
-
含义:模型一次可读写的 Token 上限。
-
主要用途与作用:决定能放多少资料;长文场景的硬约束。
- 采样参数(Temperature / Top-p 等)
-
含义:控制输出稳定性与多样性的超参数。
-
主要用途与作用:低温求稳、头脑风暴提温;可控创意与确定性。
- Embedding(嵌入)
-
含义:把文本/多模态内容映射为语义向量。
-
主要用途与作用:相似度搜索、聚类、推荐、RAG 检索端核心。
- 向量数据库(Vector DB)
-
含义:针对向量相似搜索优化的数据库。
-
主要用途与作用:高效召回相似知识片段,支撑知识库问答与 RAG。
- RAG(Retrieval-Augmented Generation)
-
含义:先检索证据,再基于证据生成答案。
-
主要用途与作用:显著降低幻觉、让答案有出处;
-
关键实践:切分(Chunking 300–500 tokens, 10–20% overlap)、重排(Rerank)、引用(Citations)。
- 工具/函数调用(Tool / Function Calling)
-
含义:模型按需调用外部工具/API(计算、爬取、DB、代码、文件解析)。
-
主要用途与作用:从“会说话”升级为“会办事”,打通自动化闭环。
- 安全与审查(Guardrails / Moderation / Policy)
-
含义:基于策略过滤/改写/拒绝危险或违规内容。
-
主要用途与作用:合规、降风险、可上线。
- 观测与评测(Tracing / Eval / 回放)
-
含义:记录调用链路与结果,用任务集与指标打分。
-
主要用途与作用:定位问题、A/B 迭代、量化提升。
- 成本与速率限制(计费/吞吐/并发)
-
含义:Token 成本、QPS 限流、配额。
-
主要用途与作用:控成本、控延迟、稳并发。
- 流式输出与并发/批处理(Streaming / Batching)
-
含义:边生成边显示;合并请求提吞吐。
-
主要用途与作用:体验更顺滑,后端更高效。
- 会话与长期记忆(Session / Long-term Memory)
-
含义:在会话或账号层面保留历史与偏好。
-
主要用途与作用:个性化与持续性,减少重复输入。
- 多模态(VLM / ASR / TTS)
-
含义:文本、图像、音频、视频的双向理解与生成。
-
主要用途与作用:读图解图、语音转写、配音、多模态检索与创作。
- 训练 vs 推理(Training vs Inference)
-
含义:训练是学参数;推理是用模型出结果。
-
主要用途与作用:做架构与成本决策(本地/云端/混合)。
P1|应知(打通“为什么能用”)
- Transformer
-
含义:以注意力为核心的主流架构(含因果掩码)。
-
主要用途与作用:支撑 LLM 与多模态的基础。
- Attention(注意力机制)
-
含义:让模型聚焦关键信息、忽略噪声。
-
主要用途与作用:提升长文本与序列建模能力。
- Pre-training(预训练)
-
含义:在通用大数据上先学通才能力。
-
主要用途与作用:为下游任务打地基。
- Fine-tuning(微调;含 LoRA/PEFT)
-
含义:在预训练模型上用任务数据继续训练。
-
主要用途与作用:贴合垂直场景,性价比高(LoRA/PEFT 低资源可行)。
- Quantization(量化)
-
含义:用更低比特表示参数与激活。
-
主要用途与作用:降显存与成本,便于本地/边缘部署。
- 缓存(Prompt/Key-Value Cache/Context Caching)
-
含义:复用静态上下文或解码缓存。
-
主要用途与作用:显著降延迟与费用,长对话利器。
- 推理加速(Speculative Decoding / Batching 等)
-
含义:用草稿模型或并行技巧加速解码与吞吐。
-
主要用途与作用:提速降本,稳体验。
- Embedding 距离与索引(Cosine/Dot;HNSW/IVF/PQ)
-
含义:相似度如何算、向量如何存取。
-
主要用途与作用:RAG 的召回质量与速度关键。
- SFT / DPO / RLHF / 蒸馏(Distillation)
-
含义:监督微调、偏好优化、强化对齐、模型压缩的常见方法。
-
主要用途与作用:让输出更合人意,体积更小、速度更快。
- MoE(Mixture of Experts,专家混合)
-
含义:单个模型内部含多位“专家”,由门控路由把每个 token 分配给部分专家。
-
主要用途与作用:在参数规模更大情况下,推理只激活少数专家,实现更高性价比与能力专长。
- MoM(Mixture of Models,多模型混合)
-
含义:系统层调度多个不同模型/子系统(如检索器、代码模型、视觉模型)进行路由与协作。
-
主要用途与作用:按任务类型选最合适的模型,提升鲁棒性与成本效率;易于组装“AI 系统”。
- ReAct / Plan-Execute(思维-行动范式)
-
含义:先分解与反思,再调用工具执行,再校对。
-
主要用途与作用:Agent 更稳,更少无效调用。
- GPU(图形处理单元)
-
含义:并行矩阵/向量运算硬件。
-
主要用途与作用:加速训练与推理,是大模型的底座算力。
- 数据集与标注(Dataset & Labeling)
-
含义:收集/清洗/切分/标注任务数据。
-
主要用途与作用:数据质量决定上限,是微调与 RAG 的生命线。
P2|进阶/扩展(了解更好)
- CNN(卷积神经网络)
-
含义:对图像/视频等网格数据稳定好用的网络。
-
主要用途与作用:分类、检测、分割等视觉任务。
- RNN(循环神经网络)
-
含义:顺序处理序列数据的网络。
-
主要用途与作用:早期序列建模(多被 Transformer 替代)。
- GAN(生成对抗网络)
-
含义:生成器与判别器对抗训练的生成方法。
-
主要用途与作用:逼真图像/风格化/数据增强(部分场景被扩散模型替代)。
- Diffusion Model(扩散模型)
-
含义:通过“加噪—去噪”逐步生成高质量样本。
-
主要用途与作用:图像/视频/音频生成主流方案。
- AIGC(人工智能生成内容)
-
含义:AI 自动生成文本/图像/音频/视频。
-
主要用途与作用:内容提效、个性化、规模化生产。
- AGI(通用人工智能)
-
含义:与人类智能相当、能胜任任意任务的系统(愿景)。
-
主要用途与作用:长期目标与路线讨论,尚未实现。