AI Agent 工程手册
"最优秀的 AI 工程师既理解模型,也理解工程。"
本知识库构建了从 LLM 基础到生产级 AI Agent 系统的完整技术闭环。
核心公式
Agent = Model(大脑)+ Prompt(指令)+ Memory(RAG/上下文)+ Tools(MCP)+ Planning(架构)
1. 系统架构概览
下图展示了 7 个模块之间的逻辑依赖关系:
模块之间的连接关系:
- LLM 基础提供计算和推理基础
- Prompt 与 Context是与模型交互的媒介
- RAG为模型提供静态知识支持
- MCP为模型提供动态工具支持
- Agents编排和协调以上所有组件
- Ops 与安全贯穿整个生命周期
2. 模块概要
| ID | 模块 | 一句话定义 | 关键技术与关键词 |
|---|---|---|---|
| 01 | LLM 基础 | 理解"大脑"机制、训练流程和物理限制 | Transformer、Attention、预训练、RLHF、Tokenization、推理参数(Temp/Top-P) |
| 02 | Prompt Engineering | 编写"指令代码"以引导推理和标准化输出格式 | Chain-of-Thought(CoT)、Few-shot、ReAct、XML/JSON 输出、Persona |
| 03 | RAG | 用外部"图书馆"增强模型,解决幻觉并注入私有数据 | 向量数据库、Embeddings、Chunking、混合搜索、Grounding、Self-Querying |
| 04 | Agents | 从"对话"进化为"行动",具备规划、反思和工具使用能力 | 编排、循环控制、反思、路由器、多 Agent(监督者/层级式) |
| 05 | MCP | Model Context Protocol——标准化 AI 连接(USB-C),解耦模型与工具 | Host/Client/Server、Resources、Tools、Prompts、JSON-RPC、Stdio/SSE |
| 06 | Context Engineering | 管理模型"注意力"窗口和长期/短期记忆,防止过载 | KV Cache、Context Window、短期/长期记忆、信息压缩 |
| 07 | AgentOps 与安全 | 将 Demo 转化为生产应用,确保安全性、可观测性和评估 | Eval(LLM-as-a-Judge)、Prompt 注入、Docker 部署、Tracing |
3. 学习路径
根据你的开发目标选择路径。
实践者路径(开发者)
目标: 快速构建一个能访问网络和查询数据库的 Java AI Agent。
推荐顺序:
- 05 MCP:先理解如何编写一个工具(Server)
- 04 Agents:学习如何让模型调用这个工具
- 02 Prompt:优化指令以获得更准确的调用
- 07 Ops:部署到 Docker(参考 Brave Search 案例)
重点: 快速迭代、可运行代码、生产部署
架构师路径(架构师/研究者)
目标: 设计复杂的企业级多 Agent 系统。
推荐顺序:
- 01 基础:理解模型能力边界
- 04 Agents:设计多 Agent 协作模式
- 06 Context:设计支持长工作流的记忆系统
- 03 RAG:规划企业知识库集成
重点: 系统设计、可扩展性模式、架构权衡
4. 快速参考
常见任务的必备资源——无需深入文档。