7 高级提示词技术

导言

高级提示词工程将 AI 从简单的工具转化为复杂的推理伙伴。这些技术利用了模型的元认知能力 (Metacognitive capabilities) —— 即模型反思、评估并改进其自身输出的能力。研究表明，与基础提示词相比，高级提示词技术在处理复杂推理任务时能提升 20-40% 的表现 (Zhou et al., 2024)。

本章涵盖了近期研究中经过实战检验的高级技术，并提供了面向生产系统的 Spring AI 实践实现。

┌─────────────────────────────────────────────────────────────────────────┐
│                        高级技术分类法 (TAXONOMY)                         │
├─────────────────────────────────────────────────────────────────────────┤
│                                                                         │
│  ┌─────────────────┐  ┌─────────────────┐  ┌─────────────────┐         │
│  │   自我改进技术    │  │   多步编排模式    │  │   推理增强技术    │         │
│  ├─────────────────┤  ├─────────────────┤  ├─────────────────┤         │
│  │ • 自我批判       │  │ • 提示词链       │  │ • 后退一步       │         │
│  │ • Reflexion     │  │ • 多轮对话       │  │ • 自我一致性     │         │
│  │ • 主观-评判 (A-C) │  │ • 任务分解       │  │ • ToT/GoT/AoT   │         │
│  │ • PACE          │  │ • 结果聚合       │  │ • PAL (编程辅助)  │         │
│  └─────────────────┘  └─────────────────┘  └─────────────────┘         │
│                                                                         │
│  ┌─────────────────┐  ┌─────────────────┐  ┌─────────────────┐         │
│  │   元提示词技术    │  │   输出控制技术    │  │   新兴前沿技术    │         │
│  ├─────────────────┤  ├─────────────────┤  ├─────────────────┤         │
│  │ • DSPy          │  │ • 定向激励       │  │ • 情感提示词     │         │
│  │ • OPRO          │  │ • 对比学习       │  │ • RaR (重述回答)  │         │
│  │ • 自动提示词优化  │  │ • 骨架推演       │  │ • 思路链 (ThoT)  │         │
│  │ • PE2           │  │ • 转向引导       │  │ • 重新阅读 (RE2) │         │
│  └─────────────────┘  └─────────────────┘  └─────────────────┘         │
│                                                                         │
└─────────────────────────────────────────────────────────────────────────┘

信息

性能基准：在复杂推理任务中，自我批判可提升 20-30% 的准确度，自我一致性提升 15-25%，而后退一步提示词能带来 10-20% 的收益 (Li et al., 2024)。

1. 自我批判与 Reflexion

自我批判使模型能够通过结构化的内省来评估并改进自身的输出。Reflexion 框架 (Shinn et al., 2023) 将其形式化为一个迭代改进循环。

1.1 Reflexion 框架

Reflexion 通过记忆和跨尝试的持续学习扩展了简单的自我批判。它包含三个组件：执行者 (Actor)、评估者 (Evaluator) 和自我反思 (Self-Reflection)。

1.2 基础自我批判模式

在单次调用中引导模型：

生成初始方案。
根据准确性、完整性、清晰度进行自我批判。
根据批判结果生成改进方案。
验证。

2. 迭代优化模式

2.1 PACE 框架 (Actor-Critic)

实现正式的“主观-评判”循环。评判者对输出评分并指出弱点，执行者据此优化，直到分数达标。

2.2 扩张-压缩-优化 (ECR)

扩张：生成详尽的全量分析。
压缩：提取最核心的 3-5 个见解。
优化：转化为具备可操作性的建议。

3. 元提示词 (Meta-Prompting)

元提示词是“用 AI 来写提示词”。

3.1 DSPy 风格：声明式提示词

将提示词工程系统化。定义输入输出的契约（Signature），由 AI 自动生成最优的底层 Prompt。

3.2 自动提示词优化 (OPRO)

利用 LLM 作为优化器，在提示词空间中搜索能使目标函数（如准确率）最大化的指令。

4. 多轮推理 (Multi-Turn Reasoning)

4.1 分解-求解-整合 (DSI)

将复杂难题拆解为 5-7 个独立子问题，按依赖顺序逐个求解，最后综合为完整答案。

4.2 研究-分析-综合流水线

专为知识密集型任务设计，模拟人类专家的工作流：背景调研 -> 规律识别 -> 叙事合成。

5. 自我一致性 (Self-Consistency)

生成多条不同的推理路径（使用非零温度），并通过“多数投票”机制确定最终答案，能显著降低模型计算错误的概率。

6. 后退一步提示词 (Step-Back)

在回答具体问题前，先引导模型后退一步，思考其背后的通用原则、概念或基础知识。这种“以退为进”的策略能极大地提升逻辑深度。

7. 程序辅助语言 (PAL)

将自然语言推理与代码执行相结合。模型不再自行计算数值，而是编写 Python 代码并在沙盒中运行，以确保数学运算的 100% 准确。

8. 新兴前沿技术

情感提示词 (Emotion Prompting)：加入情感上下文（如“这项任务对我的职业生涯至关重要”）可激发模型更好的表现。
重述并回答 (RaR)：要求模型先用自己的话转述问题，以确保理解无误。
思路链 (Thread of Thought)：在海量上下文中理清逻辑线索。
重新阅读 (RE2)：通过显式指令加强模型对长难段落的专注度。

总结

高级提示词技术的核心是从“单点问答”转向“系统工程”：

闭环化：通过自我批判实现质量自控。
模块化：通过多轮对话攻克复杂难题。
确定化：通过 PAL 和自洽性降低模型随机性。
抽象化：通过元提示词和后退一步提升推理深度。

导言​

1. 自我批判与 Reflexion​

1.1 Reflexion 框架​

1.2 基础自我批判模式​

2. 迭代优化模式​

2.1 PACE 框架 (Actor-Critic)​

2.2 扩张-压缩-优化 (ECR)​

3. 元提示词 (Meta-Prompting)​

3.1 DSPy 风格：声明式提示词​

3.2 自动提示词优化 (OPRO)​

4. 多轮推理 (Multi-Turn Reasoning)​

4.1 分解-求解-整合 (DSI)​

4.2 研究-分析-综合流水线​

5. 自我一致性 (Self-Consistency)​

6. 后退一步提示词 (Step-Back)​

7. 程序辅助语言 (PAL)​

8. 新兴前沿技术​

总结​

导言