3 核心推理模式
介绍
大型语言模型本身并不推理——它们预测 token。然而,2022-2025 年的研究表明,特定的提示模式可以激发系统性的推理行为,在复杂任务上显著提高性能。
本章涵盖了每个提示工程师应该掌握的核心推理模式,从基础的 Zero-shot 和 Few-shot 技术到 Tree of Thoughts 和 Self-Consistency 等高级方法。
LLM 推理的演变
2020: 基础提示
├─ 直接提问,直接回答
└─ 没有推理结构
2022: 思维链革命
├─ Wei 等人引入 CoT(数学 +23-50%)
├─ Kojima 等人发现 zero-shot CoT
└─ "让我们一步步思考" 成为标志性口号
2023: 高级推理
├─ Tree of Thoughts(24 点游戏 74% vs 4%)
├─ ReAct 模式用于工具使用(+34%)
├─ Self-Consistency 提高鲁棒性(+11-17%)
└─ Graph of Thoughts 出现
2024-2025: 推理模型
├─ OpenAI o1 和 o3 具有扩展思维
├─ DeepSeek R1 具有长链思维
├─ 测试时计算扩展
└─ 内在推理能力成熟
性能总结
| 模式 | 最适用 | 性能提升 | Token 成本 |
|---|---|---|---|
| Zero-Shot | 简单任务 | 基线 | 低 |
| Zero-Shot CoT | 快速推理 | +10-25% | 中等 |
| Few-Shot | 格式对齐 | +40% | 中等 |
| Few-Shot CoT | 复杂推理 | +23-50% | 高 |
| Self-Consistency | 高风险决策 | CoT +11-17% | 非常高 |
| ReAct |