LLM 基础5 推理本页总览Inference - 控制输出质量 "推理通过策略性的 token 选择,将概率分布转化为连贯的文本。" 训练构建了模型,但推理决定了它的输出。理解解码策略、采样参数和优化技术对于在生产环境中控制模型行为至关重要。本文档涵盖自回归生成、解码算法、采样参数以及大规模部署 LLM 的性能优化技术。 自回归生成