7. 生产环境模式
“生产级智能体需要能够扩展、恢复和协作的模式。这些模式源自真实世界的部署实践。”
本节涵盖了构建可靠智能体系统且经过生产验证的模式。这些模式在实际部署中经受了考验,代表了 Harness 工程的最佳实践。
7.1 长时运行智能体模式 (Long-Running Agent Patterns)
检查点/恢复模式 (Checkpoint/Resume Pattern)
定期保存状态,并在故障后从检查点恢复,避免重复执行已完成的工作。
定期持久化模式 (Periodic Persistence Pattern)
不仅在检查点,还要以固定的时间间隔持久化状态,以将数据丢失风险降至最低。
事件驱动模式 (Event-Driven Agent Pattern)
智能体通过响应事件而不是轮询来运行,从而降低延迟并提高资源利用率。
7.2 多智能体协作 (Multi-Agent Coordination)
通信协议 (Communication Protocol)
为智能体间的交互定义标准化的消息格式。
@Document(collection = "agent_messages")
public class AgentMessage {
private String fromAgentId;
private String toAgentId;
private String messageType; // 消息类型,如 REQUEST, RESPONSE, ERROR
private Map<String, Object> payload;
private String correlationId; // 关联 ID,用于匹配请求与响应
}
共享上下文管理 (Shared Context Management)
在多个智能体实例之间协调全局状态,确保信息的一致性。
冲突解决 (Conflict Resolution)
当多个智能体试图同时修改共享状态时,采取预定义的解决策略:
- 先写者胜 (First-Write-Wins)
- 后写者胜 (Last-Write-Wins)
- 自动合并 (Merge)
- 投票共识 (Vote)
- 人工干预 (Escalate to Human)