智能体:Harness Engineering

阅读量 ,评论量

背景

为agent设计环境,而不是协同工作。

前序知识

agent工作框架

“感知 → 决策 → 行动 → 反馈 → 再感知” 的闭环系统。核心关注两个维度:

Perceive

核心:是否有把关键上下文以agent能消费的&冗余信息更少的方式暴露出来。

Decide

核心:任务拆解与plan能力。(graphrag或者基座本身能力提升,个人倾向于持续进化的graphrag)

实际操作时比较重要的是决策约束,知识库约束不住的,就要逐步升级成规则,以代码生成为例:

同样,信任边界也不应该模糊存在,最好显式定义,而非概率预估:

Act

核心:适配LLM的完善的工程生态。

Feedback

核心:结果的回流。

Harness

Harness本身需要演化,以应对模型能力、任务类型、系统规模、风险边界这些因素后续变化的可能。一个成熟的Harness设计需要包含: