换Harness,是不是整个推倒重来? Harness不是整个推倒重来 Har

智能亲爱的你 2026-05-11 10:50:24

换Harness,是不是整个推倒重来? Harness 不是整个推倒重来 Harness 里面的代码大致分两类: 一种是骨架代码:调用 LLM、路由工具调用、读写 Session、启动容器。这些代码调用的是稳定接口,基本不用动。这可能占 Harness 代码量的 70%-80%。 另一种是策略代码:什么时候压缩上下文、怎么校验输出、多久检查一次任务目标、重试几次放弃。 这些是跟模型能力绑定的,模型变了这些要调,这可能只占 20%-30%。 所谓"换 Harness",大多数时候换的是那 20%-30% 的策略代码,不是整个 Harness 推倒重写。 用一个具体例子来感受下工作量: 假设 Sonnet 4.5 升级到 Opus 4.5,你需要调整的可能就是这些: 1.把"每 10 轮压缩一次上下文"改成"每 30 轮压缩一次"或者直接删掉 → 改一个参数或删几行代码。 2.把"输出格式校验 + 三次重试"改成"只做一次轻量检查" → 简化一个函数。 3.把"每 5 步强制检查任务是否偏离"改成"每 15 步检查一次" → 改一个数字。 [吐舌]这种级别的改动,可能就是几小时到几天的工作。不是几周几个月。

0 阅读:1
智能亲爱的你

智能亲爱的你

感谢大家的关注