记事
周四的时候,公司内部开了个 ai 交流会,同事分享和讨论了 ai 上的实践,遇到的问题,一些解法。我听下来,没有什么新东西,基本上还是偏单agent 使用上的一些技能,这些我基本上都实践了,全程我也几乎没发言,只在最后被Q到的时候,说了一下自己感兴趣以及正在研究的东西,其实就是现在说的 harness engineering 那套工程化的东西。
我比较关注工程化应用,2个方面:
1、单个 agent 如何工程化的使用,最大化的减少人的介入,让 agent 从生产到验证到上线是闭环的。
2、多个 agent 如何有效协作,完成过去需要一整个团队才能完成的项目。
ai 的产能太高了,人类 review 和验证已经完全跟不上了,必须有机制,有工作流减少人的介入,把生产力真正提上去,同时确保产出质量符合预期。
研究
harness engineering 几个问题
1、是什么
2、为什么
3、然后呢
harness engineering 相关文章
Harness Engineering: 让 Coding Agent 可靠完成长程任务
全行业都狂卷 Harness,Anthropic 还在加码,Codex 负责人却说它正在退场
motedb:Agent-First 软件工程
motedb:一场变化真正开始深入现实,往往不是先改工具,而是先改语言。
motedb:Harness 的七层结构