最近看到一篇综述兼评论风格的文章(原文链接)。起因是 Anthropic 新发布了 Dynamic Workflows,作者借此回顾了从 2022 年到 2025/2026 年这几年间 Agent 技术的研究脉络。
文章的核心观点可以总结为一句话:Agent 能力的提升,并不只是靠模型本身更强,而是把那些不适合塞进上下文窗口的东西,挪到了 runtime、代码、技能库和工作流脚本里。
这篇文章让我对工程实践产生了三点新的思考。
一、工程的高可用,来自确定性
什么是确定性?相同的输入,系统总能产生相同的输出。
在计算机工程里,确定性有:计算确定(数学运算、排序、解析)和逻辑确定(if/else、布尔判断)。
所以在 Agent 技术里,代码做了确定的事情(计算、执行、可重复运行),大模型则做”模糊”的事(制定计划、解释概念、拆解意图);人做”决策”的事(定目标、做取舍)。
二、厉害的技术,未必新颖
还有另一个感悟,是关于 Agent 这一路的发展历程。
提示词工程、思维链(CoT)、ReAct 推理、Function Calling、工作流……回头看,这些概念在底层原理上其实都谈不上多么”高明”。
这让我意识到一个长期存在的误区:我们总觉得,真正厉害的东西一定得足够新颖。
所以,当一项技术的底层实现并不新颖时,很多人会下意识地说:”这不就跟那个谁谁差不多吗?”——这种评价背后的潜台词是:一项技术要够牛,就必须够新。
但现实恰恰相反。技术演进路上的每一步,其提出的观念往往本身都算不上惊艳。它们只是”恰好有用”,并且被足够多的人验证过、确实能跑出好结果而已。
三、为什么技术总是”沿着第一条路”走下去
再延伸一点。假设技术演进是一条 A1 → A2 → A3 → A4 不断向前的路径。
但其实在 A1 这个节点上,原本可能同时存在三条岔路:A1、B1、C1。
只是因为 A1 最先出现、最先被大多数人验证,又恰好反响热烈,于是大家会迅速围绕 A1 去做周边迭代、做配套基建。结果就是——整个技术生态都顺着 A1 这条路一路长了下去,而不是从 B1 或 C1 出发。
所以技术的演进方向,很多时候并不是因为 A1 一定最优,而是因为它”先到”,先吃到了验证和生态的红利。