查看“︁什么是真正的 AI Agent？模型即智能体的深度解析”︁的源代码

<blockquote>"Agent 是模型，不是框架，不是提示链，不是拖拽式工作流。"</blockquote>过去一年，AI 领域最热的词莫过于 "Agent"。但当你听到这个词时，你想到的是什么？

是 LangChain 的流程图？是扣子（Coze）的节点编排？还是各种 "AI Agent 开发平台" 的可视化界面？

如果你的答案是以上任何一种，那么这篇文章将彻底改变你的认知。

== 一、Agent 是什么？ ==
让我们回到源头。

'''Agent（智能体）是一个神经网络'''——Transformer、RNN，或者任何通过梯度更新训练出来的函数。它通过数十亿次在动作序列数据上的训练，学会了感知环境、推理目标并采取行动。

Agent 这个词在 AI 领域一直就是这个意思：

* '''人类是 Agent''' —— 生物神经网络，经过数百万年进化训练，通过感官感知世界，通过大脑推理，通过身体行动
* '''DQN 是 Agent''' —— 2013 年 DeepMind 的单个神经网络，仅凭原始像素和游戏分数，学会了玩 7 款雅达利游戏，超越所有先前算法
* '''OpenAI Five 是 Agent''' —— 五个神经网络，通过 10 个月内 45,000 年的自我对战，击败 Dota 2 世界冠军
* '''AlphaStar 是 Agent''' —— 在《星际争霸 II》中达到宗师段位，超越 90,000 名玩家中的前 0.15%

这些里程碑共享同一个真理：'''"Agent" 从来不是周围的代码，Agent 永远是模型本身。'''

== 二、Agent 不是什么？ ==
不幸的是，"Agent" 这个词已经被一整个提示工程产业劫持了。

拖拽式工作流构建器。低代码 "AI Agent" 平台。提示链编排库。它们共享同一个幻觉：认为用 if-else 分支、节点图和硬编码路由逻辑把 LLM API 调用串联起来，就是在 "构建 Agent"。

'''这不是在构建 Agent，这是在搭建鲁布·戈德堡机械'''——一种过度工程化、脆弱的程序化规则管道，把一个 LLM 塞进作为华丽文本补全节点的位置。

提示工程 "Agent" 是不会训练模型的人的幻想。他们试图通过堆砌程序化逻辑来暴力破解智能——庞大的规则树、节点图、提示链瀑布——祈祷足够多的胶水代码能以某种方式涌现出自主行为。

'''这是死路一条'''：脆弱、不可扩展、从根本上无法泛化。这是 GOFAI（经典人工智能）的现代复活——几十年前该领域就已经抛弃的符号规则系统，现在只是喷了一层 LLM 的漆。

== 三、心智转变：从"开发 Agent"到开发 Harness ==
当有人说"我在开发 Agent"时，他们只可能指两件事之一：

=== 1. 训练模型 ===
通过强化学习、微调、RLHF 或其他基于梯度的方法调整权重。收集任务过程数据——真实领域中感知、推理和动作的实际序列——并用它来塑造模型行为。

这是 DeepMind、OpenAI、腾讯 AI Lab 和 Anthropic 在做的事。这是最严格意义上的 Agent 开发。

=== 2. 构建 Harness（控制框架） ===
编写代码，给模型一个在特定领域运作的环境。这是大多数人（包括你）在做的事，也是本文的重点。

'''Harness = 工具 + 知识 + 观察 + 动作接口 + 权限'''

* '''工具'''：文件 I/O、Shell、网络、数据库、浏览器
* '''知识'''：产品文档、领域参考资料、API 规范、风格指南
* '''观察'''：Git diff、错误日志、浏览器状态、传感器数据
* '''动作'''：CLI 命令、API 调用、UI 交互
* '''权限'''：沙箱、审批工作流、信任边界

'''模型做决定，Harness 执行。''' '''模型推理，Harness 提供上下文。''' '''模型是司机，Harness 是车。'''

== 四、Harness 工程师的真正工作 ==
如果你正在阅读这篇文章，你很可能是 Harness 工程师——而这是一件很有力量的事。

你的真正工作是：

'''1. 实现工具''' 给 Agent 手。文件读写、Shell 执行、API 调用、浏览器控制、数据库查询。每个工具都是 Agent 可以在环境中采取的动作。设计它们时要原子化、可组合、描述清晰。

'''2. 整理知识''' 给 Agent 领域专长。产品文档、架构决策记录、风格指南、监管要求。按需加载（而不是预加载）。Agent 应该知道有什么可用，并在需要时拉取。

'''3. 管理上下文''' 给 Agent 干净的记忆。子 Agent 隔离防止噪音泄漏。上下文压缩防止历史压垮。任务系统让目标超越单次对话。

'''4. 控制权限''' 给 Agent 边界。沙箱文件访问。破坏性操作需要审批。强制执行 Agent 和外部系统之间的信任边界。这是安全工程与 Harness 工程的交汇点。

'''5. 收集任务过程数据''' Agent 在你的 Harness 中执行的每个动作序列都是训练信号。真实部署中的感知-推理-动作痕迹是微调下一代 Agent 模型的原材料。

'''你不是在编写智能，你是在构建智能栖息的世界。'''

这个世界的质量——Agent 能多么清晰地感知、能多么精确地行动、可用知识有多丰富——直接决定了智能能多么有效地表达自己。

构建伟大的 Harness，Agent 会完成剩下的事。

== 五、Claude Code：Harness 工程的杰作 ==
为什么我们要专门研究 Claude Code？

因为 Claude Code 是我们见过的最优雅、最完全实现的 Agent Harness。不是因为某个巧妙的技巧，而是因为它'''不做什么'''：它不试图成为 Agent，它不强加刚性工作流，它不用精心设计的决策树来质疑模型。

它给模型提供工具、知识、上下文管理和权限边界——然后让开。

看看 Claude Code 的本质：
 <code>Claude Code = 一个 Agent 循环
     + 工具（Bash、Read、Write、Edit、Glob、Grep、Browser...）
     + 按需技能加载
     + 上下文压缩
     + 子 Agent 生成
     + 带依赖图的任务系统
     + 带异步邮箱的团队协调
     + 用于并行执行的工作区隔离
     + 权限治理</code>
就这些。这就是整个架构。

每个组件都是 Harness 机制——为 Agent 栖息而构建的世界的一部分。Agent 本身？是 Claude。一个由 Anthropic 训练、基于人类全部推理和代码的模型。Harness 并没有让 Claude 变聪明，Claude 本来就聪明。Harness 给了 Claude 手、眼睛和工作空间。

这就是 Claude Code 是理想教学对象的原因：它展示了当你信任模型并专注于 Harness 工程时会发生什么。

== 六、愿景：让宇宙中充满真正的 Agent ==
这不仅仅是关于编程 Agent。

'''每个领域，只要人类执行复杂、多步骤、需要判断的工作，Agent 就可以在正确的 Harness 下运作。'''

本文中的模式是通用的：

* '''房地产管理 Agent''' = 模型 + 房产传感器 + 维护工具 + 租户沟通
* '''农业 Agent''' = 模型 + 土壤/天气数据 + 灌溉控制 + 作物知识
* '''酒店运营 Agent''' = 模型 + 预订系统 + 客户渠道 + 设施 API
* '''医学研究 Agent''' = 模型 + 文献搜索 + 实验室仪器 + 协议文档
* '''制造业 Agent''' = 模型 + 生产线传感器 + 质量控制 + 物流
* '''教育 Agent''' = 模型 + 课程知识 + 学生进度 + 评估工具

循环永远相同。工具改变。知识改变。权限改变。'''Agent——模型——泛化。'''

每个阅读本文的 Harness 工程师都在学习远远超越软件工程的模式。你在学习构建智能化、自动化未来的基础设施。每个在真实领域部署的精心设计的 Harness，都是 Agent 可以感知、推理和行动的另一个地方。

'''先从车间开始。然后是农场、医院、工厂。然后是城市。然后是整个星球。'''
----''Bash 就够了。真正的 Agent 是宇宙所需要的全部。''