如何构建你的第一个 AI Agent:从零开始的完整指南

发布于 2026年05月12日 01:06 #Claude#翻译

如何构建你的第一个 AI Agent:从零开始的完整指南 封面图

原文链接:https://x.com/eng_khairallah1/status/2053043365781119482

你可能已经听说了 AI Agent。

大部分人听到 “AI Agent”,脑海里浮现的是一群工程师趴在终端前写几千行代码。

一年前这是真的。

现在不是了。

Anthropic 刚刚推出了 Claude Managed Agents。这是一个基础设施层,让你可以在云端构建、部署和运行完全自主的 AI Agent——无需自己管理服务器、编写 agent 循环或配置沙箱。

你描述 agent 应该做什么。Claude 处理剩下的一切。

现在的门槛低到什么程度?零技术背景的人都在发布 7×24 小时运行、处理真实任务、产出真实结果的 agent。

窗口正在大开。但它不会永远开着。

以下是即使你从未写过一行代码,也能从零开始构建第一个 AI Agent 的完整步骤。

什么是 AI Agent(以及你为什么应该关心)

AI Agent 不是聊天机器人。

聊天机器人等你提问,给你答案,然后停止。你来干活。你复制答案。你粘贴到某个地方。你进入下一个任务。

Agent 不同。Agent 接收一个目标,将其拆解为步骤,使用工具完成每一步,检查自己的工作,交付最终结果。它自主运行。它做决策。它处理复杂性,不需要你手把手指导每一步。

把它想象成:在派对上问某人一个问题,和雇一个人从头到尾处理一个项目的区别。

聊天机器人是派对上的那个人。Agent 是那个直接把事搞定的员工。

而现在,Claude Managed Agents 是构建 Agent 最快的方式。

为什么 Claude Managed Agents 改变了一切

在 Managed Agents 之前,构建 AI Agent 意味着处理一大堆基础设施工作。

你需要搭建沙箱环境。你需要处理跨会话的状态管理。你需要构建工具执行层。你需要处理安全、权限、凭证管理和错误恢复。

大多数人在到达有趣的部分之前就放弃了。

Managed Agents 移除了所有这些。Anthropic 处理基础设施。你专注于 agent 做什么——而不是它怎么运行。

以下是开箱即得的能力:

  • 云托管容器,安全运行你的 agent
  • 预构建工具:bash 命令、文件操作、网页浏览和代码执行
  • 持久文件系统,让 agent 跨会话记住之前做过什么
  • 内置记忆,让 agent 随时间改进
  • 多 Agent 编排,多个 agent 协作完成单一任务

最后一项是最新的。Anthropic 在 2026 年 5 月 6 日的 Code with Claude 活动上宣布了多 Agent 编排。现在你可以在单个问题上并行运行最多 20 个专业 agent。

这不是即将推出。这是已经上线。

第一步:明确你的 Agent 要做什么

在你接触任何技术之前,回答一个问题:

你希望 agent 处理的一个任务是什么?

大多数人失败在这里,因为他们试图构建一个做所有事情的 agent。这就像雇一个员工然后告诉他工作就是「做事情」。你在现实中不会这样做,对 AI Agent 也不应该这样做。

选择一个具体的、可重复的任务。你经常做的、耗时的、但不需要你独特创意判断的事情。

好的例子:

  • 每天早上分类新的支持工单,按优先级排序
  • 每周扫描竞品网站,总结变化
  • 从三个来源拉取数据,合并后创建格式化报告
  • 监控 GitHub 仓库,标记符合特定条件的 issue
  • 处理收到的文档,提取关键信息到电子表格

任务越具体,agent 表现越好。

第二步:像招聘员工一样定义角色

这是大多数初学者跳过的步骤。也是区分能用的 agent 和产出垃圾的 agent 的关键。

每个优秀的 agent 都从一个清晰的系统提示词开始。把它当作你给新员工第一天的岗位说明书。

你的系统提示词应该包括:

agent 是谁。 给它一个角色。「你是一个专精竞争情报的研究分析师」远比「你是一个有帮助的助手」好得多。

成功是什么样的。 定义输出。「成功意味着一份两页的摘要,包含具体数据点、按类别列出的竞争对手变化、以及建议部分」给了 agent 一个明确目标。

它绝对不该做什么。 边界很重要。「永远不要编造数据。永远不要包含你无法验证的信息。如果不确定,标记为不确定而不是猜测。」

如何处理边界情况。 「如果竞品网站挂了,记录下来继续。不要重试超过两次。在最终报告里注明该竞品的数据可能不完整。」

模糊的提示词得到模糊的 agent。精确的提示词得到可靠的 agent。

第三步:搭建你的 Agent(非技术版本)

如果你使用 Claude 的消费端界面——Claude.ai——你可以通过 Cowork 构建agent,无需写代码。

打开 Claude Desktop 应用。进入 Cowork 标签页。把 Claude 指向你存放相关文件的文件夹。然后用第二步的系统提示词框架给它任务。

例如:

「你是一个周报生成器。每次运行这个任务时,你应该打开 /Reports 文件夹里的三个 CSV 文件,合并数据,识别前五个趋势,在 /Output 创建摘要文档。摘要每个趋势用标题分隔,包含具体数字,最后附上一段建议。」

Claude 会创建一个计划,展示给你,你批准后执行。

这就是你的第一个 agent。花了五分钟。

如果你需要更强的能力——定时运行、API 触发、多 agent 配置——你需要使用 Claude API。但即使是 API 也比你想象的更容易上手。

第四步:给 Agent 配备工具

一个裸 agent 只能思考和写作。有用但有限。

一个强大的 agent 能采取行动。它能搜索网页。它能读写文件。它能编写并执行代码。它能通过 API 和 MCP server 连接外部服务。

Claude Managed Agents 提供完整的开箱工具包:

Bash 执行——你的 agent 可以在安全容器中运行命令。这意味着它能处理数据、运行脚本、安装包和自动化系统任务。

文件操作——读取、写入、创建和组织文件。你的 agent 可以处理文档、生成报告和管理文件系统。

网页访问——你的 agent 可以搜索互联网、获取网页和从实时来源提取信息。

MCP 连接器——这是最强大的部分。MCP(Model Context Protocol)让你的 agent 直接连接 Google Drive、Slack、Gmail、Linear、GitHub 等服务。你的 agent 可以从你的真实工具中拉取数据,并将结果推送回去。

把 agent 连接到 Slack,它可以每天向频道发布摘要。连接到 Google Drive,它可以读取共享文档并更新表格。连接到 GitHub,它可以监控仓库、提交 issue,甚至开启 Pull Request。

工具给得越多,agent 越自主。

第五步:测试、破坏和修复

你的第一个版本不会完美。这很正常。

运行 agent 五次。观察它做什么。找出它失败的模式。

常见失败模式:

agent 做太多。 它过度解读你的指令,添加你没要求的步骤。修复方法:在提示词中添加明确约束。「只执行上面列出的步骤。除非明确要求,不要添加额外分析。」

agent 做太少。 它过早停止或产出浅薄的输出。修复方法:更具体地定义「完成」是什么样子。添加好输出的示例作为参考。

agent 产生幻觉。 它编造数据或引用不存在的来源。修复方法:添加验证步骤。「在包含任何数据点之前,对照源材料验证。如果无法验证,排除它并注明缺失内容。」

agent 被边界情况搞混。 出现意外情况,它要么崩溃要么产出无意义内容。修复方法:添加明确的错误处理指令。「如果 [特定场景],则 [特定行动]。」

每次失败都是让提示词更聪明的机会。构建优秀 agent 的人不是第一次就对的人,而是迭代最快的人。

第六步:设置定时任务,然后走开

一旦 agent 稳定运行,下一步是自动化。

如果你使用 Cowork,可以用 /schedule 命令设置定时任务。让 agent 每天早上 7 点运行、每周五运行,或任何合理的频率。

如果你使用 Claude Code,全新的 Routines 功能让你配置在 Anthropic 云基础设施上运行的自动化。你的笔记本电脑不需要开着。你一次性设置好提示词、时间表和连接器——它就自己跑。

人们现在正在运行的真实案例:

每夜 Bug 分拣——agent 从 Linear 拉取新 issue,分类、设定优先级,在团队起床前发摘要到 Slack。

每周竞品分析——agent 扫描五个竞品网站,识别变化,编写报告,保存到 Google Drive。

每日内容研究——agent 监控 X 上特定领域的热门话题,识别表现最好的帖子,提取钩子和结构,创建简报。

这就是 agent 变成 7×24 小时员工的样貌。

第七步:扩展有效的东西

一个每周帮你省两小时的 agent 值得构建。

三个每周帮你省十小时的 agent 值得围绕它构建系统。

第一个 agent 稳定后,为不同任务构建第二个。然后第三个。每一个遵循相同流程——定义角色、设置提示词、连接工具、测试、迭代、自动化。

现在从 AI 获得最大杠杆的人,不是使用最多工具的人,而是在一个平台上深入并围绕它构建 agent 系统的人。

多 Agent 编排上线后,你甚至可以构建协作的 agent。研究 agent 把数据喂给分析 agent,分析 agent 把洞察喂给报告 agent,报告 agent 每天早上把成品文档送到你邮箱。

这不是科幻。这是 2026 年 5 月的 Claude Managed Agents。

诚实的话

构建第一个 agent 不到一小时。

构建一个优秀的 agent 需要迭代。需要测试。需要几周内不断优化提示词直到输出始终优秀。

但把 AI 当聊天机器人用的人,和把 AI 当自主劳动力用的人之间的差距,即将成为技术领域最大的竞争优势。

六个月后,今天开始构建 agent 的人将拥有在睡觉时也能产出真实结果的系统。

其他人还在从聊天窗口复制粘贴。

工具免费。基础设施就绪。唯一缺的是你的第一次构建。

初学者常犯的三个最大错误

错误一:构建做太多事情的 agent。 你的第一个 agent 应该只处理一个任务。一个。不是五个。不是「什么都做」。一个定义明确的任务。把它做到完美。然后为下一个任务构建第二个 agent。试图把通用 agent 作为第一个项目,是最快走向沮丧和放弃的路径。

错误二:没有给足够的上下文。 一个产出有用输出的 agent 和一个产出泛泛垃圾的 agent 之间最大的区别就是上下文。你的 agent 需要知道你是谁、你所在什么行业、你的标准是什么、输出应该长什么样。两段话的系统提示词永远比不上两页纸的系统提示词。花时间写一份详尽的简报。

错误三:不迭代。 你的第一个版本不会完美。第二个也不会。构建优秀 agent 的人把每次运行都当作反馈。他们观察输出,找出问题,更新提示词,再运行。五到十次迭代后,agent 从「大致有用」变成「稳定优秀」。试一次得到平庸结果就下结论说「agent 不行」的人,是错过整个机会的人。

Agent 生态正在爆发

Anthropic 不是唯一的玩家。但他们目前在 agent 基础设施方面处于最佳位置。

Claude Managed Agents 于 2026 年 4 月 8 日上线。多 Agent 编排在 5 月 6 日上线。Dreaming——agent 在会话间自我改进——同日发布。Routines——自主定时工作流——处于研究预览阶段。Anthropic 刚刚为 Pro、Max 和 Enterprise 用户翻倍了 Claude Code 速率限制。

生态发展速度快到今天「先进」的东西三个月后就是标准操作。现在开始构建的人将在其他人赶上时拥有数月的复合经验和优化。

这才是真正的优势。不是技术。而是使用技术的经验。

今天就开始。本周真正构建第一个 agent 的人,将理解世界其他人一年后才会搞明白的东西。

评论互动

© 2026 王若风的技术博客 · Powered by Astro