为什么 AI Agent 都绕不开 Puppeteer
从 Chrome DevTools Protocol 到 Browser Agent,拆解 Puppeteer 的架构设计与工程实践,看它如何从一个测试工具,演变成 AI Agent 时代的事实基础设施。 从 Chrome DevTools Protocol 到 Browser Agent,拆解 Puppeteer 的架构设计与工程实践,看它如何从一个测试工具,演变成 AI Agent 时代的事实基础设施。
共 58 篇文章
围绕 #Agents 汇总相关文章,适合连续阅读同一主题下的实践与思考。
从 Chrome DevTools Protocol 到 Browser Agent,拆解 Puppeteer 的架构设计与工程实践,看它如何从一个测试工具,演变成 AI Agent 时代的事实基础设施。 从 Chrome DevTools Protocol 到 Browser Agent,拆解 Puppeteer 的架构设计与工程实践,看它如何从一个测试工具,演变成 AI Agent 时代的事实基础设施。
发布于 2026年06月13日 16:11
Anthropic 工程团队系统拆解 Claude 在不同产品里的 containment 策略,重点不是让模型更听话,而是把 blast radius 锁在环境层。Google DeepMind 的 Logan Kilpatrick 则把 Antigravity agent harness 讲成 Google 产品的新 through line;X 上的信号集中在 Codex/Ona、vibecoding 闭环和 agent 生产工作流。 Anthropic 工程团队系统拆解 Claude 在不同产品里的 containment 策略,重点不是让模型更听话,而是把 blast radius 锁在环境层。Google DeepMind 的 Logan Kilpatrick 则把 Antigravity agent harness 讲成 Google 产品的新 through line;X 上的信号集中在 Codex/Ona、vibecoding 闭环和 agent 生产工作流。
发布于 2026年06月13日 14:32
Mike Krieger 详细拆解 Claude Fable 5 在长任务、动态工作流和验证闭环里的真实用法;X 上更值得看的信号,则集中在 Codex token 消耗突增、Fable 自剪视频工作流,以及 memory 与跨工具上下文迁移开始产品化。 Mike Krieger 详细拆解 Claude Fable 5 在长任务、动态工作流和验证闭环里的真实用法;X 上更值得看的信号,则集中在 Codex token 消耗突增、Fable 自剪视频工作流,以及 memory 与跨工具上下文迁移开始产品化。
发布于 2026年06月12日 09:55
从 Prompt Engineer 到 Loop Engineer,最顶尖的 AI 工程师不再手动提示 AI,而是设计循环系统让 AI 自主运行。详解闭环 vs 开环、6 大构建块、以及为什么 DeepSeek 改变了游戏规则。 从 Prompt Engineer 到 Loop Engineer,最顶尖的 AI 工程师不再手动提示 AI,而是设计循环系统让 AI 自主运行。详解闭环 vs 开环、6 大构建块、以及为什么 DeepSeek 改变了游戏规则。
Anthropic 把 Managed Agents 的 dreaming、outcomes 和 multiagent orchestration 一次打包放出,本地 Builder feed 里最有价值的回应则集中在另一面:Agent 时代真正缺的不是点子,而是长期记忆、明确标准和能在不确定环境里继续交付的个人与团队。 Anthropic 把 Managed Agents 的 dreaming、outcomes 和 multiagent orchestration 一次打包放出,本地 Builder feed 里最有价值的回应则集中在另一面:Agent 时代真正缺的不是点子,而是长期记忆、明确标准和能在不确定环境里继续交付的个人与团队。
发布于 2026年06月10日 09:53
Addy Osmani 提出 Loop Engineering 的概念——不再是你去 Prompt AI,而是你设计一个系统让 AI 自己循环工作。五个核心组件,Codex 和 Claude Code 都已具备。 Addy Osmani 提出 Loop Engineering 的概念——不再是你去 Prompt AI,而是你设计一个系统让 AI 自己循环工作。五个核心组件,Codex 和 Claude Code 都已具备。
WWDC 2026 最大的变化,不是界面更炫,而是 Siri AI 与 Apple Intelligence 终于从概念走向系统级落地。 WWDC 2026 最大的变化,不是界面更炫,而是 Siri AI 与 Apple Intelligence 终于从概念走向系统级落地。
今天的 Builder 圈重点不在新模型,而在真正把 Agent 跑起来的系统层能力:无限循环工作流、模型路由、网关恢复与长期运行的工程治理。 今天的 Builder 圈重点不在新模型,而在真正把 Agent 跑起来的系统层能力:无限循环工作流、模型路由、网关恢复与长期运行的工程治理。
发布于 2026年06月09日 09:52
拆解 NousResearch 的 Hermes Agent,从自学习循环、Skills 系统、用户建模到多平台网关,看开源 Agent 如何真正理解「人」 拆解 NousResearch 的 Hermes Agent,从自学习循环、Skills 系统、用户建模到多平台网关,看开源 Agent 如何真正理解「人」
发布于 2026年06月08日 13:22
今天的 Builder 圈没有被新模型刷屏,真正有信息量的是另外三件事:企业开始正视 token 经济学,产品开始把模型路由做成系统层能力,而本地优先与隐私保护正在被重新包装成 Agent 时代的产品卖点。 今天的 Builder 圈没有被新模型刷屏,真正有信息量的是另外三件事:企业开始正视 token 经济学,产品开始把模型路由做成系统层能力,而本地优先与隐私保护正在被重新包装成 Agent 时代的产品卖点。
发布于 2026年06月07日 21:47
从 mvanhorn/last30days-skill 出发,拆解它如何用预解析、查询规划、多源抓取、聚类合并和信源治理,把 Reddit、X、YouTube、GitHub 与 Polymarket 上的实时讨论,变成一份可复用的研究工作流。 从 mvanhorn/last30days-skill 出发,拆解它如何用预解析、查询规划、多源抓取、聚类合并和信源治理,把 Reddit、X、YouTube、GitHub 与 Polymarket 上的实时讨论,变成一份可复用的研究工作流。
精华浓缩版。80% 代码由 Claude 编写、工程师产出 8 倍提升、实验加速 52 倍,这些不是预测,是已经发生的事。 精华浓缩版。80% 代码由 Claude 编写、工程师产出 8 倍提升、实验加速 52 倍,这些不是预测,是已经发生的事。
Anthropic Institute 首次公开内部数据,揭示 AI 正在加速 AI 本身的开发,工程师代码产出提升 8 倍,以及这对未来的意味。 Anthropic Institute 首次公开内部数据,揭示 AI 正在加速 AI 本身的开发,工程师代码产出提升 8 倍,以及这对未来的意味。
Anthropic 把 Claude containment 的具体工程代价摊开讲,OpenAI 把 Codex 与 memory 一起推向更长工作流,Builder 圈则同步暴露出另一个现实:Agent 时代真正难做的是边界、上下文和持续运行。 Anthropic 把 Claude containment 的具体工程代价摊开讲,OpenAI 把 Codex 与 memory 一起推向更长工作流,Builder 圈则同步暴露出另一个现实:Agent 时代真正难做的是边界、上下文和持续运行。
发布于 2026年06月05日 09:40
Token、Embedding、Attention、RAG、Agent……如果这些概念没想清楚,AI 应用调试起来会非常痛苦。 Token、Embedding、Attention、RAG、Agent……如果这些概念没想清楚,AI 应用调试起来会非常痛苦。
从 Token 到 Agent,用最通俗的方式建立 AI 工程的完整心智模型,帮你告别调试盲区。 从 Token 到 Agent,用最通俗的方式建立 AI 工程的完整心智模型,帮你告别调试盲区。
Listen Labs 在播客里把“知道该造什么”定义成 AGI 时代最稀缺的能力;X 上的 builders 则同时把 Claude Workflows、Gemini Thinking Levels、Codex 产品化和 token routing 推向真实工作流。今天最强的信号不是模型更会答题,而是智能体开始带着预算、记忆和运行时进入生产。 Listen Labs 在播客里把“知道该造什么”定义成 AGI 时代最稀缺的能力;X 上的 builders 则同时把 Claude Workflows、Gemini Thinking Levels、Codex 产品化和 token routing 推向真实工作流。今天最强的信号不是模型更会答题,而是智能体开始带着预算、记忆和运行时进入生产。
发布于 2026年06月04日 09:52
RTX Spark 不只是 NVIDIA 重新定义 AI PC 的发布会故事。换个角度看,它也是联发科进入高端 Windows AI PC 市场的一次关键跃迁。 RTX Spark 不只是 NVIDIA 重新定义 AI PC 的发布会故事。换个角度看,它也是联发科进入高端 Windows AI PC 市场的一次关键跃迁。
Anthropic 把 dreaming、outcomes 和 multiagent orchestration 打包推向 Managed Agents;Google Gemini 联席负责人 Oriol Vinyals 继续押注 world models;多位 builder 则给出了 Codex 长任务、预算控制和企业落地的真实信号。 Anthropic 把 dreaming、outcomes 和 multiagent orchestration 打包推向 Managed Agents;Google Gemini 联席负责人 Oriol Vinyals 继续押注 world models;多位 builder 则给出了 Codex 长任务、预算控制和企业落地的真实信号。
发布于 2026年06月01日 15:42
Salesforce 发布 Claude Code 深度整合报告,231 天迁移缩至 13 天;No Priors 对话 Onyx Security CEO,探讨 AI Agent 安全监管的必要性;OpenAI Codex 暗示新里程碑数据;YC CEO Garry Tan 给创始人的直言忠告 Salesforce 发布 Claude Code 深度整合报告,231 天迁移缩至 13 天;No Priors 对话 Onyx Security CEO,探讨 AI Agent 安全监管的必要性;OpenAI Codex 暗示新里程碑数据;YC CEO Garry Tan 给创始人的直言忠告
发布于 2026年05月31日 00:27
从最底层的工程视角出发,把 AI 的核心概念 LLM、Token、Context、Prompt、Harness、Tool、MCP、Agent 一个个拆开讲透 从最底层的工程视角出发,把 AI 的核心概念 LLM、Token、Context、Prompt、Harness、Tool、MCP、Agent 一个个拆开讲透
基于 Anthropic 官方发布拆解 Claude Opus 4.8:能力提升、动态工作流、努力程度控制、API 更新,以及它对 Agent 产品的真实意义。 基于 Anthropic 官方发布拆解 Claude Opus 4.8:能力提升、动态工作流、努力程度控制、API 更新,以及它对 Agent 产品的真实意义。
Daytona CEO Ivan Burazin 详解为什么每个 AI agent 都需要自己的计算机,AWS/Azure 无法满足 agent 需求,以及即将到来的 CPU 短缺。OpenClaw 创始人 Peter Steinberger 用 Rust WASM 替换 Sharp/Jimp,从 140MB 降到 2MB。YC CEO Garry Tan 分享 LLM 作为 eval 裁判的方法论。 Daytona CEO Ivan Burazin 详解为什么每个 AI agent 都需要自己的计算机,AWS/Azure 无法满足 agent 需求,以及即将到来的 CPU 短缺。OpenClaw 创始人 Peter Steinberger 用 Rust WASM 替换 Sharp/Jimp,从 140MB 降到 2MB。YC CEO Garry Tan 分享 LLM 作为 eval 裁判的方法论。
发布于 2026年05月27日 10:00
Daytona CEO Ivan Burazin 深度解析为什么 AWS 和 Azure 跑不了自主 AI Agent,Y Combinator CEO Garry Tan 分享三模型交叉评估法,OpenClaw 创始人用 Rust WASM 将图像依赖从 140MB 砍到 2MB Daytona CEO Ivan Burazin 深度解析为什么 AWS 和 Azure 跑不了自主 AI Agent,Y Combinator CEO Garry Tan 分享三模型交叉评估法,OpenClaw 创始人用 Rust WASM 将图像依赖从 140MB 砍到 2MB
发布于 2026年05月26日 21:00
从 multica-ai/multica 开源项目出发,拆解它如何用 issue 看板、agent daemon、runtime、squad、autopilot 和 reusable skills,把 coding agents 从一次性工具变成可管理的团队成员。 从 multica-ai/multica 开源项目出发,拆解它如何用 issue 看板、agent daemon、runtime、squad、autopilot 和 reusable skills,把 coding agents 从一次性工具变成可管理的团队成员。
从 nexu-io/open-design 开源项目出发,拆解它如何用本地 daemon、coding-agent CLI、Skills、Design Systems、沙盒预览和多格式导出,把 AI 设计从云端产品变成可自托管的工程工作流。 从 nexu-io/open-design 开源项目出发,拆解它如何用本地 daemon、coding-agent CLI、Skills、Design Systems、沙盒预览和多格式导出,把 AI 设计从云端产品变成可自托管的工程工作流。
拆解 HeyGen 开源 HyperFrames 的 Agent 视频制作思路,对比 Remotion、Manim、Pixelle-Video 等 8 个开源项目,帮你选对视频工程工具。 拆解 HeyGen 开源 HyperFrames 的 Agent 视频制作思路,对比 Remotion、Manim、Pixelle-Video 等 8 个开源项目,帮你选对视频工程工具。
拆解 Firecrawl 的产品定位、技术能力与商业化张力,对比 MediaCrawler 和 CloakBrowser 拆解 Firecrawl 的产品定位、技术能力与商业化张力,对比 MediaCrawler 和 CloakBrowser
拆解 Dify 的产品定位与技术架构,对比 n8n 和 Coze,帮你判断什么时候该选 Dify。 拆解 Dify 的产品定位与技术架构,对比 n8n 和 Coze,帮你判断什么时候该选 Dify。
技能能沉淀、记忆可检索、消息全平台——拆解一个想把 AI 做成操作系统的开源项目 技能能沉淀、记忆可检索、消息全平台——拆解一个想把 AI 做成操作系统的开源项目
OpenAI Codex 现已支持在 ChatGPT 手机 App 上使用。本文整理官方更新要点、手机端能力边界,并附上 iOS + Mac 完整接入配对步骤截图教程。 OpenAI Codex 现已支持在 ChatGPT 手机 App 上使用。本文整理官方更新要点、手机端能力边界,并附上 iOS + Mac 完整接入配对步骤截图教程。
Anthropic 推出 Claude for Small Business,接入 QuickBooks、PayPal 等工具,帮小企业主自动完成对账、催款、发工资等日常工作流。 Anthropic 推出 Claude for Small Business,接入 QuickBooks、PayPal 等工具,帮小企业主自动完成对账、催款、发工资等日常工作流。
Anthropic Claude Code 工程总监 Fiona Fung 分享:当编码不再是瓶颈,真正需要重构的不是工具,而是你的流程、团队和组织方式。 Anthropic Claude Code 工程总监 Fiona Fung 分享:当编码不再是瓶颈,真正需要重构的不是工具,而是你的流程、团队和组织方式。
基于 Susam Pal 的 Three Inverse Laws of AI,重新整理一套面向开发者和知识工作者的 AI 使用原则:不拟人化、不盲从、不甩锅。 基于 Susam Pal 的 Three Inverse Laws of AI,重新整理一套面向开发者和知识工作者的 AI 使用原则:不拟人化、不盲从、不甩锅。
发布于 2026年05月06日 22:22
从开发者视角拆解 AI 时代的基础设施赛道,看看 runtime、推理、数据和观测层谁更有机会成为默认框架。 从开发者视角拆解 AI 时代的基础设施赛道,看看 runtime、推理、数据和观测层谁更有机会成为默认框架。
我研究了 Matt Pocock 的 skills 仓库,发现真正拉开 AI 编程差距的,不是模型参数,而是从需求收束、任务拆分到 TDD 的整套工作流。 我研究了 Matt Pocock 的 skills 仓库,发现真正拉开 AI 编程差距的,不是模型参数,而是从需求收束、任务拆分到 TDD 的整套工作流。
Vercel 开源 npx skills,把 AI Agent 的 Skill 安装、发现、更新、删除做成统一 CLI。Skill 管理,正在进入包管理时代。 Vercel 开源 npx skills,把 AI Agent 的 Skill 安装、发现、更新、删除做成统一 CLI。Skill 管理,正在进入包管理时代。
基于 AINews 2026 年 1 月到 4 月 issue,梳理 AI 重要产品发布、模型竞争、Agent 工程化、基础设施和安全事件。 基于 AINews 2026 年 1 月到 4 月 issue,梳理 AI 重要产品发布、模型竞争、Agent 工程化、基础设施和安全事件。
深入理解 AI Harness:控制层的工程实践。模型是引擎,Harness 才是让引擎变得可用的关键 深入理解 AI Harness:控制层的工程实践。模型是引擎,Harness 才是让引擎变得可用的关键
Claude Dispatch 是什么?如何用手机远程指挥桌面端 AI 并行执行多个任务?PM 连续 48 小时实测,覆盖设置教程、真实工作流、踩坑解决方案,以及四种远程模式对比。 Claude Dispatch 是什么?如何用手机远程指挥桌面端 AI 并行执行多个任务?PM 连续 48 小时实测,覆盖设置教程、真实工作流、踩坑解决方案,以及四种远程模式对比。
解析 Google Agent Development Kit 中的 Tool Wrapper、Generator、Reviewer、Inversion 和 Pipeline 五种设计模式,帮助开发者构建结构化、可维护的 AI Agent 技能体系。 解析 Google Agent Development Kit 中的 Tool Wrapper、Generator、Reviewer、Inversion 和 Pipeline 五种设计模式,帮助开发者构建结构化、可维护的 AI Agent 技能体系。
OpenClaw Skills 安装教程与前端开发技能推荐。涵盖 23000+ 技能库精选、React/Vue/Flutter 技能组合,以及 OpenClaw 与 Claude Code Skills 区别详解。 OpenClaw Skills 安装教程与前端开发技能推荐。涵盖 23000+ 技能库精选、React/Vue/Flutter 技能组合,以及 OpenClaw 与 Claude Code Skills 区别详解。
从约束到反馈循环,可信 AI 的核心。AI 马具工程是构建与强大人工智能安全有效伙伴关系的学科。 从约束到反馈循环,可信 AI 的核心。AI 马具工程是构建与强大人工智能安全有效伙伴关系的学科。
深度解析 OpenClaw 橙皮书 v1.1.0 核心内容,从技术架构到实战部署,从 Skill 系统到成本控制,全面揭秘这个现象级 AI Agent 项目的成功之道 深度解析 OpenClaw 橙皮书 v1.1.0 核心内容,从技术架构到实战部署,从 Skill 系统到成本控制,全面揭秘这个现象级 AI Agent 项目的成功之道
精选 8 条今日 AI 领域重要动态,涵盖 Claude Corps、DXC × Claude、Fable 5、GitHub Agentic Workflows 与 Copilot CLI 等进展。 精选 8 条今日 AI 领域重要动态,涵盖 Claude Corps、DXC × Claude、Fable 5、GitHub Agentic Workflows 与 Copilot CLI 等进展。
精选 9 条 AI 动态,聚焦 Dreaming、Codex 上云、Claude 安全与企业生态、Copilot 长上下文等进展。 精选 9 条 AI 动态,聚焦 Dreaming、Codex 上云、Claude 安全与企业生态、Copilot 长上下文等进展。
精选 9 条今日 AI 动态,涵盖 Dreaming 记忆系统、Codex on AWS、Anthropic containment、Google agentic 产品与 NVIDIA 终端部署。 精选 9 条今日 AI 动态,涵盖 Dreaming 记忆系统、Codex on AWS、Anthropic containment、Google agentic 产品与 NVIDIA 终端部署。
精选 15 条今日 AI 动态,涵盖 GPT-5 早期体验、Gemma 4 量化模型、Google 太空算力合作、Agentic Era 工具指南、微软开源 pg_durable 等 精选 15 条今日 AI 动态,涵盖 GPT-5 早期体验、Gemma 4 量化模型、Google 太空算力合作、Agentic Era 工具指南、微软开源 pg_durable 等
精选 10 条今日 AI 领域重要动态,涵盖 ChatGPT Active Sessions、Claude Dynamic Workflows、Gemini Spark、微软 Agent Runtime 与 NVIDIA Agent 基础设施。 精选 10 条今日 AI 领域重要动态,涵盖 ChatGPT Active Sessions、Claude Dynamic Workflows、Gemini Spark、微软 Agent Runtime 与 NVIDIA Agent 基础设施。
精选 10 条今日 AI 领域重要动态,涵盖 GPT-5.5 Instant、Claude Managed Agents、Gemini Spark、NVIDIA Vera CPU 与 Anthropic 融资。 精选 10 条今日 AI 领域重要动态,涵盖 GPT-5.5 Instant、Claude Managed Agents、Gemini Spark、NVIDIA Vera CPU 与 Anthropic 融资。
精选 11 条今日 AI 领域重要动态,涵盖 GPT-5.5 Instant、Anthropic Managed Agents、Gemini Spark、NVIDIA Vera CPU 与 Cognition 融资。 精选 11 条今日 AI 领域重要动态,涵盖 GPT-5.5 Instant、Anthropic Managed Agents、Gemini Spark、NVIDIA Vera CPU 与 Cognition 融资。
精选 20 条今日 AI 领域重要动态,涵盖 xAI 放弃 JAX GPU 自研 C 框架、软银 750 亿欧元法国 AI 数据中心、OpenRouter 1.13 亿美元 B 轮、NVIDIA N1X 笔记本芯片等 精选 20 条今日 AI 领域重要动态,涵盖 xAI 放弃 JAX GPU 自研 C 框架、软银 750 亿欧元法国 AI 数据中心、OpenRouter 1.13 亿美元 B 轮、NVIDIA N1X 笔记本芯片等
精选 16 条今日 AI 领域重要动态,涵盖 Claude Opus 4.8、Anthropic 965 亿美元估值融资、Mistral 全栈 AI、Liquid 端侧 MoE 模型等 精选 16 条今日 AI 领域重要动态,涵盖 Claude Opus 4.8、Anthropic 965 亿美元估值融资、Mistral 全栈 AI、Liquid 端侧 MoE 模型等
精选 20 条今日 AI 领域重要动态,涵盖 Gemini 3.5 Flash 发布、Karpathy 加入 Anthropic、Grok Skills 上线、OpenAI 采用 SynthID 水印、Forge 护栏等 精选 20 条今日 AI 领域重要动态,涵盖 Gemini 3.5 Flash 发布、Karpathy 加入 Anthropic、Grok Skills 上线、OpenAI 采用 SynthID 水印、Forge 护栏等
精选 20 条今日 AI 领域重要动态,涵盖推理模型决策机制、AI 工具致技术退化、德国 eIDAS 数字身份、Codex 切换 API 定价等 精选 20 条今日 AI 领域重要动态,涵盖推理模型决策机制、AI 工具致技术退化、德国 eIDAS 数字身份、Codex 切换 API 定价等
精选 20 条今日 AI 领域重要动态,涵盖 ASI-Evolve 自我进化框架、SKILL0 智能体强化学习、Mollick 论 Agent 时代、Paul Graham 论写作等 精选 20 条今日 AI 领域重要动态,涵盖 ASI-Evolve 自我进化框架、SKILL0 智能体强化学习、Mollick 论 Agent 时代、Paul Graham 论写作等
精选 8 条 Claude 官方密集发布动态,涵盖 Computer Use 操控电脑、Dispatch 远程调度、Claude Code Auto Mode 等 精选 8 条 Claude 官方密集发布动态,涵盖 Computer Use 操控电脑、Dispatch 远程调度、Claude Code Auto Mode 等
精选 20 条今日 AI 领域重要动态,涵盖 GPT-5 早期体验、Agent 时代 AI 选型指南、NVIDIA Nemotron-Cascade 2 等 精选 20 条今日 AI 领域重要动态,涵盖 GPT-5 早期体验、Agent 时代 AI 选型指南、NVIDIA Nemotron-Cascade 2 等
快捷键:`Cmd/Ctrl + K` 打开,`Esc` 关闭。
输入关键词开始搜索。
扫描二维码关注微信公众号