AI Builders Digest 0530:AI Agent 安全控制层、Claude Code 工作流重构、Codex 采用信号

发布于 2026年05月30日 23:41 #Follow Builders#Claude

AI Builders Digest 0530:AI Agent 安全控制层、Claude Code 工作流重构、Codex 采用信号 封面图

今天的 AI Builders Digest 主线是 Agent 从效率工具走向企业基础设施:一边是 Onyx Security 把“监督 Agent 的 Agent”做成安全控制层,另一边是 Claude Code 和 Codex 的采用信号继续变强。真正的变化不是 AI 帮人快一点,而是企业开始重写权限、质量、安全和协作边界。

今日总结

今天的 AI Builders Digest 主线是:Agent 正在从个人效率工具变成企业系统的一部分。

Agent 的核心问题从“能不能做”变成“该不该做”。 Onyx Security 的判断很关键:当 agent action 数量指数级增长,human-in-the-loop 会变成瓶颈。企业真正需要的是一个能理解上下文的控制层,知道什么时候放行,什么时候让更强模型介入。

AI coding 的胜负手不是提速,而是重写流程。 Boris Cherny 提到的 Salesforce 案例说明,Claude Code 的价值不只是让工程师更快写 PR,而是把迁移、测试、安全和交付组织成新的 agentic workflow。231 天变 13 天的背后,是流程结构被改了。

应用层和工具层没有被模型消灭,反而被重新定价。 Aaron Levie 的观点和 Thibault Sottiaux 的 Codex 信号可以放在一起看:基础模型越强,越需要新的应用层、控制层、工作流层承接它。真正有价值的软件,正在从“提供功能”变成“组织 AI 能力”。

今日关键词: Agent Security · Claude Code · Codex · Secure AI Control Plane · Workflow Redesign · App Layer


播客精选

No Priors:企业为什么需要 AI Agent 守护者 - Maxim Bar Kogan (Onyx Security)

Maxim Bar Kogan 是 Onyx Security 联合创始人兼 CEO。Onyx 是一家以色列 AI 安全公司,方向很明确:训练模型和构建 Agent,用来监督企业内部越来越多的 autonomous agent。

核心判断:传统安全工具看得到动作,看不懂意图。 企业过去依赖 identity、endpoint、API security 来限制软件风险,因为普通软件的权限边界相对清楚。但 coding agent 和 autonomous assistant 不一样:企业希望它们继承人的权限,独立完成数据库、代码、部署、SaaS 自动化等任务。问题也在这里:同样一个“删除并重建数据库”的动作,在一个任务里可能合理,在另一个任务里可能是灾难。

Onyx 的产品形态是 secure AI control plane。 它要先发现企业里的 AI 和 autonomous agent,再把这些系统接入一个监督层,用模型判断每个 agent action 是否合理。Maxim 给出的部署观察很具体:在典型企业里,超过 50% 的 AI agent 使用来自 autonomous coding agents 和 assistants,约 45% 来自 low-code AI automations,真正由企业自己构建的一方 agent 只有约 2%。

最关键的架构不是“大模型看大模型”,而是小模型做风险路由。 如果每运行一个 agent,就再运行一个同等强大的监督 agent,成本和延迟都会失控。Onyx 的思路是训练小而专门的模型,只做一件事:判断当前动作是否值得更聪明的 agent 介入深查。

“不要在不需要的地方花太多智能;高风险的时候,才投入压倒性的智能。”

这句话几乎就是 AI security 的下一阶段设计原则。未来的企业安全不只是“拦截危险动作”,而是要理解 agent 的任务上下文、历史行为和当前计划,然后决定什么时候放行、什么时候升级审查。

🔗 https://www.youtube.com/watch?v=QDsbFLEt9ro

X/Twitter 动态

Boris Cherny(Claude Code):AI 价值不是加速旧流程,而是删除旧流程

Boris Cherny 分享 Salesforce 使用 Claude Code 的案例,最值得注意的不是“写代码更快”,而是工作流被重新设计。他强调,真正从 AI 中获得最大收益的团队,不是在加速既有步骤,而是在问:哪些步骤可以删除,哪些交接可以消失,哪些任务可以让 agent 端到端负责。

案例里的数字很硬:Salesforce 原本估算 231 天的迁移任务,最终 13 天完成;一个 PR 交付了 21 个 endpoint,并达到 100% 测试覆盖率。更重要的是,产出增加并没有牺牲质量,总事故数反而下降 5%,因为安全 guardrails 和质量标准被嵌进了 agentic workflow 本身。

🔗 https://x.com/bcherny/status/2060390852619272526 🔗 https://x.com/bcherny/status/2060390853835726946


Thibault Sottiaux(OpenAI Codex / ChatGPT):Codex 采用数据可能快来了

Thibault Sottiaux 暗示自己在 Codex dashboard 上看到一个令人兴奋的数字,并说很快会有更多消息。这不是正式发布,但它传递的信号很清楚:Codex 的采用还处在早期,但增长已经足够值得对外讲。

他还问了一个很现实的问题:用户还相信 benchmark,还是更听朋友推荐?当模型和 coding agent 越来越多,真实任务里的口碑、朋友推荐和团队内部体感,可能正在变得比单一榜单更能推动迁移。

🔗 https://x.com/thsottiaux/status/2060565265906290786 🔗 https://x.com/thsottiaux/status/2060563528596287874


Aaron Levie(Box CEO):5 亿美元自建应用层,反而说明软件仍然值钱

Aaron Levie 对“一家公司花 5 亿美元自建应用层”的新闻给出反向解读:这不是 app layer 被基础模型吞掉的证据,反而是 app layer 最好的广告。表面上看,大公司在绕过现成软件;真正关键的是,如果企业愿意花这么多钱重建应用能力,说明软件应用层仍然有巨大商业价值。

🔗 https://x.com/levie/status/2060525104384418271


Josh Woodward(Google Labs / Gemini VP):Gemini 把多模态能力继续下沉到消费级交互

Josh Woodward 分享了两个 Gemini 相关 demo:一个是把普通汽车视觉变成 Lamborghini 风格,另一个强调多语言能力现在已经变得“ridiculously easy”。这类内容的重点不是单个 demo 有多炫,而是图像编辑、多语言表达这类过去偏专业的能力,正在被压缩成普通用户可以直接调用的交互。

🔗 https://x.com/joshwoodward/status/2060443095527989413 🔗 https://x.com/joshwoodward/status/2060443093825094091


Garry Tan(YC CEO):融资不是火,是倒在火上的汽油

Garry Tan 给创始人的提醒很直接:不要把“如果有钱我们就能做 X”误判成融资问题。钱不是火,钱是倒在已有火焰上的汽油;真正的问题通常是“还没有足够多人想要它”。先证明需求,再让资本放大需求。

🔗 https://x.com/garrytan/status/2060600088079356292


Peter Steinberger(OpenClaw / OpenAI):懂新软件构建方式的人正在变稀缺

Peter Steinberger 表示很高兴 Vince 加入团队,理由是“很少有人真正理解软件是如何以新方式被构建的”。这条没有展开产品细节,但指向一个正在变重要的人才判断:在 AI coding 团队里,理解 agentic software development 可能正在成为比单纯会写代码更稀缺的能力。

🔗 https://x.com/steipete/status/2060306947035832628


数据采集时间:2026-05-30 23:41 CST

评论互动

© 2026 王若风的技术博客 · Powered by Astro