AI Builders Digest 0612:Fable、Codex 增长与 Memory 管线

发布于 2026年06月12日 09:55 #Follow Builders#Agents

AI Builders Digest 0612:Fable、Codex 增长与 Memory 管线 封面图

今天的 AI Builders Digest 主线是 Builder 们开始把“模型更强”翻译成真正能连续运行的工作系统。Mike Krieger 讲的是长任务、动态工作流和 verification loops;Thibault 晒出的是 Codex 在没有新发布的情况下 48 小时 token 消耗依然猛增;另一边,Fable 已经被拿去自动剪 launch video、导入跨产品 memory、重写企业 agent 评估方法。真正的分水岭,越来越不是 demo 会不会炫,而是谁把 memory、workflow、verification 和 distribution 连成闭环。

今日总结

主线:Agent 正在从“会生成”切到“会长期运行、会验证自己、会接住真实上下文”。

Mike Krieger 这期播客最重要的信号,不是 Fable 5 变强了,而是 Builder 的工作方法被迫升级。 他反复提到要先做 architecture planning,再把任务拆给动态工作流,还要用 screenshots、video 和 mock backend 做 verification loops。模型一旦能稳定跑到凌晨两点,真正稀缺的就变成如何定义边界、校验结果和设计 delegation。

X 上最强的采用信号来自两个方向:Codex 的真实使用量上升,以及 Fable 被拿去做跨模态生产。 Thibault 说 Codex 在 48 小时内出现“非发布驱动”的 token consumption spike;Thariq 则直接用 Fable 自动写代码、调 ffmpeg、接 Figma MCP、做 remotion UI,把 launch video 整条产线跑完。一个是 demand signal,一个是 workflow signal。

另一条很值得盯的是 memory 与上下文迁移开始产品化。 Garry Tan 推荐 Nessie 把 ChatGPT、Perplexity 和 Gemini 的现有 memory/history 导入其他系统,再接进 OpenClaw/Hermes Agent;这说明 Builder 圈已经不再满足于单个模型会做什么,而是在追“上下文资产能不能跟着我流动”。

今日关键词: Fable 5 · Codex · Dynamic Workflows · Verification Loops · Figma MCP · Memory Import

播客精选

AI & I by Every:Mike Krieger 谈 Claude Fable 5,重点不是更聪明,而是终于能放心把长任务交出去

这期 How Anthropic Uses Claude Fable 5 With Mike Krieger 发布于 2026-06-11 01:27 CST。Mike Krieger 反复强调,Fable 5 改变的不是单次问答体验,而是整个 builder workflow:先和模型做 architecture planning,再把复杂任务交给 dynamic workflows 长时间运行,最后用 screenshots、video capture、mock backend 和 verification loops 校验结果。

播客里最打动人的一句,是他形容自己会“wish Claude a good night”,然后把复杂任务丢给它过夜。这背后的含义很重:当模型已经能在远程服务挂掉时自己写 scaffolded backend、记录待修事项并继续推进,builder 真正要重新学习的就不是 prompt 小技巧,而是任务分解、边界定义和 review discipline。

另一条高价值线索,是他几乎把所有长期使用经验都落回到“动态工作流 + 验证闭环”。从 Python 代码库迁移到 TypeScript/Bun,到让模型看视频检查动画卡顿,再到让 agent 用真实 staging 账号走产品主路径,他讲的都是同一件事:越强的模型,越需要更系统化的 runtime 和 eval。

“I’ll wish Claude a good night… and wake up to… really impressive ability to complete the swing.”

🔗 https://www.youtube.com/watch?v=XWpTgCvgYaE

X/Twitter 动态

Thibault Sottiaux(OpenAI Codex & ChatGPT):Codex 在没有新发布的情况下,48 小时 token 消耗仍然显著上冲

Thibault 这条帖文的原话很短,但信号很强:Can confirm we saw a strong spike in growth of token consumption for Codex over last 48 hours. Unusual when we don't launch something. 按 feed 快照,这条内容拿到 2460 个点赞、105 次转发和 257 条回复。

这说明 Codex 的增长已经不完全依赖 launch 节奏,而开始出现“用户自己长出用法”的自驱需求。对 builder 工具来说,这比一次产品发布带来的 spike 更重要,因为它往往意味着任务复杂度和使用时长都在变大。

🔗 https://x.com/thsottiaux/status/2064911328087810308


Thariq(Anthropic Claude Code):Fable 已经被拿去自动剪 launch video,连 ffmpeg、Figma MCP 和渲染都串起来了

Thariq 发布的这条帖子是今天最具体的 workflow 样本之一。按原帖描述,Fable “wrote a lot of code & tool calls” 来调用 transcription services、ffmpeg、做 color grading、使用 figma mcp、生成 remotion UI 并完成最终 render;而他自己“didn't touch a video editor”。这条内容在 feed 中拿到 6036 个点赞、367 次转发和 207 条回复。

这类案例的价值,不在“AI 能剪视频”本身,而在它证明 agent 已经开始越过单一文本工作流,进入真正跨工具、跨格式、跨模态的生产链路。Builder 们现在最该关注的,是如何把这些 tool calls 组织成可复用技能包,而不是再做一个孤立 demo。

🔗 https://x.com/trq212/status/2064826394589442448


Aaron Levie(Box CEO):Fable 在 Box 复杂知识工作评测里,对 Opus 4.8 出现整档跃迁

Aaron Levie 贴出了 Box AI Complex Work Eval 的一组高信号结果:Fable 相比 Opus 4.8 在多个行业场景里都出现明显提升,例如 Media & Entertainment 78% vs 61%Technology 81% vs 73%Financial Services 89% vs 83%Healthcare 66% vs 60%。他还列出了法律并购审查、临床放射错误审计、零售分析和财务预测等具体任务中的逐项对比。

这条帖子的意义在于,它把“模型变强了”翻译成了企业文档与 agent 工作流里的真实任务胜率。Builder 真正关心的不是 benchmark 排名,而是模型在多步计算、长文档约束和复杂领域知识里的 consistency;Aaron 的这组数据正好给了这类判断一个更接近生产环境的参照。

🔗 https://x.com/levie/status/2064922814688481678


Madhu Guru(前 Gemini 产品负责人):做新应用别先省钱,先用最强模型找上限

Madhu Guru 这条内容虽然互动量不高,但判断很实用。他说企业早期常把 quality/cost tradeoff 选反:如果只是拿 LLM 替换传统 ML,可以从小模型起步;但如果是在“构建新东西”,应该先上最强模型,先把可能性边界摸清,再往更小模型收敛。

这条建议本质上是在纠正很多团队最常见的误区:太早优化成本,反而会把本来可能成立的 agent 工作流直接做死。对 builder 来说,先用高能力模型验证 magic,再回头做 routing 和 cost-down,通常才是更合理的产品顺序。

🔗 https://x.com/realmadhuguru/status/2064794601320481150


Garry Tan(YC CEO):Nessie 开始把 ChatGPT、Perplexity、Gemini 的历史上下文导进其他系统,再接到 OpenClaw/Hermes Agent

Garry Tan 提到,Nessie 已经能把现有的 context、memory 和 history 从 ChatGPT、Perplexity 与 Gemini 导入其他有 memory 的系统,并进一步接到 OpenClaw/Hermes Agent。按 feed 快照,这条内容拿到 269 个点赞、23 次转发和 41 条回复。

这条更新值得盯,是因为它触碰了 agent 产品下一阶段最核心的竞争点:不是谁单次回答更好,而是谁能把用户已经沉淀下来的上下文资产迁移、整合并持续复用。memory 一旦能流动,用户锁定和工作流复利都会发生质变。

🔗 https://x.com/garrytan/status/2064947145652994510


Peter Yang(AI Builders 作者):别再把“做管理”当默认上升路径,AI 时代更奖励长期做 Builder 的人

Peter Yang 写得很直白:很多 builder 把最好的几年花在了“爬错梯子”上。随着 AI 提升个体生产力,企业越来越愿意奖励高产出 IC,甚至管理者也被要求保留 IC 能力。他的建议不是空泛焦虑,而是回到一线:持续做项目、保留作品、把 build 的 reps 练回来。

这类内容虽然没有技术发布那么硬核,但它和 Mike Krieger 在播客里讲的变化是同一条线。模型让“会不会写”不再是唯一门槛后,真正值钱的反而是定义问题、拆任务、持续构建和复盘的 builder 基本功。

🔗 https://x.com/petergyang/status/2064799855059616172


数据采集时间:2026-06-11 16:02 CST

评论互动

© 2026 王若风的技术博客 · Powered by Astro