AI Builders Digest 0524：Cerebras CEO 谈 630 亿 IPO、Vercel CEO 的 AI 产品大调查、Box CEO 论 AI 与就业

发布于 2026年05月25日 01:12 #Follow Builders #Models

推理速度成为AI基础设施新变量，慢推理市场将归零
AI产品竞争从模型转向产品体验，工具品牌与底层模型使用出现分化
AI自动化任务而非消灭岗位，岗位定义将扩展重塑
Cerebras十年创业从不可能到IPO，晶圆级芯片实现15-20倍推理速度
个人AI记忆工具GBrain在基准测试中超越现有方案

今天的 AI Builders Digest 覆盖了过去 24 小时内 AI 领域最有价值的动态：Cerebras CEO 对十年创业历程的深度回顾、多位一线 Builder 对 AI 产品格局和就业的洞察，以及 Garry Tan 对个人 AI 记忆工具的探索。

今日总结

今天的 AI Builders Digest 主线是：AI 行业正在从“能不能做到”进入“以多快速度做到”的阶段，速度本身正在催生全新的商业模式和工作方式。

推理速度是新的基础设施变量。 Cerebras 的故事说明，当 AI 模型“聪明到真正有用”之后，推理速度从次要指标变成了核心刚需。Feldman 的判断——“慢推理的市场将是零”——如果成立，意味着整个 AI 基础设施的竞争维度正在从训练能力转向推理速度。

产品格局正在快速分化。 Vercel CEO 的 1400 条回复统计揭示了一个有趣的趋势：用户在谈论“工具品牌”时更多提及 OpenAI/Codex，但按底层模型统计时 Anthropic 更占优势。这说明 AI 产品的竞争正在从“哪家模型”扩展到“哪个产品体验”——同一家公司的模型可以出现在不同的产品包装中。

岗位不会消失，但会重塑。 Box CEO Levie 的论点为 AI 就业焦虑提供了一个务实的框架：不要混淆任务自动化和岗位消灭。当 AI 让一个岗位中的 80% 任务自动化后，剩下的 20% 往往定义了一个全新的、更有价值的岗位。

今日关键词： Cerebras IPO · 推理速度 · OpenAI 200 亿合作 · AI 就业 · Agent 决策日志 · GBrain 记忆 · Qwen3.5 微调

播客精选

No Priors：Cerebras CEO Andrew Feldman 谈 630 亿美元 IPO 背后的故事

Andrew Feldman 是 Cerebras 的联合创始人兼 CEO，公司刚以约 630 亿美元市值上市。他在 No Priors 播客中回顾了十年创业历程，从“所有人说不可能”到成为 OpenAI 和 AWS 的核心推理供应商。

核心洞察：速度不会让现有模式更好，而是催生全新商业模式。

Feldman 用 Netflix 做类比：Netflix 最早是寄 DVD 的公司，竞争对手是 Blockbuster。当互联网速度够快之后，Netflix 不是把 DVD 寄得更快了，而是变成了一家电影工作室。AI 推理速度也一样——现在看到的只是替代现有的编码、设计、SaaS 工具，但真正的变化将出现在“围绕速度重新组织工作方式”之后。

晶圆级芯片的十年赌博。 Cerebras 的核心产品是一块 46,000 平方毫米的晶圆级芯片——“餐盘大小”，而竞争对手的芯片只有邮票大小。推理速度比 GPU 快 15-20 倍，覆盖从 10 亿到万亿参数的所有模型。2017-2019 年间，团队每月烧 800 万美元，每六周开一次董事会说“还是做不出来”。2019 年夏天第一次成功点亮芯片时，整个团队沉默了半小时。Feldman 说：“计算机史上七十年来无数人尝试过晶圆级产品，Gene Amdahl 都失败了。”

OpenAI 200 亿美元合作内幕。 Sam Altman 在 2025 年夏天首次表态“看到了快速推理的重要性”。经过一系列测试后，感恩节前夜签了条款书，四周半后（12 月 24 日）签署了 200 多亿美元的正式协议。“所有人都说这种规模的交易不可能在四周内完成，但如果每天工作 8-10 小时，就可以。”

AI 行业正在重新定义“可能的艺术”。 Feldman 提到 Cursor 和 Cognition 的增长速度前所未闻，Cognition 周末收购 Windsurf，Elon 建数据中心的速度打破所有先例。“所有人都说不可能，但做到了。”他认为 AI 行业正在经历与当年 PC → Cloud → SaaS 类似的范式转移。

内部 AI 编程的真实数据。 Cerebras 850 人团队中，token 消费从 8 个月前的零增长到每月 2.5-3 万美元。少数工程师已经从 10x 变成了 100x——同时运行 8-10 个 Agent，7x24 不停歇。但包括 CEO 本人在内的大多数人“还在蹒跚学步”。

“慢推理的市场有多大？零。拨号上网的市场有多大？零。慢推理的市场也将是零。”

为什么上市？ Cerebras 是市场上唯一的纯 AI 基础设施公司，100% 收入来自 AI——没有游戏、没有图形、没有 PC。Feldman 称上市是“从企业青春期到企业成年的毕业典礼”。

🔗 https://www.youtube.com/watch?v=jeop9wfb9jU

X/Twitter 动态

Vercel CEO Guillermo Rauch：1400 条回复揭示 AI 产品格局

Rauch 发起了一个互动实验：让大家展示用 AI 做的最自豪的产品，需附带 URL 和使用的模型。这条推文获得 2195 个赞和 1558 条回复。

随后他统计了 1400 条回复的数据：

OpenAI 正在追赶 Anthropic
“Codex”被提及的次数比“Claude Code”多
但按模型分类统计时，Anthropic 的模型更占优势

这个数据点值得注意：用户在谈论“工具”时更多提及 OpenAI 的 Codex，但在实际使用中选择模型时，Anthropic 的模型被采用的比例更高。

🔗 https://x.com/rauchg/status/2058245330836271263
🔗 https://x.com/rauchg/status/2058353051073970416

Box CEO Aaron Levie：不要混淆“任务”和“岗位”

Levie 发了一篇关于 AI 与就业的长推，核心论点是：即使 AI 能自动化一个岗位中的多项任务，岗位的定义通常会扩展——做得更多、质量更高、或者转向尚未自动化的任务。

他用具体例子说明：以前请不起营销公司的小企业，现在可以雇佣一个用 Agent 达到营销公司效果的人；以前无法承接大型软件项目的非技术公司，现在可以组建技术团队了。

“不要掉进把任务等同于岗位的陷阱。”

🔗 https://x.com/levie/status/2058223867815227756

YC 掌门人 Garry Tan：GBrain 记忆基准测试 + 几小时微调 Qwen3.5-397B

Garry Tan 分享了两个动态：

一是 GBrain（他的个人 AI 记忆工具）在 LongMemEval 基准上超过 MemPalace 1%、超过 Vector RAG 38%，在 reranking 和 embedding 的成本、速度和检索成功率上达到 SOTA。

二是他花几个小时就在 Thinking Machines 上微调了一个 Qwen3.5-397B 模型。他称“快速可用的多模态将催生真正令人震撼的个人 AI”。这条推文获得了近千赞。

🔗 https://x.com/garrytan/status/2058448209027141709
🔗 https://x.com/garrytan/status/2058378310254793013

OpenClaw 创始人 Peter Steinberger：Agent 决策日志 + GitHub 仪表盘

Steinberger 建议让 Codex 在做大重构时维护一份“决策日志”（scratch-log），记录取舍、评审修复、遗漏的规范等，方便事后回溯 Agent 做了哪些权衡。这个实践对理解 Agent 的“思维过程”和改进提示词非常有价值。

他还做了一个 GitHub 仪表盘工具，可以查看仓库状态、Issue/PR、最近版本和未发布提交数，获得了 676 个赞。

🔗 https://x.com/steipete/status/2058308112134635528
🔗 https://x.com/steipete/status/2058381186884411473

Anthropic Claude Code 工程师 Thariq：“please save me money” 提示词

Thariq 分享了一个实用技巧：用“please save me money”提示词让 AI 自动分析云服务账单并找到省钱方案。他用 Claude Code 清理老创业项目遗留的基础设施，发现 AI 能有效处理历史代码库的成本优化。这恰好是开发者最常拖延的任务。

🔗 https://x.com/trq212/status/2058377974882210096

Replit CEO Amjad Masad：一个周末用 Replit 做的 App 通过 Apple 审核

Masad 转发了用户反馈：该用户此前用 Cursor 做了三个 App，觉得已经很快了，但用 Replit 做一个叫 Dial 的 MVP 时，一个周末就完成并通过了 Apple 审核——“以前从没一次过”。

🔗 https://x.com/amasad/status/2058418731840159953

前 Facebook 早期工程师、Dropbox CTO Aditya Agarwal：6 个月的巨变

Agarwal 回顾：2025 年 11 月人们还只是在跟 LLM 聊天就觉得 AI 很棒，到了 2026 年 5 月，LLM 生成的代码量已经超过了人类有史以来写的所有代码。South Park Commons 合伙人 Nikunj Kothari 则提醒 B2B 公司不要忽视叙事和品牌调性的重要性。

🔗 https://x.com/adityaag/status/2058233900464238801
🔗 https://x.com/nikunj/status/2058203594672021769

数据采集时间：2026-05-25 01:12 CST