AI Builders Digest 0524:Cerebras CEO 谈 630 亿 IPO、Vercel CEO 的 AI 产品大调查、Box CEO 论 AI 与就业

发布于 2026年05月25日 01:12 #Follow Builders#Models

AI Builders Digest 0524:Cerebras CEO 谈 630 亿 IPO、Vercel CEO 的 AI 产品大调查、Box CEO 论 AI 与就业 封面图

今天的 AI Builders Digest 覆盖了过去 24 小时内 AI 领域最有价值的动态:Cerebras CEO 对十年创业历程的深度回顾、多位一线 Builder 对 AI 产品格局和就业的洞察,以及 Garry Tan 对个人 AI 记忆工具的探索。

今日总结

今天的 AI Builders Digest 主线是:AI 行业正在从“能不能做到”进入“以多快速度做到”的阶段,速度本身正在催生全新的商业模式和工作方式。

推理速度是新的基础设施变量。 Cerebras 的故事说明,当 AI 模型“聪明到真正有用”之后,推理速度从次要指标变成了核心刚需。Feldman 的判断——“慢推理的市场将是零”——如果成立,意味着整个 AI 基础设施的竞争维度正在从训练能力转向推理速度。

产品格局正在快速分化。 Vercel CEO 的 1400 条回复统计揭示了一个有趣的趋势:用户在谈论“工具品牌”时更多提及 OpenAI/Codex,但按底层模型统计时 Anthropic 更占优势。这说明 AI 产品的竞争正在从“哪家模型”扩展到“哪个产品体验”——同一家公司的模型可以出现在不同的产品包装中。

岗位不会消失,但会重塑。 Box CEO Levie 的论点为 AI 就业焦虑提供了一个务实的框架:不要混淆任务自动化和岗位消灭。当 AI 让一个岗位中的 80% 任务自动化后,剩下的 20% 往往定义了一个全新的、更有价值的岗位。

今日关键词: Cerebras IPO · 推理速度 · OpenAI 200 亿合作 · AI 就业 · Agent 决策日志 · GBrain 记忆 · Qwen3.5 微调


播客精选

No Priors:Cerebras CEO Andrew Feldman 谈 630 亿美元 IPO 背后的故事

Andrew Feldman 是 Cerebras 的联合创始人兼 CEO,公司刚以约 630 亿美元市值上市。他在 No Priors 播客中回顾了十年创业历程,从“所有人说不可能”到成为 OpenAI 和 AWS 的核心推理供应商。

核心洞察:速度不会让现有模式更好,而是催生全新商业模式。

Feldman 用 Netflix 做类比:Netflix 最早是寄 DVD 的公司,竞争对手是 Blockbuster。当互联网速度够快之后,Netflix 不是把 DVD 寄得更快了,而是变成了一家电影工作室。AI 推理速度也一样——现在看到的只是替代现有的编码、设计、SaaS 工具,但真正的变化将出现在“围绕速度重新组织工作方式”之后。

晶圆级芯片的十年赌博。 Cerebras 的核心产品是一块 46,000 平方毫米的晶圆级芯片——“餐盘大小”,而竞争对手的芯片只有邮票大小。推理速度比 GPU 快 15-20 倍,覆盖从 10 亿到万亿参数的所有模型。2017-2019 年间,团队每月烧 800 万美元,每六周开一次董事会说“还是做不出来”。2019 年夏天第一次成功点亮芯片时,整个团队沉默了半小时。Feldman 说:“计算机史上七十年来无数人尝试过晶圆级产品,Gene Amdahl 都失败了。”

OpenAI 200 亿美元合作内幕。 Sam Altman 在 2025 年夏天首次表态“看到了快速推理的重要性”。经过一系列测试后,感恩节前夜签了条款书,四周半后(12 月 24 日)签署了 200 多亿美元的正式协议。“所有人都说这种规模的交易不可能在四周内完成,但如果每天工作 8-10 小时,就可以。”

AI 行业正在重新定义“可能的艺术”。 Feldman 提到 Cursor 和 Cognition 的增长速度前所未闻,Cognition 周末收购 Windsurf,Elon 建数据中心的速度打破所有先例。“所有人都说不可能,但做到了。”他认为 AI 行业正在经历与当年 PC → Cloud → SaaS 类似的范式转移。

内部 AI 编程的真实数据。 Cerebras 850 人团队中,token 消费从 8 个月前的零增长到每月 2.5-3 万美元。少数工程师已经从 10x 变成了 100x——同时运行 8-10 个 Agent,7x24 不停歇。但包括 CEO 本人在内的大多数人“还在蹒跚学步”。

“慢推理的市场有多大?零。拨号上网的市场有多大?零。慢推理的市场也将是零。”

为什么上市? Cerebras 是市场上唯一的纯 AI 基础设施公司,100% 收入来自 AI——没有游戏、没有图形、没有 PC。Feldman 称上市是“从企业青春期到企业成年的毕业典礼”。

🔗 https://www.youtube.com/watch?v=jeop9wfb9jU

X/Twitter 动态

Vercel CEO Guillermo Rauch:1400 条回复揭示 AI 产品格局

Rauch 发起了一个互动实验:让大家展示用 AI 做的最自豪的产品,需附带 URL 和使用的模型。这条推文获得 2195 个赞和 1558 条回复。

随后他统计了 1400 条回复的数据:

  • OpenAI 正在追赶 Anthropic
  • “Codex”被提及的次数比“Claude Code”多
  • 但按模型分类统计时,Anthropic 的模型更占优势

这个数据点值得注意:用户在谈论“工具”时更多提及 OpenAI 的 Codex,但在实际使用中选择模型时,Anthropic 的模型被采用的比例更高。

🔗 https://x.com/rauchg/status/2058245330836271263 🔗 https://x.com/rauchg/status/2058353051073970416


Box CEO Aaron Levie:不要混淆“任务”和“岗位”

Levie 发了一篇关于 AI 与就业的长推,核心论点是:即使 AI 能自动化一个岗位中的多项任务,岗位的定义通常会扩展——做得更多、质量更高、或者转向尚未自动化的任务。

他用具体例子说明:以前请不起营销公司的小企业,现在可以雇佣一个用 Agent 达到营销公司效果的人;以前无法承接大型软件项目的非技术公司,现在可以组建技术团队了。

“不要掉进把任务等同于岗位的陷阱。”

🔗 https://x.com/levie/status/2058223867815227756


YC 掌门人 Garry Tan:GBrain 记忆基准测试 + 几小时微调 Qwen3.5-397B

Garry Tan 分享了两个动态:

一是 GBrain(他的个人 AI 记忆工具)在 LongMemEval 基准上超过 MemPalace 1%、超过 Vector RAG 38%,在 reranking 和 embedding 的成本、速度和检索成功率上达到 SOTA。

二是他花几个小时就在 Thinking Machines 上微调了一个 Qwen3.5-397B 模型。他称“快速可用的多模态将催生真正令人震撼的个人 AI”。这条推文获得了近千赞。

🔗 https://x.com/garrytan/status/2058448209027141709 🔗 https://x.com/garrytan/status/2058378310254793013


OpenClaw 创始人 Peter Steinberger:Agent 决策日志 + GitHub 仪表盘

Steinberger 建议让 Codex 在做大重构时维护一份“决策日志”(scratch-log),记录取舍、评审修复、遗漏的规范等,方便事后回溯 Agent 做了哪些权衡。这个实践对理解 Agent 的“思维过程”和改进提示词非常有价值。

他还做了一个 GitHub 仪表盘工具,可以查看仓库状态、Issue/PR、最近版本和未发布提交数,获得了 676 个赞。

🔗 https://x.com/steipete/status/2058308112134635528 🔗 https://x.com/steipete/status/2058381186884411473


Anthropic Claude Code 工程师 Thariq:“please save me money” 提示词

Thariq 分享了一个实用技巧:用“please save me money”提示词让 AI 自动分析云服务账单并找到省钱方案。他用 Claude Code 清理老创业项目遗留的基础设施,发现 AI 能有效处理历史代码库的成本优化。这恰好是开发者最常拖延的任务。

🔗 https://x.com/trq212/status/2058377974882210096


Replit CEO Amjad Masad:一个周末用 Replit 做的 App 通过 Apple 审核

Masad 转发了用户反馈:该用户此前用 Cursor 做了三个 App,觉得已经很快了,但用 Replit 做一个叫 Dial 的 MVP 时,一个周末就完成并通过了 Apple 审核——“以前从没一次过”。

🔗 https://x.com/amasad/status/2058418731840159953


前 Facebook 早期工程师、Dropbox CTO Aditya Agarwal:6 个月的巨变

Agarwal 回顾:2025 年 11 月人们还只是在跟 LLM 聊天就觉得 AI 很棒,到了 2026 年 5 月,LLM 生成的代码量已经超过了人类有史以来写的所有代码。South Park Commons 合伙人 Nikunj Kothari 则提醒 B2B 公司不要忽视叙事和品牌调性的重要性。

🔗 https://x.com/adityaag/status/2058233900464238801 🔗 https://x.com/nikunj/status/2058203594672021769


数据采集时间:2026-05-25 01:12 CST

评论互动

© 2026 王若风的技术博客 · Powered by Astro