OpenAI 和 AWS 终于走到一起了
Ben Thompson 这周经历了一个堪称戏剧性的场面。
上周五,他坐在那里,对面是 Sam Altman 和 AWS CEO Matt Garman,三个人聊的是 OpenAI 和 AWS 的新合作,Bedrock Managed Agents。采访嘛,自然要问那个所有人都想知道的问题,这跟微软给 Azure 的 OpenAI 模型独占权,怎么兼容?
结果周日晚上,他从小道消息听说微软周一要有大动作。
他心想,不会是要搞先发制人的诉讼吧???
周一,微软和 OpenAI 宣布修改协议。OpenAI 的产品,可以在其他云上提供了。
戏剧性拉满。
这次采访和协议变更几乎同步发生,刚好把整个故事串了起来。我仔细读完了这篇访谈,说实话信息量太大,我自己也还在消化,但里面有几样东西,我觉得值得好好聊聊。
先说微软和 OpenAI 的协议变更,这是理解后面所有事的前提。
核心变化其实就一句话,微软从独占变成了非独占。当然细节不止这些,微软仍然是 OpenAI 的主要云伙伴,产品优先在 Azure 发布,但 OpenAI 现在可以在任何云上提供产品了。IP 许可从独占变非独占,延续到 2032 年。微软不再向 OpenAI 支付收入分成,反过来 OpenAI 向微软的分成持续到 2030 年,有总额上限。微软继续当大股东,参与 OpenAI 的增长。
Thompson 的分析我觉得挺到位的。Azure 之前确实因为独占 OpenAI 模型有了竞争优势,但这也反过来把 OpenAI 给限制住了。
你想想看,越来越多的企业明确说,我只想在我现有的云上用模型,不想为了一个模型把整个基础设施搬一遍。Anthropic 正是靠着「哪里都能用」吃到了红利。
坦率的讲,Azure 的独占权其实在损害微软对 OpenAI 的投资价值。
Anthropic 今年增长飞快,微软再不放,OpenAI 的市场空间就被挤压了。对 OpenAI 来说,AWS 代表着巨大的市场机会,大到愿意放弃接下来几年的 Azure 相关收入。而且他们还免除了微软的 AGI 条款,不管 OpenAI 达不达到 AGI,协议都跑满到 2032 年。
两家各取所需,算得上体面分手。
说完了背景,接下来聊聊重头戏。
OpenAI 和 AWS 联合发布的产品叫 Bedrock Managed Agents,后面跟着一行小字,「由 OpenAI 提供支持」。
理解这个产品最简单的方式,AWS 上的 Codex。
但这不是简单地把 OpenAI 模型部署到 AWS 上让你调 API。它把 OpenAI 的前沿模型打包进了一个 AWS 原生的 agent 运行时,身份认证、权限管理、状态维护、日志审计、治理合规,全部原生集成在 AWS 环境里。
Garman 说的情况我是真的有感触。客户之前想做类似的事,只能自己拼,模型在这边,Agent 框架在那边,身份认证又要接另一个系统,数据库权限还得单独配。每个客户都在重复造轮子。。。
现在这个产品把这些全部整合在一起了。身份认证内建,数据库操作全部在 AWS VPC 内完成,客户数据不离开 AWS 环境。OpenAI 看不到你的数据。
Altman 打了个我觉得很实在的类比。前 AWS 时代,你当然也能搞出很多东西,只要愿意去机房里站着,买一堆服务器,自己搞定网络连接,雇一个网络工程师。但当你能直接登录控制面板点一下就搞定,你能做的事情一下就多了一个量级。
他还说了句更扎心的话。
每次我看别人用我们的模型,我一方面为他们感到高兴,觉得这是魔法般的技术,另一方面又在抓狂,他们为了做成一件事要经历那么多痛苦。现在还是太早、太粗糙了。
这个产品就是要把这种痛苦降到最低。
顺着这个再往下聊。访谈里我觉得最有深度的一段,是关于 Harness 和模型之间关系的讨论。
Harness 是 OpenAI 的运行框架,负责运行时、工具、状态、记忆、权限、评估这些活儿。Thompson 问了一个好问题,Harness 对让 Agent 真正工作有多重要?
Altman 直截了当,「怎么夸大都不过分。我不再认为 Harness 和模型是完全可分离的东西了。」
他举了自己的体验。在 Codex 里发起一个任务,它帮你做了一件很棒的事,但你分不清功劳该给模型还是运行框架。
然后 Thompson 追问了一个关键问题,这种整合发生在哪里?后训练阶段?Prompt 层面?
Altman 说都有。然后给了一个我自己觉得非常重要的观察,很多一开始认为可以分离的东西,后来被越来越深地融合在一起。比如工具调用(tool-calling),一开始他们没把它深度整合到训练过程中,但随着时间推移做得越来越多。他预测模型和 Harness 会进一步融合,甚至预训练和后训练最终也会更紧密地结合。
然后他抛出了一个名字。
家酿计算机俱乐部(Homebrew Computer Club)。
这是 1975 年在硅谷门洛帕克成立的一个电脑爱好者俱乐部。乔布斯和沃兹尼亚克就是在那儿展示了第一台 Apple 原型机。Altman 的意思很明确,AI 现在就处在那个阶段,一群人在车库里鼓捣,没人知道最终会变成什么样,但所有人都感觉到,something big is coming。
Thompson 顺着这个说了自己的理论。在任何价值链中,最终会出现一个关键整合点,两个部分必须结合在一起才能工作。而价值,自然会聚集在那个整合点上。
他的判断是,Harness 和模型的整合,就是 AI 价值链里那个关键整合点。
回到 Codex 这块,聊到为什么先做本地而不是云端,Altman 说得很坦率。其实他们一开始是在云端跑的,但你的电脑已经配置好了,你的数据就在那里,不用想别的。虽然不是最终状态,但短期内易用性更好。
Thompson 换了个角度理解,本地运行就像自己给自己造了个城堡与护城河,一切都在那里,默认都是安全的。但在生产环境中,你需要的是零信任模型,每个组件都有适当的权限结构和认证。这种东西你不可能全放本地。
然后 Altman 抛出了一个我越想越觉得有意思的问题。
如果你是一家公司的员工,你的 Agent 应该用你的账号,还是用另一个独立的账号?如果是你的账号,服务器怎么区分是你在操作还是 Agent 在操作?
这种基础原语我们现在连想都没想过。但随着 Agent 以越来越高的自主性加入工作流,我们对软件、权限、访问控制的几乎所有认知都需要进化。
这也是为什么 Bedrock Managed Agents 要在云端做。企业级的身份、权限、安全边界,只能在云端环境里从头构建。
回到策略这块。Thompson 最后问了 Garman 一个挺尖锐的问题。Google Cloud CEO Thomas Kurian 刚说过他们的策略是从芯片到模型到 Agent 层全栈自研。你这里跟 OpenAI 合作,明显不是全栈自研。是不是之前大家批评你没有前沿模型,结果到了推理时代,你的中立策略反而让你处于更好的位置?是有意的还是歪打正着?
Garman 的回答很有 AWS 风格。一部分是有意的,AWS 从成立第一天就把合作伙伴视为核心战略,他们的成功标准是合作伙伴成功了。有些人说「我必须拥有一切」,那也是一种观点,但他们认为选择权很重要,最好的产品应该赢。
其实就是两条路线的对比。Google 从 TPU 芯片到 Gemini 模型到 Agent 层,全部自己做。AWS 是基础设施层自己做,往上越开放。你说 S3 有替代品吗?没有。基础设施层他们深度投入自建。但往上走,能力集合更广,你不可能一家公司拥有所有应用。
AWS 从基础设施起步,这给了它最大的灵活性,在中间层与合作伙伴会合。
最后聊聊一个我觉得会越来越常被引用的概念。
Altman 说自己越来越把 OpenAI 想象成一个 token 工厂,但他马上纠正了自己。
也许我说 token 工厂不对。我们更像是一个智能工厂(Intelligence Factory)。
原因是 GPT-5.5。这个模型单 token 成本比 5.4 高得多,但完成同样的任务需要的 token 数量大幅减少。用户根本不在乎用了多少 token,他们要的是任务完成,是一个价格和足够的容量。
所以不管是大模型跑少 token、小模型跑多 token、跑在 GPU 还是 Trainium 上,客户不在乎。他们不应该需要在乎。
关于需求弹性,Altman 给了一个我觉得很妙的类比。
水,你降价了我可能多喝点,一天洗两次澡而不是一次。但到某个点你会说「够了」。智能不一样,只要价格足够低,我对智能的需求没有上限。
他补充说,现在远超讨价还价的客户在问「能不能给我更多容量」,而不是在争论价格。
想想就觉得兴奋。
回到开头那个家酿计算机俱乐部的比喻。1975 年,那群在车库里鼓捣个人电脑的极客们,大概也没想到自己正在开启一个持续半个世纪的技术革命。
AI 现在也在那个时间点上。
Bedrock Managed Agents 表面上看是 OpenAI 模型上了 AWS。但实质上,它是模型、运行框架、云基础设施三者的深度整合。这种整合正在创造一种全新的 AI 产品形态,不是「我给你一个 API 让你调」,而是「我给你一个能直接在企业环境里跑的 Agent」。
AI 的竞争,已经从「谁的模型更强」转移到了「谁的整合能力更强」。 模型层在变得越来越商品化,真正的壁垒在基础设施、分发能力和生态伙伴关系。
微软有 Azure,Google 有全栈,AWS 有中立生态。三条路线,各有各的逻辑。
但有一点是确定的。
光有模型,已经不够了。
游戏规则,变了。
原文来自 Ben Thompson 的 Stratechery 专访,原文链接
评论互动