Codex vs Claude Code:30 天社区数据告诉你真相

发布于 2026年06月07日 22:30 #Claude#OpenAI

Codex vs Claude Code:30 天社区数据告诉你真相 封面图

r/codex 上有个帖子,标题简单粗暴:“Claude code is not on the same level as Codex”。837 个 upvote,217 条评论。这不是某个小众社区的噪音,发帖人是个长期 Claude Code 用户,在做底层 C++ hypervisor 开发。

更有意思的是,r/ClaudeCode 社区自己也坐不住了,冒出个帖子:“Claude surpassed by Codex?” 一个 Claude Code 的老用户在里面承认,最近几次 Codex 更新之后,他“re-bought Claude to use Claude Code again, but Codex keeps pulling me back”。

我花了一周时间,抓取了过去 30 天 Reddit、Hacker News、YouTube、GitHub 上的社区讨论数据,想搞清楚一个问题:AI 编程工具这场仗,到底打成什么样了?

用户在用脚投票

数据不会说谎。过去 30 天里,r/codex 和 r/ClaudeCode 上最火的帖子几乎都是同一种类型:迁移体验报告。

一位 Reddit 用户写得很直白:“I switched from Claude Code to Codex last month($25 plan)and I can’t believe the usage limits on GPT-5.5 xhigh。Opus 4.6 would last me exactly 15 minutes per 5-hour limit, while GPT-5.5 high can often run for hours at a time on even more complex projects.”

翻译成人话:Opus 4.6 的额度 5 小时窗口只能撑 15 分钟,GPT-5.5 高配置模式跑几个小时都不带停的。这不是体验差异,这是能不能用的区别。

更极端的案例来自另一位用户:“I was able to downgrade from two Claude Max 20x accounts to a single $100 ChatGPT account.” 两个 Claude Max 20x 账户意味着什么?每月 400 美元。换成 Codex 之后,一个 $100 的 ChatGPT 账户就够了。成本直接砍掉四分之三。

中文社区的爆发更夸张。PAPAYA 电脑教室做的 Codex 零基础教程,291K 播放量、10,010 个点赞。秋芝 2046 的“40 分钟学会 Codex”教程,139K 播放。光这两条视频就有 43 万播放量,说明中文用户群体正在快速涌入。

Hacker News 上甚至出现了一个专门的词:“Codex-maxxing”。这个词的本意是把 Codex 用到极致,但背后反映的趋势很明确:开发者正在把主力工具从 Claude Code 切换到 Codex,而且不是个别现象。

Usage limits 才是真正的胜负手

表面上看,Codex 和 Claude Code 的竞争是模型能力的较量。GPT-5.5 对 Opus 4.6,都是顶级模型,各有所长。但真正让用户用脚投票的,不是谁的代码写得更漂亮,而是你能用多久。

Claude Code 的问题很具体:Pro 计划的 5 小时限制窗口里,Opus 4.6 实际能跑的时间只有 15 分钟左右。对于那些需要长时间运行的复杂任务 - 重构、调试、多文件编辑 - 15 分钟根本不够用。你刚进入心流,额度就没了。Claude 甚至不会给你一个软着陆,而是直接硬停。

Codex 的 GPT-5.5 就大方得多。同样是高配置模式,可以连续运行数小时。用户形容这种体验差异是“从每天踩刹车变成全天开高速”。

Anthropic 也不是没反应。5 月中旬,Claude Code 宣布 weekly limits 提升 50%,持续到 7 月 13 日。但说实话,提升 50% 如果基数本身就不够,提升后还是捉襟见肘。更关键的是,这个提升是临时的,7 月 13 日之后怎么办?用户心里没底。

还有个细节值得注意:有用户在 GitHub 上反馈,Claude Code Pro 计划默认使用 1M context,无法调整。这在处理大型项目时是个问题 - 不是所有任务都需要那么大的上下文窗口,但你没得选。结果就是本就不富裕的额度被上下文窗口进一步消耗。

Claude Code 的护城河在“深度”

说完 Codex 的优势,得公平地讲:Claude Code 不是被全面碾压。如果你问 Claude Code 真正强在哪,答案是四个字:深度理解。

Hacker News 上有一篇 “How Claude Code works in large codebases”,248 个 upvote,135 条评论。这不是一篇营销文,而是开发者分享在大型代码库里使用 Claude Code 的实战经验和最佳实践。评论区的讨论质量极高,说明真正在用 Claude Code 做重活的人,对它的代码理解能力是认可的。

另一个帖子更说明问题:“Claude Code - Everything you can configure that the docs don’t tell you”。326 个 upvote。有人真的去读了 Claude Code 的源码,整理出一份配置指南。这背后的潜台词是:Claude Code 足够复杂、足够有深度,值得花时间去挖掘那些文档没写出来的配置选项。

Codex 也有配置文件 AGENTS.md,但社区的讨论深度明显不如 Claude Code 的 CLAUDE.md 体系。这不是偶然 - Claude Code 的可定制性本身就是一个护城河。

Dynamic Workflows 是另一个信号。Anthropic 5 月底发布这个功能,HN 上 200 个 upvote。它允许用户在 Claude Code 里创建动态工作流,自动化复杂任务。加上 skills、hooks、MCP(Model Context Protocol)三层扩展机制,Claude Code 的生态可塑性远高于 Codex。

举个具体的例子:有人做了一个 Python 工具包专门用于构建 Claude Code hooks。还有人在 GitHub 上发布了 “skills-for-humanity” - 171 个结构化推理 skills,专门给 Claude Code 用。HN 上 28 个 upvote,说明社区在认真构建这个生态。

Zed 编辑器的用户也在推动原生 Claude Code 集成。一个 PR 让 Claude Code CLI 通过 WebSocket 连接到 Zed,和 VS Code、JetBrains 一样。这意味着 Claude Code 正在成为跨 IDE 的底层能力,而不只是一个独立工具。

稳定性:两个都有坑

聊完优势,该说说坑了。坦白讲,两个工具的稳定性都不完美,但坑的形态很不一样。

Claude Code 的问题集中在模型调用层面。GitHub issues 里反复出现一个错误:“The model’s tool call could not be parsed(retry also failed)”。一个 issue 拿到 69 个 reactions、48 条评论,另一个拿到 98 个 reactions、48 条评论。这不是偶发问题,是正常使用过程中会频繁遇到的阻塞。你正写着代码,突然卡住不动了,只能重启 session。

更严重的是 extended thinking 相关的 bug。恢复一个使用 extended thinking 的 session 后,会进入永久错误状态,每次后续请求都返回 400 错误。58 条评论的 issue 里,用户描述这种体验是“permanently broken”。对于依赖长 session 的开发者来说,这几乎是不可接受的。

Codex 的坑则体现在工程规模上。openai/codex 仓库 89,249 stars,听着很厉害。但同时有 6,292 个 open issues。6292 个。这个数字说明快速增长带来了严重的工程质量压力。新功能在密集发布(Sites 就是最新的例子),但底层稳定性可能在被牺牲。

Sites 功能本身很有野心:让非开发者也能通过 Codex 快速搭建和部署应用。OpenAI 官方 YouTube 发布的介绍视频 80K 播放量、2,189 个点赞,说明市场对这个方向是有需求的。但功能发布速度和稳定性之间的张力,是 Codex 需要面对的长期挑战。

双持不是答案,但趋势已经很明显

一个有趣的现象:社区里开始出现“双持”方案。有人在 HN 上分享了让 Claude Code 和 Codex 通过 Git 实时协作的方法。一个工具写代码,另一个审查和修改,通过 Git commit 来回传递。这个帖子拿到了 115 个 upvote,说明开发者确实在尝试同时使用两个工具。

还有个叫 Chatcode 的项目,同时支持 Claude Code 和 Codex 的远程控制。HN 上 9 个 upvote、14 条评论,不算爆款,但方向很有代表性:工具之间的边界正在模糊。

但说实话,双持更多是无奈之举,不是最优解。当你需要在两个工具之间来回切换,维护两套配置、两套工作流,摩擦成本不低。大部分开发者的真实选择是:选定一个主力,偶尔用另一个做补充。

如果看趋势的话,30 天的数据指向很明确:Codex 在大众市场的势能更强。中文社区的爆发式增长(430K+ YouTube 播放量)、r/codex 的活跃度、“Codex-maxxing” 成为流行语 - 这些都是增长信号。Claude Code 的用户群更像是深度用户、专业开发者,但数量上正在被拉开。

Microsoft 的一举一动也值得玩味。5 月底,The Verge 报道 Microsoft 开始取消内部 Claude Code 许可证。HN 上 493 个 upvote、466 条评论。不论真实原因是什么(成本控制?产品战略?),当最大的企业客户之一开始砍你的产品,这不是好信号。

聊到这里,我想说

如果你问我怎么选,答案取决于你做什么、在什么阶段。

刚入门或者成本敏感,选 Codex。GPT-5.5 的 usage limits 让你能真正用起来,不用每 15 分钟焦虑一次额度够不够。291K 播放量的中文教程说明学习资源充足,上手门槛低。

重度开发、大型代码库、需要深度定制,选 Claude Code。它的代码理解能力、扩展机制(skills/hooks/MCP)、以及社区沉淀的深度配置经验,是 Codex 目前比不了的。

如果你是决策者,在给团队选工具,我的建议是:两个都试一个月。不是同时用,而是先一个再一个。让团队自己感受 usage limits 的实际影响、代码理解的质量差异、以及工作流的流畅度。纸上谈兵没有意义,30 天的实战比任何评测文章都有说服力。

最后说一个容易被忽略的角度:这场竞争真正的受益者是用户。Codex 把额度和性价比卷上去了,Claude Code 把深度和可定制性卷上去了。Anthropic 不得不提升 50% 的 weekly limits,OpenAI 不得不加速发布 Sites 这样的新功能。两边都在拼命,用户才有得选。

这就是竞争该有的样子。

评论互动

© 2026 王若风的技术博客 · Powered by Astro