Codex最近的更新频率实在疯狂。
过去两个月,OpenAI几乎隔几天就往Codex里塞一个新东西。
先是插件、内置浏览器、电脑操作、PR review、远程SSH、手机端接入……再到5月21日,Codex也搞“疯狂星期四”,一口气更新了几个大功能:一键把屏幕内容交给Codex,让Codex长时间围绕目标工作,电脑锁屏后继续远程使用,还支持团队共享插件和查看使用数据。
之前网上有一个流传挺广的梗图:醒来,看见又一个Claude更新。现在Codex也不遑多让。
只不过Claude更新得更“碎”、更精细,Codex则发布了更多大功能。
值得注意的是,它们更新的都是同一个方向——企业入口和真实工作流。
Claude Code已经先证明了这条路的价值,Anthropic甚至开始让市场相信,前沿模型公司不一定永远只能烧钱,也有机会把利润表跑出来。
Codex也在做同样的事,在这个时间点上,背后站着的是正在准备上市的OpenAI。
ChatGPT已经证明了OpenAI有用户,但用户不等于生意,热闹也不一定能带来利润。尤其对一家前沿模型公司来说,算力成本、训练投入、推理开销都重。OpenAI需要向市场证明,自己不只是会做爆款Chatbot,也能把AI放进企业真正愿意付钱的生产环节。
Codex的高频更新,就是在补全这一部分。
它不只是一个开发工具,它是OpenAI眼下最容易讲清楚商业价值的一张牌。
01
这两个月,Codex在做什么
我们用ChatGPT Images 2.0做了一张图,看看最近两个月Codex都做了什么更新。
3月24日,搜索与设置同步。
Codex App加入历史线程搜索、最近线程快捷跳转功能,并同步Codex App和VS Code扩展里的关键设置。算是基础体验优化:让用户能更快找回之前的任务,让桌面端和编辑器里的使用体验更一致。
3月25日,插件体系上线。
Codex开始支持插件。插件可以打包skills、应用集成和MCP server配置,用来复用工作流,支持Codex App、CLI和IDE extension。
4月9日,代码审查工作流增强。
Codex App加入了可折叠的行内审查评论、不同的审查模式、Git摘要和来源区块。Codex开始更深地进入代码审查和PR协作。
4月12日,文件与终端上下文增强。
Codex增加了命令菜单里的文件搜索,支持在侧边栏预览图片、PDF和Markdown,也为每个线程加入了终端标签页,并支持用户选中文本后直接询问Codex。
4月16日,Codex for almost everything。
这是最近两个月第一个大节点,OpenAI开始把Codex推成一个更完整的AI工作台。这一波更新包括内置浏览器、电脑操作、线程自动化、任务侧边栏、PR工作流、结果预览、SSH远程连接、多终端、多窗口、Intel Mac支持,以及一批新插件。
4月23日,自动审批审查。
Codex可以把符合条件的审批请求,先交给自动审查代理判断风险,再显示审查状态和风险等级,最后由用户决定是否批准。
5月5日,Codex访问令牌上线。
ChatGPT Enterprise的工作区所有者和管理员,可以允许成员创建Codex访问令牌,用在脚本、调度器、私有CI runner等可信的非交互式本地工作流里。Codex开始接近CI、自动化和企业工程系统。
5月7日,Codex进入Chrome。
Codex推出Chrome扩展,可以在浏览器标签页里并行工作,但不会直接接管用户浏览器,用户也可以控制哪些网站允许Codex使用。浏览器是很多后台系统、内部工具和网页调试场景的入口,这一步让Codex更接近真实办公现场。
5月14日,Codex支持手机控制。
OpenAI支持用户从ChatGPT手机App使用Codex,连接一台正在运行Codex App的Mac,用户在手机上也可以查看任务进展、批准操作、看代码差异和测试结果。这一波还包括Hooks正式可用、访问令牌和企业管理员设置指南。Codex开始变成一个可以远程跟进的工作代理。
5月21日,Appshots、目标模式、锁屏远程使用和插件共享。
这是第二个大节点。Appshots可以把Mac当前窗口的截图和可用文本直接发给Codex;目标模式正式上线,用户可以给Codex一个目标,让它围绕这个目标持续工作数小时甚至数天;锁屏远程使用则允许Codex在Mac锁屏后继续操作桌面应用,不再需要“留一线”。
同时,ChatGPT Business开始支持团队共享插件;内置浏览器的标注能力进一步增强,可以直接调整字体、颜色、间距等样式。
功能本身当然重要,但整体的更新趋势同样值得关注。无论是Appshots还是目标模式,又或者Chrome扩展、访问令牌和插件共享,都是在补进入真实工作流的基本条件:看得见现场,推得动任务,也管得住风险。
想看得见现场,需要补全的是上下文能力。
真实开发任务很少只发生在代码编辑器里。文件搜索、文件预览、终端标签页、内置浏览器、浏览器标注、Chrome扩展、Appshots,本质上都是在减少用户给AI描述上下文的成本。
以前你要通过描述或者Ctrl+C/V告诉AI哪里有问题,现在,OpenAI想让Codex直接看到这些东西。
想推得动任务,长任务和远程执行能力很重要。
目标模式解决的是“能不能持续做下去”。手机端远程访问和锁屏远程使用,让用户即使不在电脑前,任务也能继续推进。访问令牌和Hooks,则把Codex进一步接进脚本、调度器、CI runner这些企业工程系统里。
能不能管住风险,就是企业和团队管理的事情了。
个人开发者用工具,核心是看好不好用,但企业工具的问题要复杂得多:权限怎么管,插件怎么分发,谁在用、用了多少,风险怎么审查,能不能接入CI,能不能被团队统一管理。
Codex在这方面也做了很多工作。插件体系让工作流可以被打包和复用;插件共享让团队可以统一分发工具;自动审批审查是在控制代理执行的风险;访问令牌和企业管理员设置,则是在让Codex接进企业已有的工程和治理流程。
02
“全村的希望”
Codex的更新为它带来了非常亮眼的用户增长速度。
3月初,Codex的周活跃用户还是160万左右。到了5月14日,OpenAI官方在介绍Codex手机端时提到,每周使用Codex的人已经超过400万。也就是说,在两个月左右的时间里,Codex的周活用户又翻了一大截。
这条增长线绕不开底层模型的能力,用户愿意更频繁地把真实任务交给Codex的前提是,它真的能干活。尤其是GPT-5.5之后,Codex的编码、工具调用、长上下文和多步骤任务能力有了更好的基础。
但光有模型是不够的,市场不会只因为一个模型benchmark变高就买单,它更关心这些能力能不能变成收入。
这也是OpenAI在上市前必须讲清楚的地方。
OpenAI手里有很多牌,但每张牌都有自己的不确定性。
ChatGPT是最大的用户入口,证明了OpenAI有全球用户和消费级订阅能力。问题是,用户规模越大,推理成本也越重;消费级订阅能不能支撑一家前沿模型公司的长期投入,还需要继续证明。
API是基础收入来源,能把模型能力卖给开发者和企业。但API市场很容易卷进价格竞争,企业客户也未必只绑定一家模型供应商。模型能力越通用,客户越可能多模型混用。
ChatGPT Enterprise、Agents和行业解决方案,是OpenAI进入企业市场的正面战场。但这些产品要真正深入企业流程,需要时间、销售、集成和行业落地。
更远一点,OpenAI还有硬件、数据中心、多云合作和算力基础设施。这些故事想象力很大,但也更重、更远、更烧钱。它们能撑起长期愿景,却很难立刻解释短期商业回报。
而Codex的商业价值更容易被解释。它面对的人群很明确:开发者和工程团队。
这是一群本来就愿意花钱服务的人。工程师时间贵,软件项目周期长,代码维护成本高。bug修复、测试、代码审查,每一个环节都能算出成本。
软件开发本身也是企业最核心的生产环节之一。金融公司有风控和交易系统,零售公司有供应链和会员系统,医疗公司有数据和合规系统,媒体公司有内容后台和分发系统。哪怕不是科技公司,也有大量内部工具、数据管道、自动化脚本和业务系统需要维护……今天几乎所有公司都离不开软件系统。
也就是说,Codex切进去的,是企业每天都在花钱、每天都在消耗人力的地方。
某种意义上来讲,它是OpenAI讲好IPO叙事的希望。在OpenAI准备走向资本市场的时间点上,这件事变得格外重要。
因为上市叙事里,OpenAI要面对的已经不再是“AI有没有未来”这种问题。真正难回答的是另一件事:一家前沿模型公司,能不能在巨额算力投入之外,找到一条足够清楚、足够稳定、足够能赚钱的商业路径。
更麻烦的是,Anthropic已经先把这个问题往前推进了一步。
03
Anthropic已经先跑了一步
Codex必须被推到前台,还有一个很关键的原因:OpenAI最大的竞争对手之一Anthropic,已经在企业端先跑出了一条路。
虽然从营收规模看,OpenAI仍然领先,The Information报道,OpenAI 2026年第一季度营收约57亿美元,高于Anthropic同期的48亿美元。但现在的问题已经不只是收入有多少,前沿模型公司的真正压力,是收入增长能不能跑过成本增长。
OpenAI第一季度收入很高,但其调整后经营利润率约为-122%。按这一口径计算,收入1美元,调整后经营成本可能约为2.22美元,到头还要亏1.22美元。
过去几年,外界一直质疑大模型公司太烧钱:训练、推理、GPU、人才支出,每一样都是无底洞。用户越多,调用越多,成本也越重。
Anthropic最近释放出的信号,则改变了这件事的想象空间。
据《华尔街日报》报道,Anthropic预计2026年第二季度收入超过109亿美元,并接近首次季度营业利润,预计营业利润约5.59亿美元。
虽然这并不代表Anthropic从此摆脱了烧钱问题,但它给了市场一个很重要的信号:前沿模型公司不一定永远只能靠融资续命,只要模型能力足够强,产品足够贴近企业高价值场景,收入增长就有可能跑在成本前面。
Anthropic没有ChatGPT那样的全民入口,也没有那么多同时推进的故事。它的路线更窄,也更纯粹:直接进入企业愿意付钱的地方,尤其是开发者、金融、法律、研究、数据分析和内部知识工作这些高价值场景。
Claude Code就是其中最典型的一张牌。它最早做的是开发者圈里的神器,主打编程场景,后来一路补长任务、插件、权限、团队管理和企业治理,慢慢变成Anthropic进入企业工作流的重要入口。开发者先用起来,团队再跟上,最后变成企业采购和预算。
2026年4月,在Ramp的样本企业中,Anthropic的采用率升至34.4%,OpenAI则降至32.3%。虽然这只是基于Ramp平台上的企业支出样本,不代表全市场统计,但这个数据至少能说明,Anthropic在企业付费场景里的势头正在变强。
Codex的压力也就在这里。
OpenAI的营收规模仍然领先,但如果它要走向资本市场,就不能只讲用户规模或者模型能力。它需要一个更接近企业生产现场的产品,去证明自己能把AI变成稳定的企业收入。
如果Claude Code证明了开发者工作流可以成为Anthropic的企业入口,那么Codex就必须证明,OpenAI也能走通这条路。
Codex负责人Tibo Sottiaux最近半开玩笑地总结了公司的“总体规划”:发布更好、更高效的模型,每周发布更好的产品,再拿到更多算力(并增加在X上冲浪的时间)。
更好的模型,决定Codex能不能真正干活;更高频的产品更新,决定Codex能不能进入真实工作流;更多算力,则决定这一切能不能支撑越来越大的使用量。
这些都对上市非常重要。
换句话说,Codex最近的密集更新不只是追功能,也在追Anthropic已经跑出来的那条企业化路径。
ChatGPT已经证明了OpenAI有用户。
而Codex要证明,OpenAI是个能赚钱的生意。