【导读】OpenAI如何以自下而上的文化和行动导向,推动大模型突破?从零到上线仅用7周,Calvin带你走进OpenAI编程智能体Codex的诞生过程,体验高强度冲刺的魔力。
外界对于OpenAI众说纷纭,很少有人从内部视角描述它的真实文化。
三周前,在推出Codex后,Calvin French-Owen离开了OpenAI。
在2024年5月,他加入了OpenAI,全程见证了OpenAI编程智能体Codex的诞生。
如今,Calvin French-Owen想趁热打铁,效仿Nabeel Quereshi的《对Palantir的反思》,揭秘OpenAI的独特之处。
没有任何商业机密,更多的是他对当下历史性时刻的思考——在当前阶段,关于这个史上最迷人组织之一所呈现的样貌。
首先澄清:离开OpenAI并非因为个人矛盾,实际上他对这个决定非常纠结。
从创业公司创始人,转变为一家3000人规模企业的员工,这个角色转变并不容易。
现在,他渴望一个全新的开始。
但这份优质的工作完全有可能再次吸引他回来。
构建AGI是无与伦比的使命,LLM无疑是这十年最重要的技术突破。
他很幸运能亲眼见证一些技术进展,并参与了Codex的发布。
当然,这些仅为个人观点,不代表公司立场。OpenAI海阔天空,这只是管中窥豹的一瞥。
深度揭秘OpenAI文化
首先,要了解的是OpenAI的发展速度之快。
2024年5月,他加入时,OpenAI大约有1000多人。
一年后,员工数暴增至3000多人,他的工龄竟然排在前30%。
几乎所有领导层如今负责的工作,都与他们两三年前的大相径庭。
如此快速的扩张导致许多机制出现问题:内部沟通、组织架构、产品发布流程、人员管理和招聘体系等,都在不断调整。
不同团队的文化差异显著:有的团队全力冲刺,有的负责大型计算任务,有的则节奏更平稳。
因此,OpenAI的体验因团队而异,研究、应用和市场团队的工作节奏完全不同。
Slack驱动一切
OpenAI的独特之处在于,所有事情——没错就是指所有事情——都依赖Slack运转。
几乎所有工作都在Slack上完成,没有电子邮件。
如果不擅长信息管理,这种模式会让你分心到崩溃;但如果精心规划频道和通知设置,这套系统其实相当高效。
OpenAI的文化非常「自下而上」,尤其是在研究领域。
刚加入时询问下一季度的路线图,他得到的回答是:「没有路线图」(现在有了)。
好的想法可以来自任何地方,很难提前预测哪个想法会成功。
相比宏大的总体计划,OpenAI的进展靠不断试错和研究突破推动。
得益于这种文化,OpenAI也极为推崇「实力至上」。
公司领导者的晋升主要基于他们提出好点子并付诸实践的能力。
许多优秀领导并不擅长演讲或办公室政治,但在OpenAI,这不是重点。
真正的好想法往往能脱颖而出。
行动导向!
公司鼓励直接行动。不同团队常不约而同地探索类似想法。
刚加入时,他参与了一个与ChatGPT Connectors类似的内部项目。
Codex发布前,内部有3-4个不同的原型项目,通常由几个人自发启动,无需特别审批。
一旦显现出潜力,团队便会迅速围绕它们集结起来。
Codex负责人Andrey曾说,研究员就像独立的小高管,独立探索项目。
优秀的研究经理和项目经理(PM)影响力巨大,同时也极为稀缺。
最顶尖的经理能将众多不同的研究项目串起来,推动更大规模的模型训练。
他合作的ChatGPT工程经理非常沉稳,他们大多放手管理,但擅长招聘优秀人才,并尽力为他们创造成功的条件。
OpenAI能快速调整战略方向,决策调整非常迅速。
这是创业时就很看重的:根据新信息做正确的事,远比固守计划重要。
令人惊讶的是,OpenAI这样的大公司仍保持这种灵活性,谷歌显然做不到。
一旦决定某个方向,公司会全力以赴。
OpenAI备受外界关注。内部尚未公布的消息常被媒体提前曝光。甚至有X用户用脚本监控OpenAI的新功能发布。
因此,公司内部非常注重保密,无法详细透露工作内容。
Slack工作空间有不同权限,收入和支出数据更是严格保密。
OpenAI也比你想象的要严肃,这里的风险和机遇都太大了。
一方面,公司追求AGI,责任重大;另一方面,产品服务数亿用户,涵盖医疗建议到心理咨询等场景。
尽管OpenAI常被媒体批评,他遇到的每个同事都在努力做正确的事。
作为最受关注的AI实验室,OpenAI容易招致批评。
不应该将OpenAI视为单一的整体。
它最初是一群科学家和技术爱好者,共同探索科学的前沿。
这个团体偶然间催生了历史上最具病毒传播效应的消费级应用。随后,它又萌生了向政府和企业销售产品的雄心。
因此,不同时期加入、身处不同部门的员工,其目标和视角也大相径庭。
待得越久,就越可能倾向于从「研究实验室」或「非营利组织」的视角看待公司。
积极分享成果
最欣赏的一点是,公司在分享AI成果方面,是真正地说到做到。
顶尖模型没有被限制在高价企业套餐中,任何人都能免费使用ChatGPT获取答案。
API向初创公司开放,最先进的模型通常很快接入API。
这一点OpenAI值得高度赞扬,也是公司文化的核心。
OpenAI对安全的重视超出外界猜测。
许多人在开发安全系统,重点关注实际风险(如仇恨言论、滥用、政治偏见、生物武器、自我伤害、提示注入等),而非理论风险(如智能爆炸)。
安全方面的工作大多未公开,OpenAI应更积极分享这方面成果。
纪念品稀缺:不像其他公司大肆发放纪念品,OpenAI的纪念品限量分发。第一次投放需求太大,Shopify商店直接崩溃。内部还流传了如何用JSON绕过限制的教程。
GPU成本惊人:相比GPU开支,其他成本几乎微不足道。比如,Codex一个功能模块的GPU成本,就相当于我们整个Segment基础设施的开支。
雄心勃勃:OpenAI可能是最有野心的组织。不仅满足于顶级消费级应用,还想在API、深度研究、硬件、代码代理、图像生成等多个领域竞争。这里是实现想法的沃土。
X驱动:公司很关注X。病毒式传播的OpenAI相关内容常被内部注意到。朋友开玩笑说:这家公司靠X氛围驱动。
团队流动性:团队协作非常灵活。Codex发布时,需要ChatGPT工程师支持,第二天就来了两位高手加入,没有繁琐的审批流程。
高管参与度高:领导层非常投入,gdb、sama、kw、mark、dane等人常在Slack上发言,没有甩手掌柜式的领导。
代码与技术栈
OpenAI使用一个庞大的单一代码库(monorepo),以Python为主,但也加入了Rust(用于部分服务)和Golang(用于网络代理等)。
由于Python的灵活性,代码风格差异很大:既有谷歌十年老兵设计的可扩展库,也有刚毕业的博士写的临时Jupyter笔记本。
API开发主要依赖FastAPI,数据验证用Pydantic,但公司没有统一的代码风格规范。
OpenAI的全部基础设施运行在Azure上,只有三项服务被认为是可靠的:
- Azure Kubernetes Service:用于容器管理。
- CosmosDB:Azure的文档存储。
- BlobStore:用于对象存储。
OpenAI较少依赖自动扩展单元,权限管理(IAM)功能也比AWS更受限。公司倾向于「自研优先」。
在工程团队中,有大量从Meta(包括Instagram)跳槽到OpenAI的人才。
OpenAI在很多方面类似早期Meta:拥有现象级消费应用、基础设施尚在发展、追求快速行动。
这些Meta背景的工程师为OpenAI带来了强大的基础设施经验,也导致OpenAI的基础设施有些Meta的影子,比如:
- 自研了类似Meta TAO的系统(用于图数据库)。
- 在网络边缘整合身份认证的尝试。
代码为王(Code wins)
OpenAI没有中央架构或规划委员会,决策通常由执行工作的团队做出,这带来强烈的行动导向,但也导致代码库中存在大量重复功能。
例如,至少有六种队列管理和代理循环的库。
值得称赞的是,内部团队正投入大量精力来改善这一状况。
消费级品牌的运作
OpenAI以「专业订阅」(pro subs)为核心衡量指标。
即使是Codex这样的产品,也主要考虑个人用户而非团队使用。这对于B2B/企业背景的人来说有点颠覆认知。
产品上线第一天就能吸引大量流量,令人震撼。
大模型训练
训练过程介于「实验」和「工程」之间:
- 初期是小规模实验,调整核心算法和数据组合,仔细分析结果。
- 如果实验结果有潜力,会被纳入更大规模的训练。
- 大规模训练类似分布式系统工程,会遇到各种意外情况,需要不断调试。
Codex发布
过去三个月,他参与了Codex的发布,这无疑是职业生涯的亮点之一。
2024年11月,OpenAI定下2025年推出编程智能体的目标。
到2025年2月,内部已有几个工具效果不错,市场对编程智能体的需求日益明确,模型在编程任务上已非常实用。
他提前结束陪产假,加入Codex发布工作。
回归一周后,两支团队合并,开始了疯狂冲刺。
从第一行代码到产品上线,仅用了7周!
Codex的开发是近十年来最艰苦的工作。
每天工作到深夜11点或凌晨,早上5:30被新生儿吵醒,7点到办公室,周末也几乎都在工作。
整个团队全力以赴,每一周都至关重要,感觉像回到了Y Combinator的创业节奏。
这种速度令人叹为观止。从未见过任何组织(无论大小)能在如此短的时间内从想法到免费上线的完整产品。
Codex构建了容器运行时、优化了代码库下载、微调了代码编辑模型、支持了各种Git操作、引入了全新功能界面、启用了网络访问。
最终打造了一款让用户用起来得心应手、体验极佳的产品。
OpenAI依然保有那种全力以赴、快速发布产品的冲劲。
对的人聚在一起,真的能创造奇迹。
团队有8名资深工程师、4名研究员、2名设计师、2名市场人员和1名项目经理。
如果有机会与Codex团队的成员共事,他们每一个人都非常出色。
发布之夜
发布前夜,五个人一直熬到凌晨4点,部署巨大的单体服务(一个耗时数小时的流程)。
早上8点,他们回到办公室进行发布直播,打开功能开关后,流量迅速涌入。
他从未见过一个产品仅靠出现在ChatGPT侧边栏就立即获得如此大的流量——这就是ChatGPT的力量。
Codex采用完全异步的形式。
与当时的Cursor或Claude Code不同,团队希望用户能像与同事合作一样使用编程智能体:发送任务,代理在独立环境中运行,完成后返回拉取请求(PR)。
这是一个大胆的尝试。当前模型虽好,但还不够完美,能运行几分钟但无法持续几小时。
用户对模型能力的信任度千差万别,甚至不清楚模型的真正的上限在哪里。
Codex在处理大型代码库时表现优异,能很好地理解和导航代码结构。
与其他工具相比,它最大的优势是能同时启动多个任务,并比较它们的输出结果。
公开数据显示,Codex自发布以来生成了63万个PR,平均每个工程师在53天内贡献了约7.8万个公开PR(私有PR的数量可能更多)。
这可能是他职业生涯中最具影响力的项目。
坦白说,最初加入OpenAI时有些犹豫。
放弃创业者的自由、接受管理、成为大机器中的小齿轮,他不确定能否适应。
如果创业者感到停滞不前,可以:
深入反思如何能进行更多、更大胆的尝试;
加入一家顶级的AI实验室。现在是投身创造的绝佳时机,也是窥探未来的绝佳时机。
目前,通向AGI的竞争三足鼎立:OpenAI、Anthropic和Google。
公司路径因其DNA不同(消费级产品 vs. 企业级服务 vs. 坚如磐石的基础设施+数据),在其中任何一家工作,都将是大开眼界的经历。
参考资料:
https://calv.info/openai-reflections
https://techcrunch.com/2025/07/15/a-former-openai-engineer-describes-what-its-really-like-to-work-there/
本文来自微信公众号“新智元”,编辑:英智 ,36氪经授权发布。