一个开发奇迹，仅四人28天上线Android版Sora：OpenAI用AI造AI的实战手册-开发者社区

昨天傍晚的时候，看到了 OpenAI 官方的文章，他们团队回忆了整个 Sora Android 版的开发过程，收获巨大，在这里分享给大家。

去年 11 月，Android 版 Sora 应用一上线就冲上了 Google Play 榜首，前 24 小时用户就生成了超过 100 万个视频。这个成绩背后，藏着一个让人意外的事实：这款应用从零到上线，只用了 28 天。

更让人惊讶的是，完成这项工作的不是一个几十人的大团队，而是 4 个工程师加上他们的 AI 助手 Codex。这听起来像是在吹牛，但数据摆在那里：50 亿个 token 的消耗量，99.9%的无崩溃率，一个让开发团队自己都很满意的架构。

这不是什么科幻故事，而是 OpenAI 团队刚刚完成的真实项目。他们把整个过程记录下来，告诉我们一个事实：软件开发的游戏规则，正在被 AI 悄悄改写。

为什么不是几十个人干几个月

按照传统做法，开发一个这样规模的生产级应用，通常需要一个庞大的团队花上好几个月。人多了，开会多了，沟通成本就上去了，进度反而慢下来。

计算机界有句老话：向一个已经延期的项目增加人手，只会让它更晚完成。这话听起来反直觉，但仔细想想就明白了。十个人的团队，大家要互相沟通的次数远远多于两个人。每增加一个人，不是简单地增加一份力量，还要增加很多协调的麻烦。

OpenAI 的团队想了个办法：既然人多了会添乱，那就干脆保持小团队，但给每个人配上强大的 AI 助手。4 个工程师，每人身边有个 Codex 帮忙，效果比传统的大团队还好。

这里面有个很有意思的类比。Codex 就像是一个刚入职的高级工程师，能力很强，但需要你告诉他公司的做事风格、技术规范、产品思路。你不能指望他自己去猜这些东西，但只要说清楚了，他的执行能力就非常惊人。

AI 能做什么，不能做什么

要和 AI 合作得好，首先得搞清楚它擅长什么，不擅长什么。

Codex 有几个地方特别厉害。它能快速读懂大量代码，几乎掌握所有主流编程语言。让它写单元测试，它特别热衷，能覆盖很多场景。编译失败了，把错误日志给它看，它马上能提出修复方案。最厉害的是，你可以同时开好几个 Codex 会话，让它们并行工作，互不干扰。

但它也有明显的局限。比如说，你们公司喜欢用什么架构模式，产品的设计理念是什么，用户真实的使用习惯如何，这些它都不知道，得你来告诉它。它也看不到应用实际运行的样子，不能自己打开手机看看界面是不是卡顿，流程是不是顺畅。

更关键的是，Codex 在做深层次架构判断时会犯难。如果没人指导，它可能会为了让功能跑起来，把本该放在数据层的逻辑塞到界面层，或者在不该加新组件的地方加了一堆东西。它的本能是让代码能用，但不一定考虑长期的可维护性。

这让人想到一个道理：工具再强大，也需要懂行的人来掌控方向。就像给你一把好刀，你还是得知道往哪切才对。

把基础打好，剩下的交给 AI

OpenAI 团队做了一个聪明的决定：他们没有一上来就让 Codex 撸起袖子全干，而是先自己搭好框架。

他们亲手设计了整个应用的架构、模块划分、依赖注入这些核心结构，还实现了身份验证和基础网络功能。然后写了几个有代表性的功能，把代码规范、设计模式都体现在里面。

这就像是给 Codex 划了一块沙盒，告诉它：这是我们做事的标准，照着这个来。等这些准备工作做好了，Codex 就能在这个框架内独立工作了，而且做出来的东西都是符合规范的。

这个策略的好处是显而易见的。虽然 Codex 写了整个项目 85%的代码，但因为基础打得好，后面就没有出现大规模返工和重构的情况。要知道，在软件开发里，后期推倒重来的代价是最高的。

团队一开始也尝试过直接让 Codex 干活，就说一句：根据 iOS 版本构建 Android 应用，开始吧。结果发现不行。虽然技术上能跑起来，但产品体验很糟糕，代码也不可靠。这印证了一个简单的道理：方向比速度更重要。

从写代码到管代码

用了 Codex 之后，工程师的工作方式发生了明显变化。

以前是自己写代码，现在是花更多时间审核和指导代码。这听起来好像轻松了，但实际上对人的要求更高了。你需要先跟 Codex 一起理解系统是怎么运作的，然后制定一个详细的实施计划，最后才让它去执行。

就拿做一个新功能来说，OpenAI 的团队会先让 Codex 读一组相关文件，总结一下功能是怎么实现的，数据是怎么流转的。然后根据 Codex 的理解，纠正它的偏差，完善它的认知。接着一起制定实施计划：哪些文件要改，要加什么新逻辑，流程怎么调整。等计划确定了，再让 Codex 开始动手写代码。

这多出来的规划环节，其实很值得。因为你知道了 Codex 的计划，就可以放心让它长时间自己干活了。审核代码也变容易了，不用费劲去理解每一行改动，只要对照计划检查实施情况就行。出了问题也好调试，先看看是计划有问题还是代码有问题。

更有意思的是，在项目高峰期，团队会同时开几个 Codex 会话。一个负责视频回放，一个负责搜索功能，一个处理错误，还有一个写测试。每个会话定期汇报进度，需要你给反馈。

这种感觉不太像在用工具，更像是在管理一个虚拟团队。你的角色从编码员变成了指挥者，从写代码的人变成了把控方向的人。工作重心从手指在键盘上敲字，变成了脑子里思考架构和决策。

跨平台开发的新玩法

传统的跨平台方案，要么用 React Native，要么用 Flutter，本质都是让不同平台共享同一套代码。但 OpenAI 团队发现，有了 Codex 之后，可以玩出新花样。

他们半开玩笑地说：跨平台的未来就是 Codex 本身。换句话讲，忘掉 React Native 和 Flutter，未来的跨平台框架就是 Codex。这个观点太狠了，太颠覆认知了。

这话背后的逻辑很简单：应用的底层逻辑，数据模型、网络调用、业务规则，这些东西在 iOS 和 Android 上其实是一样的，只是用不同语言写而已。Codex 特别擅长读懂 Swift 代码，然后写出功能相同的 Kotlin 代码。

所以他们的做法是，把 iOS、后端、Android 的代码仓库都放在一个环境里，然后告诉 Codex：读读 iOS 里这个功能是怎么实现的，然后在 Android 里用我们的架构做出同样的效果。

这种方式的好处是，你不用维护一套复杂的共享抽象层，但也不用写两遍代码。大部分转换工作都由 Codex 完成了，你只要把控好方向就行。

这里面有个更深层的洞察：对 Codex 来说，背景信息就是一切。当它既了解功能在 iOS 上怎么跑的，又知道 Android 应用的结构是什么样的，它就能发挥最大效能。背景信息给得不够，它就只能瞎猜，结果自然好不到哪去。

这让人想到，在 AI 时代，能不能把复杂问题解释清楚，能不能提供足够的上下文，这些能力变得比以前更重要了。

保持高质量的秘诀

用 AI 写代码，不等于可以降低质量要求。恰恰相反，OpenAI 团队对代码质量的要求跟传统项目一模一样。

他们的办法是在代码仓库里到处建 AGENT.md 文件，把开发规范、架构原则、最佳实践都写进去。这样每次启动新会话，Codex 都能自动读到这些指导，保持一致的风格。

其实这里用到的就是我们之前文章当中提到的 Skills 技术，道理是相通的。

另外一个关键是审核机制。虽然 Codex 写代码很快，但每一行代码都要经过人工审核。而且因为有了实施计划，审核起来反而更容易，直接对照计划看实施就行了。

这里面其实反映了一个趋势：AI 辅助开发不是降低了对专业性的要求，反而提高了。因为现在考验的不是你能不能写出代码，而是你能不能判断这代码写得对不对，架构设计得好不好，未来维护方不方便。

这跟开车的道理有点像。自动驾驶辅助功能越强，司机的注意力反而要越集中，因为你要随时准备接管。同样的，AI 写代码越快，工程师的判断力就要越强，因为你要确保方向始终是对的。

瓶颈转移：从写代码到做决策

OpenAI 团队提到一个有趣的现象：用了 Codex 之后，开发的瓶颈发生了转移。

以前的瓶颈是写代码太慢，现在的瓶颈变成了审核队列总是满的，决策永远做不完。Codex 不会因为切换任务而效率降低，但人会。你一会儿要审这个会话提交的代码，一会儿要给那个会话提供反馈，一会儿又要思考新的架构问题，注意力被切得很碎。

这就像是从单人独奏变成了乐团指挥。指挥的价值不在于自己能演奏多少乐器，而在于能不能让整个乐团协调一致，奏出和谐的乐章。

而且增加 Codex 会话数量，不一定能线性提升速度。就像前面说的那个道理，每多一双手，哪怕是虚拟的手，也会增加协调成本。你要给每个会话提供指导，审核每个会话的输出，整合所有的改动，这些都需要时间和精力。

这个转变对个人成长的启示挺明显的。在 AI 时代，单纯提升执行速度的价值在下降，而提升判断力、系统思维、协调能力的价值在上升。技术的进步不是让某些技能变得不重要了，而是让重心转移了。

软件工程师的未来

经历了这个项目，OpenAI 团队对软件工程的未来有了新的理解。

AI 辅助开发没有减少对严谨性的需求，反而增加了这种需求。因为 AI 的目标是快速从 A 到 B，它不会自动考虑系统的长期可维护性，不会主动权衡各种技术方案的利弊。这些判断必须由人来做。

软件工程师的超能力，正在从会写代码，变成深刻理解系统，以及会和 AI 长期协作。会写代码只是基本功，会设计可扩展的系统，会做正确的技术决策，会给 AI 提供恰到好处的指导，这些才是真正的核心竞争力。

有个细节很能说明问题。软件工程最有意思的部分，其实是构建有吸引力的产品，设计优雅的架构，写高效的算法，在各种可能性中找到最佳方案。但日常工作里，大量时间花在了调整界面、对接 API、写重复代码这些琐事上。现在 Codex 帮忙处理这些琐事，工程师就能把更多精力放在真正有价值的事情上。

这不是说写代码不重要了，而是说写代码的方式变了。以前是自己敲键盘，现在是指导 AI 敲键盘。以前花 80%时间写代码，20%时间思考，现在可能反过来了，花 80%时间思考、设计、审核，20%时间动手写关键代码。

一些值得思考的地方

这个案例给我们展示了 AI 工具的真正威力：不是替代人，而是放大每个人的能力。4 个人配合 AI，能干传统方式下需要几十人才能完成的工作。

这背后有几点特别值得注意。首先是小团队在 AI 时代可能比大团队更有优势。人少意味着沟通成本低，决策链条短，每个人都能深度参与，对项目有全局认知。配上强大的 AI 工具，小团队的执行力可能反而更强。

其次是专业判断的价值在上升。当执行工作可以交给 AI 时，怎么判断方向对不对，架构好不好，决策合不合理，这些需要经验和洞察力的能力就变得更加重要。技术门槛在某种程度上降低了，但专业门槛反而提高了。

还有一点是上下文管理能力的重要性。怎么给 AI 提供恰当的背景信息，怎么把复杂的需求解释清楚，怎么检查 AI 的输出是否符合预期，这些都是新的技能要求。会用 AI 不等于会管 AI，会管 AI 才能真正发挥它的价值。

最后是工作方式的根本转变。从单打独斗到人机协作，从自己做所有事情到指挥 AI 做大部分事情，这个转变需要心态和能力的双重调整。有些人可能觉得这样反而累了，因为要同时管好几个 AI 会话，不停地审核和反馈。但换个角度看，这也是把时间从重复劳动中解放出来，投入到更有创造性的工作中。

新篇章才刚刚开始

OpenAI 团队在文章最后说，七个月前 Codex 刚推出研究预览版时，软件工程的样子跟现在已经很不一样了。随着模型和工具不断进化，AI 会成为开发过程中不可或缺的一部分。

这话说得很诚恳。他们没有吹嘘自己的方法多么完美，而是坦言这只是一次探索，希望分享出来能帮助更多团队找到适合自己的 AI 协作方式。

从更大的视角看，这个案例揭示的不仅是软件开发方式的变化，而是整个知识工作方式的变化。写代码如此，写文章、做设计、分析数据也是如此。AI 不是来抢饭碗的，而是来帮我们把饭碗端得更稳的。关键在于，我们能不能适应新的工作方式，能不能学会和 AI 合作，能不能把时间投入到机器做不了的事情上。

28 天完成一个 Android 应用，这只是开始。接下来还会有更多这样的故事发生，在各个领域，各个行业。而那些早点适应这种变化，学会和 AI 协作的人，大概率会在新时代里找到自己的位置。

原文地址：https://openai.com/zh-Hans-CN/index/shipping-sora-for-android-with-codex/

最后，介绍一下，我的星球：「AIGC·掘金成长研习社」，主要分享什么内容呢？三个板块的内容：

1、副业赚钱领域的内容。我做自媒体十几年了，有很多副业赚钱方面的经验和干货，而且每周都会定期详细带大家拆解一个副业赚钱案例，持续更新的那种，目前，已经分享了上百篇跟副业赚钱相关的帖子和文章了。

2、AI 落地和实操相关的内容。我在里面也分享了很多 AI的各种玩法和落地场景，包括用 AI 做副业的案例也都有。

3、个人成长。我会分享很多我做超级个体和自由职业的一些思考和成长类的内容，目前我已经做自由职业 5 年了，有太多的感慨和内容分享。

如果你想学习如何搞副业，如何使用 AI ，甚至如何使用 AI 搞副业，那一定要加入我这个超值的星球。目前，已经更新了 1600 多条干货和文章了，加入成员 790+。感兴趣的可以加入。

最近限时最大优惠，原价 149 ，今天加入可以立减 50 元，只需要 99 元，春节后，会涨价到 199 元。我认为我的星球是目前副业和 AI 领域最超值和具有性价比的星球，价格不贵，同时内容也不比几千块钱的星球差。

大家可以扫码，查看，支持 3 天无理由退款，内容好不好，先进来看看再说，不适合自己退了也没毛病。

一个开发奇迹，仅四人28天上线Android版Sora：OpenAI用AI造AI的实战手册

为什么不是几十个人干几个月

AI 能做什么，不能做什么

把基础打好，剩下的交给 AI

从写代码到管代码

跨平台开发的新玩法

保持高质量的秘诀

瓶颈转移：从写代码到做决策

软件工程师的未来

一些值得思考的地方

新篇章才刚刚开始

把 Chatbot 拉进机房：运维自动化的“人手 +1”革命

Langchain-Chatchat用于机场航站楼管理知识查询

当 AI 拿起笔：生成式 AI 如何重写传统出版的未来？

舆情分析：大数据如何重塑公共关系？——从危机预警到精准应对

FaceFusion能否实现历史人物“复活”演绎？

FaceFusion能否用于数字人生成？实测结果告诉你答案