news 2026/2/2 0:17:54

一个开发奇迹,仅四人28天上线Android版Sora:OpenAI用AI造AI的实战手册

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
一个开发奇迹,仅四人28天上线Android版Sora:OpenAI用AI造AI的实战手册

昨天傍晚的时候,看到了 OpenAI 官方的文章,他们团队回忆了整个 Sora Android 版的开发过程,收获巨大,在这里分享给大家。

去年 11 月,Android 版 Sora 应用一上线就冲上了 Google Play 榜首,前 24 小时用户就生成了超过 100 万个视频。这个成绩背后,藏着一个让人意外的事实:这款应用从零到上线,只用了 28 天。

更让人惊讶的是,完成这项工作的不是一个几十人的大团队,而是 4 个工程师加上他们的 AI 助手 Codex。这听起来像是在吹牛,但数据摆在那里:50 亿个 token 的消耗量,99.9%的无崩溃率,一个让开发团队自己都很满意的架构。

这不是什么科幻故事,而是 OpenAI 团队刚刚完成的真实项目。他们把整个过程记录下来,告诉我们一个事实:软件开发的游戏规则,正在被 AI 悄悄改写。

为什么不是几十个人干几个月

按照传统做法,开发一个这样规模的生产级应用,通常需要一个庞大的团队花上好几个月。人多了,开会多了,沟通成本就上去了,进度反而慢下来。

计算机界有句老话:向一个已经延期的项目增加人手,只会让它更晚完成。这话听起来反直觉,但仔细想想就明白了。十个人的团队,大家要互相沟通的次数远远多于两个人。每增加一个人,不是简单地增加一份力量,还要增加很多协调的麻烦。

OpenAI 的团队想了个办法:既然人多了会添乱,那就干脆保持小团队,但给每个人配上强大的 AI 助手。4 个工程师,每人身边有个 Codex 帮忙,效果比传统的大团队还好。

这里面有个很有意思的类比。Codex 就像是一个刚入职的高级工程师,能力很强,但需要你告诉他公司的做事风格、技术规范、产品思路。你不能指望他自己去猜这些东西,但只要说清楚了,他的执行能力就非常惊人。

AI 能做什么,不能做什么

要和 AI 合作得好,首先得搞清楚它擅长什么,不擅长什么。

Codex 有几个地方特别厉害。它能快速读懂大量代码,几乎掌握所有主流编程语言。让它写单元测试,它特别热衷,能覆盖很多场景。编译失败了,把错误日志给它看,它马上能提出修复方案。最厉害的是,你可以同时开好几个 Codex 会话,让它们并行工作,互不干扰。

但它也有明显的局限。比如说,你们公司喜欢用什么架构模式,产品的设计理念是什么,用户真实的使用习惯如何,这些它都不知道,得你来告诉它。它也看不到应用实际运行的样子,不能自己打开手机看看界面是不是卡顿,流程是不是顺畅。

更关键的是,Codex 在做深层次架构判断时会犯难。如果没人指导,它可能会为了让功能跑起来,把本该放在数据层的逻辑塞到界面层,或者在不该加新组件的地方加了一堆东西。它的本能是让代码能用,但不一定考虑长期的可维护性。

这让人想到一个道理:工具再强大,也需要懂行的人来掌控方向。就像给你一把好刀,你还是得知道往哪切才对。

把基础打好,剩下的交给 AI

OpenAI 团队做了一个聪明的决定:他们没有一上来就让 Codex 撸起袖子全干,而是先自己搭好框架。

他们亲手设计了整个应用的架构、模块划分、依赖注入这些核心结构,还实现了身份验证和基础网络功能。然后写了几个有代表性的功能,把代码规范、设计模式都体现在里面。

这就像是给 Codex 划了一块沙盒,告诉它:这是我们做事的标准,照着这个来。等这些准备工作做好了,Codex 就能在这个框架内独立工作了,而且做出来的东西都是符合规范的。

这个策略的好处是显而易见的。虽然 Codex 写了整个项目 85%的代码,但因为基础打得好,后面就没有出现大规模返工和重构的情况。要知道,在软件开发里,后期推倒重来的代价是最高的。

团队一开始也尝试过直接让 Codex 干活,就说一句:根据 iOS 版本构建 Android 应用,开始吧。结果发现不行。虽然技术上能跑起来,但产品体验很糟糕,代码也不可靠。这印证了一个简单的道理:方向比速度更重要。

从写代码到管代码

用了 Codex 之后,工程师的工作方式发生了明显变化。

以前是自己写代码,现在是花更多时间审核和指导代码。这听起来好像轻松了,但实际上对人的要求更高了。你需要先跟 Codex 一起理解系统是怎么运作的,然后制定一个详细的实施计划,最后才让它去执行。

就拿做一个新功能来说,OpenAI 的团队会先让 Codex 读一组相关文件,总结一下功能是怎么实现的,数据是怎么流转的。然后根据 Codex 的理解,纠正它的偏差,完善它的认知。接着一起制定实施计划:哪些文件要改,要加什么新逻辑,流程怎么调整。等计划确定了,再让 Codex 开始动手写代码。

这多出来的规划环节,其实很值得。因为你知道了 Codex 的计划,就可以放心让它长时间自己干活了。审核代码也变容易了,不用费劲去理解每一行改动,只要对照计划检查实施情况就行。出了问题也好调试,先看看是计划有问题还是代码有问题。

更有意思的是,在项目高峰期,团队会同时开几个 Codex 会话。一个负责视频回放,一个负责搜索功能,一个处理错误,还有一个写测试。每个会话定期汇报进度,需要你给反馈。

这种感觉不太像在用工具,更像是在管理一个虚拟团队。你的角色从编码员变成了指挥者,从写代码的人变成了把控方向的人。工作重心从手指在键盘上敲字,变成了脑子里思考架构和决策。

跨平台开发的新玩法

传统的跨平台方案,要么用 React Native,要么用 Flutter,本质都是让不同平台共享同一套代码。但 OpenAI 团队发现,有了 Codex 之后,可以玩出新花样。

他们半开玩笑地说:跨平台的未来就是 Codex 本身。换句话讲,忘掉 React Native 和 Flutter,未来的跨平台框架就是 Codex。这个观点太狠了,太颠覆认知了。

这话背后的逻辑很简单:应用的底层逻辑,数据模型、网络调用、业务规则,这些东西在 iOS 和 Android 上其实是一样的,只是用不同语言写而已。Codex 特别擅长读懂 Swift 代码,然后写出功能相同的 Kotlin 代码。

所以他们的做法是,把 iOS、后端、Android 的代码仓库都放在一个环境里,然后告诉 Codex:读读 iOS 里这个功能是怎么实现的,然后在 Android 里用我们的架构做出同样的效果。

这种方式的好处是,你不用维护一套复杂的共享抽象层,但也不用写两遍代码。大部分转换工作都由 Codex 完成了,你只要把控好方向就行。

这里面有个更深层的洞察:对 Codex 来说,背景信息就是一切。当它既了解功能在 iOS 上怎么跑的,又知道 Android 应用的结构是什么样的,它就能发挥最大效能。背景信息给得不够,它就只能瞎猜,结果自然好不到哪去。

这让人想到,在 AI 时代,能不能把复杂问题解释清楚,能不能提供足够的上下文,这些能力变得比以前更重要了。

保持高质量的秘诀

用 AI 写代码,不等于可以降低质量要求。恰恰相反,OpenAI 团队对代码质量的要求跟传统项目一模一样。

他们的办法是在代码仓库里到处建 AGENT.md 文件,把开发规范、架构原则、最佳实践都写进去。这样每次启动新会话,Codex 都能自动读到这些指导,保持一致的风格。

其实这里用到的就是我们之前文章当中提到的 Skills 技术,道理是相通的。

另外一个关键是审核机制。虽然 Codex 写代码很快,但每一行代码都要经过人工审核。而且因为有了实施计划,审核起来反而更容易,直接对照计划看实施就行了。

这里面其实反映了一个趋势:AI 辅助开发不是降低了对专业性的要求,反而提高了。因为现在考验的不是你能不能写出代码,而是你能不能判断这代码写得对不对,架构设计得好不好,未来维护方不方便。

这跟开车的道理有点像。自动驾驶辅助功能越强,司机的注意力反而要越集中,因为你要随时准备接管。同样的,AI 写代码越快,工程师的判断力就要越强,因为你要确保方向始终是对的。

瓶颈转移:从写代码到做决策

OpenAI 团队提到一个有趣的现象:用了 Codex 之后,开发的瓶颈发生了转移。

以前的瓶颈是写代码太慢,现在的瓶颈变成了审核队列总是满的,决策永远做不完。Codex 不会因为切换任务而效率降低,但人会。你一会儿要审这个会话提交的代码,一会儿要给那个会话提供反馈,一会儿又要思考新的架构问题,注意力被切得很碎。

这就像是从单人独奏变成了乐团指挥。指挥的价值不在于自己能演奏多少乐器,而在于能不能让整个乐团协调一致,奏出和谐的乐章。

而且增加 Codex 会话数量,不一定能线性提升速度。就像前面说的那个道理,每多一双手,哪怕是虚拟的手,也会增加协调成本。你要给每个会话提供指导,审核每个会话的输出,整合所有的改动,这些都需要时间和精力。

这个转变对个人成长的启示挺明显的。在 AI 时代,单纯提升执行速度的价值在下降,而提升判断力、系统思维、协调能力的价值在上升。技术的进步不是让某些技能变得不重要了,而是让重心转移了。

软件工程师的未来

经历了这个项目,OpenAI 团队对软件工程的未来有了新的理解。

AI 辅助开发没有减少对严谨性的需求,反而增加了这种需求。因为 AI 的目标是快速从 A 到 B,它不会自动考虑系统的长期可维护性,不会主动权衡各种技术方案的利弊。这些判断必须由人来做。

软件工程师的超能力,正在从会写代码,变成深刻理解系统,以及会和 AI 长期协作。会写代码只是基本功,会设计可扩展的系统,会做正确的技术决策,会给 AI 提供恰到好处的指导,这些才是真正的核心竞争力。

有个细节很能说明问题。软件工程最有意思的部分,其实是构建有吸引力的产品,设计优雅的架构,写高效的算法,在各种可能性中找到最佳方案。但日常工作里,大量时间花在了调整界面、对接 API、写重复代码这些琐事上。现在 Codex 帮忙处理这些琐事,工程师就能把更多精力放在真正有价值的事情上。

这不是说写代码不重要了,而是说写代码的方式变了。以前是自己敲键盘,现在是指导 AI 敲键盘。以前花 80%时间写代码,20%时间思考,现在可能反过来了,花 80%时间思考、设计、审核,20%时间动手写关键代码。

一些值得思考的地方

这个案例给我们展示了 AI 工具的真正威力:不是替代人,而是放大每个人的能力。4 个人配合 AI,能干传统方式下需要几十人才能完成的工作。

这背后有几点特别值得注意。首先是小团队在 AI 时代可能比大团队更有优势。人少意味着沟通成本低,决策链条短,每个人都能深度参与,对项目有全局认知。配上强大的 AI 工具,小团队的执行力可能反而更强。

其次是专业判断的价值在上升。当执行工作可以交给 AI 时,怎么判断方向对不对,架构好不好,决策合不合理,这些需要经验和洞察力的能力就变得更加重要。技术门槛在某种程度上降低了,但专业门槛反而提高了。

还有一点是上下文管理能力的重要性。怎么给 AI 提供恰当的背景信息,怎么把复杂的需求解释清楚,怎么检查 AI 的输出是否符合预期,这些都是新的技能要求。会用 AI 不等于会管 AI,会管 AI 才能真正发挥它的价值。

最后是工作方式的根本转变。从单打独斗到人机协作,从自己做所有事情到指挥 AI 做大部分事情,这个转变需要心态和能力的双重调整。有些人可能觉得这样反而累了,因为要同时管好几个 AI 会话,不停地审核和反馈。但换个角度看,这也是把时间从重复劳动中解放出来,投入到更有创造性的工作中。

新篇章才刚刚开始

OpenAI 团队在文章最后说,七个月前 Codex 刚推出研究预览版时,软件工程的样子跟现在已经很不一样了。随着模型和工具不断进化,AI 会成为开发过程中不可或缺的一部分。

这话说得很诚恳。他们没有吹嘘自己的方法多么完美,而是坦言这只是一次探索,希望分享出来能帮助更多团队找到适合自己的 AI 协作方式。

从更大的视角看,这个案例揭示的不仅是软件开发方式的变化,而是整个知识工作方式的变化。写代码如此,写文章、做设计、分析数据也是如此。AI 不是来抢饭碗的,而是来帮我们把饭碗端得更稳的。关键在于,我们能不能适应新的工作方式,能不能学会和 AI 合作,能不能把时间投入到机器做不了的事情上。

28 天完成一个 Android 应用,这只是开始。接下来还会有更多这样的故事发生,在各个领域,各个行业。而那些早点适应这种变化,学会和 AI 协作的人,大概率会在新时代里找到自己的位置。

原文地址:https://openai.com/zh-Hans-CN/index/shipping-sora-for-android-with-codex/


最后,介绍一下,我的星球:「AIGC·掘金成长研习社」,主要分享什么内容呢?三个板块的内容:

1、副业赚钱领域的内容。我做自媒体十几年了,有很多副业赚钱方面的经验和干货,而且每周都会定期详细带大家拆解一个副业赚钱案例,持续更新的那种,目前,已经分享了上百篇跟副业赚钱相关的帖子和文章了。

2、AI 落地和实操相关的内容。我在里面也分享了很多 AI的各种玩法和落地场景,包括用 AI 做副业的案例也都有。

3、个人成长。我会分享很多我做超级个体和自由职业的一些思考和成长类的内容,目前我已经做自由职业 5 年了,有太多的感慨和内容分享。

如果你想学习如何搞副业,如何使用 AI ,甚至如何使用 AI 搞副业,那一定要加入我这个超值的星球。目前,已经更新了 1600 多条干货和文章了,加入成员 790+。感兴趣的可以加入。

最近限时最大优惠,原价 149 ,今天加入可以立减 50 元,只需要 99 元,春节后,会涨价到 199 元。我认为我的星球是目前副业和 AI 领域最超值和具有性价比的星球,价格不贵,同时内容也不比几千块钱的星球差。

大家可以扫码,查看,支持 3 天无理由退款,内容好不好,先进来看看再说,不适合自己退了也没毛病。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/30 18:48:20

把 Chatbot 拉进机房:运维自动化的“人手 +1”革命

把 Chatbot 拉进机房:运维自动化的“人手 +1”革命 作者:Echo_Wish 🌧 引子:人永远不该当“接口适配器” 干运维的人,都懂一句“扎心名言”: 90% 的故障不是复杂,是重复。 用户问:“服务器是不是挂了?” 开发问:“日志怎么看?” 业务问:“MySQL 怎么新建账号?”…

作者头像 李华
网站建设 2026/2/1 12:36:10

Langchain-Chatchat用于机场航站楼管理知识查询

Langchain-Chatchat 在机场航站楼管理中的智能知识服务实践 在现代机场运营中,一线工作人员每天面临大量高频、高时效性的信息查询需求:登机口临时变更如何通知旅客?廊桥故障是否有备用方案?航班延误超两小时的餐饮安置标准是什么…

作者头像 李华
网站建设 2026/2/1 4:06:29

当 AI 拿起笔:生成式 AI 如何重写传统出版的未来?

友友们好! 我是Echo_Wish,我的的新专栏《Python进阶》以及《Python!实战!》正式启动啦!这是专为那些渴望提升Python技能的朋友们量身打造的专栏,无论你是已经有一定基础的开发者,还是希望深入挖掘Python潜力的爱好者,这里都将是你不可错过的宝藏。 在这个专栏中,你将会…

作者头像 李华
网站建设 2026/1/29 21:36:22

舆情分析:大数据如何重塑公共关系?——从危机预警到精准应对

舆情分析:大数据如何重塑公共关系?——从危机预警到精准应对 作者:Echo_Wish 🧠 引子:一句话让你理解舆情与 PR 的生命线 有一句互联网时代的老话: “信息传播的速度,永远快过你的修复速度。” 当一条关于品牌的负面消息在社交网络上爆发,它可能在 10 分钟内扩散至千…

作者头像 李华
网站建设 2026/1/29 15:24:44

FaceFusion能否实现历史人物“复活”演绎?

FaceFusion能否实现历史人物“复活”演绎?在纪录片中,一位白发苍苍的老人站在讲台前,眼神深邃地讲述着相对论的诞生;博物馆里,慈禧太后缓缓开口,用略带京腔的语调叙述晚清政局——这些画面并非来自未来的时…

作者头像 李华
网站建设 2026/1/29 14:04:30

FaceFusion能否用于数字人生成?实测结果告诉你答案

FaceFusion能否用于数字人生成?实测结果告诉你答案在虚拟主播、AI客服和元宇宙内容爆发的今天,越来越多团队开始尝试构建自己的数字人系统。一个常见的问题是:有没有现成的开源工具可以“一键生成”会说话、有表情的虚拟人?其中&a…

作者头像 李华