OpenAI 里面掀翻 Vibe Engineering 翻新,区别于盲目依赖 AI 生成代码的 Vibe Coding,Codex 接管率超 92%,助力工程师 PR 产出进步 70%。12 小时从零重写方式、7 小时 200 轮迭代考据 500 行有用代码,AI 让代码变低价,而信任与东说念主类判断力成为中枢价值。

OpenAI 办了一场里面共享,主题是 Vibe Engineering,这里区别于「Vibe Coding」,具体为啥,容我细细说念来
Developer Experience 庄重东说念主 Romain Huet 和工程师 Aaron Friel 讲了一个数据:
OpenAI 里面技能东说念主员的 Codex 接管率超过 92%,总计里面 PR 王人由 Codex 审核,使用 Codex 的工程师产出的并吞 PR 比无须的多 70%

发生在 OpenAI 里面的翻新
Friel 也讲的另一个故事:
让 Codex 跑了 7 小时,迭代了 200 多轮测试,最终产出的 diff 唯有约莫 500 行
代码行数越来越低廉了,但证据代码有用这件事,变贵了

代码越来越低廉,信任越来越贵
12 小时,从空目次到竣工方式共享会上, Friel 作念了个现场演示把一个叫 Bazel Diff 的 Kotlin 方式用 Rust 从零重写,条目 100% 兼容原方式
12 小时,从空目次到竣工方式
开首是一个空目次,里面唯有一个 prompt 文献Friel 把 prompt 贴进 Codex CLI,然后就….等着
Codex 作念的第一件事不是写代码,是创建一个「watchdog」子代理——成心用来辅导主代理「你的诡计是什么、用户的条目是什么」,驻扎跑偏
然后它启动了一堆子代理并行职责,有的用 GPT 5.1,有的用 Codex Mini,分别去商量上游方式的代码、调研 Bazel 8 和 Bazel 9 的相反、设想方式架构
总计程度王人纪录在一个叫「exec plan」的文献里——不仅仅给模子看的,亦然给东说念主看的
Friel 说他之前晚上跑过一次竣工的,简略 12 小时跑完这个任务淌若让工程师手写,简略需要几周
7 小时 500 行的故事这是 Friel 在 Dev Day 讲过的故事,咫尺有了更多细节那时他在沙发上边看电视边干活,顺遂把电脑设成束缚眠,让 Codex 跑一个任务第二天早上醒来发现 Codex 还在跑
7 小时,200 多轮迭代,最终产出一个约莫 500 行的 diff
7小时,200轮迭代,500行代码
Friel 说许多工程师听到这个数字的第一反馈是:「罢了,写了 10 万行垃圾代码吧?」
但事实相背——这是一个特别复杂的蜕变,Codex 把大部分时间花在了跑测试、改测试、再跑测试上
最终这个蜕变被 merge 了
Romain 说这才是新的程度单元:更少的失实、更好的 review、更高的置信度——即使最终的 patch 很小
Codex 的自我构建一个细节:OpenAI 用 Codex 来开辟 Codex
系统运行自我优化
Romain 说这即是为什么 Codex 险些每隔几天就能发一个新版块
recursive self-improvement,从 Codex 运行
非工程师也在用OpenAI 里面,有一个 Codex 的 Slack 集成,非技能团队不错径直问 Codex 对于代码库的问题
比如家具司理思知说念某个功能是怎么完结的,销售思了解某个 API 的细节,无须再去找工程师集结议了
技能,流向每一个东说念主
Friel 说:Codex 恢复这些问题偶然候比他我方恢复得还好
设想师也在用,比如通过 MCP 劝诱 Figma,径直把 Figma 组件拉成代码
Romain 的说法是:不是每个东说念主王人要形成工程师,但每个东说念主王人在变得更技能
总计工程师王人升职了Friel 开打趣说:咫尺总计工程师王人形成 Manager 了
因为你不再是我方写代码,而是给 Codex 分派任务、审核它的产出
况且 Codex 还会我方创建子代理、给子代理分派任务
是以准确说,行家王人形成 Director 了
总计东说念主王人升职了
Best of NCodex 有一个功能叫「Best of N」你给它一个任务,它不错并行尝试 4 种不同的决议,然后把 4 个效果的截图王人给你看
并行探索
Friel 说他世俗用这个功能——先看 4 个决议,挑一个最赋闲的,然后连接迭代
Romain 的说法是:这即是创意流动的神情,让 AI 思 4 个决议供你挑选
什么变弥留了对于这些器用带来的才能瓶颈更动,Romain 讲得很径直:
设想和回味(taste)判断力(discernment)明晰的疏通还有一个:产出让东说念主类欢快读的东西
「弥留」的移动
Friel 说他有一个测试圭臬淌若 Codex 的产出是你我方不思读的东西,那它对 AI 代理也不会有用
他们在鼓舞工程师多写文档、多写测试的原理亦然这个:这些东西,不仅仅给东说念主看的,亦然给下一个接办这个代码库的 AI 代理看的
话说纪念Simon Willison 建议「Vibe Engineering」这个词是为了跟「Vibe Coding」远离开
Vibe Coding 是让模子荒诞写代码然后祷告测试能过Vibe Engineering 是高等工程师对每一滑代码庄重,但在磋磨、架构、调试、文档各个设施王人用上代理
要用 AI 构建,也要保抓东说念主类的累赘
本文由东说念主东说念主王人是家具司理作家【赛博禅心】,微信公众号:【赛博禅心】,原创/授权 发布于东说念主东说念主王人是家具司理,未经许可,不容转载。
题图来自Unsplash,基于 CC0 契约。