12 · 一句话复盘 Codex 全貌 · AI 编程官方教程中文版

把 Codex 的入口、上下文、工具、边界、验证和团队落地压成一条新手能复用的决策链。

学完 Codex，最好的检验不是记住多少名词，而是能不能用一句话解释它。

一句话：Codex 是一个 AI Coding Agent，它读现场、改文件、调工具、跑验证、交结果。你的工作不是“让它写代码”，而是给它目标、上下文、边界和验证标准，然后审查它的交付。

先理解：Codex 全貌只有六件事

第一，目标。你要让 Codex 知道这次任务到底要解决什么问题，而不是只说“优化一下”。

第二，上下文。Codex 需要项目文件、AGENTS.md、配置、历史对话、工具输出和你补充的业务背景。

第三，工具。Codex 通过文件读写、shell、浏览器、MCP、skills、subagents 和 hooks 进入真实工程现场。

第四，边界。Sandbox 决定它能碰哪里，approval 决定高风险动作是否需要你确认。

第五，验证。测试、lint、diff、日志、截图、运行结果都属于验证证据。

第六，审查。Codex 交付的是建议和改动，不是免审结果。你仍然要看 diff、看风险、看未验证项。

怎么判断自己是否真的会用

你能在任务开始前说清目标、范围和禁止事项。

你能让 Codex 先理解项目，而不是一上来改代码。

你能根据任务风险选择 CLI、IDE、App 或 Cloud。

你能解释 sandbox 和 approval 各自控制什么。

你能判断什么时候该用 MCP、Skill、Subagent、Hook，而不是把所有扩展都装上。

你能在 Codex 完成后要求它给出 diff、验证结果、未验证项和剩余风险。

如果这些做不到，你还不是不会用 Codex，而是还没有建立工程化使用习惯。

接到任何任务，按这条决策链走

先问：任务清楚吗？不清楚就分诊，先收集错误、现象、目标和验收标准。

再问：规则齐吗？没有项目规则就先读或补 AGENTS.md。

再问：入口对吗？本地小改动用 CLI / IDE，长任务用 Cloud，团队自动化用 codex exec 或 GitHub Action。

再问：边界画了吗？先 read-only，需要写入再 workspace-write，危险操作必须审批。

再问：需要外部工具吗？需要文档、数据库、内部 API，再接 MCP 或浏览器。

再问：这是重复任务吗？重复流程沉淀成 Skill，独立探索交给 Subagent，必须执行的检查交给 Hook。

最后才让 Codex 执行，并要求它交验证证据。

新手最少必要能力

你不需要一开始学完所有功能。

先选一个入口。IDE 适合边看边改，CLI 适合终端用户，Cloud 适合异步长任务。

写一份 AGENTS.md。哪怕只有项目用途、启动命令、测试命令、禁止事项，也比每次口头解释强。

默认用 workspace-write + on-request 或更保守的 read-only 起步。不要一上来全权限。

每个任务先让 Codex 读现场，再让它改。不要把“马上动手”当效率。

每次结束都复盘，把稳定经验沉淀回 AGENTS.md、Skill 或 rules。

新手常见坑

误区一：装 4 个入口就算掌握。实际上你需要先把一个入口用顺。

误区二：配 10 个 MCP 就更强。工具越多，权限和错误来源越多。

误区三：把 Subagent、Hook、Skill 一起上。新手应该在真实重复问题出现后再加。

误区四：只看 Codex 最终回答。真正要看的是它读了什么、改了什么、验证了什么、没验证什么。

误区五：把 AGENTS.md 当文档。它是项目和 Agent 的协作接口，应该持续演进。

读完整套后应该能回答

Codex 和普通聊天机器人的差别是什么？

一次稳定任务为什么需要目标、上下文、边界和验证？

AGENTS.md 应该写什么，不该写什么？

Sandbox 和 approval 分别防什么风险？

App、IDE、CLI、Cloud 各适合什么人和任务？

MCP、Skill、Subagent、Hook 各自解决什么问题？

团队要如何从个人使用升级到可审查、可追溯、可治理？

下一步怎么做

选一个真实小任务，不要选玩具 demo。

先让 Codex 只读理解项目，让它输出项目用途、目录结构、运行方式、风险和建议小任务。

再选一个范围很小的改动，让它修改、验证、说明未验证项。

最后把这次任务中你反复提醒它的规则沉淀进 AGENTS.md。

学习闭环就是：任务、复盘、沉淀、下一个任务。

12 · 一句话复盘 Codex 全貌