12 · 一句话复盘 Codex 全貌
把 Codex 的入口、上下文、工具、边界、验证和团队落地压成一条新手能复用的决策链。
学完 Codex,最好的检验不是记住多少名词,而是能不能用一句话解释它。
一句话:Codex 是一个 AI Coding Agent,它读现场、改文件、调工具、跑验证、交结果。你的工作不是“让它写代码”,而是给它目标、上下文、边界和验证标准,然后审查它的交付。
先理解:Codex 全貌只有六件事
第一,目标。你要让 Codex 知道这次任务到底要解决什么问题,而不是只说“优化一下”。
第二,上下文。Codex 需要项目文件、AGENTS.md、配置、历史对话、工具输出和你补充的业务背景。
第三,工具。Codex 通过文件读写、shell、浏览器、MCP、skills、subagents 和 hooks 进入真实工程现场。
第四,边界。Sandbox 决定它能碰哪里,approval 决定高风险动作是否需要你确认。
第五,验证。测试、lint、diff、日志、截图、运行结果都属于验证证据。
第六,审查。Codex 交付的是建议和改动,不是免审结果。你仍然要看 diff、看风险、看未验证项。
怎么判断自己是否真的会用
你能在任务开始前说清目标、范围和禁止事项。
你能让 Codex 先理解项目,而不是一上来改代码。
你能根据任务风险选择 CLI、IDE、App 或 Cloud。
你能解释 sandbox 和 approval 各自控制什么。
你能判断什么时候该用 MCP、Skill、Subagent、Hook,而不是把所有扩展都装上。
你能在 Codex 完成后要求它给出 diff、验证结果、未验证项和剩余风险。
如果这些做不到,你还不是不会用 Codex,而是还没有建立工程化使用习惯。
接到任何任务,按这条决策链走
先问:任务清楚吗?不清楚就分诊,先收集错误、现象、目标和验收标准。
再问:规则齐吗?没有项目规则就先读或补 AGENTS.md。
再问:入口对吗?本地小改动用 CLI / IDE,长任务用 Cloud,团队自动化用 codex exec 或 GitHub Action。
再问:边界画了吗?先 read-only,需要写入再 workspace-write,危险操作必须审批。
再问:需要外部工具吗?需要文档、数据库、内部 API,再接 MCP 或浏览器。
再问:这是重复任务吗?重复流程沉淀成 Skill,独立探索交给 Subagent,必须执行的检查交给 Hook。
最后才让 Codex 执行,并要求它交验证证据。
新手最少必要能力
你不需要一开始学完所有功能。
先选一个入口。IDE 适合边看边改,CLI 适合终端用户,Cloud 适合异步长任务。
写一份 AGENTS.md。哪怕只有项目用途、启动命令、测试命令、禁止事项,也比每次口头解释强。
默认用 workspace-write + on-request 或更保守的 read-only 起步。不要一上来全权限。
每个任务先让 Codex 读现场,再让它改。不要把“马上动手”当效率。
每次结束都复盘,把稳定经验沉淀回 AGENTS.md、Skill 或 rules。
新手常见坑
误区一:装 4 个入口就算掌握。实际上你需要先把一个入口用顺。
误区二:配 10 个 MCP 就更强。工具越多,权限和错误来源越多。
误区三:把 Subagent、Hook、Skill 一起上。新手应该在真实重复问题出现后再加。
误区四:只看 Codex 最终回答。真正要看的是它读了什么、改了什么、验证了什么、没验证什么。
误区五:把 AGENTS.md 当文档。它是项目和 Agent 的协作接口,应该持续演进。
读完整套后应该能回答
Codex 和普通聊天机器人的差别是什么?
一次稳定任务为什么需要目标、上下文、边界和验证?
AGENTS.md 应该写什么,不该写什么?
Sandbox 和 approval 分别防什么风险?
App、IDE、CLI、Cloud 各适合什么人和任务?
MCP、Skill、Subagent、Hook 各自解决什么问题?
团队要如何从个人使用升级到可审查、可追溯、可治理?
下一步怎么做
选一个真实小任务,不要选玩具 demo。
先让 Codex 只读理解项目,让它输出项目用途、目录结构、运行方式、风险和建议小任务。
再选一个范围很小的改动,让它修改、验证、说明未验证项。
最后把这次任务中你反复提醒它的规则沉淀进 AGENTS.md。
学习闭环就是:任务、复盘、沉淀、下一个任务。