用 Computer Use 做应用验收

Computer Use 适合做真实产品流程 QA：它能看见界面、点击流程、输入字段，并记录哪里失败。适合在 release 前跑关键 user journey

Computer Use 适合做真实产品流程 QA：它能看见界面、点击流程、输入字段，并记录哪里失败。适合在 release 前跑关键 user journeys，输出 severity、repro steps 和 triage summary。

官方页面：https://developers.openai.com/codex/use-cases/qa-your-app-with-computer-use

适合什么任务

场景	Codex 应该做什么
release 前验证真实用户流程	点击关键 flows，记录 functional bugs 和 UI issues
QA pass 需要可交接报告	每个 bug 写 repro steps、expected result、actual result、severity
遇到 non-blocking issues	继续测试剩余 flow，最后统一 triage

起始提示词

@Computer Use 请在 [environment] 中测试我的 app。

测试这些 flows：
- [hero use case 1]
- [hero use case 2]
- [hero use case 3]

每发现一个 bug，请包含：
- repro steps
- expected result
- actual result
- severity

遇到 non-blocking issues 时继续测试，最后给一份简短 triage summary。

这个 prompt 明确了 environment、flows 和 report format。QA pass 的价值来自可复现、可分派的输出。

操作步骤

准备 Computer Use。
告诉 Codex 要测试哪个 app、build 或 environment。
列出你最关心的 flows 或 hero use cases。
要求 structured report，方便 triage 或 handoff。

宽泛版本：

@Computer Use 请测试我的 app，找出主要问题，并给我一份报告。

更明确版本：

@Computer Use 请在 staging 中测试我的 app。覆盖 signup、invite a teammate 和 upgrade billing。每个 bug 都记录 repro steps、expected result、actual result 和 severity。

如果 repo 里已有 test-plan file，把它 attach 到 thread，或告诉 Codex 路径，让 QA pass 按已有 flows 走。

实用边界

说清 setup

account state、test data、feature flags、environment choice 会直接影响结果。prompt 里写清 local、staging 或 production-like behavior。

指定关注的问题类型

可以让 Codex 聚焦：

broken functionality。
layout issues。
confusing copy。
visual regressions。
all of the above。

决定 stop 还是 continue

如果一个 blocking issue 应该终止本轮测试，提前说明。否则要求 Codex 继续跑完剩余 flow，收集所有 non-blocking issues 后再总结。

后续处理

QA pass 后保持同一线程：

让 Codex 修其中一个 bug。
把 findings 转成 Linear 或 GitHub-ready drafts。
把下一轮 QA 缩小到某个 failing flow。

On this page