📚AI 编程官方教程中文版
官方教程中文版实战场景

用 Computer Use 做应用验收

Computer Use 适合做真实产品流程 QA:它能看见界面、点击流程、输入字段,并记录哪里失败。适合在 release 前跑关键 user journey

Computer Use 适合做真实产品流程 QA:它能看见界面、点击流程、输入字段,并记录哪里失败。适合在 release 前跑关键 user journeys,输出 severity、repro steps 和 triage summary。

官方页面:https://developers.openai.com/codex/use-cases/qa-your-app-with-computer-use

适合什么任务

场景Codex 应该做什么
release 前验证真实用户流程点击关键 flows,记录 functional bugs 和 UI issues
QA pass 需要可交接报告每个 bug 写 repro steps、expected result、actual result、severity
遇到 non-blocking issues继续测试剩余 flow,最后统一 triage

相关官方说明:

起始提示词

@Computer Use 请在 [environment] 中测试我的 app。

测试这些 flows:
- [hero use case 1]
- [hero use case 2]
- [hero use case 3]

每发现一个 bug,请包含:
- repro steps
- expected result
- actual result
- severity

遇到 non-blocking issues 时继续测试,最后给一份简短 triage summary。

这个 prompt 明确了 environment、flows 和 report format。QA pass 的价值来自可复现、可分派的输出。

操作步骤

  1. 准备 Computer Use
  2. 告诉 Codex 要测试哪个 app、build 或 environment。
  3. 列出你最关心的 flows 或 hero use cases。
  4. 要求 structured report,方便 triage 或 handoff。

宽泛版本:

@Computer Use 请测试我的 app,找出主要问题,并给我一份报告。

更明确版本:

@Computer Use 请在 staging 中测试我的 app。覆盖 signup、invite a teammate 和 upgrade billing。每个 bug 都记录 repro steps、expected result、actual result 和 severity。

如果 repo 里已有 test-plan file,把它 attach 到 thread,或告诉 Codex 路径,让 QA pass 按已有 flows 走。

实用边界

说清 setup

account state、test data、feature flags、environment choice 会直接影响结果。prompt 里写清 local、staging 或 production-like behavior。

指定关注的问题类型

可以让 Codex 聚焦:

  • broken functionality。
  • layout issues。
  • confusing copy。
  • visual regressions。
  • all of the above。

决定 stop 还是 continue

如果一个 blocking issue 应该终止本轮测试,提前说明。否则要求 Codex 继续跑完剩余 flow,收集所有 non-blocking issues 后再总结。

后续处理

QA pass 后保持同一线程:

  • 让 Codex 修其中一个 bug。
  • 把 findings 转成 Linear 或 GitHub-ready drafts。
  • 把下一轮 QA 缩小到某个 failing flow。

On this page