你在 Playground 里应该做哪些测试
- 提示词结构:角色/目标/约束/输出格式是否写清楚。
- 模型对比:同一提示词在不同模型下的差异(速度、稳定、风格)。
- 边界与容错:对模糊输入、极端输入、缺失信息时是否能给出合理追问。
- 输出可解析:如果你要 JSON/表格,测试是否稳定可解析。
从 Playground 迁移到代码(最短路径)
- 固定输入模板:把可变部分抽成变量(比如 {产品名}、{受众})。
- 固定输出结构:要求“标题/要点/步骤/结论”或 JSON schema。
- 补齐错误处理:超时、重试、限流、空输出、解析失败等。
- 加上费用监控:记录每次调用的输入/输出长度与请求频率。