一句话讲懂 Token
Token 不等于“字数”。它更像是文本被切分后的片段单位。不同语言、不同内容,Token 数可能差很多。
为什么 Token 会影响成本
- 输入 Token:你发给模型的内容(提示词 + 上下文)。
- 输出 Token:模型回复的内容。
- 很多模型对输入/输出分别计费;因此“让模型输出很长内容”会显著增加费用。
上下文窗口是什么
上下文窗口表示模型一次能处理的 Token 总量(输入 + 可能的输出)。窗口越大,你能一次塞进去的材料越多,但成本也可能更高。
成本控制三板斧(实操)
- 减少重复上下文:不要每次把同一段长背景重复粘贴。
- 限制输出长度:要求“最多 N 条要点/最多 N 字/输出为表格”。
- 分阶段:先让模型给大纲,再针对每一段细化,而不是一次生成超长全文。