Token 缓存与成本优化
Qwen Code 在使用 API 密钥认证时,会通过 Token 缓存自动优化 API 成本。该功能将系统指令、对话历史等高频使用的内容进行缓存,从而减少后续请求中需要处理的 Token 数量。
对您带来的好处
- 降低成本:Token 减少意味着 API 费用降低
- 响应更快:缓存内容可被更快速地检索
- 自动优化:无需任何配置,后台自动运行
支持 Token 缓存的用户类型包括
- 使用 API 密钥的用户(Qwen API 密钥、兼容 OpenAI 的服务商)
监控您的节省情况
使用 /stats 命令查看缓存的 Token 节省量:
- 启用后,统计信息会显示从缓存中提供的 Token 数量
- 您将同时看到缓存 Token 的绝对数量及其占总 Token 数的百分比
- 示例:“10,500(90.4%)个输入 Token 来自缓存,从而降低了成本。”
该信息仅在实际使用缓存 Token 时显示;这发生在使用 API 密钥认证时,而 OAuth 认证下不会启用缓存。
统计信息显示示例

上图展示了 /stats 命令输出的示例,重点突出了缓存 Token 节省量的相关信息。
Last updated on