Skip to Content
用户指南功能特性Token 缓存

Token 缓存与成本优化

Qwen Code 在使用 API 密钥认证时,会通过 Token 缓存自动优化 API 成本。该功能将系统指令、对话历史等高频使用的内容进行缓存,从而减少后续请求中需要处理的 Token 数量。

对您带来的好处

  • 降低成本:Token 减少意味着 API 费用降低
  • 响应更快:缓存内容可被更快速地检索
  • 自动优化:无需任何配置,后台自动运行

支持 Token 缓存的用户类型包括

  • 使用 API 密钥的用户(Qwen API 密钥、兼容 OpenAI 的服务商)

监控您的节省情况

使用 /stats 命令查看缓存的 Token 节省量:

  • 启用后,统计信息会显示从缓存中提供的 Token 数量
  • 您将同时看到缓存 Token 的绝对数量及其占总 Token 数的百分比
  • 示例:“10,500(90.4%)个输入 Token 来自缓存,从而降低了成本。”

该信息仅在实际使用缓存 Token 时显示;这发生在使用 API 密钥认证时,而 OAuth 认证下不会启用缓存。

统计信息显示示例

Qwen Code 统计信息显示

上图展示了 /stats 命令输出的示例,重点突出了缓存 Token 节省量的相关信息。

Last updated on