Кэширование токенов и оптимизация затрат
Qwen Code автоматически оптимизирует затраты на API с помощью кэширования токенов при использовании аутентификации по API-ключу. Эта функция сохраняет часто используемый контент, такой как системные инструкции и историю диалогов, чтобы уменьшить количество токенов, обрабатываемых в последующих запросах.
Преимущества для вас
- Снижение затрат: Меньше токенов — ниже затраты на API
- Быстрые ответы: Кэшированный контент извлекается быстрее
- Автоматическая оптимизация: Не требуется настройка — всё работает в фоновом режиме
Кэширование токенов доступно для
- Пользователям API-ключей (Qwen API-ключ, провайдеры, совместимые с OpenAI)
Мониторинг вашей экономии
Используйте команду /stats, чтобы увидеть сэкономленные кэшированные токены:
- Когда эта функция активна, в статистике отображается, сколько токенов было получено из кэша.
- Вы увидите как абсолютное число, так и процент кэшированных токенов.
- Пример: «10 500 (90,4%) входных токенов были получены из кэша, что позволило снизить затраты.»
Эта информация отображается только при использовании кэшированных токенов, что происходит при аутентификации с помощью API-ключа, но не при аутентификации OAuth.
Пример отображения статистики

Приведённое выше изображение показывает пример вывода команды /stats, выделяя информацию об экономии за счёт кэшированных токенов.
Last updated on