Кэширование токенов и оптимизация затрат

Qwen Code автоматически оптимизирует затраты на API с помощью кэширования токенов при использовании аутентификации по API-ключу. Эта функция сохраняет часто используемый контент, такой как системные инструкции и историю диалогов, чтобы уменьшить количество токенов, обрабатываемых в последующих запросах.

Преимущества для вас

Снижение затрат: Меньше токенов — ниже затраты на API
Быстрые ответы: Кэшированный контент извлекается быстрее
Автоматическая оптимизация: Не требуется настройка — всё работает в фоновом режиме

Кэширование токенов доступно для

Пользователям API-ключей (Qwen API-ключ, провайдеры, совместимые с OpenAI)

Мониторинг вашей экономии

Используйте команду /stats, чтобы увидеть сэкономленные кэшированные токены:

Когда эта функция активна, в статистике отображается, сколько токенов было получено из кэша.
Вы увидите как абсолютное число, так и процент кэшированных токенов.
Пример: «10 500 (90,4%) входных токенов были получены из кэша, что позволило снизить затраты.»

Эта информация отображается только при использовании кэшированных токенов, что происходит при аутентификации с помощью API-ключа, но не при аутентификации OAuth.

Пример отображения статистики

Qwen Code Stats Display

Приведённое выше изображение показывает пример вывода команды /stats, выделяя информацию об экономии за счёт кэшированных токенов.