Skip to Content
Featuresトークンキャッシング

トークンキャッシングとコスト最適化

Qwen Code は、API キー認証を使用している場合(例:OpenAI 互換プロバイダー)、トークンキャッシングを通じて API コストを自動的に最適化します。この機能は、以前のシステム指示とコンテキストを再利用して、後続のリクエストで処理されるトークン数を削減します。

トークンキャッシングが利用可能なのは以下のユーザーです:

  • API キー認証ユーザー(Qwen API キー)
  • Vertex AI ユーザー(プロジェクトとロケーションの設定済み)

トークンキャッシングが利用できないのは以下のユーザーです:

  • OAuth ユーザー(Google 個人/エンタープライズアカウント)- 現在のところ、Code Assist API はキャッシュされたコンテンツの作成をサポートしていません

トークン使用量とキャッシュされたトークンによる節約量は、/stats コマンドで確認できます。キャッシュされたトークンがある場合、その情報は stats の出力に表示されます。

Last updated on