Skip to Content
Guide développeurSDK Java (version alpha)

Qwen Code Java SDK

Le SDK Java Qwen Code est un SDK expérimental minimal permettant un accès programmatique aux fonctionnalités de Qwen Code. Il fournit une interface Java pour interagir avec la CLI Qwen Code, permettant aux développeurs d’intégrer les capacités de Qwen Code dans leurs applications Java.

Prérequis

  • Java >= 1.8
  • Maven >= 3.6.0 (pour la compilation depuis les sources)
  • qwen-code >= 0.5.0

Dépendances

  • Logging : ch.qos.logback:logback-classic
  • Utilities : org.apache.commons:commons-lang3
  • JSON Processing : com.alibaba.fastjson2:fastjson2
  • Testing : JUnit 5 (org.junit.jupiter:junit-jupiter)

Installation

Ajoutez la dépendance suivante à votre fichier Maven pom.xml :

<dependency> <groupId>com.alibaba</groupId> <artifactId>qwencode-sdk</artifactId> <version>{$version}</version> </dependency>

Ou si vous utilisez Gradle, ajoutez-le à votre build.gradle :

implementation 'com.alibaba:qwencode-sdk:{$version}'

Compilation et exécution

Commandes de compilation

# Compile le projet mvn compile # Exécute les tests mvn test # Génère le JAR mvn package # Installe dans le dépôt local mvn install

Démarrage rapide

La manière la plus simple d’utiliser le SDK est via la méthode QwenCodeCli.simpleQuery() :

public static void runSimpleExample() { List<String> result = QwenCodeCli.simpleQuery("hello world"); result.forEach(logger::info); }

Pour une utilisation plus avancée avec des options de transport personnalisées :

public static void runTransportOptionsExample() { TransportOptions options = new TransportOptions() .setModel("qwen3-coder-flash") .setPermissionMode(PermissionMode.AUTO_EDIT) .setCwd("./") .setEnv(new HashMap<String, String>() {{put("CUSTOM_VAR", "value");}}) .setIncludePartialMessages(true) .setTurnTimeout(new Timeout(120L, TimeUnit.SECONDS)) .setMessageTimeout(new Timeout(90L, TimeUnit.SECONDS)) .setAllowedTools(Arrays.asList("read_file", "write_file", "list_directory")); List<String> result = QwenCodeCli.simpleQuery("who are you, what are your capabilities?", options); result.forEach(logger::info); }

Pour la gestion du streaming avec des consommateurs de contenu personnalisés :

public static void runStreamingExample() { QwenCodeCli.simpleQuery("who are you, what are your capabilities?", new TransportOptions().setMessageTimeout(new Timeout(10L, TimeUnit.SECONDS)), new AssistantContentSimpleConsumers() { @Override public void onText(Session session, TextAssistantContent textAssistantContent) { logger.info("Text content received: {}", textAssistantContent.getText()); } @Override public void onThinking(Session session, ThinkingAssistantContent thinkingAssistantContent) { logger.info("Thinking content received: {}", thinkingAssistantContent.getThinking()); } @Override public void onToolUse(Session session, ToolUseAssistantContent toolUseContent) { logger.info("Tool use content received: {} with arguments: {}", toolUseContent, toolUseContent.getInput()); } @Override public void onToolResult(Session session, ToolResultAssistantContent toolResultContent) { logger.info("Tool result content received: {}", toolResultContent.getContent()); } @Override public void onOtherContent(Session session, AssistantContent<?> other) { logger.info("Other content received: {}", other); } @Override public void onUsage(Session session, AssistantUsage assistantUsage) { logger.info("Usage information received: Input tokens: {}, Output tokens: {}", assistantUsage.getUsage().getInputTokens(), assistantUsage.getUsage().getOutputTokens()); } }.setDefaultPermissionOperation(Operation.allow)); logger.info("Streaming example completed."); }

Pour d’autres exemples, consultez src/test/java/com/alibaba/qwen/code/cli/example

Architecture

Le SDK suit une architecture en couches :

  • Couche API : Fournit les points d’entrée principaux via la classe QwenCodeCli avec des méthodes statiques simples pour une utilisation basique
  • Couche Session : Gère les sessions de communication avec la CLI Qwen Code via la classe Session
  • Couche Transport : Gère le mécanisme de communication entre le SDK et le processus CLI (actuellement via le transport de processus avec ProcessTransport)
  • Couche Protocole : Définit les structures de données pour la communication basée sur le protocole CLI
  • Utils : Utilitaires communs pour l’exécution concurrente, la gestion des timeouts et la gestion des erreurs

Fonctionnalités principales

Modes de permission

Le SDK prend en charge différents modes de permission pour contrôler l’exécution des outils :

  • default : Les outils d’écriture sont refusés sauf s’ils sont approuvés via le callback canUseTool ou dans allowedTools. Les outils en lecture seule s’exécutent sans confirmation.
  • plan : Bloque tous les outils d’écriture, en demandant à l’IA de présenter d’abord un plan.
  • auto-edit : Approuve automatiquement les outils d’édition (edit, write_file) tandis que les autres outils nécessitent une confirmation.
  • yolo : Tous les outils s’exécutent automatiquement sans confirmation.

Consommateurs d’événements de session et consommateurs de contenu d’assistant

Le SDK fournit deux interfaces clés pour gérer les événements et le contenu provenant de la CLI :

Interface SessionEventConsumers

L’interface SessionEventConsumers fournit des callbacks pour différents types de messages lors d’une session :

  • onSystemMessage : Gère les messages système de la CLI (reçoit Session et SDKSystemMessage)
  • onResultMessage : Gère les messages de résultat de la CLI (reçoit Session et SDKResultMessage)
  • onAssistantMessage : Gère les messages de l’assistant (réponses IA) (reçoit Session et SDKAssistantMessage)
  • onPartialAssistantMessage : Gère les messages partiels de l’assistant pendant le streaming (reçoit Session et SDKPartialAssistantMessage)
  • onUserMessage : Gère les messages utilisateur (reçoit Session et SDKUserMessage)
  • onOtherMessage : Gère les autres types de messages (reçoit Session et un message String)
  • onControlResponse : Gère les réponses de contrôle (reçoit Session et CLIControlResponse)
  • onControlRequest : Gère les requêtes de contrôle (reçoit Session et CLIControlRequest, retourne CLIControlResponse)
  • onPermissionRequest : Gère les requêtes de permission (reçoit Session et CLIControlRequest<CLIControlPermissionRequest>, retourne Behavior)

Interface AssistantContentConsumers

L’interface AssistantContentConsumers gère différents types de contenu dans les messages de l’assistant :

  • onText : Gère le contenu textuel (reçoit Session et TextAssistantContent)
  • onThinking : Gère le contenu de réflexion (reçoit Session et ThinkingAssistantContent)
  • onToolUse : Gère le contenu d’utilisation d’outil (reçoit Session et ToolUseAssistantContent)
  • onToolResult : Gère le contenu de résultat d’outil (reçoit Session et ToolResultAssistantContent)
  • onOtherContent : Gère les autres types de contenu (reçoit Session et AssistantContent)
  • onUsage : Gère les informations d’utilisation (reçoit Session et AssistantUsage)
  • onPermissionRequest : Gère les requêtes de permission (reçoit Session et CLIControlPermissionRequest, retourne Behavior)
  • onOtherControlRequest : Gère les autres requêtes de contrôle (reçoit Session et ControlRequestPayload, retourne ControlResponsePayload)

Relation entre les interfaces

Remarque importante sur la hiérarchie des événements :

  • SessionEventConsumers est le processeur d’événements de haut niveau qui gère les différents types de messages (système, assistant, utilisateur, etc.)
  • AssistantContentConsumers est le processeur de contenu de bas niveau qui gère les différents types de contenu dans les messages de l’assistant (texte, outils, réflexion, etc.)

Relation entre les processeurs :

  • SessionEventConsumersAssistantContentConsumers (SessionEventConsumers utilise AssistantContentConsumers pour traiter le contenu des messages de l’assistant)

Relations de dérivation des événements :

  • onAssistantMessageonText, onThinking, onToolUse, onToolResult, onOtherContent, onUsage
  • onPartialAssistantMessageonText, onThinking, onToolUse, onToolResult, onOtherContent
  • onControlRequestonPermissionRequest, onOtherControlRequest

Relations de timeout des événements :

Chaque méthode de gestion d’événement dispose d’une méthode de timeout correspondante permettant de personnaliser le comportement de timeout pour cet événement spécifique :

  • onSystemMessageonSystemMessageTimeout
  • onResultMessageonResultMessageTimeout
  • onAssistantMessageonAssistantMessageTimeout
  • onPartialAssistantMessageonPartialAssistantMessageTimeout
  • onUserMessageonUserMessageTimeout
  • onOtherMessageonOtherMessageTimeout
  • onControlResponseonControlResponseTimeout
  • onControlRequestonControlRequestTimeout

Pour les méthodes de timeout de AssistantContentConsumers :

  • onTextonTextTimeout
  • onThinkingonThinkingTimeout
  • onToolUseonToolUseTimeout
  • onToolResultonToolResultTimeout
  • onOtherContentonOtherContentTimeout
  • onPermissionRequestonPermissionRequestTimeout
  • onOtherControlRequestonOtherControlRequestTimeout

Valeurs de timeout par défaut :

  • Timeout par défaut de SessionEventSimpleConsumers : 180 secondes (Timeout.TIMEOUT_180_SECONDS)
  • Timeout par défaut de AssistantContentSimpleConsumers : 60 secondes (Timeout.TIMEOUT_60_SECONDS)

Exigences de hiérarchie des timeouts :

Pour un fonctionnement correct, les relations de timeout suivantes doivent être respectées :

  • La valeur de retour de onAssistantMessageTimeout doit être supérieure aux valeurs de retour de onTextTimeout, onThinkingTimeout, onToolUseTimeout, onToolResultTimeout et onOtherContentTimeout
  • La valeur de retour de onControlRequestTimeout doit être supérieure aux valeurs de retour de onPermissionRequestTimeout et onOtherControlRequestTimeout

Options de transport

La classe TransportOptions permet de configurer la manière dont le SDK communique avec la CLI Qwen Code :

  • pathToQwenExecutable : Chemin vers l’exécutable de la CLI Qwen Code
  • cwd : Répertoire de travail pour le processus CLI
  • model : Modèle IA à utiliser pour la session
  • permissionMode : Mode de permission contrôlant l’exécution des outils
  • env : Variables d’environnement à transmettre au processus CLI
  • maxSessionTurns : Limite le nombre de tours de conversation dans une session
  • coreTools : Liste des outils principaux devant être disponibles pour l’IA
  • excludeTools : Liste des outils à exclure de la disponibilité pour l’IA
  • allowedTools : Liste des outils pré-approuvés pour une utilisation sans confirmation supplémentaire
  • authType : Type d’authentification à utiliser pour la session
  • includePartialMessages : Active la réception de messages partiels pendant les réponses en streaming
  • turnTimeout : Timeout pour un tour de conversation complet
  • messageTimeout : Timeout pour les messages individuels au sein d’un tour
  • resumeSessionId : ID d’une session précédente à reprendre
  • otherOptions : Options de ligne de commande supplémentaires à transmettre à la CLI

Fonctionnalités de contrôle de session

  • Création de session : Utilisez QwenCodeCli.newSession() pour créer une nouvelle session avec des options personnalisées
  • Gestion de session : La classe Session fournit des méthodes pour envoyer des prompts, gérer les réponses et contrôler l’état de la session
  • Nettoyage de session : Fermez toujours les sessions avec session.close() pour terminer correctement le processus CLI
  • Reprise de session : Utilisez setResumeSessionId() dans TransportOptions pour reprendre une session précédente
  • Interruption de session : Utilisez session.interrupt() pour interrompre un prompt en cours d’exécution
  • Changement dynamique de modèle : Utilisez session.setModel() pour modifier le modèle pendant une session
  • Changement dynamique de mode de permission : Utilisez session.setPermissionMode() pour modifier le mode de permission pendant une session

Configuration du pool de threads

Le SDK utilise un pool de threads pour gérer les opérations concurrentes avec la configuration par défaut suivante :

  • Taille du pool de base : 30 threads
  • Taille maximale du pool : 100 threads
  • Temps de maintien en vie (Keep-Alive) : 60 secondes
  • Capacité de la file d’attente : 300 tâches (via LinkedBlockingQueue)
  • Nommage des threads : "qwen_code_cli-pool-{number}"
  • Threads daemon : false
  • Gestionnaire de rejet d’exécution : CallerRunsPolicy

Gestion des erreurs

Le SDK fournit des types d’exceptions spécifiques pour différents scénarios d’erreur :

  • SessionControlException : Levée en cas de problème avec le contrôle de session (création, initialisation, etc.)
  • SessionSendPromptException : Levée en cas de problème lors de l’envoi d’un prompt ou de la réception d’une réponse
  • SessionClosedException : Levée lors d’une tentative d’utilisation d’une session fermée

FAQ / Dépannage

Q : Dois-je installer la CLI Qwen séparément ?

R : Oui, la CLI Qwen version 0.5.5 ou supérieure est requise.

Q : Quelles versions de Java sont prises en charge ?

R : Le SDK nécessite Java 1.8 ou supérieur.

Q : Comment gérer les requêtes de longue durée ?

R : Le SDK inclut des utilitaires de timeout. Vous pouvez configurer les timeouts via la classe Timeout dans TransportOptions.

Q : Pourquoi certains outils ne s’exécutent-ils pas ?

R : Cela est probablement dû aux modes de permission. Vérifiez vos paramètres de mode de permission et envisagez d’utiliser allowedTools pour pré-approuver certains outils.

Q : Comment reprendre une session précédente ?

R : Utilisez la méthode setResumeSessionId() dans TransportOptions pour reprendre une session précédente.

Q : Puis-je personnaliser l’environnement pour le processus CLI ?

R : Oui, utilisez la méthode setEnv() dans TransportOptions pour transmettre des variables d’environnement au processus CLI.

Licence

Apache-2.0 - consultez LICENSE pour plus de détails.

Last updated on