Skip to Content
Guia do DesenvolvedorSDK Java (alpha)

Qwen Code Java SDK

O Qwen Code Java SDK é um SDK experimental mínimo para acesso programático às funcionalidades do Qwen Code. Ele fornece uma interface Java para interagir com o CLI do Qwen Code, permitindo que desenvolvedores integrem capacidades do Qwen Code em suas aplicações Java.

Requisitos

  • Java >= 1.8
  • Maven >= 3.6.0 (para compilação a partir do código-fonte)
  • qwen-code >= 0.5.0

Dependências

  • Logging: ch.qos.logback:logback-classic
  • Utilitários: org.apache.commons:commons-lang3
  • Processamento de JSON: com.alibaba.fastjson2:fastjson2
  • Testes: JUnit 5 (org.junit.jupiter:junit-jupiter)

Instalação

Adicione a seguinte dependência ao seu pom.xml do Maven:

<dependency> <groupId>com.alibaba</groupId> <artifactId>qwencode-sdk</artifactId> <version>{$version}</version> </dependency>

Ou se estiver usando Gradle, adicione ao seu build.gradle:

implementation 'com.alibaba:qwencode-sdk:{$version}'

Compilação e Execução

Comandos de Compilação

```markdown # Compilar o projeto mvn compile # Executar os testes mvn test # Empacotar o JAR mvn package # Instalar no repositório local mvn install

Início Rápido

A maneira mais simples de usar o SDK é através do método QwenCodeCli.simpleQuery():

public static void runSimpleExample() { List<String> result = QwenCodeCli.simpleQuery("hello world"); result.forEach(logger::info); }

Para uso mais avançado com opções personalizadas de transporte:

public static void runTransportOptionsExample() { TransportOptions options = new TransportOptions() .setModel("qwen3-coder-flash") .setPermissionMode(PermissionMode.AUTO_EDIT) .setCwd("./") .setEnv(new HashMap<String, String>() {{put("CUSTOM_VAR", "value");}}) .setIncludePartialMessages(true) .setTurnTimeout(new Timeout(120L, TimeUnit.SECONDS)) .setMessageTimeout(new Timeout(90L, TimeUnit.SECONDS)) .setAllowedTools(Arrays.asList("read_file", "write_file", "list_directory")); List<String> result = QwenCodeCli.simpleQuery("who are you, what are your capabilities?", options); result.forEach(logger::info); }

Para manipulação de conteúdo em streaming com consumidores de conteúdo personalizados:

public static void runStreamingExample() { QwenCodeCli.simpleQuery("who are you, what are your capabilities?", new TransportOptions().setMessageTimeout(new Timeout(10L, TimeUnit.SECONDS)), new AssistantContentSimpleConsumers() { @Override public void onText(Session session, TextAssistantContent textAssistantContent) { logger.info("Conteúdo de texto recebido: {}", textAssistantContent.getText()); } @Override public void onThinking(Session session, ThingkingAssistantContent thingkingAssistantContent) { logger.info("Conteúdo de raciocínio recebido: {}", thingkingAssistantContent.getThinking()); } @Override public void onToolUse(Session session, ToolUseAssistantContent toolUseContent) { logger.info("Conteúdo de uso de ferramenta recebido: {} com argumentos: {}", toolUseContent, toolUseContent.getInput()); } @Override public void onToolResult(Session session, ToolResultAssistantContent toolResultContent) { logger.info("Conteúdo de resultado da ferramenta recebido: {}", toolResultContent.getContent()); } @Override public void onOtherContent(Session session, AssistantContent<?> other) { logger.info("Outro conteúdo recebido: {}", other); } @Override public void onUsage(Session session, AssistantUsage assistantUsage) { logger.info("Informações de uso recebidas: Tokens de entrada: {}, Tokens de saída: {}", assistantUsage.getUsage().getInputTokens(), assistantUsage.getUsage().getOutputTokens()); } }.setDefaultPermissionOperation(Operation.allow)); logger.info("Exemplo de streaming concluído."); }

outros exemplos veja src/test/java/com/alibaba/qwen/code/cli/example

Arquitetura

O SDK segue uma arquitetura em camadas:

  • Camada de API: Fornece os pontos de entrada principais através da classe QwenCodeCli com métodos estáticos simples para uso básico
  • Camada de Sessão: Gerencia as sessões de comunicação com o Qwen Code CLI por meio da classe Session
  • Camada de Transporte: Lida com o mecanismo de comunicação entre o SDK e o processo CLI (atualmente usando transporte de processo via ProcessTransport)
  • Camada de Protocolo: Define estruturas de dados para comunicação com base no protocolo CLI
  • Utilitários: Utilitários comuns para execução concorrente, tratamento de tempo limite e gerenciamento de erros

Recursos Principais

Modos de Permissão

O SDK suporta diferentes modos de permissão para controlar a execução das ferramentas:

  • default: Ferramentas de escrita são negadas, a menos que sejam aprovadas por meio do callback canUseTool ou estejam em allowedTools. Ferramentas somente leitura são executadas sem confirmação.
  • plan: Bloqueia todas as ferramentas de escrita, instruindo a IA a apresentar primeiro um plano.
  • auto-edit: Aprova automaticamente ferramentas de edição (edit, write_file), enquanto outras ferramentas exigem confirmação.
  • yolo: Todas as ferramentas são executadas automaticamente sem confirmação.

Consumidores de Eventos de Sessão e Consumidores de Conteúdo do Assistente

O SDK fornece duas interfaces principais para lidar com eventos e conteúdo provenientes da CLI:

Interface SessionEventConsumers

A interface SessionEventConsumers fornece callbacks para diferentes tipos de mensagens durante uma sessão:

  • onSystemMessage: Trata mensagens do sistema da CLI (recebe Session e SDKSystemMessage)
  • onResultMessage: Trata mensagens de resultado da CLI (recebe Session e SDKResultMessage)
  • onAssistantMessage: Trata mensagens do assistente (respostas de IA) (recebe Session e SDKAssistantMessage)
  • onPartialAssistantMessage: Trata mensagens parciais do assistente durante o streaming (recebe Session e SDKPartialAssistantMessage)
  • onUserMessage: Trata mensagens do usuário (recebe Session e SDKUserMessage)
  • onOtherMessage: Trata outros tipos de mensagens (recebe Session e mensagem String)
  • onControlResponse: Trata respostas de controle (recebe Session e CLIControlResponse)
  • onControlRequest: Trata requisições de controle (recebe Session e CLIControlRequest, retorna CLIControlResponse)
  • onPermissionRequest: Trata requisições de permissão (recebe Session e CLIControlRequest, retorna Behavior)

Interface AssistantContentConsumers

A interface AssistantContentConsumers lida com diferentes tipos de conteúdo dentro das mensagens do assistente:

  • onText: Lida com conteúdo de texto (recebe Sessão e TextAssistantContent)
  • onThinking: Lida com conteúdo de pensamento (recebe Sessão e ThingkingAssistantContent)
  • onToolUse: Lida com uso de ferramentas (recebe Sessão e ToolUseAssistantContent)
  • onToolResult: Lida com resultados de ferramentas (recebe Sessão e ToolResultAssistantContent)
  • onOtherContent: Lida com outros tipos de conteúdo (recebe Sessão e AssistantContent)
  • onUsage: Lida com informações de uso (recebe Sessão e AssistantUsage)
  • onPermissionRequest: Lida com solicitações de permissão (recebe Sessão e CLIControlPermissionRequest, retorna Comportamento)
  • onOtherControlRequest: Lida com outras solicitações de controle (recebe Sessão e ControlRequestPayload, retorna ControlResponsePayload)

Relação Entre as Interfaces

Nota Importante sobre Hierarquia de Eventos:

  • SessionEventConsumers é o processador de eventos de alto nível que lida com diferentes tipos de mensagens (sistema, assistente, usuário, etc.)
  • AssistantContentConsumers é o processador de conteúdo de baixo nível que lida com diferentes tipos de conteúdo dentro das mensagens do assistente (texto, ferramentas, raciocínio, etc.)

Relação entre Processadores:

  • SessionEventConsumersAssistantContentConsumers (SessionEventConsumers utiliza AssistantContentConsumers para processar conteúdo dentro das mensagens do assistente)

Relações de Derivação de Eventos:

  • onAssistantMessageonText, onThinking, onToolUse, onToolResult, onOtherContent, onUsage
  • onPartialAssistantMessageonText, onThinking, onToolUse, onToolResult, onOtherContent
  • onControlRequestonPermissionRequest, onOtherControlRequest

Relações de Tempo Limite de Eventos:

Cada método de manipulação de evento possui um método de tempo limite correspondente que permite personalizar o comportamento de tempo limite para esse evento específico:

  • onSystemMessageonSystemMessageTimeout
  • onResultMessageonResultMessageTimeout
  • onAssistantMessageonAssistantMessageTimeout
  • onPartialAssistantMessageonPartialAssistantMessageTimeout
  • onUserMessageonUserMessageTimeout
  • onOtherMessageonOtherMessageTimeout
  • onControlResponseonControlResponseTimeout
  • onControlRequestonControlRequestTimeout

Para métodos de tempo limite do AssistantContentConsumers:

  • onTextonTextTimeout
  • onThinkingonThinkingTimeout
  • onToolUseonToolUseTimeout
  • onToolResultonToolResultTimeout
  • onOtherContentonOtherContentTimeout
  • onPermissionRequestonPermissionRequestTimeout
  • onOtherControlRequestonOtherControlRequestTimeout

Valores Padrão de Tempo Limite:

  • Tempo limite padrão do SessionEventSimpleConsumers: 180 segundos (Timeout.TIMEOUT_180_SECONDS)
  • Tempo limite padrão do AssistantContentSimpleConsumers: 60 segundos (Timeout.TIMEOUT_60_SECONDS)

Requisitos de Hierarquia de Tempo Limite:

Para funcionamento adequado, as seguintes relações de tempo limite devem ser mantidas:

  • O valor retornado por onAssistantMessageTimeout deve ser maior que os valores retornados por onTextTimeout, onThinkingTimeout, onToolUseTimeout, onToolResultTimeout e onOtherContentTimeout
  • O valor retornado por onControlRequestTimeout deve ser maior que os valores retornados por onPermissionRequestTimeout e onOtherControlRequestTimeout

Opções de Transporte

A classe TransportOptions permite configurar como o SDK se comunica com o CLI do Qwen Code:

  • pathToQwenExecutable: Caminho para o executável do CLI do Qwen Code
  • cwd: Diretório de trabalho para o processo do CLI
  • model: Modelo de IA a ser usado na sessão
  • permissionMode: Modo de permissão que controla a execução de ferramentas
  • env: Variáveis de ambiente a serem passadas para o processo do CLI
  • maxSessionTurns: Limita o número de rodadas de conversa em uma sessão
  • coreTools: Lista de ferramentas principais que devem estar disponíveis para a IA
  • excludeTools: Lista de ferramentas a serem excluídas e não disponibilizadas para a IA
  • allowedTools: Lista de ferramentas pré-aprovadas para uso sem confirmação adicional
  • authType: Tipo de autenticação a ser usado na sessão
  • includePartialMessages: Habilita o recebimento de mensagens parciais durante respostas em streaming
  • skillsEnable: Habilita ou desabilita a funcionalidade de habilidades para a sessão
  • turnTimeout: Tempo limite para uma rodada completa de conversa
  • messageTimeout: Tempo limite para mensagens individuais dentro de uma rodada
  • resumeSessionId: ID de uma sessão anterior para retomar
  • otherOptions: Opções adicionais de linha de comando a serem passadas para o CLI

Recursos de Controle de Sessão

  • Criação de sessão: Use QwenCodeCli.newSession() para criar uma nova sessão com opções personalizadas
  • Gerenciamento de sessão: A classe Session fornece métodos para enviar prompts, lidar com respostas e gerenciar o estado da sessão
  • Limpeza de sessão: Sempre feche as sessões usando session.close() para encerrar adequadamente o processo CLI
  • Retomada de sessão: Use setResumeSessionId() em TransportOptions para retomar uma sessão anterior
  • Interrupção de sessão: Use session.interrupt() para interromper um prompt atualmente em execução
  • Troca dinâmica de modelo: Use session.setModel() para alterar o modelo durante uma sessão
  • Troca dinâmica de modo de permissão: Use session.setPermissionMode() para alterar o modo de permissão durante uma sessão

Configuração do Pool de Threads

O SDK usa um pool de threads para gerenciar operações concorrentes com a seguinte configuração padrão:

  • Tamanho do Pool Principal: 30 threads
  • Tamanho Máximo do Pool: 100 threads
  • Tempo de Manutenção (Keep-Alive): 60 segundos
  • Capacidade da Fila: 300 tarefas (usando LinkedBlockingQueue)
  • Nomeação das Threads: “qwen_code_cli-pool-{número}”
  • Threads Daemon: falso
  • Manipulador de Execução Rejeitada: CallerRunsPolicy

Tratamento de Erros

O SDK fornece tipos específicos de exceções para diferentes cenários de erro:

  • SessionControlException: Lançada quando há um problema com o controle da sessão (criação, inicialização, etc.)
  • SessionSendPromptException: Lançada quando há um problema ao enviar um prompt ou receber uma resposta
  • SessionClosedException: Lançada ao tentar usar uma sessão fechada

Perguntas Frequentes / Solução de Problemas

P: Preciso instalar o Qwen CLI separadamente?

R: Sim, requer Qwen CLI 0.5.5 ou superior.

P: Quais versões do Java são suportadas?

R: O SDK requer Java 1.8 ou superior.

P: Como faço para lidar com requisições de longa duração?

R: O SDK inclui utilitários de tempo limite. Você pode configurar os tempos limite usando a classe Timeout em TransportOptions.

P: Por que algumas ferramentas não estão sendo executadas?

R: Isso provavelmente se deve aos modos de permissão. Verifique suas configurações de modo de permissão e considere usar allowedTools para pré-aprovar determinadas ferramentas.

P: Como faço para retomar uma sessão anterior?

R: Use o método setResumeSessionId() em TransportOptions para retomar uma sessão anterior.

P: Posso personalizar o ambiente para o processo da CLI?

R: Sim, utilize o método setEnv() em TransportOptions para passar variáveis de ambiente ao processo da CLI.

Licença

Apache-2.0 - veja LICENSE para detalhes.

Last updated on