Qwen Code Wochenupdate: Paralleles Agent-Panel, Auto-Memory standardmäßig aktiv, Worktree Phase D

Qwen Team

2026-05-28

Der Coding-Agent-Bereich wurde diese Woche noch heißer. Cognition kündigte über 1 Mrd. Dollar Finanzierung bei einer Bewertung von 26 Mrd. Dollar an , und Simon Willison erklärte, dass Anthropic und OpenAI über Coding-Agents PMF gefunden haben —auf Kosten deutlich höherer Unternehmensausgaben.

Qwen Code lieferte diese Woche v0.16.2 mit über 30 zusammengeführten PRs in drei Richtungen, die Nutzer am deutlichsten spüren:

Parallele Agents sind endlich sichtbar. Wenn zuvor mehrere Agents gleichzeitig liefen, konnten Sie nur die scrollenden Logs beobachten. Jetzt gibt es ein kompaktes Panel—eine Zeile pro Sub-Agent, Tastaturnavigation, Echtzeit-Fortschritt. Das ist die erste wirklich nutzbare Interaktionsschnittstelle für „Agents, die sich von Single-Thread-Assistenten zu Multi-Thread-Teams entwickeln.”

Gedächtnis braucht keine Konfiguration. auto-dream und auto-skill sind jetzt standardmäßig aktiv. Der Agent lernt Ihre Vorlieben und Projektkonventionen bei der Nutzung und speichert sie sitzungsübergreifend. Neuer /memory-Befehl zum jederzeitigen Anzeigen und Umschalten. Verglichen mit Claude Code, das immer noch manuelle CLAUDE.md-Pflege erfordert, ist das eine deutliche UX-Lücke.

Isolierte Umgebung mit einem Parameter. Worktree rückte von Phase C der letzten Woche (Session-Persistenz) zu Phase D vor—qwen-code --worktree startet direkt in einem unabhängigen Arbeitsbaum, --worktree=#<N> holt Remote-PR-Code. Optionale worktree.symlinkDirectories-Konfiguration verlinkt schwere Verzeichnisse wie node_modules per Symlink zum Hauptrepo und vermeidet redundante Installationen. Kombiniert mit /goal + Auto Approval läuft der Agent eine komplette Aufgabe autonom in Isolation, während der Hauptbranch sauber bleibt.

Zusätzlich gab es diese Woche echte Fortschritte beim Long-Conversation-Overflow: Die automatische Komprimierung wurde von einem einzelnen Schwellenwert zu einer dreistufigen warn / auto / hard Leiter umgestaltet, der verschwendete Freiraum für Großfenster-Modelle sank von 30% auf feste 33K. Headless-Modus erhielt --max-wall-time und --max-tool-calls Laufzeitbudgets—endlich ein hartes Limit für Agents in CI.

✨ Neue Features

Paralleles Agent-Panel: Alle Agents auf einen Blick

Wenn Sie die Coding-Agent-Trends verfolgen, ist „parallel” das meistgenannte Schlüsselwort. Cognitions 26-Mrd.-Dollar-Bewertung verkauft die Geschichte von mehreren Agents, die gleichzeitig arbeiten. Aber wenn mehrere Agents laufen—wie wissen Sie, wer was tut und wo er ist?

Qwen Codes Ansatz: Wenn 2 oder mehr Agents parallel ausgeführt werden, wird automatisch ein kompaktes Inline-Panel (InlineParallelAgentsDisplay) gerendert. Jeder Sub-Agent erhält eine Zeile mit Status, Name, aktuelle Operation, verstrichene Zeit und Token-Verbrauch. Tastatur ↑↓ wechselt den Fokus, Enter erweitert Details für vollständige Ausgabe, Esc kehrt zum Eingabefeld zurück, und Tippen hebt den Fokus automatisch auf—komplett mausfrei.

Was Sie damit tun können:

Wenn /review und ähnliche Befehle mehrere Sub-Agents starten, sehen Sie alle Fortschritte auf einen Blick (Status/Name/Operation/Zeit/Token)
Tastaturnavigation: ↑↓ zum Auswählen, Enter für Details, Esc zurück zur Eingabe—Tippen hebt Fokus automatisch auf
Panel aktualisiert sich in Echtzeit während der Live-Phase, friert dann als scrollbarer Verlauf ein

Siehe PR #4477

Auto-Memory standardmäßig aktiv + /memory Umschalter

Claude Code pusht stark Auto-Memory—Nutzer müssen manuell CLAUDE.md erstellen und Regeln schreiben, damit sich der Agent erinnert. Das Problem: Viele wissen nicht einmal, dass diese Datei existiert, geschweige denn wie man sie pflegt.

Qwen Code hat diese Woche auto-dream und auto-skill standardmäßig aktiviert. Das bedeutet: Was der Agent in Gesprächen lernt (Ihre Vorlieben, Projektkonventionen, häufige Muster) wird automatisch ins Gedächtnis geschrieben und in der nächsten Sitzung geladen. Keine Konfiguration, keine Dateierstellung, funktioniert sofort.

Für manuelle Kontrolle enthält der /memory-Dialog jetzt eine Auto-skill Toggle-Zeile neben den bestehenden Auto-memory und Auto-dream—drei Schalter mit Pfeiltasten navigierbar, Enter zum Umschalten, Einstellungen persistent in .qwen/settings.json des Workspace.

Was Sie damit tun können:

Keine Konfiguration nötig—alle drei Managed-Memory-Subsysteme (Zusammenfassungsgedächtnis, stufenweise Konsolidierung, Skill-Extraktion) sind standardmäßig aktiv
Vorlieben und Projektkonventionen bleiben sitzungsübergreifend erhalten
/memory-Dialog bietet drei Toggle-Zeilen zum jederzeitigen Ein-/Ausschalten
Bestehende explizite Einstellungen bleiben unberührt—neue Standardwerte überschreiben Ihre vorherigen Wahlen nicht

Siehe PR #4547

Worktree Phase D: Direkt in Isolation starten

Letzte Woche erreichte Worktree Phase C—Session-Persistenz + Statusleisten-Anzeige. Diese Woche springt direkt zu Phase D: --worktree beim Start hinzufügen und Qwen Code erstellt automatisch einen unabhängigen Arbeitsbaum. Mit PR-Refs können Sie den Code eines PRs in eine isolierte Umgebung ziehen zum Review oder Weiterentwicklung, ohne den Hauptbranch zu berühren.

Eine weitere praktische Konfiguration: worktree.symlinkDirectories unterstützt das Verlinken schwerer Verzeichnisse wie node_modules und .venv im Worktree zurück zum Hauptrepo per Symlink. Dies ist opt-in—konfigurieren Sie die Pfadliste in .qwen/settings.json, und alle nachfolgenden Worktrees (--worktree, enter_worktree-Tool, Agent-Isolation) wenden es automatisch an. Pfad-Traversierung, absolute Pfade, .git- und .qwen-Verzeichnisse werden sicher abgelehnt.

Was Sie damit tun können:

qwen --worktree betritt Isolation mit einem Parameter—kein manuelles git worktree add
--worktree=#<N> oder GitHub PR URL: holt Remote-PR via git fetch origin pull/<N>/head in einen Worktree
worktree.symlinkDirectories konfigurieren, um große Verzeichnisse per Symlink zu teilen ohne Neuinstallation
Bildet mit der Session-Persistenz + /resume der letzten Woche einen vollständigen Kreislauf

Siehe PR #4381

Headless-Schutz: Laufzeitbudgets für nicht-interaktiven Modus

Anthropic veröffentlichte diese Woche ein Zero Trust AI Agent Security Framework und wies darauf hin, dass ein großes Risiko autonomer Agents ist, „ohne Kontrolle davonzulaufen.” Baoyu (@dotey ) sagt dasselbe: Der Schlüssel zur guten Nutzung von Coding-Agents liegt an beiden Enden—Planung am Anfang und Review am Ende.

Qwen Code hat zwei Laufzeitbudget-Parameter hinzugefügt: --max-wall-time (maximale Laufzeit, unterstützt Formate wie 90, 30s, 5m, 1h) und --max-tool-calls (maximale Tool-Aufrufanzahl). Bei Budgeterschöpfung wird mit Exit-Code 55 beendet, unterscheidbar von Nutzerabbruch (130) und Rundenlimit (53)—CI-Skripte können den Beendigungsgrund genau bestimmen.

Zusätzlich wird bei Verwendung von --yolo (volle Auto-Genehmigung) ohne Sandbox im Headless-Modus eine Sicherheitswarnung auf stderr beim Start ausgegeben, unterdrückbar mit QWEN_CODE_SUPPRESS_YOLO_WARNING=1.

Was Sie damit tun können:

qwen -p "Modul refactoren" --max-wall-time 5m --max-tool-calls 50—harte Limits für Agents in CI
Automatischer Stopp bei Budgeterschöpfung, Exit-Code 55, CI-Skripte unterscheiden „Budget erschöpft” von „normal beendet”
Alle Budgets standardmäßig -1 (unbegrenzt), bestehende Nutzung unberührt
--yolo ohne Sandbox Startwarnung hilft unsichere Konfigurationen zu entdecken

Siehe PR #4502

Dreistufige Auto-Komprimierung: Kein Long-Conversation-Overflow mehr

Simon Willison sagt, Coding-Agents erhöhen die Unternehmenskosten erheblich. Ein Hauptgrund: Der Kontext langer Gespräche wächst stetig, und wenn er sich dem Kontextfenster des Modells nähert, stürzt er entweder ab oder verliert kritische Informationen.

Qwen Code hat die Auto-Komprimierung von einem einzelnen Schwellenwert (ausgelöst bei 70% Fenster) zu einer dreistufigen Leiter umgestaltet, mit doppelter Prüfung von Belegungsanteil und absoluter Bytezahl:

warn-Stufe (≈60% Fenster oder 20K von auto-Stufe): warnt den Nutzer, dass der Kontext Grenzen nähert—eine UX-Frühwarnung
auto-Stufe (≈70% Fenster oder 13K vom Fensterrand): löst proaktiv Komprimierung aus, geringe Kosten, nahezu verlustfreie Gesprächsqualität
hard-Stufe (3K vom Fensterrand): erzwungene Komprimierung—das letzte Sicherheitsnetz bevor die API einen übergroßen Prompt ablehnt

Kleinfenster-Modelle (32K/64K) nutzen den Anteilszweig, Großfenster-Modelle den absoluten Bytezweig—verschwendeter Freiraum sinkt von 30% des Fensters auf ca. 33K festen Overhead.

Was Sie damit tun können:

Lange Gespräche stürzen nicht mehr durch Kontext-Overflow ab—hard-Stufe erzwingt Komprimierung vor API-Ablehnung
Keine manuelle Konfiguration nötig, System berechnet dreistufige Schwellenwerte automatisch nach Modellfenstergröße
Alte chatCompression.contextPercentageThreshold-Konfiguration ist veraltet, gibt Deprecation-Warnung beim Start aus

Siehe PR #4345

Befehlssubstitution nicht mehr direkt abgelehnt: Bestätigung + ⚠️ Warnung

Anthropics Zero Trust Security Framework merkt an, dass Agent-Sicherheitsgrenzen zwischen „nutzbar” und „sicher” balancieren müssen. Qwen Code war zuvor zu strikt: Wenn Agent-generierte Shell-Befehle $(), Backticks, <() oder andere Befehlssubstitutions-Syntax enthielten, wurde die Ausführung pauschal verweigert—selbst YOLO-Modus konnte es nicht umgehen.

Jetzt zeigt es einen Bestätigungsdialog mit ⚠️ „Contains command substitution”-Warnung. Sie sehen die Warnung und wählen Erlauben oder Ablehnen—die Entscheidung liegt bei Ihnen, keine pauschalen Ablehnungen mehr. YOLO-Modus führt normal aus mit Audit-Eintrag in DEBUG-Logs zur nachträglichen Prüfung.

Was Sie damit tun können:

Legitime Szenarien wie $(git rev-parse HEAD) zum Abrufen von Commit-Hashes werden nicht mehr blockiert
Bestätigungsdialog zeigt ⚠️ Warnung, sofort erkennbar dass der Befehl Substitutions-Syntax enthält
YOLO-Modus führt normal aus, DEBUG-Logs behalten Audit-Einträge
Monitor-Tool behebt dasselbe Problem überstrenger Ablehnung

Siehe PR #4386

Weitere neue Features

Feature	PR	Auswirkung
Token Plan Cache Control: Prompt-Cache spart wiederholte Abrechnung	#4495	Token-Plan-Nutzer erhalten automatisch gecachte System-Prompts in aufeinanderfolgenden Gesprächen
memory-leak-debug Skill: Eingebaute Speicherleck-Diagnose	#4468	Agent hat systematischen Heap-Snapshot-Analyse-Workflow für Speicherlecks
Verzeichnisvervollständigung ohne nachfolgendes Leerzeichen	#4288	Tab-Vervollständigung von Verzeichnissen erlaubt weiteres Tippen von Unterpfaden
MCP Server Entfernungen persistent	#4535	Entfernte MCP-Server bleiben nach Neustart entfernt
@ Auslöser braucht vorangestelltes Leerzeichen	#4487	E-Mail-Adressen und anderer @-haltiger Text lösen nicht mehr fälschlich Dateivervollständigung aus
Mehrere Dateipfade einfügen fügt automatisch @ hinzu	#4544	Einfügen mehrerer Pfade vom Terminal konvertiert automatisch zu @-Referenzen
Projektlokaler Kontext .qwen/QWEN.local.md	#4394	`.qwen/QWEN.local.md` im Projektstamm für persönliche lokale Regeln erstellen
new app Prompt zu Skills migriert	#4567	Neue-App-Anleitungsprompts sind flexibler und anpassbar
ACP Streamable HTTP Transport	#4472	Daemon fügt Standard-ACP-Protokoll-Endpunkt für Drittanbieter-UI-Integration hinzu
Daemon followup_suggestion Push	#4507	Web UI pusht automatisch Nächste-Schritte-Vorschläge nach Sitzungsende
Background Agent Parallelitätslimit	#4324	Hintergrund-Agents erschöpfen nicht Ressourcen durch zu viele gleichzeitige Läufe
W3C traceparent Propagation	#4390	Unternehmen können vollständige Aufrufketten für Agent-Anfragen verfolgen
Daemon CORS Allowlist	#4527	`--allow-origin` kontrolliert präzise welche Frontends auf Daemon zugreifen können
Daemon Modellwechsel in Sitzung	#4546	Modelle mitten im Gespräch wechseln ohne Neustart
Daemon Datei-Logging	#4559	Daemon-Laufzeitlogs in Datei geschrieben für einfacheres Debugging
Serve Prompt-Deadline + SSE Idle-Timeout	#4530	Lange nicht-antwortende Anfragen werden automatisch abgebrochen
Serve POST /session/:id/recap	#4504	Sitzungszusammenfassungen für Web-UI-Gesprächsübersichten abrufen

🔧 Wichtige Fehlerbehebungen

PR	Behebung	Auswirkung
#4366	Fix für AbortSignal-Listener-Leak in langen Sitzungen (MaxListenersExceededWarning)	Lange Gespräche geben keine Listener-Overflow-Warnungen mehr aus
#4489	auto-skill überschreibt bestehende Skill-Dateien nicht mehr	Manuell geschriebene Skills werden nicht von automatisch erstellten überschrieben
#4407	safeJsonStringify bewahrt wiederholte Objektreferenzen	Komplexe Datenstrukturen verlieren bei Serialisierung keine Informationen mehr
#4426	Anmeldedaten in Quelldiagnose-Infos unkenntlich gemacht	Fehlermeldungen leaken keine Schlüssel/Tokens mehr
#4371	Mehr gefährliche Interpreter-Regeln entfernt	Agent-Berechtigungsgrenzen sind strikter
#4478	Token Plan Modell-Standardwerte mit ModelStudio abgeglichen	Token-Plan-Nutzer sehen mit der Plattform konsistente Modelllisten
#4512	/context Token-Statistiken mit tatsächlichen API-Anfragen abgeglichen	`/context` zeigt endlich genaue Token-Zahlen
#4465	WeChat-Integration erlaubt Windows-Workspace-Bildpfade	Windows-Nutzer bekommen keine Pfadfehler mehr beim Bildsenden via WeChat
#4464	WeChat-Integration sendet entschlüsselbare Bild-Payloads	Via WeChat gesendete Bilder sind nun für Empfänger sichtbar
#4517	Rohe Modell-abgeleitete Standardwerte aktualisiert	Parameterkonfigurationen aktualisieren sich korrekt nach Modellwechsel
#4461	Startwarnungen in stderr vor TUI-Rendering anzeigen	Startprobleme werden nicht mehr von der TUI-Oberfläche verschluckt
#4470	Fix für veralteten Closure-Race im Textbuffer-Commit-Handler	Schnelle Eingabe-Submits verlieren nicht mehr gelegentlich Inhalte
#4510	Daemon Cross-Client-Sync Nachbesserungen (Epoch-Reset, Approval-Mode-Serialisierung)	Multi-Client-Verbindungen zum selben Daemon haben stabilere Zustandssynchronisation
#4497	Claude Marketplace füllt Resources korrekt wenn auf Ordner zeigend	Ressourcenladung nicht mehr leer bei Nutzung von Claude-Marketplace-Plugins
#4491	SDK canUseTool Timeout in CLI-Kontrollanfragen wirksam	Tool-Call-Timeouts werden in SDK-Integrationen nicht mehr ignoriert
#4453	Veraltete Ausgaben vor Build bereinigen verhindert TS5055	Entwickler beim Bauen aus Quellcode bekommen keine TypeScript-Inkrementalbau-Fehler mehr

🙏 Mitwirkende

Danke an alle Mitwirkenden dieser Woche:

Mitwirkende	Hauptbeiträge
@LaZzyMan	Worktree Phase D, dreistufige Auto-Komprimierung, Auto-Memory Standard-an, auto-skill Überschreib-Fix, Befehlssubstitutions-Berechtigungs-Fix
@wenshao	Paralleles Agent-Panel, @-Auslöser-Fix
@DragonnZhang	Token Plan Cache Control, SDK-Fix, Monitor-Doku
@doudouOUC	W3C traceparent Propagation, Serve Deadline/Recap, AbortSignal-Leak-Fix, Telemetrie
@chiga0	Daemon Modellwechsel in Sitzung, Cross-Client-Sync-Fix
@huww98	memory-leak-debug Skill, Stale-Closure-Fix
@yiliang114	WeChat-Integration-Fixes, OSS-Sync-CI
@BZ-D	Headless-Schutz
@dykebo	Verzeichnisvervollständigungs-Optimierung
@kkhomej33-netizen	Background-Agent-Parallelitätslimit
@pomelo-nwu	/context-Abgleich-Fix, PR-Template-Refactor
@qqqys	Anmeldedaten-Unkenntlichmachung, Interpreter-Regel-Sicherheitshärtung
@Jerry2003826	MCP-Entfernungen-Persistenz, Modell-Standardwerte-Fix
@MikeWang0316tw	Multi-Datei-Einfügen fügt automatisch @ hinzu
@DennisYu07	new app Prompt Migration
@YingchaoX	Token Plan Standardwerte-Abgleich
@ihubanov	safeJsonStringify-Fix
@kagura-agent	Startwarnung-Anzeige (Erstbeitrag 🎉)

Upgrade-Anleitung: Führen Sie npm i @qwen-code/qwen-code@latest -g aus, um die neueste Version zu erhalten.

Bei Fragen oder Vorschlägen eröffnen Sie gerne ein Issue auf GitHub Issues !