Leistungsoptimierung: Antwortgeschwindigkeit steigern
Was Sie nach diesem Lernen können
- Wählen Sie das geeignete Modell basierend auf der Aufgabenkomplexität und balancieren Sie Kosten und Leistung
- Verwalten Sie effektiv das Kontextfenster und vermeiden Sie das Erreichen der Grenzen
- Konfigurieren Sie MCP-Server sinnvoll, um den verfügbaren Kontext zu maximieren
- Verwenden Sie strategische Komprimierung, um den Dialogzusammenhang logisch zu erhalten
Ihre aktuelle Herausforderung
Claude Code reagiert langsam? Das Kontextfenster ist schnell voll? Unklar, wann Sie Haiku, Sonnet oder Opus verwenden sollen? Diese Probleme können die Entwicklungseffizienz erheblich beeinträchtigen.
Kernprinzip
Das Kernstück der Leistungsoptimierung ist das richtige Werkzeug zur richtigen Zeit. Die Auswahl von Modellen, die Verwaltung von Kontext, die Konfiguration von MCP – all dies ist ein Trade-off: Geschwindigkeit vs. Intelligenz, Kosten vs. Qualität.
Schlüsselkonzept
Das Kontextfenster ist die Länge des Dialogverlaufs, den Claude "erinnern" kann. Die aktuellen Modelle unterstützen ca. 200k Tokens, dies wird jedoch durch Faktoren wie die Anzahl der MCP-Server, die Häufigkeit der Werkzeugaufrufe usw. beeinflusst.
Häufige Leistungsprobleme
Problem 1: Langsame Antwortgeschwindigkeit
Symptome: Auch einfache Aufgaben dauern lange
Mögliche Ursachen:
- Verwendung von Opus für einfache Aufgaben
- Zu langer Kontext, der viel Historie verarbeiten muss
- Zu viele MCP-Server aktiviert
Lösungen:
- Verwenden Sie Haiku für leichte Aufgaben
- Komprimieren Sie regelmäßig den Kontext
- Reduzieren Sie die Anzahl der aktivierten MCPs
Problem 2: Kontextfenster schnell voll
Symptome: Nach kurzer Entwicklungszeit muss komprimiert oder die Sitzung neu gestartet werden
Mögliche Ursachen:
- Zu viele MCP-Server aktiviert (jeder MCP belegt Kontext)
- Dialoghistorie nicht rechtzeitig komprimiert
- Komplexe Werkzeugaufrufketten verwendet
Lösungen:
- Aktivieren Sie MCP bei Bedarf, deaktivieren Sie ungenutzte mit
disabledMcpServers - Verwenden Sie strategische Komprimierung, komprimieren Sie manuell an Aufgabengrenzen
- Vermeiden Sie unnötiges Dateilesen und -suchen
Problem 3: Schneller Token-Verbrauch
Symptome: Kontingent schnell verbraucht, hohe Kosten
Mögliche Ursachen:
- Immer Opus für Aufgaben verwenden
- Wiederholtes Lesen großer Dateien
- Keine sinnvolle Nutzung von Komprimierung
Lösungen:
- Wählen Sie das Modell basierend auf der Aufgabenkomplexität
- Verwenden Sie
/compactfür aktive Komprimierung - Nutzen Sie strategic-compact Hooks für intelligente Erinnerungen
Strategien zur Modellauswahl
Die Wahl des passenden Modells basierend auf der Aufgabenkomplexität kann die Leistung erheblich steigern und die Kosten senken.
Haiku 4.5 (90% Sonnet-Fähigkeiten, 3x Kosteneinsparung)
Anwendungsszenarien:
- Leichte Agenten, häufige Aufrufe
- Pair Programming und Code-Generierung
- Worker-Agents in Multi-Agent-Systemen
Beispiel:
Einfache Code-Änderungen, Formatierung, Kommentar-Generierung
Verwenden Sie HaikuSonnet 4.5 (Bestes Codierungsmodell)
Anwendungsszenarien:
- Hauptentwicklungsarbeit
- Koordination von Multi-Agent-Workflows
- Komplexe Codierungsaufgaben
Beispiel:
Implementierung neuer Funktionen, Refactoring, Behebung komplexer Bugs
Verwenden Sie SonnetOpus 4.5 (Stärkste Inferenzfähigkeit)
Anwendungsszenarien:
- Komplexe Architekturentscheidungen
- Aufgaben, die maximale Inferenztiefe erfordern
- Forschungs- und Analyseaufgaben
Beispiel:
Systemdesign, Sicherheitsaudit, komplexe Problembehebung
Verwenden Sie Opus::: Tipp Modellauswahl-Hinweis
Geben Sie das Modell in der Agenten-Konfiguration über das Feld model an:
---
name: my-agent
model: haiku # oder sonnet, opus
---:::
Verwaltung des Kontextfensters
Die zu intensive Nutzung des Kontextfensters kann die Leistung beeinträchtigen und sogar zum Scheitern von Aufgaben führen.
Aufgaben, die die letzten 20% des Kontextfensters vermeiden sollten
Für diese Aufgaben wird empfohlen, zuerst den Kontext zu komprimieren:
- Großes Refactoring
- Funktionsimplementierung über mehrere Dateien
- Debugging komplexer Interaktionen
Aufgaben mit geringerer Kontextabhängigkeit
Diese Aufgaben haben geringe Kontextanforderungen und können fortgesetzt werden, wenn die Grenze erreicht ist:
- Einzeldatei-Bearbeitung
- Erstellung unabhängiger Werkzeuge
- Dokumentationsupdates
- Einfache Bug-Behebungen
Wichtiger Hinweis
Das Kontextfenster wird von folgenden Faktoren beeinflusst:
- Anzahl der aktivierten MCP-Server
- Anzahl der Werkzeugaufrufe
- Länge der Dialoghistorie
- Dateioperationen in der aktuellen Sitzung
MCP-Konfigurationsoptimierung
MCP-Server sind eine wichtige Möglichkeit, die Fähigkeiten von Claude Code zu erweitern, aber jeder MCP belegt Kontext.
Grundprinzipien
Gemäß den Empfehlungen der README:
{
"mcpServers": {
"mcp-server-1": { ... },
"mcp-server-2": { ... }
// ... weitere Konfigurationen
},
"disabledMcpServers": [
"mcp-server-3",
"mcp-server-4"
// Deaktivieren Sie ungenutzte MCPs
]
}Best Practices:
- Sie können 20-30 MCP-Server konfigurieren
- Aktivieren Sie nicht mehr als 10 pro Projekt
- Halten Sie die Anzahl aktiver Werkzeuge unter 80
MCP bei Bedarf aktivieren
Wählen Sie relevante MCPs basierend auf dem Projekttyp:
| Projekttyp | Empfohlene Aktivierung | Optional |
|---|---|---|
| Frontend-Projekt | Vercel, Magic | Filesystem, GitHub |
| Backend-Projekt | Supabase, ClickHouse | GitHub, Railway |
| Full-Stack-Projekt | Alle | - |
| Tool-Bibliothek | GitHub | Filesystem |
::: Tipp Wie man MCP wechselt
Verwenden Sie in der Projektkonfiguration (~/.claude/settings.json) disabledMcpServers:
{
"disabledMcpServers": ["cloudflare-observability", "clickhouse-io"]
}:::
Strategische Komprimierung
Automatische Komprimierung kann jederzeit ausgelöst werden und möglicherweise die Aufgabenlogik unterbrechen. Strategische Komprimierung wird manuell an Aufgabengrenzen ausgeführt und erhält den logischen Zusammenhang.
Warum strategische Komprimierung notwendig ist
Probleme der automatischen Komprimierung:
- Wird oft mitten in der Aufgabe ausgelöst, verliert wichtigen Kontext
- Kennt keine logischen Aufgabengrenzen
- Kann komplexe mehrstufige Operationen unterbrechen
Vorteile der strategischen Komprimierung:
- Komprimierung an Aufgabengrenzen, behält wichtige Informationen
- Klarere Logik
- Vermeidet Unterbrechung wichtiger Prozesse
Beste Komprimierungszeitpunkte
- Nach der Erkundung, vor der Ausführung - Komprimieren Sie den Forschungskontext, behalten Sie den Implementierungsplan
- Nach Abschluss eines Meilensteins - Neustart für die nächste Phase
- Vor dem Aufgabenwechsel - Bereinigen Sie den Erkundungskontext, bereiten Sie die neue Aufgabe vor
Strategic Compact Hook
Dieses Plugin enthält die strategic-compact Skill, die Sie automatisch daran erinnert, wann Sie komprimieren sollten.
Funktionsweise des Hooks:
- Verfolgt die Anzahl der Werkzeugaufrufe
- Erinnert beim Erreichen des Schwellenwerts (standardmäßig 50 Aufrufe)
- Danach alle 25 Aufrufe erneut
Schwellenwert konfigurieren:
# Umgebungsvariable setzen
export COMPACT_THRESHOLD=40Hook-Konfiguration (bereits in hooks/hooks.json enthalten):
{
"matcher": "tool == \"Edit\" || tool == \"Write\"",
"hooks": [{
"type": "command",
"command": "node \"${CLAUDE_PLUGIN_ROOT}/scripts/hooks/suggest-compact.js\""
}]
}Nutzungstipps
- Nach der Planung komprimieren - Wenn der Plan feststeht, komprimieren und neu beginnen
- Nach dem Debugging komprimieren - Bereinigen Sie den Fehlerlösungskontext, fahren Sie mit dem nächsten Schritt fort
- Nicht während der Implementierung komprimieren - Behalten Sie den Kontext relevanter Änderungen bei
- Auf Erinnerungen achten - Der Hook sagt Ihnen "wann", Sie entscheiden "ob komprimiert wird"
::: Tipp Aktuellen Status anzeigen
Mit dem Befehl /checkpoint können Sie den aktuellen Status speichern und dann die Sitzung komprimieren.
:::
Leistungs-Checkliste
Überprüfen Sie im täglichen Gebrauch regelmäßig folgende Punkte:
Modellnutzung
- [ ] Einfache Aufgaben mit Haiku statt Sonnet/Opus
- [ ] Komplexe Inferenz mit Opus statt Sonnet
- [ ] Geeignetes Modell in der Agenten-Konfiguration angegeben
Kontextverwaltung
- [ ] Nicht mehr als 10 MCPs aktiviert
- [ ] Regelmäßige Komprimierung mit
/compact - [ ] Komprimierung an Aufgabengrenzen statt mitten in der Aufgabe
MCP-Konfiguration
- [ ] Projekt aktiviert nur benötigte MCPs
- [ ]
disabledMcpServerszum Verwalten ungenutzter MCPs verwenden - [ ] Regelmäßige Überprüfung der Anzahl aktiver Werkzeuge (empfohlen < 80)
Häufig gestellte Fragen
F: Wann sollte man Haiku, Sonnet oder Opus verwenden?
A: Basierend auf der Aufgabenkomplexität:
- Haiku: Leichte Aufgaben, häufige Aufrufe (z.B. Code-Formatierung, Kommentar-Generierung)
- Sonnet: Hauptentwicklungsarbeit, Agenten-Koordination (z.B. Funktionsimplementierung, Refactoring)
- Opus: Komplexe Inferenz, Architekturentscheidungen (z.B. Systemdesign, Sicherheitsaudit)
F: Was tun, wenn das Kontextfenster voll ist?
A: Verwenden Sie sofort /compact zum Komprimieren der Sitzung. Wenn der strategic-compact Hook aktiviert ist, wird er Sie zum richtigen Zeitpunkt erinnern. Vor der Komprimierung können Sie mit /checkpoint wichtige Status speichern.
F: Wie erfahre ich, wie viele MCPs aktiviert sind?
A: Überprüfen Sie die Konfigurationen mcpServers und disabledMcpServers in ~/.claude/settings.json. Anzahl der aktiven MCPs = Gesamtzahl - Anzahl in disabledMcpServers.
F: Warum sind meine Antworten besonders langsam?
A: Überprüfen Sie folgende Punkte:
- Verwenden Sie Opus für einfache Aufgaben?
- Ist das Kontextfenster fast voll?
- Zu viele MCP-Server aktiviert?
- Führen Sie umfangreiche Dateioperationen durch?
Zusammenfassung
Das Kernstück der Leistungsoptimierung ist "das richtige Werkzeug zur richtigen Zeit":
- Modellauswahl: Wählen Sie Haiku/Sonnet/Opus basierend auf der Aufgabenkomplexität
- Kontextverwaltung: Vermeiden Sie die letzten 20% des Fensters, komprimieren Sie rechtzeitig
- MCP-Konfiguration: Aktivieren Sie bei Bedarf, nicht mehr als 10
- Strategische Komprimierung: Manuelle Komprimierung an Aufgabengrenzen, logischer Zusammenhang erhalten
Verwandte Kurse
- Token-Optimierungsstrategien - Vertiefte Kenntnisse der Kontextfenster-Verwaltung
- Hooks-Automatisierung - Konfiguration des strategic-compact Hooks
- MCP-Server-Konfiguration - So konfigurieren Sie MCP-Server
Anhang: Quellcode-Referenz
Klicken zum Anzeigen der Quellcode-Positionen
Aktualisiert am: 2026-01-25
| Funktion | Dateipfad | Zeilennummer |
|---|---|---|
| Leistungsoptimierungsregeln | rules/performance.md | 1-48 |
| Strategische Komprimierung Skill | skills/strategic-compact/SKILL.md | 1-64 |
| Hooks-Konfiguration | hooks/hooks.json | 1-158 |
| Strategic Compact Hook | hooks/hooks.json | 46-54 |
| Suggest Compact Skript | scripts/hooks/suggest-compact.js | - |
| MCP-Konfigurationsbeispiel | mcp-configs/mcp-servers.json | - |
Wichtige Regeln:
- Modellauswahl: Haiku (leichte Aufgaben), Sonnet (Hauptentwicklung), Opus (komplexe Inferenz)
- Kontextfenster: Vermeiden Sie die Nutzung der letzten 20%, komprimieren Sie rechtzeitig
- MCP-Konfiguration: Aktivieren Sie nicht mehr als 10 pro Projekt, aktive Werkzeuge < 80
- Strategische Komprimierung: Manuelle Komprimierung an Aufgabengrenzen, vermeiden Sie Unterbrechungen durch automatische Komprimierung
Wichtige Umgebungsvariablen:
COMPACT_THRESHOLD: Schwellenwert für Werkzeugaufrufe (Standard: 50)