Performance: prompt caching, fast mode, ultraplan

Üç farklı kaldıraç, üç farklı problem.

Prompt caching

Anthropic API’sinde 5 dakikalık cache TTL. Aynı prefix’i tekrar gönderen istek çok daha ucuz + çok daha hızlı cevaplar.

Claude Code otomatik cache breakpoints koyar:

Sistem promptu + tool defs (her zaman cache)
CLAUDE.md + rules (her zaman cache)
Konuşma geçmişinin sabit kısmı

Optimize et:

CLAUDE.md’yi sık değiştirme — cache invalidate olur
Aynı session’ı uzun tut (5 dk içinde tekrar gir)
Sub-agent içinde tekrarlanan bilgiyi sistem prompt’una koy

Etki: %50-80 token tasarrufu, 2-5x daha hızlı yanıt.

Fast mode

/fast veya claude --fast. Claude Opus 4.6 ile çalışır ama streaming optimizasyonları + daha hızlı first-token. Aynı kapasite, daha hızlı geri dönüş.

Ne zaman kullan:

İnteraktif iterasyon (kısa sorular ardarda)
Yazım/edit cycle
Demo/sunum

Ne zaman kapatma:

Derin akıl yürütme (think hard ile çelişebilir)
Agentic uzun loop (paralelleşme önemli, hız değil)

Ultraplan

/ultraplan (yeni feature). Plan mode + extended thinking + multi-pass tasarım. Claude:

İlk taslak plan üretir
Planın zayıf yerlerini kendi eleştirir
Düzeltir
Final plan’ı verir

Maliyet: çok token. Faydası: gerçekten karmaşık feature için %30-40 daha az iterasyon.

Karar tablosu

Durum	Kaldıraç
Çok mesajlı oturum	Prompt caching (otomatik)
Hızlı interaktif	Fast mode
Karmaşık tasarım	Ultraplan
Tekrarlayan mekanik	Haiku model
1-shot büyük analiz	Opus + ultrathink

Sıradaki

Mini-proje: kendi self-evolving workflow loop’unu kur — Ralph Wiggum pattern’inin pratiği.