Modül 4 · Sharing and safety in Claude Cowork · ⏱ 8 dakika

Plugin'ler için skill'leri doğrulamak

Validating skills for plugins

Bu derste neler öğreneceksin

  • Bir eval'in ne olduğunu ve bir skill'i paylaşmadan veya ona güvenmeden önce neden önemli olduğunu açıklamak
  • skill-creator üzerinden hafif (lightweight) bir eval çalıştırmak

Bu neden önemli?

Bir skill inşa ettiğinde — veya bunları bir plugin’de bundle ettiğinde — esasen başkalarının kullanacağı küçük bir ürün inşa ediyorsun. Ve bir meslektaşına vereceğin her şey gibi — bir template, bir spreadsheet modeli, bir checklist — masandan ayrılmadan önce bir test sürüşüne değer.

Kendi inşa ettiğin skill’i kullandığında, herhangi bir issue veya başarısızlığı nasıl etrafından dolaşacağını bilirsin. Ne soracağını, ne dosya vereceğini ve cevabın nasıl görünmesi gerektiğini tam olarak bilirsin.

Bir takım arkadaşının bunların hiçbiri yok. İsteği biraz farklı ifade edebilirler, biraz farklı input verebilirler veya bir edge case’e denk gelebilirler — alışılmadık-ama-gerçek bir durum, skill’in tasarımının tam dışında bir istek. Skill’lerin tökezlediği yer burasıdır ve onu kullanan kişi nedenini bilmeyecektir.

Skill’leri eval (evaluation kısaltması) ile test etmek, başkası yapmadan önce bu tökezlemeleri yakalamanın yolu.

Eval sistemi nasıl çalışır?

skill-creator (Claude’un skill oluşturma için built-in helper’ı) ile skill inşa ettiğinde, eval’ları sürecin parçası olarak seni gezdirir. Pratikte böyle görünüyor:

1. skill-creator iki veya daha fazla gerçekçi prompt üretir

Her prompt için bir çift output üretir:

OutputAçıklama
Skill’liClaude senin skill’ini kullanarak cevap verir
Skill’sizClaude aynı prompt’a skill olmadan cevap verir

Bu ikincisi karşılaştırma noktasıdır. Yan yana fark görmeyi sağlar — sadece “bu output OK mi” değil, “bu output Claude’un kendi başına yapacağından daha iyi mi?“

2. Her çifti review et ve plain English feedback ver

Her çifti okurken aslında iki soruya cevap veriyorsun:

  • Skill versiyonu göndereceğim versiyon mu? Evetse — harika, onu daha iyi yapan şeyi not et ki skill onu yapmaya devam etsin.
  • Hayırsa — ne eksik veya yanlış? Spesifik ol.
YetersizYeterli
”Bu pek doğru değil""Ton çok formal"
"Eksik""Executive summary’yi atladı”

Spesifik feedback Claude’a bir şey üzerinde aksiyon almasını sağlar.

3. Submit et — Claude skill’i revize eder

Feedback’i gönderdiğinde, Claude söylediklerine dayanarak skill’i revize eder.

Skill üzerinde iterate et

Feedback’in fix’tir. Submit ettiğinde Claude skill’i günceller — talimatları yeniden yazar, örnekleri ayarlar, neyi soracağını sıkılaştırır — ve aynı prompt’ları tekrar çalıştırıp değişikliğin tuttuğunu görebilirsin.

Tek seferde tek bir şeyi değiştir

İlk turda skill çok uzun ve bir section’ı eksik çıktıysa, daha önemli olanı seç, düzelt, yeniden çalıştır, sonra bir review için dön. Neyin gerçekten ibreyi oynattığını anlayabilirsin.

Revizyondan sonra hâlâ mutlu değilsen — tekrar çalıştır. Bu tek seferlik bir kapı değil, bir loop. Çoğu skill bir-iki turdan sonra hazırdır.

Ship etmek için baraj

StandartNe demek
Perfect evalsŞart değil
Önemsediğin case’ler baseline’dan anlamlı olarak daha iyi geçiyorYeterli
Henüz ele almadığın case’leri isimlendirdinYeterli

İlk pass’te output’lar zaten harika görünüyorsa? Bitirdin. Eval’lar atlaman gereken bir çember değil — onlar güvene ihtiyacın olduğunda vardır, ceremony için değil.

Şimdi dene — örnek bir review

Tipik case: Bir team sync recap’i

Prompt: “Bugünkü product sync’in recap’ini yaz. Notlar notes/2026-05-01-product-sync.md’de.”

House rules (skill içine kodlanmış)

  • ✓ Kararlarla başla
  • ✓ Her action item’in bir owner’ı ve tarihi var
  • ✓ Open question’lar belirtildi
  • ✓ 150 kelimenin altında

Skill’li output (4/4 ✓)

Product sync — recap

DECISIONS

  • Pazartesi’den itibaren yeni onboarding flow’unu yeni sign-up’ların %10’una ship et.
  • In-app tour redesign’ı launch sonrasına kadar duraklat.

ACTION ITEMS

  • Maya — rollout plan’ı Cuma 9 Mayıs’a kadar finalize et.
  • Devon — yeni flow’u activation rate için Çarşamba 7 Mayıs’a kadar instrument et.
  • Priya — duyuru post’unu Pazartesi 12 Mayıs’a kadar taslakla.

OPEN QUESTIONS

  • %10 öncesi yeni metin için legal sign-off gerekiyor mu?

Skill’siz output (1/4 ✓)

Product sync recap

Ekip bu sabah yeni onboarding flow’u hakkında verimli bir tartışma yaptı. En son mockup’ları gözden geçirdikten sonra grup, gelecek Pazartesi’den itibaren %10 rollout ile ileri gitmeye karar verdi. In-app tour redesign gündeme geldi ama konsensüs launch sonrasına bırakmak yönündeydi.

Maya rollout plan’ı finalize etmeyi önerdi ve Devon instrumentation’a bakacağını söyledi. Priya duyuru için bir şey taslaklayacak. Legal’in yeni metni gözden geçirmesi gerekip gerekmediği konusunda da bazı ileri-geri vardı — ekip o konuda bir sonuca varmadı.

Genel olarak net sonraki adımlarla verimli bir toplantıydı.

Sen ne yaparsın?

  • Hangisini gönderirdin? → Skill’li (4/4 house rules)
  • Claude’a tek bir feedback satırı: “Skill versiyonu mükemmel — bu formatı tut. Skill’siz versiyon kararlarla başlamıyor ve action item’larda owner/tarih yok.”

Bu döngünün tamamı.

Sırada ne var?

Bir sonraki derste “bu benim için çalışıyor“‘dan “bu ekip için çalışıyor“‘a geçeceksin — kişisel workflow’ları paylaşılan altyapıya çeviren pattern’ler ve seçimler.