6
ilk-yapay-zeka-asistanınız
8
7
6
5
4
2
3
1
5
15
11
9
20
18
19
17
16
15
14
13
12
11
10
8
7
6
5
4
3
2
1
10
18
17
16
14
13
12
10
9
8
7
6
4
3
2
1
9
8
7
6
5
4
3
2
1
7
6
5
4
3
2
1
6
5
4
3
2
1
Sonraki ders
Sonraki ders
Bu derste

Ajanınızı hangi Büyük Dil Modelinin çalıştıracağına karar vermek, projenizdeki en önemli teknik kararlardan biridir.

Bu karar, ajanınızın ne kadar iyi çalıştığını, işletme maliyetini ve zaman içinde davranışının ne kadar öngörülebilir olduğunu etkiler.

Tek bir en iyi model yoktur. Doğru seçim, hedeflerinize, bütçenize ve çıktılar üzerinde ne kadar kontrol istediğinize bağlıdır.

Bu kararı aceleye getiren ekipler genellikle sonradan pişman olur. Anahtar nokta, erken test yapmak, net öncelikler belirlemek ve kendinizi tek bir sağlayıcıya veya kurguya bağımlı kılmamaktır.

İyi bir LLM stratejisi dört ana soruya yanıt verir:

  1. Hangi modeli kullanıyorsunuz ve neden?
  2. Alternatifleri ne sıklıkla test edeceksiniz?
  3. Kullanım senaryonuzda ne daha önemli: hız mı, güç mü?
  4. Model başarısız olursa veya performansı düşerse yedek planınız nedir?

Şimdi bunların her birine bakalım.

Model seçimi prestijden çok uyumla ilgilidir. Bazı modeller hızlı ve ucuzdur, bazıları ise daha yavaş ama karmaşık akıl yürütmede daha iyidir.

Kullanım senaryonuz kısa müşteri etkileşimleri içeriyorsa, gecikme ve maliyet derinlikten daha önemli olabilir.

Kullanım senaryonuz çok adımlı akıl yürütme veya detaylı özetler gerektiriyorsa, öncelik güç olabilir.

Erken ve sık test yapmak, modellerin kendi verilerinizle nasıl davrandığını görmenizi sağlar. Her LLM'nin kendine özgü özellikleri vardır. Bazıları talimatları izleme konusunda, bazıları ise tutarlı bir ton veya hassasiyet sağlama konusunda daha iyidir. Bunu ancak kendi iş akışlarınızdan gerçek örneklerle keşfedebilirsiniz.

Yedek planlama da aynı derecede önemlidir. En stabil API'ler bile bazen davranış değiştirir, performansı düşer veya erişilemez hale gelir. Her zaman bir yedek model ve performansınız belirlediğiniz seviyenin altına düştüğünde geçiş yapma politikanız olmalı. (Ya da Botpress gibi, ajan oluşturucunuzun varsayılan bir yedek seçeneği sunduğundan emin olun)

Terminal Roast'ta muhasebeci Ross, rakamları inceler. Ekip, ajanlarının kahve ve hamur işleriyle ilgili basit müşteri sohbetlerini fark edilir bir gecikme olmadan yönetmesini ister. Birkaç seçeneği test ettikten sonra Gemini 2.5 Flash kullanmaya karar verirler. Hızlı, uygun maliyetli ve gündelik müşteri sohbetleri için yeterli akıl yürütme gücüne sahip.

Yedek için, sistemde gecikme veya hata oranı eşiklerini aşarsa ikincil bir modele geçecek şekilde yapılandırma yaparlar. Bu seçim, kullanıcı deneyimini sorunsuz ve işletme maliyetini öngörülebilir tutar.

Ross, ajanı ileride daha karmaşık görevlere genişletirlerse model seçimini tekrar gözden geçirebileceklerini belirtir.

Her model kararı aynı zamanda bir iş kararıdır. Yanlış seçim, işletme maliyetinizi ikiye katlayabilir veya kullanıcı etkileşimlerinde gereksiz gecikmelere yol açabilir. Doğru seçim ise performans ve maliyeti, sunmak istediğiniz deneyime uygun şekilde dengeler.

Esneklik de aynı derecede önemlidir. Sistem mimarinizi tek bir modele çok sıkı bağlamaktan kaçının; böylece ileride geçiş yapmak zorlaşmaz. Bir soyutlama katmanı veya birden fazla modeli destekleyen bir sağlayıcı kullanın ki, ortam değiştikçe uyum sağlayabilesiniz.

Bu esneklik, sisteminizi dayanıklı kılar ve tek bir sağlayıcının yol haritasına veya fiyatlandırmasına bağımlı kalmanızı önler.

Gerçek bir LLM stratejisi oluşturmak için üç şeyi belgeleyin:

  • Birincil modeliniz ve neden seçildiği.
  • Performans ve maliyet eşikleriniz — ne zaman geçiş yapmayı düşüneceğiniz.
  • Yedek modeliniz ve onu devreye alma kurallarınız.

Bu kararları en az üç ayda bir gözden geçirin. LLM ekosistemindeki değişim hızı çok yüksek ve yeni modeller genellikle daha düşük maliyetle eskilerden daha iyi performans gösteriyor. Bunu tek seferlik bir kurulum değil, sürekli bir değerlendirme olarak ele alın.

Terminal Roast'un hız ve öngörülebilirliği ham güçten öncelemesi, ilk dağıtımlarını sürdürülebilir kılan şeydir. Müşterileri memnun eder, maliyeti sınırlar ve teknik istikrarsızlık olmadan gerçek dünya verisi toplamalarını sağlar.

Bu denge — uygun modeli seçmek, değişime hazırlıklı olmak ve esnekliği korumak — deneme projeleriyle üretim projelerini birbirinden ayırır.

LLM stratejiniz her zaman iş hedeflerinizi desteklemeli, onlara yön vermemelidir.

Eylem: Hangi modeli kullanmayı planladığınızı, kullanım senaryonuzda neyin en önemli olduğunu (hız, maliyet veya derinlik) ve yedek seçeneğinizin ne olacağını yazın. Kullanım verisi topladıkça bu tercihlerinizi düzenli olarak gözden geçirin.

Özet
Bir yapay zeka ajanı için performans, maliyet, gecikme süresi ve uzun vadeli güvenilirliğe göre doğru büyük dil modelinin nasıl seçileceği.
bu kurstaki tüm dersler
Fresh green broccoli floret with thick stalks.