- OpenAI o1, yalnızca ön eğitim değil, gerçek zamanlı akıl yürütmeye odaklanan yeni bir model serisidir (o1-preview ve o1-mini ile başlıyor).
- o1, STEM görevlerinde GPT-4o'dan daha iyi performans gösteriyor; IMO elemelerinde %83 başarıya ulaşırken, GPT-4o %13'te kalıyor ve Codeforces'ta %89'luk dilime giriyor.
- o1, zincirleme düşünme yöntemini doğal olarak kullanır; bu da onu daha yavaş ama karmaşık görevlerde çok daha doğru kılar.
- o1'i jailbreak yapmak çok daha zordur; zorlu güvenlik testlerinde 100 üzerinden 84 alırken, GPT-4o yalnızca 22 puan alıyor.
ChatGPT hayranlarının aylarca süren spekülasyonlarından sonra, OpenAI'nin en son Strawberry LLM sürümü yayınlandı – ve adı GPT-5 değil.
Daha önce Q* ve Strawberry gibi gizemli kod adlarıyla anılan yeni model serisinin adı sonunda OpenAI o1 olarak belirlendi.
OpenAI'nin yeni modelindeki en büyük yenilik, geliştirilmiş akıl yürütme yeteneği. OpenAI, o1'in önceki modellere göre daha fazla düşünmek üzere eğitildiğini ve bu sayede insan zekasına daha da yaklaştığını açıkladı.
OpenAI o1 nedir?
OpenAI o1, OpenAI tarafından 12 Eylül 2024'te piyasaya sürülen en yeni büyük dil modeli serisidir ve şu anda iki modelden oluşur: o1-preview ve o1-mini.
o1 ile önceki modeller arasındaki en büyük fark, gelişmiş akıl yürütme yeteneğidir. Tam sürümü henüz yayınlanmamış olsa da, preview ve mini modelleri matematik, bilim ve kodlama testlerinde GPT-4o'yu açık ara geride bırakıyor.
OpenAI o1 modelleri
Eylül ayında iki model yayınlandı: o1-preview ve o1-mini. Bunlar, OpenAI'nin yeni LLM'ini geliştirmeye devam ettikçe yayınlayacağı serinin ilk modelleri.
Farkı nedir? o1-mini modeli daha küçük ve preview modeline göre %80 daha ucuz. Geniş bilgi gerektirmeyen, ancak gelişmiş akıl yürütme isteyen görevler için tasarlandı. Özellikle kodlama veya matematik içeren işler için idealdir.
OpenAI o1 ne kadar akıllı?
OpenAI, o1’in akıl yürütme yeteneklerini gösteren bir dizi STEM ölçütünü öne çıkardı, bunlar arasında:
- Fizik, kimya ve biyoloji testlerinde doktora öğrencileriyle benzer performans.
- ABD Matematik Olimpiyatı elemelerinde ABD'deki en iyi 500 öğrenci arasına girmek.
- Codeforces adlı rekabetçi kodlama testinde %89’luk dilime yerleşmek.
o1’in akıl yürütme yetenekleri hakkında daha fazla bilgiyi OpenAI’nin araştırma raporunda bulabilirsiniz.
Zincirleme düşünme yöntemi nedir?
o1 modelleri zincirleme düşünme yöntemini kullanır; bu, istekleri daha uzun ve ayrıntılı bir şekilde parçalara ayırma yöntemidir.
o1 modeline bir komut verildiğinde hemen yanıt vermez – bu yüzden bekleme süresi uzundur. Bunun yerine, her adımı tek tek değerlendirir, her bilgiyi ve olası sonuçlarını dikkatlice düşünür ve ancak tüm adımları tamamladıktan sonra yanıt verir.
o1, GPT-4o'dan nasıl farklıdır?
1) Akıl yürütme yetenekleri
Genel zekasının merkezinde, o1’in yeni akıl yürütme yeteneği var. Altman, Gates ile yaptığı sohbette “Belki de en önemli ilerleme alanları akıl yürütme yeteneğiyle ilgili olacak,” dedi. “Şu anda, GPT-4 yalnızca son derece sınırlı şekillerde akıl yürütebiliyor.”
Akıl yürütme, insanlar için bile zordur. OpenAI o1, bunu başardığını iddia eden ilk modeldir.
o1 modelleri, önceden eğitilmiş veriye dayanmadan gerçek zamanlı akıl yürütebiliyor. Bu nedenle yeni model, bilim, matematik ve kodlama görevlerinde önceki OpenAI modellerinden daha başarılı.
2) Jailbreak yapmak daha zor
LLM'ler popülerlik ve güç kazandıkça güvenlik endişeleri arttı ve OpenAI'nin son geliştirmelerinde güvenlik ana odak noktası oldu. Şirket, o1 serisini geliştirirken ABD ve İngiltere Yapay Zeka Güvenliği Enstitüleriyle ve Amerikan hükümetiyle iş birliği yaptı.
Büyük bir ilerleme olarak, o1 serisi önceki modellere göre güvenlik önlemlerini aşmanın – yani jailbreak yapmanın – çok daha zor olduğu bir model.
En zorlu jailbreak testlerinden birinde, o1-preview modeli 100 üzerinden 84 puan alırken, GPT-4o yalnızca 22 puan aldı.
3) Yeni adlandırma sistemi
Yeni OpenAI LLM'in adının en heyecan verici yanı olmasa da, bu kasıtlı olarak anlamlı bir değişiklik.
OpenAI o1, 'GPT' adını bırakan ilk model; çünkü şirket bunun yepyeni bir 'akıl yürütme paradigmasının' ilk aşaması olduğunu, eski modellerin ise 'ön eğitim paradigmasının' bir parçası olduğunu söylüyor.
Yeni model, önceden eğitilmiş veriye dayanmadan gerçek zamanlı akıl yürütmeye zaman ayırıyor.
4) STEM problem çözmede daha iyi
Daha iyi akıl yürütme, daha iyi matematik becerileri getirir.
Hem o1 hem de GPT-4o, Uluslararası Matematik Olimpiyatı için bir eleme sınavını çözmeleri istendi. GPT-4o soruların %13’ünü çözerken, o1 %83’ünü çözdü.
5) Daha uzun bekleme süresi
OpenAI o1-preview’a diğer modellere kıyasla soru sorarsanız, yanıt için çok daha uzun beklemeniz gerekir.
Ancak, akıl yürütmeyi dışarıya bırakabilmek küçük bir bedel karşılığında büyük bir avantaj. Serinin sonraki modelleri çıktıkça o1’in hızı da muhtemelen artacaktır.
o1’i kimler kullanabilir?
12 Eylül itibarıyla, ChatGPT Plus ve Team kullanıcıları ChatGPT’de o1 modellerine erişebiliyor.
OpenAI, o1-mini’yi ücretsiz kullanıcılara da sunacağını duyurdu, ancak kesin bir tarih belirtilmedi.
Şu anki haftalık mesaj sınırları 01-preview için 30, o1-mini için 50 mesaj; yakında bu sınırlar artırılacak.
o1’i ne için kullanmalıyım?
o1’in gelişmiş akıl yürütme yetenekleri, özellikle matematik, bilim ve kodlama gibi karmaşık problemleri çözmede oldukça faydalı. OpenAI şöyle açıklıyor:
OpenAI o1’in Sınırlamaları
Bu model henüz preview aşamasında olduğu için GPT-4o’nun tüm yeteneklerine sahip değil. Eğer bir LLM ile web’de bilgi aramak veya dosya ya da görsel yüklemek istiyorsanız, o1’in sonraki sürümleri çıkana kadar GPT-4o’yu kullanmaya devam etmelisiniz.
OpenAI o1’e nasıl komut verilir?
OpenAI’nin o1 için önerdiği komutlar, gelişmiş akıl yürütme nedeniyle önceki modellere göre değişti.
Komutlarınızı basit tutun. Akıllı bir model olduğu için, GPT-4 serisi kadar yönlendirmeye ihtiyaç duymaz. Yani, zincirleme düşünce içeren girdilerden kaçının – model zaten içsel olarak akıl yürütüyor.
GPT destekli yapay zeka asistanları oluşturun
Yapay zeka asistanınız her OpenAI güncellemesiyle otomatik olarak senkronize olsaydı ne olurdu?
Botpress tamamen açık ve genişletilebilir bir yapay zeka asistanı platformudur. Altyapımız, geliştiricilerin her türlü yeteneğe sahip sohbet botları ve yapay zeka asistanları oluşturmasına olanak tanır.
Düşük kodlu kurulumdan sınırsız özelleştirme ve genişletilebilirliğe kadar uzanan tek platform olan Botpress, sohbet botunuzda en yeni GPT sürümünün gücünü otomatik olarak kullanmanızı sağlar – hiçbir ek çaba gerekmez.
Bugün oluşturmaya başlayın. Ücretsizdir.
Sıkça Sorulan Sorular
1. “o1” ne anlama geliyor? Gelecekteki modeller için bir adlandırma mantığı var mı (ör. o2, o3)?
“o1” adı büyük olasılıkla “OpenAI 1” anlamına geliyor ve yeni bir model ailesinin başlangıcını gösteriyor. Buna dayanarak, bu serinin sonraki sürümlerinde “o2”, “o3” gibi sıralı adlandırmalar beklemek mantıklı.
2. OpenAI neden “GPT” adlandırmasından vazgeçti?
OpenAI, odağını değiştirdiğini göstermek için “GPT” adlandırmasından “o1”e geçti – genel ön eğitimli dil modellerinden, gerçek zamanlı akıl yürütme ve etkileşimli yeteneklere sahip modellere geçişi vurguluyor.
3. OpenAI o1, GPT-4’ün halefi mi yoksa tamamen yeni bir ürün serisi mi?
OpenAI o1, doğrudan GPT-4’ün halefi değildir; gerçek zamanlı akıl yürütme ve verimlilik etrafında tasarlanmış yeni bir ürün serisinin başlangıcını temsil eder, ancak GPT-4 ve GPT-4o ile elde edilen ilerlemeler üzerine inşa edilmiştir.
4. o1, çok dilli girdilerde GPT-4’ten daha iyi mi?
OpenAI, o1’in çok dilli performansının GPT-4 ile karşılaştırması hakkında resmi bir açıklama yapmadı; ancak o1, akıl yürütme ve yeni yetenekler için optimize edildiğinden, gelecekteki sürümlerin çok dilli girdilerde daha da etkili olabileceği öngörülebilir.
5. o1, ücretsiz kullanıcılar için ne zaman genel kullanıma açılacak?
OpenAI, ücretsiz kullanıcılar için "o1-mini" adlı bir sürümün yayınlanacağını doğruladı, ancak şu anda genel kullanıma sunulacağına dair resmi bir tarih açıklanmadı.





.webp)
