Aylar süren spekülasyonların ardından, OpenAI'un en son Strawberry LLM sürümü çıktı - ve adı GPT-5 değil.
Daha önce Q* ve Strawberry gibi şifreli, ilgi çekici kod adlarıyla anılan en son model serisi nihayet OpenAI o1 takma adını aldı.
OpenAI'un yeni modelindeki en büyük yenilik, geliştirilmiş muhakeme becerileri. OpenAI , o1'in önceki modellere göre düşünmeye daha fazla zaman ayıracak şekilde eğitildiğini ve böylece insan zekasına yaklaştığını açıkladı.
OpenAI o1 nedir?
OpenAI o1, OpenAI tarafından 12 Eylül 2024 tarihinde piyasaya sürülen ve şu anda iki modelden oluşan en yeni büyük dil modelleri serisidir: o1-preview ve o1-mini.
O1 ile şirketin önceki modelleri arasındaki en büyük fark, gelişmiş muhakeme yeteneği. Henüz tam olarak piyasaya sürülmemiş olsa da, önizleme ve mini modeller matematik, fen ve kodlama testlerinde GPT-4o'yu şimdiden geride bıraktı.
OpenAI o1 modelleri̇
Eylül sürümünde o1-preview ve o1-mini olmak üzere iki model yer aldı. Bunlar, OpenAI yeni LLM adresini geliştirdikçe piyasaya sürülmeye devam edecek bir dizi modelin ilkidir.
Aradaki fark nedir? o1-mini modeli, önizleme modelinden daha küçük ve %80 daha ucuzdur. Gelişmiş muhakeme gerektiren ancak daha geniş bilgi gerektirmeyen görevler için üretilmiştir. Kodlama veya matematik içeren görevler için mükemmel şekilde uygundur.
OpenAI o1 ne kadar akıllı?
OpenAI o1'in muhakeme yeteneklerini ortaya koyan STEM kıyaslamalarının bir listesini sundu:
- Fizik, kimya ve biyoloji alanlarındaki kıyaslama testlerinde doktora öğrencilerine benzer bir performans.
- ABD Matematik Olimpiyatı için ABD elemelerinde ilk 500 öğrenci arasına girme.
- Rekabetçi bir kodlama testi olan Codeforces'ta 89. yüzdelik dilimde yer aldı.
O1'in muhakeme yetenekleri hakkında daha fazla bilgiyi OpenAI adresindeki araştırma bülteninde okuyabilirsiniz.
Düşünce zinciri muhakemesi nedir?
O1 modelleri, talepleri ayrıştırmanın daha uzun ve kapsamlı bir yolu olan düşünce zinciri muhakemesini kullanır.
Eğer o1 modeline bir istem verilirse, hemen cevap vermez - dolayısıyla uzun bekleme süresi vardır. Bunun yerine, bir sonraki hareket tarzına karar vermeden önce her bir bilgi parçasını ve sonuçlarını dikkatlice değerlendirerek her bir adımda mantık yürütecektir. Soruda istenen adımların tamamını düşünene kadar bir yanıt vermeyecektir.
o1'in GPT-4o'dan farkı nedir?
1) Muhakeme yetenekleri
Genel zekasının merkezinde o1'in yeni muhakeme yeteneği yer alıyor. "Belki de en önemli ilerleme alanları muhakeme yeteneği etrafında olacak," diye paylaştı Altman Gates ile. "Şu anda GPT-4 sadece son derece sınırlı şekillerde muhakeme yapabiliyor."
Akıl yürütmek herkesin bildiği gibi zordur. İnsanlar için bile. Ve OpenAI o1 bunu iddia eden ilk modeldir.
o1 modelleri, ön eğitim verilerine dayanmak yerine gerçek zamanlı olarak muhakeme yapabilmektedir. Yeni modelin bilim, matematik ve kodlama görevlerinde önceki OpenAI modellerinden daha iyi olmasının nedeni budur.
2) Jailbreak yapmak daha zor
LLMs 'un popülaritesi ve gücü arttıkça güvenlikle ilgili endişeler de artıyor. OpenAI'un son geliştirmesinde güvenlik önemli bir odak noktası oldu. Şirket, o1 serisini geliştirirken ABD ve İngiltere Yapay Zeka Güvenlik Enstitüleri ile ortaklık kurdu ve durum tespiti için Amerikan hükümeti ile birlikte çalıştı.
İleriye doğru atılmış büyük bir adım olarak, o1 serisinin jailbreak edilmesi (güvenlik önlemlerinin aşılması) önceki modellere göre çok daha zordur.
En zorlu jailbreaking testlerinden birinde, o1-preview modeli 100 üzerinden 84 puan alırken, GPT-4o'dan 22 puan aldı.
3) Yeni isimlendirme kuralı
İsmi yeni OpenAI LLM ile ilgili en heyecan verici şey olmasa da, kasıtlı olarak anlamlı bir değişiklik.
OpenAI o1, 'GPT' takma adını kullanan ilk modeldir ve bunun nedeni, şirketin yepyeni bir 'akıl yürütme paradigmasının' ilk aşaması olduğunu iddia etmesidir; oysa eski modeller 'eğitim öncesi paradigmanın' bir parçasıydı.
Yeni model, ön eğitim verilerine güvenmek yerine gerçek zamanlı olarak akıl yürütmek için zaman harcıyor.
4) STEM problem çözme görevlerinde daha iyi
Daha iyi muhakeme ile daha iyi matematik becerileri gelir.
Hem o1 hem de GPT-4o'dan Uluslararası Matematik Olimpiyatı için bir eleme sınavını tamamlamaları istenmiştir. GPT-4o problemlerin %13'ünü çözerken, o1 %83'ünü çözmüştür.
5) Daha uzun bekleme süresi
Gerçek zamanlı akıl yürütme, eğitim verilerine başvurmaktan ve bir yanıt oluşturmaktan daha uzun sürer. Diğer modellere kıyasla OpenAI o1-preview adresine bir soru sorarsanız, önemli ölçüde daha uzun süre beklersiniz.
Bununla birlikte, dış kaynak akıl yürütme yeteneği ile ödenecek küçük bir bedeldir. O1 modellerinin hızı, serideki sonraki modeller piyasaya sürüldükçe muhtemelen artacaktır.
o1'i kimler kullanabilir?
12 Eylül itibariyle ChatGPT Plus ve Ekip kullanıcıları ChatGPT adresindeki o1 modellerine erişebilmektedir.
OpenAI o1-mini'yi ücretsiz kullanıcılara sunacaklarını duyurdu, ancak herhangi bir tarih belirtilmedi.
Mevcut haftalık ücret sınırları 01-preview için 30 mesaj ve o1-mini için 50 mesajdır, ancak yakında artacaktır.
o1'i ne için kullanmalıyım?
o1'in gelişmiş muhakeme yetenekleri özellikle matematik, bilim ve kodlamadaki karmaşık problemleri çözmek için kullanışlıdır. OpenAI 'un açıkladığı gibi:
OpenAI o1'in sınırlamaları
Bir önizleme olarak, bu model henüz GPT-4o'nun tüm özelliklerine sahip değildir. Web'de bilgi aramak ya da dosya veya resim yüklemek için LLM kullanmak istiyorsanız, o1'in sonraki modelleri piyasaya sürülene kadar GPT-4o'ya bağlı kalmanız gerekecektir.
OpenAI o1 nasıl sorulur
OpenAI'in yönlendirme önerileri, gelişmiş muhakemesi nedeniyle önceki modellerine kıyasla o1 için değişmiştir.
Yönlendirmelerinizi basit tutun. Bu akıllı bir modeldir ve GPT-4 serisi kadar fazla yönlendirmeye ihtiyaç duymaz. Bu, herhangi bir düşünce zinciri girdisinden kaçının anlamına gelir - model zaten dahili olarak mantık yürütmektedir.
GPT destekli yapay zeka ajanları oluşturun
Yapay zeka aracınız her OpenAI güncellemesiyle otomatik olarak senkronize olsaydı ne olurdu?
Botpress tamamen açık ve genişletilebilir bir yapay zeka aracı platformudur. stack adresimiz, geliştiricilerin herhangi bir iş akışında herhangi bir yeteneğe sahip sohbet robotları ve yapay zeka aracıları oluşturmasına olanak tanır.
Düşük kod kurulumundan sonsuz özelleştirilebilirlik ve genişletilebilirliğe kadar uzanan tek platform olan Botpress , sohbet botunuzda en son GPT sürümünün gücünü otomatik olarak elde etmenizi sağlar - çaba gerektirmez.
Bugün inşa etmeye başlayın. Ücretsiz.
İçindekiler
Yapay zeka ajanlarıyla ilgili en son gelişmelerden haberdar olun
Bunu paylaşın: