İki kat hız ve yarı fiyat - GPT-4o yapay zeka sohbet robotları için ne anlama geliyor?
Gizemli duyurularının ardından OpenAI amiral gemisi modellerinin en son sürümünü piyasaya sürdü: GPT-4o.
En son model sadece çok modlu yeteneklerde gösterişli bir parıltı almadı. GPT -4 Turbo'dan daha hızlı ve daha ucuz. Ana akım medya yeni amiral gemisi modelin video ve ses özelliklerine hayran olsa da, yeni maliyet ve hız, uygulamalarını güçlendirmek için GPT kullananlar için de aynı derecede etkili.
"4o'nun kullanılabilirliği hem inşaatçı hem de kullanıcı deneyimini önemli ölçüde iyileştirme gücüne sahip" diyen Patrick Hamelin, yazılım mühendisi lideri Botpress. "Etkisi düşündüğümüzden daha geniş kapsamlı."
Şimdi yeni modelin yapay zekalı sohbet robotlarını nasıl sarsacağını inceleyelim.
Model Yetenekleri
Yeni amiral gemisi modeli heyecan verici bir güncelleme listesi ve yeni özelliklerle birlikte geliyor: gelişmiş ses ve video yetenekleri, gerçek zamanlı çeviri, daha fazla doğal dil yeteneği. Görüntüleri analiz edebilir, daha çeşitli ses girdilerini anlayabilir, özetleme yardımı sağlayabilir, gerçek zamanlı çeviriyi kolaylaştırabilir ve grafikler oluşturabilir. Kullanıcılar dosya yükleyebilir ve sesten sese görüşme yapabilir. Hatta bir masaüstü uygulamasıyla birlikte gelir.
Lansman videoları serisinde, OpenAI çalışanları (ve Khan Academy'den Sal Khan gibi iş ortakları) GPT 'un en son sürümünü bir kullanıcıyı iş görüşmesine hazırlarken, şarkı söylerken, yüz ifadeleri aracılığıyla insan duygularını tanımlarken, yazılı matematik denklemlerini çözerken ve hatta başka bir ChatGPT-4o ile etkileşime girerken gösteriyor.
Lansman, bir yapay zeka modelinin çocuğunuzun defterindeki yazıları analiz edebildiği ve yanıt verebildiği yeni bir gerçekliği gösterdi. Kesirleri toplama kavramını ilk kez açıklayabilir, çocuğunuzun anlayışına göre tonunu ve taktiklerini değiştirebilir - sohbet robotundan kişisel öğretmene kadar çizgiyi aşabilir.
GPT-4o, LLM Chatbot'ları için ne anlama geliyor?
LLMs üzerinde çalışan yapay zekalı sohbet botları, OpenAI gibi şirketler modellerini her güncellediklerinde bir güncelleme alırlar. Bir sohbet botu Botpress gibi bir bot oluşturma platformuna bağlıysa, kendi sohbet botlarında en son GPT modelinin tüm avantajlarından yararlanırlar.
GPT-4o'nun piyasaya sürülmesiyle birlikte, AI sohbet robotları artık gelişmiş modelde çalışmayı tercih ederek yeteneklerini, fiyatlarını ve hızlarını değiştirebiliyor. Yeni model, GPT-4 Turbo'dan 5 kat daha yüksek hız limitlerine sahip ve dakikada 10 milyon token'a kadar işlem yapabiliyor.
Twilio on Botpress gibi ses entegrasyonlarını kullanan botlar için, ses destekli yeni bir etkileşim dünyası ortaya çıktı. Sohbet botları, geçmiş yılların ses işlemleriyle sınırlı kalmak yerine, insan etkileşimini taklit etmeye bir adım daha yaklaştı.
Belki de en önemlisi, ücretli kullanıcılar için daha düşük maliyettir. Benzer kapasitedeki bir sohbet botunu yarı maliyetle çalıştırmak, dünya çapında erişimi ve satın alınabilirliği büyük ölçüde artırabilir. Ve Botpress kullanıcıları botları için ek yapay zeka harcaması yapmazlar - böylece bu tasarruflar doğrudan inşaatçılara gider.
Denklemin kullanıcı tarafında ise GPT-4o çok daha iyi bir kullanıcı deneyimi anlamına geliyor. Kimse beklemekten hoşlanmaz. Daha kısa yanıt süreleri, AI chatbot kullanıcıları için daha yüksek kullanıcı memnuniyeti anlamına gelir.
Kullanıcılar Hızı Seviyor
Sohbet robotlarının benimsenmesinin en önemli unsurlarından biri kullanıcı deneyimini iyileştirmektir. Peki kullanıcı deneyimini bekleme sürelerini kısaltmaktan daha fazla ne iyileştirebilir?
"Kesinlikle daha iyi bir deneyim olacak," dedi Hamelin. "Yapmak isteyeceğiniz son şey birini beklemektir."
İnsanlar beklemekten nefret eder. Daha 2003 yılında yapılan bir araştırma, insanların bir web sayfasının yüklenmesi için yalnızca yaklaşık 2 saniye beklemeye razı olduklarını ortaya koymuştu. O zamandan bu yana sabrımız kesinlikle artmadı.
Ve herkes beklemekten nefret eder.
Algılanan bekleme süresini kısaltmak için çok sayıda UX ipucu var. Çoğu zaman olayların hızını artıramayız, bu nedenle kullanıcıların zamanın daha hızlı geçtiğini hissetmelerini nasıl sağlayacağımıza odaklanırız. Algılanan bekleme süresini kısaltmak için yükleme çubuğu görüntüsü gibi görsel geri bildirimler mevcuttur.
Asansör bekleme süreleriyle ilgili ünlü bir hikayede, eski bir New York binası şikayet yağmuruna tutuluyordu. Bina sakinleri asansörün gelmesi için 1-2 dakika beklemek zorunda kalıyordu. Bina, asansörü daha yeni bir modele yükseltemiyordu ve bina sakinleri kira kontratlarını bozmakla tehdit ediyordu.
Psikoloji eğitimi almış yeni bir çalışan, asıl sorunun iki dakikalık zaman kaybı değil, can sıkıntısı olduğunu fark etti. Bina sakinlerinin beklerken kendilerine ya da başkalarına bakabilmeleri için aynalar yerleştirmeyi önerdi. Asansörle ilgili şikayetler sona erdi ve artık asansör lobilerinde ayna görmek sıradan bir olay haline geldi.
Kullanıcı deneyimini geliştirmek için görsel geri bildirim gibi kısayollar kullanmak yerine OpenAI deneyimi kaynağında geliştirdi. Hız, kullanıcı deneyiminin merkezinde yer alır ve verimli bir etkileşimin sağladığı memnuniyetle eşleşen hiçbir numara yoktur.
Herkes için Tasarruf
Uygulamaları çalıştırmak için bu yeni yapay zeka modelini kullanmak aniden ucuzladı. Çok daha ucuz.
Yapay zekalı bir sohbet botunu geniş ölçekte çalıştırmak pahalıya mal olabilir. Botunuzun güç aldığı LLM , daha büyük ölçekte her bir kullanıcı etkileşimi için ne kadar ödeyeceğinizi belirler (en azından Botpress adresinde, yapay zeka harcamalarını LLM maliyetleriyle 1:1 oranında eşleştiriyoruz).
Ve bu tasarruflar sadece API kullanan geliştiriciler için değil. ChatGPT-4o, GPT-3.5'in yanı sıra LLM'un en son ücretsiz sürümüdür. Ücretsiz kullanıcılar ChatGPT uygulamasını hiçbir ücret ödemeden kullanabilirler.
Daha iyi tokenizasyon
Modelle Roma alfabesini kullanmayan bir dilde etkileşim kuruyorsanız, GPT-4o API maliyetlerinizi daha da azaltır.
Yeni model, geliştirilmiş kullanım limitleriyle birlikte geliyor. Tokenizasyon verimliliğinde önemli bir sıçrama sağlar ve büyük ölçüde İngilizce olmayan belirli dillere yoğunlaşır.
Yeni tokenizasyon modeli, giriş metnini işlemek için daha az token gerektirir. Logografik diller (yani tek tek harfler yerine semboller ve karakterler kullanan diller) için çok daha verimlidir.
Bu faydalar büyük ölçüde Roma alfabesini kullanmayan dillerde yoğunlaşmaktadır. Tasarruflardaki azalmalar aşağıdaki gibi tahmin edilmiştir:
- Hintçe, Tamilce veya Gujarati gibi Hint dillerinde belirteçlerde 2,9 - 4,4 kat azalma vardır
- Arapça'da belirteçlerde ~2 kat azalma var
- Çince, Japonca ve Vietnamca gibi Doğu Asya dillerinde belirteç sayısı 1,4 - 1,7 kat azalmıştır
Yapay zeka dijital uçurumunun kapatılması
Dijital çağ, asırlardır süregelen ve iyi belgelenmiş zenginlik uçurumunun bir uzantısı olan dijital uçurumu da beraberinde getirmiştir. Zenginliğe ve güçlü altyapıya erişimin belirli nüfuslara özel olması gibi, yapay zekaya ve ona eşlik eden fırsatlara ve faydalara erişim de öyle.
Birleşmiş Milletler Kalkınma Programı (UNDP) Dijital Baş Sorumlusu Robert Opp, yapay zeka platformlarının varlığının bir ülkenin kalkınma ölçütlerini değiştirme ya da bozma yeteneğine sahip olduğunu açıkladı:
OpenAI , GPT-4o'nun maliyetini yarıya indirerek ve ücretsiz bir katman sunarak, yapay zekadaki en büyük sorunlardan birini etkisiz hale getirmek ve politika yapıcıların ve ekonomistlerin aklındaki eşitsizliği doğrudan ele almak için çok önemli bir adım atıyor.
Büyük YZ için olumlu bir PR hamlesi, meraklıların düşündüğünden daha gerekli. YZ'nin günlük hayatımızda giderek daha fazla yer almasıyla birlikte, hem savunucular hem de şüpheciler YZ'yi 'iyilik için' nasıl kullanabileceğimizi sordular.
Yapay zeka doktoru ve eğitimci Louis Bouchard'a göre, yapay zekaya daha geniş erişim sağlamak tam da bunu yapmanın yolu: "YZ'yi erişilebilir kılmak, YZ'yi 'iyilik için' kullanmanın en iyi olmasa da bir yoludur." Gerekçesi ne? YZ teknolojisinin olumlu ve olumsuz etkilerini tam olarak kontrol edemiyorsak - en azından ilk günlerinde - bunun yerine potansiyel faydalarına eşit erişim sağlayabiliriz.
Genişletilmiş Multimodal Potansiyel
Bir işletmenin chatbot'uyla etkileşime geçmenin popüler yolu metindir, ancak OpenAI'un yeni yapay zeka modelinin gelişmiş çok modlu yetenekleri bu durumun ileride değişebileceğini göstermektedir.
Önümüzdeki yıl, geliştiricilerin yeni erişilebilir ses, görüntü ve video özelliklerinden en iyi şekilde yararlanan yeni uygulamaları piyasaya sürdüğünü göreceğiz.
Örneğin, GPT destekli sohbet robotları şunları yapabilir:
- Ürünü tanımlamak ve hasarlı olmadığından emin olmak için müşterilerden iade ettikleri ürünün bir resmini isteyin
- Bölgeye özgü lehçeleri hesaba katan gerçek zamanlı konuşmada sesli çeviri sağlayın
- Bifteğinizin pişip pişmediğini tavadaki görüntüsünden anlayabilirsiniz
- Eski bir katedralin görüntüsüne dayalı tarihsel bağlam sağlayarak, gerçek zamanlı çeviri yaparak ve ileri geri iletişime ve sorulara olanak tanıyan özelleştirilmiş bir sesli tur sunarak ücretsiz bir kişisel tur rehberi işlevi görür
- Ses girdisini dinleyen, ağız hareketlerinizin videosuna dayanarak telaffuz hakkında geri bildirim sağlayabilen veya görüntüler ve video aracılığıyla işaret dili öğretebilen bir dil öğrenme uygulamasını güçlendirin
- Düşük maliyetli konuşma terapisine olanak tanıyan ses ve videoları yorumlama yeteneğini birleştirerek acil olmayan zihinsel sağlık desteği sağlayın
Görüntüleri ve sesleri yorumlayabilen yapay zeka modelleri ile LLMs 'un bize nasıl hizmet edebileceğine dair anlayışımız hızla genişliyor.
Çok modluluk erişilebilirlik anlamına gelir
Geliştirilmiş multimodal özelliklerin sosyal fayda için kullanıldığını zaten gördük. Bunun mükemmel bir örneği OpenAI'un Be My Eyes ile yaptığı ortaklıktır.
Be My Eyes, görme engelli kullanıcıları gören gönüllülerle buluşturan Danimarkalı bir start-up. Bir kullanıcı yardıma ihtiyaç duyduğunda - süpermarkette doğru konserve ürünlerini seçmek veya bir tişörtün rengini belirlemek gibi - uygulama onları akıllı telefon aracılığıyla video aracılığıyla dünyanın dört bir yanındaki gören bir gönüllüye bağlar.
OpenAI'in yeni görme yeteneği Be My Eyes kullanıcıları için daha da faydalı bir deneyim sağlayabilir. Görme engelli kullanıcılar, bir görüntü veya videoyu gerçek zamanlı olarak görsel olarak deşifre etmek için gönüllü bir insana güvenmek yerine, modelin sesli bilgilerle yanıt verebileceği bir görüntü veya videoyu cihazlarına aktarabilirler.
OpenAI ve artık güvenilir ortaklar olan Be My Eyes, dünyanın dört bir yanındaki yasal olarak kör bireyler için daha fazla bağımsızlığın yolunu açıyor. Be My Eyes CEO'su Michael Buckley bunun etkisini açıklıyor:
Yeni hizmet yakında, 2024 yazında ilk kez kullanıma sunulacak. Erken erişim kullanıcıları yeni görüntü, video ve ses özelliklerinin beta testlerini yaparak övgü dolu yorumlar aldılar. Yapay zekanın etkileri şüpheciler için endişe yaratabilirken, bu ortaklık getirebileceği olumlu etkilerin açık bir işaretidir. Gelişmiş yapay zeka ile gelen sosyal faydayı anlamak, halkla ilişkiler için çok önemli bir adımdır.
Gelecekteki LLM modellerini nasıl değerlendireceğiz?
Rakipler en ucuz, en hızlı LLM 'u yaratmak için dibe doğru yarışa devam ederken şu soru akla geliyor: Yarının yapay zeka modellerini nasıl değerlendireceğiz?
Gelecekte bir noktada, başlıca LLM yaratıcıları (muhtemelen OpenAI ve Google) modellerinin ne kadar hızlı çalışabileceği ve ne kadar ucuza erişim sağlayabilecekleri konusunda bir plato oluşturacaklar. Maliyet ve hız konusunda istikrara ulaştığımızda, pazar lideri modeli nasıl taçlandıracağız?
Zamanın yeni işareti ne olacak? Yapay zeka modelinizin mevcut kişilikleri, video geliştirme yetenekleri, ücretsiz kullanıcılara sunulan özellikler veya mevcut anlayışımızın ötesinde yepyeni metrikler olsun, yeni nesil LLMs kapımızda.
Yapay Zeka Sohbet Robotları Artık Çok Kolay
Yapay zekalı sohbet robotunuz her GPT güncellemesiyle otomatik olarak senkronize olsa nasıl olurdu?
Botpress 2017'den beri özelleştirilebilir yapay zeka sohbet robotu çözümleri sunmakta ve geliştiricilere en yeni LLMs'un gücüyle kolayca sohbet robotları oluşturmaları için ihtiyaç duydukları araçları sağlamaktadır. Botpress sohbet robotları, web siteniz veya ürün kataloğunuz gibi özel bilgi kaynakları üzerinde eğitilebilir ve iş sistemleriyle sorunsuz bir şekilde entegre edilebilir.
Kod gerektirmeyen kurulumdan sonsuz özelleştirilebilirlik ve genişletilebilirliğe kadar uzanan tek platform olan Botpress , sohbet botunuzda en son GPT sürümünün gücünü otomatik olarak elde etmenizi sağlar - çaba gerektirmez.
Bugün inşa etmeye başlayın. Ücretsiz.
İçindekiler
Yapay zeka ajanlarıyla ilgili en son gelişmelerden haberdar olun
Bunu paylaşın: