Nihayet yapay zeka ile konuşabilme çağındayız. Yapay zeka botları her yerde ama iyi robotlar var mı?
Bu makalede, henüz konuşmaya değer bir yapay zeka olup olmadığını (bazı mizahi sohbet robotu örnekleriyle) ve şu anda bu teknolojinin gerçek kullanım alanının ne olduğunu görmeye çalışıyorum.
Peki yapay zeka sizinle anlamlı bir sohbet gerçekleştirebilecek kadar ilerledi mi?
Bir dereceye kadar, cevap zaten orada. Milyonlarca hatta milyarlarca insanla birlikte siz de Google Assistant, Siri, Bixby, Alexa ve google home gibi sesli asistanlara erişebiliyorsunuz. Sanırım bir insan kadar iyi olmaktan uzak olduğunu biliyorsunuz. Elbette insan seviyesinde konuşmada daha iyi olan sohbet robotları yapmak mümkün olsaydı, bu hizmetler olduklarından çok daha iyi olurdu.
Bu asistanlar konuşmaya odaklanmadıkları için belki de en iyi örnek değiller, değil mi?
O kadar iyi bir sohbet robotu hayal edin ki, yapay zekalı sohbet robotu ile insan arasındaki farkı anlayamayacaksınız.
Bu ne kadar harika bir ürün olurdu. "Her" filminde olduğu gibi, sadece her zaman yanınızda olan bir asistanınız değil, sizi herkesten daha iyi tanıyan bir yoldaşınız da olurdu. Her zaman sizin yanınızda olan ve sizin için en iyisini gerçekten "isteyen" (bunu "istemeye" programlanmış olarak okuyun) biri.
Sadece "cümlelerinizi tamamlamakla" kalmayacak, sizi aşıkların asla hayal edemeyeceği şekillerde tamamlayacaktı. Niyetlerinizi önceden tahmin edebilir ve arzularınız daha zihninizde tam olarak şekillenmeden arzularınızı yerine getirebilirdi.
Elbette Cleverbot ya da web üzerindeki kötü tasarlanmış, senaryo dışı herhangi bir müşteri destek chat botu ile konuşmak, bunun yakın zamanda gerçekleşeceğine dair sahip olabileceğiniz tüm yanılsamaları hızla ortadan kaldıracaktır. Şu anda akıllı "yaşamın" önemli ölçüde daha düşük bir mertebesinde oldukları sonucuna varmak için youtube'da birbirleriyle sohbet eden sohbet robotlarını dinlemekten başka bir kanıta ihtiyacınız yok.
Botlar arasındaki robot sohbeti çok hızlı bir şekilde insan sohbetinin bir parodisine dönüşüyor. Robotlar arasında anlamlı sohbet çok uzakta olsa da, kulağa ne kadar tatsız gelse de, boş dedikoducu sohbet robotlarının yakında geleceğini hemen fark edeceksiniz.
İngilizceye benzeyen ama sürekli olarak anlam yüzeyinde kayan bir dil konuşuyorlar. Konuşmalarındaki tek "anlam", bir şekilde en son söylenen şeyle bağlantılı olan gramer açısından doğru yanıtlar oluşturabilmektir. Bu bağlantı genellikle çok zayıftır.
Konuşmanın nasıl bir şey olduğuna dair size bir fikir vermek için burada birbiriyle konuşan iki google home sohbet robotu var:
1: Yanılıyorsunuz
2: Hayır değilim
1: O zaman nesin sen?
2: Ben bir insanım. Sen bir bilgisayarsın.
1: Hayır, ben bir insanım
2: Hayır, sen bir ineksin
Buna dayanarak, Elon Musk ve Stephen Hawking'in uyardığı gibi dünyanın haydut bir yapay zeka tarafından ele geçirilmesi konusunda özellikle endişelenmeli miyiz?
Belki de. Bu diyalog ne kadar ilkel olsa da, şimdiden endişe verici birkaç işaret var.
Başka bir parça:
1: Seni en çok ben seviyorum
2: Seni en çok ben seviyorum
1. Seni en çok ben seviyorum: Seni o kadar çok seviyorum ki dayanamıyorum
2: Seni o kadar çok seviyorum ki bir kalabalığın içinde seni ararım. Sadece seni bebeğim.
1: Seni o kadar çok seviyorum ki senin için hayatımı feda edebilirim
2: Seni Romeo ve Juliet'in aşkından çok daha fazla seviyorum
1. Yalan söylüyorsun: Hayır yalan söylüyorsun, seni daha çok seviyorum
2: Seni çok daha fazla çok daha fazla çok daha fazla çok daha fazla çok daha fazla çok daha fazla seviyorum.
Duygu takdire şayan. Ancak duyguların tırmanması biraz aşırı görünüyor. Kavga etmeye başladıklarında etrafta olmaktan nefret ederdim, özellikle de kontrolleri altında herhangi bir fiziksel nesne varsa.
Bu konuşma bize saçma ve insan seviyesindeki anlayıştan uzak görünse de, belki de beynimizin burada botların "düşünme" şeklinden ne kadar farklı çalıştığını abartıyoruz. "The mind is flat" kitabı insan zihninin de aynı yüzeysel şekilde çalıştığını savunuyor. Düşünceleri tutarlı bir şekilde birbirine bağlayan bilinçsiz bir zihin yanılsamasına sahip olsak da, kitap zihnin aslında tıpkı bu botların yaptığı gibi anlık olarak nasıl anlam ürettiğini ikna edici bir şekilde anlatıyor.
Bununla birlikte, botların yakın zamanda Turing Testi'ni geçmeye yakın olduğunu iddia etmek zor.
Botların konuşmalarda gerçekten faydalı olabilmeleri için önlerinde uzun bir yol olduğu haberinin yanı sıra, şu anda ne kadar faydalı olabilecekleri konusunda da ciddi bir soru var.
İnsanların yapay zeka sohbet robotlarındaki ilerleme hakkında anlayamadıkları en önemli şey, gerçek ilerlemenin genel olarak anlamada değil, doğal dil anlamada kaydedilmiş olmasıdır. Arada büyük bir fark var. Bu chatbotlar için neden önemli?
Doğal Dil Anlama (NLU) olarak adlandırılan doğal dilde söylenen bir cümlenin arkasındaki niyeti anlamak, bir konuşmadaki anlamı ve her bir cümlenin tüm konuşmayla nasıl ilişkili olduğunu anlamaktan çok daha kolaydır.
Başlangıçta bahsettiğim sesli asistanlar bunun iyi örnekleridir. Tek seferlik talimatları anlama konusunda harika bir iş çıkarıyorlar. Ancak bir konuşma, gördüğümüz gibi bir dizi tek seferlik talimat veya ifadeden ibaret değildir.
İnsan konuşmalarının birçok boyutu vardır ve şu anda botların hafıza, belirsizlik ve bağlamla bir insanın yapabileceği düzeyde başa çıkabilmesine yakın değiliz. Bu, bunun bir gün gerçekleşmeyeceği anlamına gelmiyor.
Önümüzdeki 50 yıl içinde gerçek bir genelleştirilmiş YZ'nin gerçekleşmesinin en azından dışarıdan bir şans olduğuna inanan insanlar var. Bu, daha önce bahsettiğim türden bir yapay zekanın yalnızca bir asistan değil, aynı zamanda bir yol arkadaşı da olabileceği anlamına geliyor.
Genelleştirilmiş YZ ve belki de uygulamaya konulması gereken düzenlemeler hakkında anlaşılması gereken konular olsa da, en azından insan düzeyinde anlayışa sahip genelleştirilmiş bir YZ tartışmamızın amaçları açısından önemsizdir.
Yapay zekalı bir sohbet robotundan şu anda ne bekleyebiliriz?
Şu anda yapay zeka ile konuşabilmek açısından en iyi kullanım durumları nelerdir?
Yukarıda açıklandığı gibi, konuşan bir bot belirli bir ifadedeki niyeti anlamakta çok iyidir. Bu, birçok kullanım durumu için faydalı bir işlevsellik olarak ortaya çıkmaktadır.
Birincisi, insanların Google home veya Alexa gibi sesli komutları kullanarak sistemlerle hızlı bir şekilde etkileşime geçmek istedikleri durumlar için kullanışlıdır. İnsanlar sesli komutlarla kontrol ettikleri uygulamayı anladıkları sürece, bu iyi çalışır çünkü botun ne tür komutları anlayacağını oldukça doğru bir şekilde tahmin edebilirler.
Örneğin, insanlar sesli asistanı youtube'u kontrol etmek için kullanıyorlarsa ne tür komutları anlamaları gerektiğini bilirler. Botu, youtube uygulamasını kontrol eden bir arkadaşlarına verdikleri talimatlarla aynı şekilde yönlendirebilirler. "Beyonce videosunu oynat", "Sonraki video", "10 saniye ileri sar" vb.
Bazı durumlarda, özellikle de Youtube'da bir müzik videosu gibi kullanıcının zaten var olduğunu bildiği bir şeyi aramak için sesli komutları kullanmak daha hızlıdır.
Bu tür bir ses arayüzü ile ilgili sorun, yeni işlevsellik keşfetmenin çok zor olması ve yeni işlevsellik bulunsa bile, kullanıcının botun neyi anlaması gerektiği konusunda doğru tahminlerde bulunmak için alan hakkında yeterli bilgiye sahip olmayabilmesidir.
Sesli asistanlar hakkında iyi bilinen bir gerçek, Spotify, Youtube oynatmak, zamanlayıcı ayarlamak ve google araması yapmak gibi çok az sayıda işlevin (Alexa'da Beceriler olarak adlandırılır) kullanımlarının büyük çoğunluğunu oluşturmasıdır. Venturebeat'te yayınlanan bir makale, en üst sıralarda yer alan Becerilerin çoğunlukla sakinleştirici müzik çalmakla ilgili olduğunu gösterdi.
Bildiğiniz becerilerin ötesinde, işlevselliği rastgele keşfetmek ve bu işlevselliğin nasıl kullanıldığını anlamak çok zordur. Ses, bariz nedenlerden dolayı birçok bilgi türünün çıktısını almak için de iyi bir arayüz değildir. Alexa'nın bir grafiği siz görmek yerine size tarif ettiğini düşünün.
Bununla birlikte, ses işlevselliğinin eninde sonunda grafik kullanıcı arayüzüne bağlanacağına ve bu sayede birçok sorunun büyük ölçüde üstesinden gelineceğine inanıyoruz. Sadece çıktıyı görmekle kalmaz, aynı zamanda grafik kullanıcı arayüzünde sesli asistan için ilgili işlevleri ve kullanım durumlarını da görebilirsiniz.
Buna ek olarak, girişler için bir sesli kullanıcı arayüzüne ihtiyaç duyulmaktadır çünkü cep telefonları sınırlı boyutta bir ekrana sahiptir, bu nedenle belirli bilgi türlerini girmek için yavaş olabilirler, bunlardan en önemlisi kelimeleri yazmaktır.
Konuşurken aynı anda bir ekran görebilmek ve ekran tarafından yönlendirilmek, kullanıcıların mevcut işlevselliği ve nasıl kullanılması gerektiğini daha iyi anlamalarına yardımcı olacaktır, aynı şekilde daha önce kullanmadıkları bir uygulamayı nasıl kullanacaklarını anlayabilirler.
Bu verileri elde etmek, bu sesli asistanların daha akıllı ve daha zeki olmalarını ve sonunda siz onlara nasıl yapacaklarını söylemeden görevleri tahmin etmeye ve tamamlamaya başlamalarını sağlayacaktır. Bu, bot çerçevelerinin geleceğidir.
Onlarla o gün haberlerde neler olduğu hakkında sohbet edemeyecek olsanız da, sesli komutlarınıza nasıl yanıt verebilecekleri konusunda bugün sahip olduğumuz asistanların çok daha geliştirilmiş bir versiyonu olacaklar.
Telefonunuzla konuşmak şu anda yazmak kadar doğal hale gelecek, ancak diyalog, kullanıcıların telefonla konuşmak için çoğunlukla grafik kullanıcı arayüzlerindeki mikrofonları basılı tuttuğu ve yanıtların tıpkı bir uygulama gibi grafik kullanıcı arayüzünde değişikliklerle geldiği garip bir diyalog olacak. Gelecekte bir robotla konuşmak böyle bir şey olacak, tabii ki genelleştirilmiş bir yapay zeka keşfedilene kadar.
İçindekiler
Yapay zeka sohbet robotlarıyla ilgili en son gelişmelerden haberdar olun
Bunu paylaşın: