Sektördeki pek çok kişi teknolojideki "bir sonraki büyük şeyin" blockchain, insan çalışanların yerini alan yapay zeka veya artırılmış gerçeklik olduğunu savunsa da, hafife alınan çok önemli bir teknoloji var: sesli kullanıcı arayüzü.
Araştırmalar, 2020 yılına kadar arama sorgularının %50 'sinin sesli arama yoluyla yapılacağını gösteriyor. Ancak bu araştırmanın hafife aldığı şey, sesli kullanıcı arayüzündeki küçük iyileştirmelerin mevcut insan-bilgisayar etkileşimi paradigmasını tamamen değiştirme potansiyeline sahip olmasıdır. Bu, arama kullanım durumunun ötesine geçerek, sesli kullanıcı arayüzünün grafik kullanıcı arayüzlerinin ve uygulamaların yerini almasına veya onlarla derinlemesine entegre olmasına kadar uzanmaktadır.
Sesli kullanıcı arayüzü, insanların şu anda Alexa veya Google Home gibi cihazlarda bulunan akıllı hoparlörler ve diğer cihazlar aracılığıyla cihazlarla doğal konuşma dilinde iletişim kurmasına olanak tanır. Konuşma, diğer insanlarla işlerimizi halletme şeklimiz için temeldir ve gelecekte bilgisayarlarla işlerimizi halletme şeklimiz için de temel olacaktır.
Ancak bu şu anda uç bir görüştür.
Çoğu teknoloji uzmanı sesin teknoloji ekosistemindeki mevcut niş rolünü geliştirmeye devam edeceği ya da en azından teknoloji geliştikçe kademeli olarak büyüyeceği konusunda hemfikir olsa da benim tahminim sesin kendi başına ana olay olacağı yönünde. Yazılım ve cihazlarla olan etkileşimlerimize hakim olacak ve hatta grafik kullanıcı arayüzü kadar önemli hale gelecektir.
Belirtildiği gibi, bu ana akım bir görüş değil. Birçok sektör uzmanı sesin hala bir yenilik olduğunu ve henüz mükemmel bir ürün-pazar uyumuna ulaşmadığını kabul ediyor. Örneğin bazı önde gelen VC'ler, genelleştirilmiş yapay zeka elde edilene kadar ses teknolojisinin her zaman çok niş olacağı görüşündeler.
Sesli asistanların mevcut sınırlamaları nedeniyle, insanların sesi bir sonraki teknoloji dalgası olarak hayal etmesi zor. Bana göre bugün ses, 90'ların başındaki çevirmeli web'e benziyor. O zamanlar çevrimiçi deneyim o kadar kötüydü ki bant genişliği arttığında nelerin mümkün olabileceğini hayal etmek zordu. Önde gelen düşünürler internet için geriye dönüp bakıldığında saçma bir şekilde muhafazakar görünen her türlü tahminde bulundular - hatta bazı uzmanlar internetin ekonomi üzerinde faks makinelerinden daha fazla etkisi olmayacağını öngördüler.
İnsanların sese ilişkin beklentileri, kısmen ses deneyiminin hala ne kadar zorlu olduğu nedeniyle bugün de benzer şekilde muhafazakar. Varsayım, genelleştirilmiş yapay zeka elde edilene kadar botların konuşmalarda kötü performans göstereceği ve sohbet botları kullanıcıyla insana yakın bir konuşma yapabilene kadar teknolojinin asla mükemmel olmayacağı yönündedir. Ancak, genelleştirilmiş yapay zeka ihtiyacına ilişkin bu varsayım hatalı: Mevcut teknolojiyi kullanarak sohbet robotlarının neredeyse insan seviyesinde bir performansa ulaşmasını sağlamanın kesinlikle yolları vardır.
Genel akıllı hoparlör asistanları için konu kapsamı o kadar geniş ki, neredeyse tamamen kendi kendine öğrenmeleri gerekiyor. Ne yazık ki mevcut teknoloji, insanlarla çok turlu konuşmaların üstesinden gelebilecek kendi kendine öğrenen botları otomatik olarak yaratacak kadar iyi değil. Eğer bu teknoloji mevcut olsaydı, Google'da takip soruları sorabilirdik. Ancak akıllı botların kendi kendilerini oluşturmalarını sağlamak, bir akıllı telefon uygulamasının herhangi bir insan müdahalesi olmadan kendi kendini oluşturmasını sağlamaya çalışmak gibi - şu anda mümkün değil.
Botlarla insan seviyesine yakın konuşmalar gerçekleştirmenin bir başka yolu daha var: kapsamlarını büyük ölçüde daraltmak. Tıpkı uygulamalarda olduğu gibi, geliştiriciler belirli görevler için sofistike botlar oluşturabilir ve bunları anlamlı konuşmalara girmeleri için manuel olarak programlayabilirler. Bu tür botlar sayesinde seste çığır açılacak: akıllı hoparlörler, telefonlar ve diğer cihazlar bu tür botlara ev sahipliği yapacak ve işleri doğru yapan ilk oyuncular için büyük fırsatlar yaratacak.
Günümüzün ses botlarının sorunlarını ele alma
Mevcut ses botlarının deneyimi ile bu teknolojinin gelecekte nasıl görüneceği arasındaki farkı sezgisel olarak kavramak için, bir ses cihazının şu anda neden çevirmeli modemde internette gezinmeye eşdeğer olduğunu anlayarak başlamamız gerekiyor.
İlk olarak, bir ses botu ile temel etkileşimler hala çok zayıf. Cihaza özellikle sıcak bir kelime ile hitap etmeniz ve ardından botun başarılı bir şekilde etkinleştirilip etkinleştirilmediğini görmek için beklemeniz gerekir. Etkinleştirildiyse, bip sesinden sonra yavaş ama tutarlı bir hızda konuşmanız ve cümlelerinizi gerekli tüm parametreleri içerecek şekilde formüle etmeniz gerekir - neredeyse bir SQL deyiminde konuşuyormuşsunuz gibi. Herhangi bir anda düşünmek için duraklarsanız, etkileşiminiz başarısız olur ve başa dönmeniz gerekir.
Gerçek hayattan bir örneğe bakalım:
"Hey, Google." diyorsun.
Cihazın etkinleştirildiğinin onaylanmasını beklerken bir duraklama olur.
Etkinleştirilmişse, talebinize devam edersiniz:
"Oturma odasındaki televizyonda YouTube'da Katy Perry'nin 'Dark Horse' şarkısını çal."
Cihaz söylediklerinizi işlerken bir gecikme daha olur.
İsteğiniz başarılı olursa, TV'nizde bir şeyler olmaya başlayacak ve video oynatılacaktır.
Eğer başarılı olamazsanız, başa dönüp tekrar denemeniz gerekir; belki farklı bir cümle yapısı, farklı kelimeler ya da sadece daha net konuşmaya çalışarak.
Bu deneyim gecikmelerle, olası hatalarla doludur ve görevleri tamamlamak için birçok yeniden başlatma gerekebilir. Buna ek olarak, sesli bot henüz akıllı değildir ve ne yaptığınızla ilgili komutlara veya sorgulara yanıt vermez.
Sesli botlarla etkileşim kurmanın yeni bir yolu
Geleceğin akıllı botlarıyla etkileşimi hayal etmenin en kolay yolu, cihazı kontrol eden ve ona özellikle YouTube'u çalıştırma konusunda talimatlar veren (ve başka hiçbir şey yapmayan) bir insan operatörü hayal etmektir.
İlk fark etkileşim hızındadır. "İnsan" operatörle normal bir hızda konuşabilirsiniz, yanıtta duraklama veya gecikme olmaz ve konuşurken durakladığınızda sorun yaşamazsınız. Ayrıca bir cümlenin ortasında insan operatöre referans verebilirsiniz - örneğin, "TV izlemek istiyorum - biliyor musun Alexa, lütfen YouTube'a bir şeyler koy." Aslında, yanıt vermelerini sağlamak için adlarını (sıcak kelime) söylemeniz gerekmeyebilir.
Bu insan benzeri bot, sizinle nasıl etkileşime gireceği konusunda da esnek olacaktır:
Sen: "Alexa, YouTube izlemek istiyorum."
Alexa: "Tabii, hangi televizyonda?"
Sen: "Mutfak televizyonunda - belki Katy Perry'den bir şeyler."
Alexa: "Aklınızda belirli bir şarkı var mı?"
Sen: "Hayır, ne önerebilirsin?"
İnsan: "'Roar,' 'Dark Horse'? Ekrana daha fazla öneri koydum."
Sen: "Harika, teşekkürler. "Sıcak ve Soğuk "u çal."
Bu, bot etkileşimlerinin geleceğidir: Sorunsuz, pürüzsüz ve eldeki görev veya konu hakkında konuşması kolay. Bu botlardan oluşan geniş bir evren ile ucuz, metalaştırılmış ses cihazlarından oluşan aynı derecede geniş bir evren hayal edin. Her odada ve her cihazın yanında bir insan operatörün olması gibi bir şey olacak. Yine de çok sayıda grafik kullanıcı arayüzü olacak, ancak bunların bot aracılığıyla kullanımı çok daha kolay olacak.
Sesingeleceğine adım atmak
Günümüzde metro istasyonları, havaalanları ve süpermarketler gibi yerlerde self-servis dokunmatik ekranları kullananlara yardım eden çalışanlar görmek yaygındır - örnek olarak havaalanında biniş kartınızı almak için check-in makinelerini kullanmanıza yardımcı olan kişi verilebilir. Ancak bu kişinin check-in uygulamasıyla doğrudan arayüz oluşturabildiğini düşünün - yani check-in işleminin yarısında makineye koltuğunuzu başlangıçta seçtiğiniz konumdan değiştirmek istediğinizi söyleyebilirsiniz ve uygulama sizin için ilgili ekranı getirecektir - hepsi bir insan asistanın yardımı olmadan.
Gelecek bu: bir ses botu, etkileşim kurmak istediğiniz her cihaza veya hizmete gömülü veya erişilebilir olacak ve komut verdiğiniz şeyi anında yapacak. Artık bir işi halletmek için telefonunuzu veya dizüstü bilgisayarınızı çıkarmanıza gerek kalmayacak - bunun yerine, tek yapmanız gereken ihtiyacınız olanı yüksek sesle söylemek olacak ve her şey bundan sonra yerine oturacak.
Sese geçiş, nihayetinde kolaylık kadar basit bir şeyle ilgili olacaktır. Modern dünyamızda insanlar işleri en az zahmetle hızlı bir şekilde yapmak istiyor ve hız her zamankinden daha önemli. Chatbot endüstrisiyle bağlantılı olanların çoğu şu anda bunu öngörmüyor olsa da, teknolojiyi araştıran ve geliştiren bizler, iş operasyonları, pazarlama, satış, markalaşma, ürün dağıtımı ve daha fazlası için büyük etkiler öngörüyoruz. Ses, teknolojinin geleceğidir ve biz şimdiden yolu yarılamış durumdayız.
İçindekiler
Yapay zeka sohbet robotlarıyla ilgili en son gelişmelerden haberdar olun
Bunu paylaşın: