Apa yang dimaksud dengan Asisten Suara?
Asisten suara adalah perangkat lunak yang dapat memahami dan merespons perintah yang diucapkan dalam bahasa alami. Mereka juga bisa disebut asisten pintar dan ini mungkin deskripsi yang lebih akurat karena dalam banyak kasus mereka dapat dihubungkan dengan teks melalui obrolan. Tentu saja, mereka juga dikenal sebagai bot.
Dalam beberapa tahun terakhir, adopsi asisten suara semakin meningkat terutama dalam bentuk asisten rumah tangga yang diaktifkan dengan suara seperti Alexa dan Google Home.
Produk-produk ini memungkinkan pengguna untuk memerintahkan perangkat lunak untuk melakukan berbagai hal hanya dengan suara mereka. Sebagai contoh, pengguna dapat memutar musik di Spotify atau memutar video di Youtube hanya dengan memerintahkan asisten suara pintar untuk melakukannya.
Perangkat asisten pribadi dimungkinkan oleh terobosan dalam AI, khususnya dalam bidang yang disebut pemrosesan bahasa alami.
Bagaimana Asisten Suara Menggunakan NLP untuk Pengenalan Suara?
Pemrosesan Bahasa Alami adalah teknologi yang memungkinkan komputer memahami maksud di balik frasa yang diucapkan. Ini berbeda dengan pengenalan suara yang menyalin kata-kata yang diucapkan menjadi teks. Pengenalan suara tentu saja juga diperlukan untuk asisten digital yang dikendalikan dengan suara. Pengenalan suara mentranskripsikan kata-kata yang diucapkan menjadi teks dan pemrosesan bahasa alami menentukan maksud pengguna di balik teks tersebut.
Pemrosesan Bahasa Alami penting dan berguna karena manusia menginstruksikan asisten suara menggunakan frasa yang berbeda yang memiliki arti yang sama. Misalnya, mereka dapat mengatakan, "Mainkan X di Youtube", atau "Tolong cari X di Youtube dan mainkan" atau "Di Youtube, tolong mainkan lagu X", dll.
NLP dapat mendeteksi bahwa semua frasa ini memiliki arti yang sama. Hal ini berguna bagi manusia, selain dari fakta bahwa mereka dapat berinteraksi dengan perangkat hanya dengan suara karena mereka tidak perlu mengingat perintah atau sintaks yang tepat untuk mengoperasikan perangkat. NLP juga sangat mudah bagi pengembang untuk mempelajari cara mengaturnya dan karena alasan ini, NLP merupakan bagian penting dari kerangka kerja bot apa pun.
Pro dan Kontra Asisten Suara
Seperti yang dikatakan oleh siapa pun yang pernah mencoba menggunakan asisten suara, mereka bagus untuk beberapa hal, tetapi tidak sempurna. Misalnya, Anda tidak dapat melakukan percakapan seperti manusia dengan mereka. Percakapan akan cepat rusak jika Anda mencobanya.
Juga sulit untuk mengetahui apa yang bisa atau tidak bisa mereka lakukan hanya dengan berinteraksi dengan mereka. Suara ternyata merupakan antarmuka yang buruk untuk mengambil banyak informasi dengan cepat. Memindai halaman web, misalnya, adalah cara yang jauh lebih baik untuk mendapatkan informasi dengan cepat.
Apa yang sangat mereka kuasai adalah salah satu perintah atau pertanyaan. Mereka bekerja dengan baik terutama dalam kasus di mana pengguna tahu persis hasil yang mereka inginkan, misalnya, mereka ingin memutar video tertentu di youtube yang mereka tahu namanya dan di mana jawaban atas sebuah pertanyaan adalah frasa sederhana, seperti jawaban untuk "berapa suhu di kota saya?".
Kita sering lupa bahwa asisten suara itu hanyalah antarmuka perangkat lunak. Kami menyebutnya asisten karena Anda dapat berbicara dengan mereka dan oleh karena itu mudah untuk mengonseptualisasikan mereka memiliki semacam kualitas seperti manusia. Gagasan ini semakin diperkuat oleh fakta bahwa kita harus memanggil mereka dengan nama mereka dengan kata kunci, "Hey Google", "Alexa", "Siri" untuk mengaktifkannya. Jika kita tidak memiliki kata kunci, mereka tidak akan tahu kapan mereka diajak bicara dan oleh karena itu kapan harus merespons. Kata kunci tersebut mencuci otak kita untuk berpikir tentang asisten suara lebih sebagai semacam asisten yang hampir seperti manusia daripada sebagai antarmuka perangkat lunak. Dan itu mencuci otak anak-anak muda untuk percaya bahwa Google atau Alexa adalah semacam Diet yang dapat menyebabkan kerusakan permanen pada mereka ketika mereka menemukan bahwa ini adalah perusahaan yang mendominasi dunia.
Pada kenyataannya, asisten suara hanyalah antarmuka perangkat lunak lain, misalnya setara dengan antarmuka grafis. Antarmuka grafis memiliki peran yang mirip dengan antarmuka suara, tetapi tidak dapat dimanusiakan dengan cara yang sama.
Tentu saja, antarmuka suara digunakan secara berbeda dengan antarmuka grafis. Ternyata antarmuka suara biasanya digunakan sebagai tambahan untuk antarmuka grafis, tetapi tidak sebaliknya.
Hal ini sebagian karena antarmuka grafis telah dibuat untuk sebagian besar aplikasi dan oleh karena itu menambahkan antarmuka suara ke dalamnya memungkinkan pengguna untuk berinteraksi dengan perangkat lunak. Seperti meminta asisten suara untuk memutar video youtube. Anda dapat memutar video menggunakan antarmuka grafis tetapi akan lebih lambat untuk melakukannya.
Dapat juga dikatakan bahwa antarmuka grafis lebih lengkap daripada antarmuka suara karena akan sangat sulit untuk melakukan beberapa tugas menggunakan suara yang dapat dengan mudah dilakukan pada antarmuka grafis. Untuk memahami hal ini, bayangkan jika Anda meminta kolega Anda untuk membuat spreadsheet untuk Anda dengan memberikan instruksi melalui telepon, dibandingkan dengan membuat spreadsheet sendiri menggunakan antarmuka grafis.
Meskipun antarmuka suara biasanya tidak terlalu penting, namun antarmuka ini memberikan tingkat kenyamanan baru dalam situasi tertentu. Ini biasanya merupakan kenyamanan yang dapat Anda jalani tanpa perlu kecuali dalam situasi yang jarang terjadi di mana interaksi bebas genggam sangat penting.
Masa Depan Asisten Suara
Mengingat keterbatasan mereka, pertanyaannya adalah apakah asisten suara akan menjadi lebih penting di masa depan atau apakah mereka akan tetap menjadi produk pinggiran.
Jelas bagi kami bahwa asisten suara akan menjadi jauh lebih populer dan digunakan secara luas di masa depan karena satu alasan, mereka akan sepenuhnya terintegrasi dengan antarmuka pengguna grafis.
Meskipun sulit untuk menggantikan antarmuka pengguna grafis dengan suara, sangat mungkin untuk menggabungkan antarmuka suara dan grafis. Hal ini sedang dilakukan pada tingkat yang sangat terbatas saat ini dengan Google Assistant (yang memungkinkan halaman web memberikan konteks) dan Bixby.
Antarmuka generasi berikutnya yang akan kita sebut sebagai antarmuka "kombinasi" akan mengintegrasikan grafik, teks, dan suara ke dalam pengalaman terbaik bagi pengguna. Hal ini tidak hanya akan memungkinkan pengguna untuk menyelesaikan tugas dengan lebih cepat dan dengan kurva pembelajaran yang lebih sedikit (karena suara memungkinkan pengguna untuk berinteraksi dengan perangkat lunak tanpa mengetahui perintah yang tepat), tetapi AI yang memantau interaksi akan memungkinkan antarmuka berkembang dan menjadi lebih baik dengan sendirinya.
Instruksi suara saat aplikasi pertama kali diluncurkan akan bekerja secara berbeda setelah aplikasi belajar dari ribuan interaksi tentang tindakan terbaik.
Menarik juga untuk mempertimbangkan bagaimana agar suara dapat diadopsi secara penuh, perlu ada perubahan dalam perilaku pengguna. Saat ini, orang lebih banyak mengetik teks dan menggunakan antarmuka grafis pada ponsel pintar mereka daripada berbicara ke ponsel dan menggunakan asisten suara.
Hal ini karena teknologi pengenalan suara belum sempurna. Selama beberapa dekade telah ada pintasan suara pada ponsel dan komputer, tetapi pintasan ini tidak banyak digunakan karena tingkat kesalahannya sangat tinggi sehingga rasa sakit karena kesalahan tersebut lebih besar daripada manfaat dari kenyamanan setelah hal yang baru itu hilang.
Bayangkan jika pengenalan suara sempurna dan tidak ada tingkat kesalahan.
Dalam hal ini, akan jauh lebih cepat bagi orang untuk "mengetik" email, misalnya, menggunakan suara daripada mengetik di ponsel cerdas mereka. Setelah titik kritis ini tercapai, bantuan suara akan ada di mana-mana untuk jenis tugas-tugas ini.
Agar bot dapat menjalankan teknologi NLP dan pengenalan suara, keduanya harus beroperasi pada tingkat yang tinggi. Meskipun pengenalan suara sudah bekerja dengan sangat baik, NLP, seperti yang telah kita bahas, hanya bekerja dengan baik untuk domain yang sempit.
Hal yang menarik di sini adalah bahwa pengenalan suara bekerja jauh lebih baik di domain yang sempit karena alasan yang jelas, ada lebih sedikit kemungkinan kata-kata yang mungkin diucapkan pengguna.
Ini berarti bahwa kita sudah berada pada titik di mana kita dapat membuat chatbots yang hampir sempurna dalam domain yang sempit. Dengarkan saja Demo Google Duplex.
Hal ini akan mengarah pada adopsi suara yang sangat cepat setelah penemuan dan masalah terkait diselesaikan.
Suara Pertama
Idenya adalah bahwa suara akan menjadi panggilan pertama ketika seseorang membutuhkan bantuan.
Dalam dunia Voice First, perangkat akan menjadi lebih tidak terlihat karena orang hanya perlu melihatnya untuk tugas-tugas yang tidak dapat dilakukan dengan suara.
Orang tidak hanya akan memiliki satu perangkat di ruang tamu mereka, mereka akan memiliki perangkat suara yang murah di setiap ruangan. Perangkat-perangkat ini akan terhubung satu sama lain, ke perangkat IoT dan ke ponsel pintar dan komputer. Beberapa dari perangkat ini mungkin dapat memproyeksikan gambar di dinding.
Orang-orang akan dapat mengajukan pertanyaan atau memberikan perintah saat mereka sedang mandi atau menyikat gigi. Mereka tidak perlu mengingat banyak hal untuk memberi tahu bot suara di lantai bawah.
Akan ada cara yang jauh lebih baik untuk menemukan fungsionalitas dan "melatih" manusia tentang cara menggunakan bot secara efisien.
Meskipun ada banyak masalah dengan perangkat asisten suara saat ini, sebagian besar masalah ini lebih berkaitan dengan cara penggunaannya daripada teknologi yang mendasarinya. Kami yakin dalam waktu singkat aplikasi pembunuh untuk suara akan muncul dan ini akan menjadi peristiwa yang mengubah cara penggunaan perangkat lunak. Hal ini juga akan membutuhkan beberapa standarisasi teknologi dan protokol suara, tetapi ini adalah hambatan yang tidak akan menghambat kemajuan untuk waktu yang lama.
Kami menantikan dunia yang penuh dengan kenyamanan di mana perangkat suara siap membantu di hampir semua tempat dan waktu.
Daftar Isi
Dapatkan informasi terbaru tentang agen AI
Bagikan ini: