Apakah itu Pembantu Suara?
Pembantu suara ialah perisian yang boleh memahami dan bertindak balas terhadap arahan yang dituturkan dalam bahasa semula jadi. Mereka juga boleh dipanggil pembantu pintar dan ini mungkin penerangan yang lebih tepat kerana dalam banyak kes mereka boleh di antara muka dengan teks melalui sembang. Sudah tentu, mereka juga dikenali sebagai bot.
Dalam tahun-tahun kebelakangan ini, penggunaan pembantu suara dimatikan terutamanya dalam bentuk pembantu rumah yang diaktifkan suara seperti Alexa dan Google Home.
Produk ini membolehkan pengguna mengarahkan perisian untuk melakukan perkara hanya dengan suara mereka. Sebagai contoh, pengguna boleh memainkan muzik di Spotify atau memainkan video di Youtube hanya dengan mengarahkan pembantu suara pintar untuk berbuat demikian.
Peranti pembantu peribadi dimungkinkan oleh penemuan dalam AI, khususnya di kawasan yang dipanggil pemprosesan bahasa semula jadi.
Bagaimanakah Pembantu Suara Menggunakan NLP untuk Pengecaman Suara?
Pemprosesan Bahasa Semulajadi adalah teknologi yang membolehkan komputer memahami niat di sebalik frasa yang dituturkan. Ini berbeza dengan pengecaman pertuturan yang menyalin kata-kata yang dituturkan ke teks. Pengecaman pertuturan tentu saja diperlukan untuk pembantu digital kawalan suara. Pengecaman pertuturan menyalin kata-kata yang dituturkan kepada teks dan pemprosesan bahasa semula jadi menentukan niat pengguna di sebalik teks.
Pemprosesan Bahasa Semulajadi adalah penting dan berguna kerana manusia mengarahkan pembantu suara menggunakan frasa yang berbeza yang mempunyai makna yang sama. Sebagai contoh, mereka boleh berkata, "Main X di Youtube", atau "Sila cari X di Youtube dan mainkannya" atau "Di Youtube sila mainkan lagu X", dsb.
NLP dapat mengesan bahawa semua frasa ini mempunyai makna yang sama. Ini berguna untuk manusia, selain daripada fakta bahawa mereka boleh berinteraksi dengan peranti dengan suara sahaja kerana mereka tidak perlu mengingati arahan atau sintaks yang tepat untuk mengendalikan peranti. NLP juga sangat mudah bagi pemaju untuk belajar bagaimana untuk menubuhkan dan atas sebab ini ia adalah bahagian penting dalam mana-mana rangka kerja bot.
Pembantu Suara Kebaikan dan Keburukan
Sebagai sesiapa yang sebenarnya telah cuba menggunakan pembantu suara akan memberitahu anda, mereka baik untuk sesuatu tetapi tidak sempurna. Anda tidak boleh mempunyai perbualan seperti manusia dengan mereka sebagai contoh. Perbualan akan cepat rosak jika anda mencuba.
Ia juga sukar untuk mengetahui apa yang mereka boleh atau tidak boleh lakukan hanya dengan berinteraksi dengan mereka. Suara ternyata adalah antara muka yang lemah untuk mendapatkan banyak maklumat dengan cepat. Mengimbas laman web, sebagai contoh, adalah cara yang lebih baik untuk mendapatkan maklumat dengan cepat.
Apa yang mereka sangat baik adalah satu daripada arahan atau soalan. Mereka berfungsi dengan baik terutamanya dalam kes di mana pengguna tahu dengan tepat hasil yang mereka inginkan, sebagai contoh, mereka ingin memainkan video tertentu di youtube bahawa mereka tahu nama dan di mana jawapan kepada soalan adalah frasa mudah, seperti jawapan kepada "apakah suhu di bandar saya?".
Kita sering lupa pembantu suara itu hanyalah antara muka perisian lain. Kami memanggil mereka pembantu kerana anda boleh bercakap dengan mereka dan oleh itu mudah untuk mengkonseptualisasikan mereka sebagai mempunyai kualiti seperti manusia. Idea ini diperkukuhkan lagi oleh fakta bahawa kita perlu memanggil mereka dengan nama dengan perkataan panas, "Hey Google", "Alexa", "Siri" untuk mengaktifkannya. Jika kita tidak mempunyai perkataan panas, mereka tidak akan tahu bila mereka bercakap dan oleh itu bila hendak bertindak balas. Kata kunci tidak brainwash kita untuk memikirkan pembantu suara lebih sebagai sejenis pemikiran hampir pembantu manusia daripada sebagai antara muka perisian. Dan ia brainwashes anak-anak muda untuk mempercayai bahawa Google atau Alexa adalah sejenis Dieties yang mungkin melakukan mereka beberapa kerosakan yang berkekalan apabila mereka mendapati bahawa ini adalah syarikat yang menguasai dunia.
Pada hakikatnya, pembantu suara hanyalah antara muka perisian lain iaitu setara contohnya dengan antara muka grafik. Antara muka grafik memainkan peranan yang sama dengan antara muka suara tetapi ia tidak boleh berperikemanusiaan dengan cara yang sama.
Antara muka suara digunakan secara berbeza untuk antara muka grafik tentu saja. Ternyata antara muka suara biasanya digunakan sebagai tambahan kepada antara muka grafik tetapi bukan sebaliknya.
Ini sebahagiannya kerana antara muka grafik telah dibina untuk kebanyakan aplikasi dan oleh itu menambah antara muka suara kepada mereka membolehkan pengguna cara lain berinteraksi dengan perisian. Seperti meminta pembantu suara memainkan video youtube. Anda boleh memainkan video menggunakan antara muka grafik tetapi lebih perlahan untuk melakukannya.
Ia juga boleh dikatakan bahawa antara muka grafik lebih lengkap daripada antara muka suara kerana sangat sukar untuk melakukan beberapa tugas menggunakan suara yang boleh dilakukan dengan mudah pada antara muka grafik. Untuk memahami perkara ini bayangkan cuba mendapatkan rakan sekerja anda untuk membina hamparan untuk anda dengan memberi mereka arahan melalui telefon berbanding membina hamparan itu sendiri menggunakan antara muka grafik.
Walaupun antara muka suara biasanya tidak diperlukan, ia menyediakan tahap kemudahan baru dalam situasi tertentu. Ini biasanya kemudahan yang anda boleh hidup tanpa jika perlu kecuali dalam keadaan yang jarang berlaku di mana interaksi bebas tangan adalah penting.
Masa Depan Pembantu Suara
Memandangkan batasan mereka, persoalannya ialah sama ada pembantu suara akan menjadi lebih penting pada masa akan datang atau sama ada mereka akan kekal sebagai produk pinggiran.
Sudah jelas kepada kita bahawa pembantu suara akan menjadi lebih popular dan digunakan secara meluas pada masa akan datang kerana satu sebab, mereka akan disepadukan sepenuhnya dengan antara muka pengguna grafik.
Walaupun sukar untuk menggantikan antara muka pengguna grafik dengan suara, sangat sesuai untuk menggabungkan antara muka suara dan grafik. Ini dilakukan pada tahap yang sangat terhad sekarang dengan Google Assistant (yang membolehkan halaman web memberikan konteks) dan Bixby.
Antara muka generasi akan datang yang akan kami panggil antara muka "gabungan" akan mengintegrasikan grafik, teks dan suara ke dalam pengalaman terbaik untuk pengguna. Ini bukan sahaja membolehkan pengguna menyelesaikan tugas dengan lebih cepat dan dengan kurang keluk pembelajaran (kerana suara membolehkan pengguna berinteraksi dengan perisian tanpa mengetahui arahan yang tepat) tetapi pemantauan AI interaksi akan membolehkan antara muka berkembang dan menjadi lebih baik sendiri.
Arahan suara apabila apl pertama kali dilancarkan akan berfungsi secara berbeza sebaik sahaja aplikasi telah belajar daripada beribu-ribu interaksi apa tindakan terbaik.
Ia juga menarik untuk mempertimbangkan bagaimana suara untuk diterima pakai sepenuhnya perlu ada perubahan dalam tingkah laku pengguna. Sekarang orang menaip teks dan menggunakan antara muka grafik pada telefon pintar mereka jauh lebih banyak daripada mereka bercakap ke telefon mereka dan menggunakan pembantu suara.
Ini kerana teknologi pengecaman suara tidak sempurna. Selama beberapa dekad terdapat pintasan suara pada telefon dan komputer tetapi pintasan ini tidak digunakan secara meluas kerana kadar kesilapan sangat tinggi sehingga kesakitan perakaunan untuk kesilapan melebihi manfaat kemudahan selepas kebaharuan telah dipakai.
Bayangkan jika pengecaman suara sempurna dan tiada kadar kesilapan.
Dalam kes ini, lebih cepat bagi orang untuk "menaip" e-mel, contohnya, menggunakan suara daripada dengan menaip pada telefon pintar mereka. Sebaik sahaja titik kritikal ini dicapai, bantuan suara akan sentiasa ada untuk jenis tugas ini.
Untuk bot berlepas kedua-dua NLP dan teknologi pengecaman suara perlu beroperasi pada tahap yang tinggi. Walaupun pengecaman suara berfungsi dengan baik, NLP, seperti yang telah kita bincangkan, hanya berfungsi dengan baik untuk domain sempit.
Perkara yang menarik di sini ialah pengecaman suara berfungsi lebih baik dalam domain sempit atas sebab-sebab yang jelas, terdapat kata-kata yang kurang mungkin yang boleh dikatakan oleh pengguna.
Ini bermakna bahawa kita sudah dapat membuat chatbots yang hampir sempurna dalam domain sempit. Hanya dengar Demo Dupleks Google.
Ini akan membawa kepada penggunaan suara yang sangat cepat sebaik sahaja penemuan dan isu-isu yang berkaitan diselesaikan.
Suara Pertama
Ideanya ialah suara akan menjadi port panggilan pertama apabila seseorang memerlukan bantuan.
Dalam peranti dunia Voice First akan menjadi lebih tidak kelihatan kerana orang hanya perlu melihatnya untuk tugas yang mereka tidak boleh gunakan suara untuk dilakukan.
Orang tidak hanya akan mempunyai satu peranti di ruang tamu mereka, mereka akan mempunyai peranti suara murah di setiap bilik. Peranti ini akan disambungkan antara satu sama lain, ke peranti IoT dan telefon pintar dan komputer. Sesetengah peranti ini mungkin dapat memproyeksikan imej pada dinding.
Orang akan dapat bertanya atau memberi arahan semasa mereka berada di bilik mandi atau memberus gigi mereka. Mereka tidak perlu ingat perkara untuk memberitahu bot suara di tingkat bawah.
Akan ada cara yang lebih baik untuk menemui fungsi dan "latihan" manusia tentang cara menggunakan bot dengan cekap.
Walaupun terdapat banyak masalah dengan peranti pembantu suara sekarang kebanyakan masalah ini berkaitan dengan cara ia digunakan dan bukannya teknologi asas. Kami percaya dalam tempoh yang singkat aplikasi pembunuh untuk suara akan muncul dan ini akan menjadi acara yang mengubah permainan untuk cara perisian digunakan. Ini juga memerlukan penyeragaman teknologi suara dan protokol, tetapi ini adalah halangan yang tidak akan menghalang kemajuan untuk jangka masa panjang.
Kami menantikan dunia kemudahan utama di mana peranti suara bersedia membantu di hampir mana-mana tempat atau masa.
Senarai Kandungan
Ikuti perkembangan terkini tentang ejen AI
Kongsi ini pada: