Bagama't marami sa industriya ay maaaring magtaltalan na ang "susunod na malaking bagay" sa tech ay blockchain, pinapalitan ng AI ang mga manggagawang tao o augmented reality, mayroong isang mahalagang teknolohiya na minamaliit: ang voice user interface.
Iminumungkahi ng pananaliksik na ang 50% ng mga query sa paghahanap ay gagawin sa pamamagitan ng paghahanap gamit ang boses sa 2020. Gayunpaman, ang minamaliit ng pananaliksik na ito ay ang maliliit na pagpapabuti sa voice UI ay may potensyal na ganap na baguhin ang kasalukuyang paradigm ng pakikipag-ugnayan ng tao-computer. Lumalampas ito sa kaso ng paggamit sa paghahanap patungo sa pagpapalit ng voice UI o malalim na pagsasama sa mga graphical na user interface at app.
Ang voice UI ay nagbibigay-daan sa mga tao na makipag-ugnayan sa mga device sa natural na sinasalitang wika sa pamamagitan ng mga smart speaker at iba pang device, na kasalukuyang matatagpuan sa mga device gaya ng Alexa o Google Home. Ang pagsasalita ay mahalaga sa paraan kung paano natin ginagawa ang mga bagay sa ibang tao, at magiging mahalaga ito sa paraan ng paggawa natin ng mga bagay gamit ang mga computer sa hinaharap.
Gayunpaman, ito ay kasalukuyang isang pambihirang opinyon.
Bagama't karamihan sa mga eksperto sa teknolohiya ay sasang-ayon na ang boses ay patuloy na magbabago sa kasalukuyang angkop na tungkulin nito sa ecosystem ng teknolohiya, o sa pinakamaliit na paglaki nang paunti-unti habang bumubuti ang teknolohiya, ang hula ko ay ang boses ang pangunahing kaganapan sa sarili nito. Darating ito upang dominahin ang aming mga pakikipag-ugnayan sa software at mga device, at maging kasinghalaga ng graphical na user interface.
Gaya ng nabanggit, hindi ito isang pangunahing opinyon. Kinikilala ng maraming eksperto sa industriya na ang boses ay bago pa rin at hindi pa nakakamit ng perpektong produkto-market fit. Ang ilang kilalang VC, halimbawa, ay may opinyon na hangga't hindi nakakamit ang pangkalahatang artificial intelligence, ang teknolohiya ng boses ay palaging magiging napaka angkop.
Dahil sa maraming kasalukuyang limitasyon ng mga voice assistant , mahirap para sa mga tao na isipin ang boses bilang susunod na alon ng teknolohiya. Sa aking pananaw, ang boses ngayon ay katulad ng dial-up web noong unang bahagi ng '90s. Noon, napakasama ng karanasan sa online na mahirap isipin kung ano ang magiging posible kapag bumuti ang bandwidth. Ang mga nangungunang nag-iisip ay gumawa ng lahat ng uri ng mga hula para sa internet na mukhang walang katotohanan kung isasaalang-alang - ang ilang mga eksperto ay hinulaang hindi na ito magkakaroon ng higit na epekto sa ekonomiya kaysa sa mga fax machine .
Ang mga inaasahan ng mga tao para sa boses ay katulad na konserbatibo ngayon, sa isang bahagi dahil sa kung gaano kahirap ang karanasan sa boses. Ang pagpapalagay ay hanggang sa makamit ang pangkalahatang artificial intelligence, hindi maganda ang performance ng mga bot sa mga pag-uusap — at hindi magiging maganda ang teknolohiya hanggang sa ang mga chatbot ay may kakayahang makipag-usap nang malapit sa tao sa user. Gayunpaman, ang pagpapalagay na ito tungkol sa pangangailangan para sa pangkalahatan na artificial intelligence ay may depekto: May mga tiyak na paraan ng pagkuha ng mga chatbot upang makamit ang halos antas ng pagganap ng tao gamit ang kasalukuyang teknolohiya.
Para sa mga pangkalahatang assistant ng matalinong tagapagsalita, napakalawak ng saklaw ng paksa, na kailangan nilang halos ganap na matuto sa sarili. Sa kasamaang-palad, ang kasalukuyang teknolohiya ay hindi sapat na mabuti upang awtomatikong lumikha ng mga self-learning na bot na maaaring humawak ng mga multi-turn na pag-uusap sa mga tao. Kung umiiral nga ang teknolohiyang iyon, makakapagtanong kami ng mga follow-up na tanong sa Google. Ngunit ang pagkakaroon ng mga matalinong bot na bumuo ng kanilang mga sarili ay tulad ng pagsubok na gumawa ng isang smartphone app na bumuo mismo nang walang anumang pakikilahok ng tao — hindi ito posible sa ngayon.
May isa pang paraan upang makamit ang halos antas ng tao na pag-uusap sa mga bot: lubhang paliitin ang saklaw ng mga ito. Tulad ng para sa mga app, ang mga developer ay maaaring lumikha ng mga sopistikadong bot para sa mga partikular na gawain, manu-manong i-program ang mga ito upang makisali sa makabuluhang pag-uusap. Sa mga ganitong uri ng bot darating ang tagumpay para sa boses: ang mga smart speaker, telepono at iba pang device ay magho-host ng mga ganitong uri ng mga bot, na lumilikha ng malalaking pagkakataon para sa mga unang gumagalaw na nagkakaayos ng mga bagay-bagay.
Pagtugon sa mga isyu ng mga voice bot ngayon
Upang madaling maunawaan ang pagkakaiba sa pagitan ng karanasan ng kasalukuyang mga voice bot at kung ano ang magiging hitsura ng teknolohiyang ito sa hinaharap, kailangan nating magsimula sa pamamagitan ng pag-unawa kung bakit ang isang voice device ay kasalukuyang katumbas ng pag-surf sa web sa isang dial-up modem.
Una, ang mga pangunahing pakikipag-ugnayan sa isang voice bot ay napakahirap pa rin. Kailangan mong partikular na tugunan ang device gamit ang isang mainit na salita, pagkatapos ay kailangan mong maghintay upang makita kung matagumpay na na-activate ang bot o hindi. Kung na-activate ito, kailangan mong magsalita pagkatapos ng beep sa mabagal ngunit pare-parehong bilis at bumalangkas ng iyong mga pangungusap upang isama ang lahat ng kinakailangang parameter — halos tulad ng nagsasalita ka sa isang SQL statement. Kung huminto ka para mag-isip anumang sandali, mabibigo ang iyong pakikipag-ugnayan at kakailanganin mong bumalik sa simula.
Tingnan natin ang isang halimbawa sa totoong buhay:
Sabi mo, “Hey, Google.”
May pause habang naghihintay ka ng pagkilala na ang device ay na-activate na.
Kung na-activate na ito, magpapatuloy ka sa iyong kahilingan:
“I-play ang 'Dark Horse' ni Katy Perry sa YouTube, sa TV sa sala."
May isa pang pagkaantala habang pinoproseso ng device ang sinabi mo.
Kung matagumpay ang iyong kahilingan, may magsisimulang mangyari sa iyong TV at magpe-play ang video.
Kung hindi ito matagumpay, kailangan mong bumalik sa umpisa at subukang muli, marahil ay may ibang ayos ng pangungusap, ibang salita, o sinusubukang magsalita nang mas malinaw.
Ang karanasang ito ay puno ng mga pagkaantala, mga potensyal na error at maaaring tumagal ng maraming pag-restart upang magawa ang mga gawain. Bilang karagdagan, ang voice bot ay hindi pa matalino at hindi tumugon sa mga kaugnay na utos o query tungkol sa iyong ginagawa.
Isang bagong paraan ng pakikipag-ugnayan sa mga voice bot
Ang pinakamadaling paraan upang isipin ang mga pakikipag-ugnayan sa mga smart bot ng hinaharap ay sa pamamagitan ng paglarawan sa isang operator ng tao na kumokontrol sa device at pagbibigay dito ng mga tagubilin partikular na patungkol sa pagpapatakbo ng YouTube (at wala nang iba pa).
Ang unang pagkakaiba ay sa bilis ng pakikipag-ugnayan. Maaari kang makipag-usap sa operator na "tao" sa normal na bilis, nang walang mga paghinto o pagkaantala sa pagtugon, at walang mga problema kung huminto ka habang nagsasalita. Maaari mo ring i-reference ang human operator sa gitna ng isang pangungusap — halimbawa, “Gusto kong manood ng TV — alam mo, Alexa, mangyaring maglagay ng isang bagay sa YouTube.” Sa katunayan, maaaring hindi mo na kailangang sabihin ang kanilang pangalan (ang mainit na salita) upang makuha silang tumugon.
Magiging flexible din ang mala-tao na bot na ito kung paano sila nakipag-ugnayan sa iyo:
Ikaw: “Alexa, gusto kong manood ng YouTube.”
Alexa: "Oo naman, saang TV?"
Ikaw: “Sa kusinang TV — marahil ay gawa ni Katy Perry.”
Alexa: "May naiisip ka bang partikular na kanta?"
Ikaw: "Hindi, ano ang masusuggest mo?"
Tao: “'Ungal,' 'Madilim na Kabayo'? Naglagay ako ng higit pang mga mungkahi sa screen.”
Ikaw: "Magaling, salamat. Maglaro ng 'Hot and Cold.'”
Ito ang kinabukasan ng mga pakikipag-ugnayan ng bot : Seamless, maayos at madaling kausap tungkol sa gawain o paksang nasa kamay. Isipin ang isang malawak na uniberso ng mga bot na ito na may pantay na malawak na uniberso ng mura, commoditized na mga voice device. Ito ay magiging tulad ng pagkakaroon ng isang tao na operator na nakatayo sa bawat silid at sa tabi ng bawat aparato. Magkakaroon pa rin ng maraming mga graphical na UI, ngunit magiging mas madaling gamitin ang mga ito sa pamamagitan ng bot.
Paghakbang sa kinabukasan ng boses
Sa ngayon, karaniwan nang makakita ng mga empleyado sa mga lugar gaya ng mga istasyon ng metro, paliparan, at supermarket na nagbibigay ng tulong sa mga gumagamit ng mga self-service touchscreen — bilang halimbawa, ang taong tumutulong sa iyong gamitin ang mga check-in machine para makuha ang iyong boarding pass sa airport . Isipin, gayunpaman, na ang taong ito ay maaaring direktang makipag-ugnayan sa application ng pag-check-in — ibig sabihin, sa kalagitnaan ng proseso ng pag-check-in, maaari mong sabihin sa makina na gusto mong baguhin ang iyong upuan mula sa posisyon na orihinal mong pinili, at ang aplikasyon. ilalabas ang may-katuturang screen para sa iyo — lahat nang walang tulong ng isang katulong na tao.
Ito ang hinaharap : ang isang voice bot ay i-embed sa o maa-access sa bawat device o serbisyo na gusto mong makipag-ugnayan, at agad na gagawin ang iyong iuutos. Hindi mo na kakailanganing ilabas ang iyong telepono o laptop para may magawa — sa halip, ang kailangan mo lang gawin ay sabihin nang malakas kung ano ang kailangan mo, at lahat ay mahuhulog sa lugar mula doon.
Ang paglipat sa boses ay sa huli ay tungkol sa isang bagay na kasing simple ng kaginhawahan. Sa ating modernong mundo, gusto ng mga tao na gawin ang mga bagay nang mabilis nang hindi gaanong abala, at mas mahalaga ang bilis kaysa dati. Bagama't hindi ito inaasahan ng karamihan sa mga konektado sa industriya ng chatbot, ang mga taong nagsasaliksik at nagpapaunlad ng teknolohiya ay nahuhulaan ang napakalaking implikasyon para sa mga operasyon ng negosyo, marketing, benta, pagba-brand, pamamahagi ng produkto, at higit pa. Ang boses ang kinabukasan ng teknolohiya, at nasa kalagitnaan na tayo.
Talaan ng mga Nilalaman
Manatiling napapanahon sa mga pinakabago sa AI chatbots
Ibahagi ito sa: