Ano ang Voice Assistant?
Ang voice assistant ay software na nakakaunawa at nakakatugon sa mga utos na sinasalita sa natural na wika. Maaari din silang tawaging mga matalinong katulong at maaaring ito ay isang mas tumpak na paglalarawan dahil sa maraming mga kaso maaari silang ma-interface sa text sa chat. Siyempre, kilala rin sila bilang mga bot.
Sa mga nakalipas na taon, inalis ang pag-ampon ng mga voice assistant lalo na sa anyo ng mga voice-activated home assistant gaya ng Alexa at Google Home.
Ang mga produktong ito ay nagbibigay-daan sa mga user na mag-utos ng software na gawin ang mga bagay gamit lamang ang kanilang mga boses. Halimbawa, ang isang user ay maaaring magpatugtog ng musika sa Spotify o mag-play ng video sa Youtube sa pamamagitan lamang ng pag-utos sa smart voice assistant na gawin ito.
Ang personal assistant device ay naging posible sa pamamagitan ng mga tagumpay sa AI, partikular sa isang lugar na tinatawag na natural na pagpoproseso ng wika.
Paano Gumagamit ang Voice Assistants ng NLP para sa Voice Recognition?
Ang Natural Language Processing ay isang teknolohiya na nagbibigay-daan sa mga computer na maunawaan ang intensyon sa likod ng isang binibigkas na parirala. Iba ito sa speech recognition na nag-transcribe ng mga binibigkas na salita sa text. Siyempre, kailangan din ang speech recognition para sa mga digital assistant na kinokontrol ng boses. Ang speech recognition ay nagsasalin ng mga binibigkas na salita sa teksto at ang natural na pagpoproseso ng wika ay tumutukoy sa layunin ng gumagamit sa likod ng teksto.
Mahalaga at kapaki-pakinabang ang Natural Language Processing dahil tinuturuan ng mga tao ang mga voice assistant gamit ang iba't ibang parirala na may parehong kahulugan. Halimbawa, maaari nilang sabihin, "I-play ang X sa Youtube", o "Pakihanap ang X sa Youtube at i-play ito" o "Sa Youtube paki-play ang kanta X", atbp.
Maaaring makita ng NLP na ang lahat ng mga pariralang ito ay may parehong kahulugan. Ito ay kapaki-pakinabang para sa mga tao, bukod sa ang katunayan na maaari silang makipag-ugnayan sa device gamit ang boses lamang dahil hindi nila kailangang matandaan ang isang eksaktong command o syntax upang patakbuhin ang device. Nakakagulat din na madaling matutunan ng mga developer kung paano mag-set up ang NLP at sa kadahilanang ito ay mahalagang bahagi ito ng anumang balangkas ng bot .
Mga Kalamangan at Kahinaan ng Voice Assistants
Tulad ng sasabihin sa iyo ng sinumang aktwal na sinubukang gumamit ng voice assistant, ang mga ito ay mabuti para sa isang bagay ngunit hindi perpekto. Hindi ka maaaring magkaroon ng isang tulad-tao na pakikipag-usap sa kanila halimbawa. Mabilis na masisira ang pag-uusap kung susubukan mo.
Mahirap ding alamin kung ano ang kaya o hindi nila sa pamamagitan lamang ng pakikisalamuha sa kanila. Ang boses ay lumalabas na isang mahinang interface para sa mabilis na pagkuha ng maraming impormasyon. Ang pag-scan sa isang web page, halimbawa, ay isang mas mahusay na paraan ng mabilis na pagkuha ng impormasyon.
Ang napakahusay nila ay isa sa mga utos o tanong. Gumagana nang maayos ang mga ito lalo na sa kaso kung saan alam ng user ang eksaktong resulta na gusto nila, halimbawa, gusto nilang mag-play ng isang partikular na video sa youtube na alam nila ang pangalan at kung saan ang sagot sa isang tanong ay isang simpleng parirala, tulad ng sagot sa "ano ang temperatura sa aking lungsod?".
Madalas nating nakakalimutan na ang mga voice assistant na iyon ay isa pang interface ng software. Tinatawag namin silang mga katulong dahil maaari mo silang kausapin at samakatuwid ay madaling i-konsepto sila bilang may uri ng kalidad na parang tao. Ang ideyang ito ay higit na pinalakas ng katotohanang kailangan nating tawagan sila sa pangalan gamit ang isang mainit na salita, "Hey Google", "Alexa", "Siri" upang maisaaktibo ang mga ito. Kung wala tayong mainit na salita hindi nila malalaman kung kailan sila kinakausap at kung kailan sila tutugon. Ang hotword ay nag-brainwash sa atin sa pag-iisip tungkol sa voice assistant nang higit pa bilang isang uri ng pag-iisip na halos katulong ng tao kaysa bilang isang software interface. At nagdudulot ito ng utak sa mga bata sa paniniwalang ang Google o Alexa ay ilang uri ng Dieties na maaaring magdulot sa kanila ng pangmatagalang pinsala kapag natuklasan nila na ang mga ito ay mga korporasyong nangingibabaw sa mundo.
Sa katotohanan, ang mga voice assistant ay isa lamang software interface ie isang katumbas na halimbawa sa isang graphical na interface. Ang isang graphical na interface ay gumaganap ng isang katulad na tungkulin sa isang voice interface ngunit hindi ito maaaring gawing tao sa parehong paraan.
Ang mga interface ng boses ay ginagamit nang iba sa mga graphical na interface siyempre. Lumalabas na ang mga voice interface ay karaniwang ginagamit bilang karagdagan sa mga graphical na interface ngunit hindi sa kabilang banda.
Ito ay bahagyang dahil ang mga graphical na interface ay binuo na para sa karamihan ng mga application at samakatuwid ang pagdaragdag ng isang voice interface sa mga ito ay nagbibigay-daan sa mga user ng isa pang paraan ng pakikipag-ugnayan sa software. Tulad ng pagtatanong sa isang voice assistant na mag-play ng youtube video. Maaari mong i-play ang video gamit ang graphical na interface ngunit magiging mas mabagal na gawin iyon.
Masasabi rin na ang graphical na interface ay mas kumpleto kaysa sa isang voice interface dahil magiging napakahirap gawin ang ilang mga gawain gamit ang boses na madaling gawin sa isang graphical na interface. Upang maunawaan ang puntong ito, isipin na sinusubukan mong gawin ang iyong kasamahan na bumuo ng isang spreadsheet para sa iyo sa pamamagitan ng pagbibigay sa kanila ng mga tagubilin sa pamamagitan ng telepono kumpara sa paggawa ng spreadsheet sa iyong sarili gamit ang graphical na interface.
Bagama't karaniwang hindi kailangan ang mga voice interface, nagbibigay ang mga ito ng bagong antas ng kaginhawahan sa ilang partikular na sitwasyon. Ito ay karaniwang kaginhawaan na maaari mong mabuhay nang wala kung kinakailangan maliban sa mga bihirang pagkakataon kung saan ang hands-free na pakikipag-ugnayan ay mahalaga.
Ang Kinabukasan ng Mga Voice Assistant
Dahil sa kanilang mga limitasyon, ang tanong ay kung ang mga voice assistant ay magiging mas mahalaga sa hinaharap o kung sila ay mananatiling isang fringe na produkto.
Malinaw sa amin na ang mga voice assistant ay magiging mas sikat at malawakang ginagamit sa hinaharap dahil sa isang dahilan, ganap na maisasama ang mga ito sa mga graphical na user interface.
Bagama't mahirap palitan ng boses ang mga graphical na user interface, napakabisang pagsamahin ang isang voice at graphical na interface. Ginagawa ito sa napakalimitadong lawak sa ngayon gamit ang Google Assistant (na nagbibigay-daan sa isang web page na magbigay ng konteksto) at Bixby.
Ang susunod na henerasyon ng mga interface na tatawagin nating "kombinasyon" na mga interface ay isasama ang mga graphics, text at boses sa pinakamagandang karanasan para sa user. Hindi lamang nito papayagan ang mga user na magawa ang mga gawain nang mas mabilis at may mas kaunting curve sa pagkatuto (dahil ang boses ay nagbibigay-daan sa mga user na makipag-ugnayan sa software nang hindi alam ang mga eksaktong command) ngunit ang pagsubaybay ng AI sa mga pakikipag-ugnayan ay magbibigay-daan sa mga interface na mag-evolve at maging mas mahusay sa kanilang sarili.
Ang isang boses na pagtuturo kapag unang inilunsad ang app ay gagana nang iba kapag natutunan ng app mula sa libu-libong mga pakikipag-ugnayan kung ano ang pinakamahusay na paraan ng pagkilos.
Ito rin ay kagiliw-giliw na isaalang-alang kung paano upang ganap na matanggap ang boses ay kailangang magkaroon ng pagbabago sa gawi ng gumagamit. Sa ngayon, ang mga tao ay nagta-type ng text at gumagamit ng mga graphical na interface sa kanilang mga smartphone nang higit pa kaysa sa nagsasalita sila sa kanilang mga telepono at gumagamit ng mga voice assistant.
Ito ay dahil ang teknolohiya sa pagkilala ng boses ay hindi perpekto. Sa loob ng maraming dekada, nagkaroon ng mga voice shortcut sa mga telepono at computer ngunit ang mga shortcut na ito ay hindi gaanong ginagamit dahil napakataas ng mga rate ng error na ang sakit ng accounting para sa error ay higit pa sa benepisyo ng kaginhawaan pagkatapos na mawala ang bagong bagay.
Isipin kung perpekto ang voice recognition at walang mga rate ng error.
Sa kasong ito, magiging mas mabilis para sa mga tao na "mag-type" ng isang email, halimbawa, gamit ang boses kaysa sa pag-type sa kanilang smartphone. Kapag naabot na ang kritikal na puntong ito, magiging ubiquitous ang tulong gamit ang boses para sa mga ganitong uri ng gawain.
Para maalis ng mga bot ang parehong NLP at teknolohiya sa pagkilala ng boses ay kailangang gumana sa mataas na antas. Bagama't gumagana nang mahusay ang pagkilala ng boses, ang NLP, tulad ng napag-usapan natin, ay gumagana lamang nang maayos para sa mga makitid na domain.
Ang kawili-wiling punto dito ay ang pagkilala ng boses ay mas mahusay na gumagana sa makitid na mga domain para sa mga malinaw na kadahilanan, mayroong mas kaunting posibleng mga salita na maaaring sabihin ng gumagamit.
Nangangahulugan ito na tayo ay nasa punto na ng magagawang lumikha ng mga chatbot na halos perpekto sa isang makitid na domain. Makinig lang sa Google Duplex Demos.
Ito ay hahantong sa napakabilis na paggamit ng boses sa sandaling malutas ang pagtuklas at mga kaugnay na isyu.
Voice First
Ang ideya ay ang boses ang magiging unang port of call kapag may nangangailangan ng tulong.
In a Voice First world ang mga device ay magiging mas invisible dahil kakailanganin lang tingnan ng mga tao ang mga ito para sa mga gawaing hindi nila magagamit gamit ang boses para gawin.
Ang mga tao ay hindi lang magkakaroon ng isang device sa kanilang sala, magkakaroon sila ng murang voice device sa bawat kuwarto. Ikokonekta ang mga device na ito sa isa't isa, sa mga IoT device at sa mga smartphone at computer. Ang ilan sa mga device na ito ay maaaring makapag-project ng mga larawan sa mga dingding.
Ang mga tao ay maaaring magtanong o magbigay ng mga utos habang sila ay nasa shower o nagsisipilyo ng kanilang mga ngipin. Hindi na nila kailangang tandaan ang mga bagay na sasabihin sa voice bot sa ibaba.
Magkakaroon ng mas mahusay na paraan ng pagtuklas ng functionality at "pagsasanay" sa mga tao kung paano mahusay na gamitin ang mga bot.
Bagama't maraming problema sa mga voice assistant device sa ngayon, karamihan sa mga problemang ito ay may kinalaman sa kung paano ginagamit ang mga ito kaysa sa pinagbabatayan na teknolohiya. Naniniwala kami na sa maikling panahon ay lalabas ang mga killer app para sa boses at ito ay magiging isang kaganapan sa pagbabago ng laro para sa paraan ng paggamit ng software. Mangangailangan din ito ng ilang standardisasyon ng mga teknolohiya at protocol ng boses, ngunit ito ay mga hadlang na hindi hahadlang sa pag-unlad nang matagal.
Inaasahan namin ang isang mundo ng tunay na kaginhawahan kung saan ang mga voice device ay handang tumulong sa halos anumang lugar o oras.
Talaan ng mga Nilalaman
Manatiling napapanahon sa pinakabago sa mga ahente ng AI
Ibahagi ito sa: