Isa sa mga pinakakaraniwang tanong na nakukuha namin mula sa mga potensyal na customer at user ay "Nasaan ang iyong mga intent classifiers?"
Wala kami. At oo, ito ay sinasadya.
Botpress gamit LLMs upang matukoy ang layunin ng gumagamit. Bakit? Ito ay mas mahusay para sa parehong mga tagabuo at mga gumagamit ng isang ahente ng AI .
Malakas ang pakiramdam namin tungkol sa paninindigang ito, kaya gusto kong maglaan ng ilang minuto upang ipaliwanag ang aming kakulangan ng mga intent classifier.
TLDR; Mas madaling buuin, mas tumpak, at mas simple ang pagpapanatili.
Ang matanda (pre- LLM ) araw
(Kung pamilyar ka sa kung ano ang mga intent classifier at kung ano ang ginagawa ng mga ito, huwag mag-atubiling laktawan ang seksyong ito.)
Ang intent classifier ay isang tool na ikinakategorya ang mga input ng user sa mga paunang natukoy na layunin batay sa data ng pagsasanay.
Kailangang i-curate at lagyan ng label ng mga developer ang hindi mabilang na mga halimbawa para sa bawat posibleng layunin, umaasa na maitugma ng system ang mga input ng user sa mga halimbawang ito.
Halimbawa, sa isang e-commerce na chatbot , maaaring tukuyin ng mga developer ang isang layunin tulad ng "TrackOrder". Maaaring kasama sa kanilang mga halimbawang pananalita ang: "Nasaan ang aking pakete?" "Subaybayan ang aking order," at "Maaari mo bang tingnan ang katayuan ng paghahatid para sa akin?"
Talagang sinasanay nila ang ahente ng AI na kilalanin ang layunin ng user sa pamamagitan ng pagbibigay ng mga halimbawa. At oo, kailangan nilang ipasok ang lahat ng iyon sa pamamagitan ng kamay.
Sa kabutihang-palad, ang pangangailangang gawin itong manu-manong pagmamapa ng mga posibleng pagbigkas sa isang layunin ay nawala na LLMs naging mas advanced.
Ngunit maraming pang-usap na platform ng AI ang gumagamit pa rin ng mga ito. Bakit? Aabot tayo diyan.
4 na kawalan ng mga intent classifier
Ito ay hindi lamang na ito ay isang mas mahabang proseso – ang mga intent classifier ay nakakapagod sa maraming dahilan. Narito ang ilan:
1. Pag-asa sa data
Gutom sa data ang mga intent classifier. Kailangan nila ng napakalaking, kinatawan na dataset ng mga halimbawa ng user para sa bawat layunin na gumana nang tumpak. Kung wala ito, nahihirapan silang i-classify nang tama ang mga input.
At ang pagbuo ng mga dataset na ito ay isang slog. Ang mga developer ay gumugugol ng walang katapusang mga oras sa pangangalap at pag-label ng mga halimbawa, na - walang duda - hindi isang mahusay na paggamit ng kanilang oras.
2. Limitadong scalability
Ang mga intent classifier ay hindi rin binuo upang sukatin. Ang pagdaragdag ng mga bagong layunin ay nangangahulugan ng pagkolekta ng higit pang data at muling pagsasanay sa modelo, na mabilis na nagiging isang bottleneck para sa pag-unlad. Plus , maaari silang maging isang sakit sa ulo ng pagpapanatili - dahil habang umuunlad ang paggamit ng wika, gayon din ang mga pagbigkas.
3. Mahinang pag-unawa sa wika
Ang mga intent classifier ay kulang sa tunay na pag-unawa sa wika. Nakikibaka sila sa mga pagkakaiba-iba sa wika, tulad ng:
- Mga kasingkahulugan
- Mga paraphrase
- Hindi maliwanag na parirala
- Mga typo
- Mga hindi pamilyar na kolokyal na ekspresyon
- Mga fragment na input
Karaniwan din nilang pinoproseso ang bawat pagbigkas nang hiwalay, na nangangahulugang wala silang kakayahang mapanatili ang konteksto sa buong pag-uusap.
4. Overfitting
Ang mga intent classifier ay madaling kapitan ng overfitting, kung saan nagsaulo sila ng mga halimbawa ng pagsasanay sa halip na matuto ng mga pangkalahatang pattern.
Nangangahulugan iyon na mahusay silang gumaganap sa mga eksaktong pariralang nakita nila ngunit nahihirapan sa mga bago o iba't ibang input. Ginagawa nitong mas malutong ang mga ito kaysa sa naaangkop para sa isang kaso ng propesyonal na paggamit.
6 na dahilan LLMs ay mas mahusay
LLMs lahat maliban sa nalutas ang mga isyung ito. Naiintindihan nila ang konteksto at nuance, at hindi kailangan ng mga dev na punan sila ng data ng pagsasanay para makapagsimula sila. Ang isang ahente na nakabase sa LLM ay maaaring magsimulang makipag-usap mula sa sandaling ito ay nilikha.
1. Zero-shot na mga kakayahan sa pag-aaral
LLMs hindi kailangan ng mga halimbawa para matuto. Ang kanilang malawak na pretraining ay nangangahulugan na naiintindihan na nila ang konteksto, nuance, at layunin nang hindi nangangailangan ng mga developer na bigyan sila ng mga partikular na halimbawa.
2. Isang maliit na bagay na tinatawag na nuance
LLMs excel kung saan kulang ang mga intent classifier. Maaari nilang bigyang-kahulugan ang mga idyoma, panunuya, at hindi malinaw na wika nang madali.
Ang kanilang malawak na pagsasanay sa magkakaibang mga dataset ay nagbibigay sa kanila ng kakayahang maunawaan ang mga banayad na nuances ng komunikasyon ng tao na kadalasang hindi nakuha ng mga intent classifier.
3. Mas magandang konteksto
LLMs huwag mawalan ng subaybay sa usapan. Naaalala nila ang sinabi kanina, na ginagawang natural na dumadaloy ang mga pakikipag-ugnayan at pakiramdam na mas magkakaugnay.
Tinutulungan din sila ng kontekstong ito na i-clear ang mga ambiguity. Kahit na ang input ay malabo o kumplikado, maaari nilang pagsama-samahin ito sa pamamagitan ng pagtingin sa mas malawak na pag-uusap.
4. Scalability
LLMs ay 100% mas mahusay sa scaling. Hindi nila kailangan ng muling pagsasanay upang kumuha ng mga bagong paksa, salamat sa kanilang malawak na pag-unawa sa wika.
Ginagawa nitong handa silang pangasiwaan ang halos anumang kaso ng paggamit sa labas ng kahon. Para sa mga multi-agent system , ito ay isang no-brainer na gumamit ng isang LLM sa halip na isang intent classifier.
5. Kakayahang umangkop
LLMs huwag umasa sa mga matibay na template. Ang kanilang flexibility ay nangangahulugan na ang mga tugon ay natural, iba-iba, at perpektong iniangkop sa pag-uusap. Mas magandang karanasan ang mga ito para sa mga user kaysa sa mga brittle intent classifier.
6. Mas kaunting data ng pagsasanay
LLMs hindi kailangan ng data na may label na partikular sa gawain upang magawa ang trabaho. Ang kanilang kapangyarihan ay nagmumula sa napakalaking pretraining sa magkakaibang text, kaya hindi sila umaasa sa mga masusing naka-annotate na mga dataset.
Kung kinakailangan, palaging maaaring i-customize ng mga dev ang isang LLM para sa kanilang proyekto. Halimbawa, LLMs ay maaaring maayos na may kaunting data, upang mabilis silang makaangkop sa mga espesyal na kaso o industriya ng paggamit.
Bakit gumagamit ang ibang mga kumpanya ng mga intent classifier?
Magandang tanong. Kung LLMs ay mas mahusay sa pag-uuri ng mga layunin, kung gayon bakit napakaraming kumpanya pa rin ang gumagamit ng mga intent classifier?
Ang sagot ay hindi maganda, at hindi ito ang pinakadiplomatikong sasabihin: ito ay isang problema ng legacy tech.
Karamihan sa mga kumpanya ay may sariling interes sa paggamit ng mga intent classifier. Nagtayo sila ng malalaking base sa pag-install na tumatakbo dito. Wala silang dahilan para iwasan ang kanilang mga user mula sa system na kanilang binuo.
Pero Botpress ay LLM -una
LLMs ay mas mahusay sa pagtukoy ng mga layunin kaysa sa mga makalumang intent classifier. Kaya naman nagre-rewrote kami from scratch to be LLM - una sa 2020.
Alam namin na mas mahusay na teknolohiya ang dumating, at sa halip na kumapit sa legacy tech, namuhunan kami sa pagkuha ng hakbang.
Magdaragdag ba tayo ng mga intent classifier?
Hindi. Masyado kaming nagmamalasakit sa aming karanasan sa builder at karanasan ng kanilang mga user.
Ang hinaharap ng pag-uuri ng layunin
Ang mga intent classifier ay isang tool ng nakaraan. Kaya naman lahat kami pumasok LLMs .
Bilang LLMs patuloy na bubuti, gayundin ang binuo ng mga ahente ng AI Botpress . Kami ay handa at nasasabik na patuloy na itaas ang antas para sa kung ano ang magagawa ng pakikipag-usap na AI.
Kung naghahanap ka na bumuo ng mga flexible na ahente ng AI na pinapagana ng LLMs , huwag mag-atubiling simulan ang pagbuo sa Botpress . Ito ay libre.