Salah satu soalan paling biasa yang kami terima daripada bakal pelanggan dan pengguna ialah "Di manakah pengelas niat anda?"
Kami tidak mempunyai apa-apa. Dan ya, ia sengaja.
Botpress kegunaan LLMs untuk mengenal pasti niat pengguna. kenapa? Magnitud ini lebih baik untuk pembina dan pengguna ejen AI .
Kami berasa kuat tentang pendirian ini, jadi saya ingin mengambil beberapa minit untuk menerangkan kekurangan pengelas niat kami.
TLDR; Ia lebih mudah untuk dibina, ia lebih tepat, dan ia lebih mudah untuk diselenggara.
Yang lama (pra- LLM ) hari
(Jika anda sudah biasa dengan pengelas niat dan perkara yang mereka lakukan, jangan ragu untuk melangkau bahagian ini.)
Pengelas niat ialah alat yang mengkategorikan input pengguna ke dalam niat yang dipratentukan berdasarkan data latihan.
Pembangun perlu menyusun dan melabelkan banyak contoh untuk setiap niat yang mungkin, dengan harapan sistem dapat memadankan input pengguna kepada contoh ini.
Contohnya, dengan bot sembang e-dagang , pembangun mungkin mentakrifkan niat seperti "TrackOrder". Contoh ujaran mereka mungkin termasuk: "Di manakah pakej saya?" "Jejak pesanan saya," dan "Bolehkah anda menyemak status penghantaran untuk saya?"
Mereka pada dasarnya melatih ejen AI untuk mengenali niat pengguna dengan memberikan contoh. Dan ya, mereka perlu memasukkan semua itu dengan tangan.
Nasib baik, keperluan untuk melakukan pemetaan manual ini bagi kemungkinan ujaran kepada niat semuanya telah lenyap sebagai LLMs menjadi lebih maju.
Tetapi banyak platform AI perbualan masih menggunakannya. kenapa? Kami akan sampai ke sana.
4 kelemahan pengelas niat
Ia bukan sekadar proses yang lebih panjang – pengelas niat menyusahkan kerana banyak sebab. Berikut adalah beberapa:
1. Kebergantungan data
Pengelas niat memerlukan data. Mereka memerlukan set data yang besar dan mewakili contoh pengguna untuk setiap niat untuk berfungsi dengan tepat. Tanpa itu, mereka bergelut untuk mengklasifikasikan input dengan betul.
Dan membina set data ini adalah kerja yang sukar. Pembangun menghabiskan masa yang tidak berkesudahan untuk mengumpul dan melabelkan contoh, yang – tanpa ragu-ragu – tidak menggunakan masa mereka dengan baik.
2. Kebolehskalaan terhad
Pengelas niat juga tidak dibina mengikut skala. Menambah niat baharu bermakna mengumpul lebih banyak data dan melatih semula model, yang dengan cepat menjadi halangan untuk pembangunan. Plus , mereka boleh menjadi sakit kepala penyelenggaraan – kerana apabila penggunaan bahasa berkembang, begitu juga ujaran.
3. Kefahaman bahasa yang lemah
Pengelas niat tidak mempunyai pemahaman bahasa yang sebenar. Mereka bergelut dengan variasi dalam bahasa, seperti:
- sinonim
- Parafrasa
- Frasa yang tidak jelas
- kesilapan taip
- Ungkapan bahasa sehari-hari yang tidak dikenali
- Input berpecah-belah
Mereka juga biasanya memproses setiap ujaran secara berasingan, yang bermaksud mereka tidak mempunyai keupayaan untuk mengekalkan konteks sepanjang perbualan.
4. Pemasangan berlebihan
Pengelas niat terdedah kepada overfitting, di mana mereka menghafal contoh latihan dan bukannya mempelajari corak umum.
Ini bermakna mereka berprestasi baik pada frasa tepat yang mereka lihat tetapi bergelut dengan input baharu atau pelbagai. Ini menjadikan mereka lebih rapuh daripada yang sesuai untuk kes penggunaan profesional.
6 sebab LLMs adalah lebih baik
LLMs semua kecuali menyelesaikan isu-isu ini. Mereka memahami konteks dan nuansa, dan pembangun tidak perlu mengisinya dengan data latihan untuk memulakannya. Ejen berasaskan LLM boleh mula bercakap dari saat ia dibuat.
1. Keupayaan pembelajaran zero-shot
LLMs tidak perlu contoh untuk belajar. Pralatihan meluas mereka bermakna mereka sudah memahami konteks, nuansa dan niat tanpa memerlukan pembangun memberi mereka contoh khusus.
2. Perkara kecil yang dipanggil nuansa
LLMs cemerlang di mana pengelas niat gagal. Mereka boleh mentafsir simpulan bahasa, sindiran, dan bahasa samar-samar dengan mudah.
Latihan meluas mereka tentang set data yang pelbagai memberi mereka keupayaan untuk memahami nuansa halus komunikasi manusia yang sering terlepas oleh pengelas niat.
3. Konteks yang lebih baik
LLMs jangan hilang jejak perbualan. Mereka ingat apa yang dikatakan sebelum ini, yang menjadikan interaksi mengalir secara semula jadi dan berasa lebih koheren.
Konteks ini juga membantu mereka membersihkan kekaburan. Walaupun input itu kabur atau rumit, mereka boleh menggabungkannya dengan melihat perbualan yang lebih luas.
4. Kebolehskalaan
LLMs adalah 100% lebih baik dalam penskalaan. Mereka tidak memerlukan latihan semula untuk mengambil topik baharu, berkat pemahaman mereka yang luas tentang bahasa.
Itu menjadikan mereka bersedia untuk mengendalikan hampir mana-mana kes penggunaan terus dari kotak. Untuk sistem berbilang ejen , bukan masalah untuk menggunakan sistem LLM bukannya pengelas niat.
5. Fleksibiliti
LLMs jangan bergantung pada templat tegar. Fleksibiliti mereka bermakna respons berasa semula jadi, pelbagai dan disesuaikan dengan sempurna untuk perbualan. Ia merupakan pengalaman yang lebih baik untuk pengguna berbanding pengelas niat rapuh.
6. Kurang data latihan
LLMs tidak memerlukan data berlabel khusus tugas untuk menyelesaikan kerja. Kuasa mereka datang daripada pralatihan besar-besaran pada teks yang pelbagai, jadi mereka tidak bergantung pada set data beranotasi dengan teliti.
Jika perlu, pembangun sentiasa boleh menyesuaikan LLM untuk projek mereka. Sebagai contoh, LLMs boleh diperhalusi dengan data yang minimum, supaya mereka boleh menyesuaikan diri dengan cepat kepada kes atau industri penggunaan khusus.
Mengapakah syarikat lain menggunakan pengelas niat?
Soalan yang bagus. Jika LLMs adalah lebih baik dalam mengklasifikasikan niat, maka mengapa begitu banyak syarikat masih menggunakan pengelas niat?
Jawapannya bukanlah jawapan yang cantik, dan ia bukan yang paling diplomatik untuk dikatakan: ia adalah masalah teknologi warisan.
Kebanyakan syarikat mempunyai kepentingan dalam menggunakan pengelas niat. Mereka telah membina pangkalan pemasangan besar yang berjalan di atasnya. Mereka tidak mempunyai sebab untuk menghalang pengguna mereka daripada sistem yang telah mereka bina.
Tetapi Botpress ialah LLM -pertama
LLMs jauh lebih baik dalam mengenal pasti niat daripada pengelas niat lama. Itulah sebabnya kami menulis semula dari awal menjadi LLM -pertama pada tahun 2020.
Kami tahu teknologi yang lebih baik telah tiba, dan daripada berpegang kepada teknologi lama, kami melabur dalam mengambil lompatan.
Adakah kita akan menambah pengelas niat?
Tidak. Kami terlalu mengambil berat tentang pengalaman pembina kami dan pengalaman pengguna mereka.
Masa depan klasifikasi niat
Pengelas niat ialah alat masa lalu. Itulah sebabnya kami pergi semua LLMs .
Sebagai LLMs terus menjadi lebih baik, begitu juga dengan ejen AI yang dibina Botpress . Kami bersedia dan teruja untuk terus meningkatkan tahap tentang perkara yang boleh dilakukan oleh AI perbualan.
Jika anda ingin membina ejen AI fleksibel yang dikuasakan oleh LLMs , jangan ragu untuk mula membina di Botpress . Ia percuma.
Senarai Kandungan
Ikuti perkembangan terkini tentang ejen AI
Kongsi ini pada: