Tại sao chúng tôi loại bỏ các bộ phân loại ý định

Được viết bởi

Jean-Bernard Perron

Mục lục

Olden (trước LLM ) Ngày

4 Nhược điểm của Phân loại Ý định

6 lý do LLMs Tốt hơn

Tại sao các công ty khác lại sử dụng bộ phân loại ý định?

Chúng ta có thêm bộ phân loại ý định không?

Tương lai của phân loại ý định

Bản tóm tắt

Một trong những câu hỏi phổ biến nhất mà chúng tôi nhận được từ khách hàng và người dùng tiềm năng là "Bộ phân loại ý định của bạn ở đâu?"

Chúng tôi không có. Và đúng vậy, đó là cố ý.

Botpress sử dụng LLMs để xác định ý định của người dùng. Tại sao? Nếu bạn đang xây dựng một chatbot hoặc một tác nhân AI , thì điều đó tốt hơn rất nhiều cho cả người xây dựng và người dùng.

Chúng tôi rất quan tâm đến lập trường này, vì vậy tôi muốn dành vài phút để giải thích lý do chúng tôi không có bộ phân loại ý định.

Tóm lại; Nó dễ xây dựng hơn, chính xác hơn và dễ bảo trì hơn.

Xây dựng AI Chatbots

Xây dựng chatbot agentic tùy chỉnh

Bắt đầu ngay

Olden (trước LLM ) Ngày

(Nếu bạn đã quen với bộ phân loại ý định là gì và chúng làm gì, hãy bỏ qua phần này.)

Bộ phân loại ý định là công cụ phân loại dữ liệu đầu vào của người dùng thành các ý định được xác định trước dựa trên dữ liệu đào tạo.

Các nhà phát triển phải tuyển chọn và dán nhãn vô số ví dụ cho mỗi ý định có thể có, với hy vọng hệ thống có thể khớp thông tin đầu vào của người dùng với các ví dụ này.

Ví dụ, với chatbot thương mại điện tử , các nhà phát triển có thể định nghĩa một ý định như "Theo dõi đơn hàng". Các câu lệnh ví dụ của họ có thể bao gồm: "Gói hàng của tôi ở đâu?" "Theo dõi đơn hàng của tôi" và "Bạn có thể kiểm tra trạng thái giao hàng cho tôi không?"

Về cơ bản, họ đang đào tạo AI để nhận ra ý định của người dùng bằng cách đưa ra ví dụ. Và đúng vậy, họ phải nhập tất cả những ví dụ đó bằng tay.

May mắn thay, nhu cầu thực hiện việc lập bản đồ thủ công các phát ngôn có thể có thành một ý định hầu như đã biến mất khi LLMs trở nên tiên tiến hơn.

Nhưng nhiều nền tảng AI đàm thoại vẫn sử dụng chúng. Tại sao? Chúng ta sẽ tìm hiểu điều đó sau.

4 Nhược điểm của Phân loại Ý định

Không chỉ vì đây là một quá trình dài hơn – các bộ phân loại ý định còn tệ vì nhiều lý do. Sau đây là một vài lý do:

1. Sự phụ thuộc dữ liệu

Các bộ phân loại ý định rất cần dữ liệu. Chúng cần một tập dữ liệu lớn, đại diện cho các ví dụ người dùng cho mỗi ý định để hoạt động chính xác. Nếu không có nó, chúng sẽ gặp khó khăn trong việc phân loại đầu vào chính xác.

Và việc xây dựng các tập dữ liệu này là một công việc khó khăn. Các nhà phát triển dành vô số thời gian để thu thập và dán nhãn các ví dụ, điều này – chắc chắn – không phải là cách sử dụng thời gian hiệu quả.

2. Khả năng mở rộng hạn chế

Bộ phân loại ý định cũng không được xây dựng để mở rộng quy mô. Việc thêm ý định mới có nghĩa là thu thập thêm dữ liệu và đào tạo lại mô hình, điều này nhanh chóng trở thành nút thắt cổ chai cho quá trình phát triển. Plus , chúng có thể là vấn đề đau đầu khi bảo trì – vì khi cách sử dụng ngôn ngữ phát triển, các phát ngôn cũng phát triển theo.

3. Hiểu ngôn ngữ kém

Các bộ phân loại ý định thiếu sự hiểu biết ngôn ngữ thực sự. Chúng gặp khó khăn với các biến thể trong ngôn ngữ, như:

Từ đồng nghĩa
Diễn giải
Câu văn mơ hồ
Lỗi đánh máy
Những cách diễn đạt thông tục không quen thuộc
Đầu vào bị phân mảnh

Họ cũng thường xử lý từng lời nói một cách riêng lẻ, nghĩa là họ không có khả năng duy trì ngữ cảnh trong suốt cuộc trò chuyện.

4. Quá phù hợp

Bộ phân loại ý định có xu hướng quá khớp, khi đó chúng ghi nhớ các ví dụ đào tạo thay vì học các mẫu chung.

Điều đó có nghĩa là chúng hoạt động tốt với các cụm từ chính xác mà chúng đã thấy nhưng lại gặp khó khăn với các đầu vào mới hoặc đa dạng. Điều này khiến chúng dễ vỡ hơn nhiều so với trường hợp sử dụng chuyên nghiệp.

Triển khai tác nhân AI?

Đọc Bản thiết kế của chúng tôi để triển khai tác nhân AI

Đọc ngay

6 lý do LLMs Tốt hơn

LLMs hầu như đã giải quyết được những vấn đề này. Chúng hiểu ngữ cảnh và sắc thái, và các nhà phát triển không cần phải cung cấp cho chúng dữ liệu đào tạo để chúng bắt đầu. Một tác nhân dựa trên LLM có thể bắt đầu trò chuyện ngay từ khi nó được tạo ra.

1. Khả năng học tập không cần bắn

LLMs không cần ví dụ để học. Việc đào tạo trước mở rộng của họ có nghĩa là họ đã hiểu ngữ cảnh, sắc thái và mục đích mà không cần nhà phát triển cung cấp cho họ các ví dụ cụ thể.

2. Một điều nhỏ gọi là sắc thái

LLMs excel khi bộ phân loại ý định còn thiếu sót. Chúng có thể diễn giải thành ngữ, châm biếm và ngôn ngữ mơ hồ một cách dễ dàng.

Việc đào tạo chuyên sâu về nhiều tập dữ liệu khác nhau giúp họ có khả năng nắm bắt những sắc thái tinh tế trong giao tiếp của con người mà các bộ phân loại ý định thường bỏ qua.

3. Bối cảnh tốt hơn

LLMs Đừng mất dấu cuộc trò chuyện. Họ nhớ những gì đã nói trước đó, điều này khiến các tương tác diễn ra tự nhiên và mạch lạc hơn.

Bối cảnh này cũng giúp họ làm sáng tỏ sự mơ hồ. Ngay cả khi thông tin đầu vào mơ hồ hoặc phức tạp, họ có thể ghép chúng lại với nhau bằng cách xem xét cuộc trò chuyện rộng hơn.

4. Khả năng mở rộng

LLMs có khả năng mở rộng quy mô tốt hơn 100%. Họ không cần đào tạo lại để tiếp nhận các chủ đề mới, nhờ vào sự hiểu biết rộng về ngôn ngữ của họ.

Điều đó làm cho chúng sẵn sàng xử lý hầu như mọi trường hợp sử dụng ngay khi xuất xưởng. Đối với các hệ thống đa tác nhân , việc sử dụng LLM thay vì bộ phân loại ý định.

5. Tính linh hoạt

LLMs Đừng dựa vào các mẫu cứng nhắc. Tính linh hoạt của chúng có nghĩa là phản hồi sẽ tự nhiên, đa dạng và hoàn toàn phù hợp với cuộc trò chuyện. Chúng mang lại trải nghiệm tốt hơn nhiều cho người dùng so với các trình phân loại ý định dễ vỡ.

6. Ít dữ liệu đào tạo hơn

LLMs không cần dữ liệu được gắn nhãn theo nhiệm vụ cụ thể để hoàn thành công việc. Sức mạnh của chúng đến từ quá trình đào tạo trước hàng loạt trên nhiều văn bản khác nhau, do đó chúng không phụ thuộc vào các tập dữ liệu được chú thích tỉ mỉ.

Nếu cần, các nhà phát triển luôn có thể tùy chỉnh LLM cho dự án của họ. Ví dụ, LLMs có thể được tinh chỉnh với lượng dữ liệu tối thiểu, do đó chúng có thể nhanh chóng thích ứng với các ngành công nghiệp hoặc trường hợp sử dụng chuyên biệt.

Tại sao các công ty khác lại sử dụng bộ phân loại ý định?

Câu hỏi hay. Nếu LLMs có khả năng phân loại ý định tốt hơn nhiều, vậy tại sao nhiều công ty vẫn sử dụng trình phân loại ý định?

Câu trả lời không hề đẹp đẽ và cũng không phải là câu trả lời ngoại giao nhất: đó là vấn đề của công nghệ cũ.

Hầu hết các công ty đều có lợi ích trong việc sử dụng bộ phân loại ý định. Họ đã xây dựng được cơ sở cài đặt khổng lồ chạy trên đó. Họ không có lý do gì để ngăn cản người dùng của mình khỏi hệ thống mà họ đã xây dựng.

Nhưng Botpress là LLM -Đầu tiên

LLMs tốt hơn nhiều trong việc xác định ý định so với các bộ phân loại ý định lỗi thời. Đó là lý do tại sao chúng tôi viết lại từ đầu để LLM -Đầu tiên vào năm 2020.

Chúng tôi biết công nghệ tốt hơn đã xuất hiện và thay vì bám vào công nghệ cũ, chúng tôi đã đầu tư để thực hiện bước đột phá.

Chúng ta có thêm bộ phân loại ý định không?

Không. Chúng tôi quá quan tâm đến trải nghiệm của người xây dựng và trải nghiệm của người dùng.

Tương lai của phân loại ý định

Phân loại ý định là một công cụ của quá khứ. Đó là lý do tại sao chúng tôi đã đi vào LLMs .

BẰNG LLMs tiếp tục trở nên tốt hơn, các tác nhân AI được xây dựng trên đó cũng vậy Botpress . Chúng tôi đã sẵn sàng và hào hứng tiếp tục nâng cao tiêu chuẩn về những gì AI đàm thoại có thể làm được.

Nếu bạn đang muốn xây dựng các tác nhân AI linh hoạt được hỗ trợ bởi LLMs , hãy thoải mái bắt đầu xây dựng trên Botpress . Nó miễn phí.

Xây dựng AI Chatbots

Xây dựng chatbot agentic tùy chỉnh

Bắt đầu ngay