Một trong những câu hỏi phổ biến nhất mà chúng tôi nhận được từ khách hàng tiềm năng và người dùng là “Các bộ phân loại ý định của bạn ở đâu?”
Chúng tôi không có. Và đúng vậy, đó là chủ ý.
Botpress sử dụng LLM để xác định ý định của người dùng. Tại sao? Nếu bạn đang xây dựng một chatbot hoặc một AI agent, cách này tốt hơn rất nhiều cho cả người xây dựng và người dùng.
Chúng tôi rất kiên định với quan điểm này, nên tôi muốn dành vài phút để giải thích vì sao chúng tôi không dùng bộ phân loại ý định.
Tóm lại: Dễ xây dựng hơn, chính xác hơn và đơn giản hơn để duy trì.
Thời kỳ trước LLM
(Nếu bạn đã biết bộ phân loại ý định là gì và cách hoạt động của nó, có thể bỏ qua phần này.)
Bộ phân loại ý định là công cụ phân loại đầu vào của người dùng thành các ý định đã định sẵn dựa trên dữ liệu huấn luyện.
Lập trình viên phải tự thu thập và gán nhãn vô số ví dụ cho từng ý định, hy vọng hệ thống có thể khớp đầu vào của người dùng với các ví dụ đó.
Ví dụ, với một chatbot thương mại điện tử, lập trình viên có thể định nghĩa ý định như "TrackOrder". Các câu ví dụ có thể là: "Gói hàng của tôi đang ở đâu?" "Theo dõi đơn hàng của tôi," và "Bạn có thể kiểm tra trạng thái giao hàng giúp tôi không?"
Về cơ bản, họ đang huấn luyện AI nhận biết ý định của người dùng bằng cách đưa ra ví dụ. Và đúng, tất cả đều phải nhập thủ công.
May mắn thay, nhu cầu phải gán thủ công các câu nói cho ý định gần như biến mất khi LLM phát triển hơn.
Nhưng vẫn còn rất nhiều nền tảng AI hội thoại sử dụng chúng. Tại sao? Chúng ta sẽ nói đến điều đó.
4 nhược điểm của bộ phân loại ý định
Không chỉ vì quy trình dài hơn – bộ phân loại ý định còn có nhiều điểm yếu. Dưới đây là một vài lý do:
1. Phụ thuộc vào dữ liệu
Bộ phân loại ý định cần rất nhiều dữ liệu. Chúng cần một bộ dữ liệu lớn, đại diện cho từng ý định để hoạt động chính xác. Nếu không có, chúng sẽ khó phân loại đúng đầu vào.
Và việc xây dựng các bộ dữ liệu này rất vất vả. Lập trình viên phải dành hàng giờ thu thập và gán nhãn ví dụ – điều này rõ ràng là không phải cách sử dụng thời gian hiệu quả.
2. Khó mở rộng
Bộ phân loại ý định không được thiết kế để mở rộng. Thêm ý định mới nghĩa là phải thu thập thêm dữ liệu và huấn luyện lại mô hình, nhanh chóng trở thành nút thắt cho phát triển. Ngoài ra, việc bảo trì cũng phức tạp – vì ngôn ngữ thay đổi, các câu nói cũng thay đổi theo.
3. Hiểu ngôn ngữ kém
Bộ phân loại ý định không thực sự hiểu ngôn ngữ. Chúng gặp khó khăn với các biến thể ngôn ngữ như:
- Từ đồng nghĩa
- Diễn đạt lại
- Cách diễn đạt mơ hồ
- Lỗi chính tả
- Thành ngữ lạ
- Câu nói rời rạc
Chúng cũng thường xử lý từng câu nói riêng lẻ, nghĩa là không duy trì được ngữ cảnh trong suốt cuộc hội thoại.
4. Quá khớp
Bộ phân loại ý định dễ bị quá khớp, tức là chỉ nhớ các ví dụ huấn luyện thay vì học các mẫu chung.
Điều này khiến chúng chỉ hoạt động tốt với các câu đã thấy, nhưng gặp khó với đầu vào mới hoặc đa dạng. Điều này làm chúng trở nên kém linh hoạt và không phù hợp cho các trường hợp sử dụng chuyên nghiệp.
6 lý do LLM vượt trội hơn
LLM gần như đã giải quyết các vấn đề này. Chúng hiểu ngữ cảnh và sắc thái, lập trình viên không cần cung cấp dữ liệu huấn luyện để bắt đầu. Một AI agent dựa trên LLM có thể bắt đầu trò chuyện ngay khi được tạo.
1. Học không cần ví dụ
LLM không cần ví dụ để học. Nhờ được huấn luyện trước trên quy mô lớn, chúng đã hiểu ngữ cảnh, sắc thái và ý định mà không cần lập trình viên cung cấp ví dụ cụ thể.
2. Hiểu sắc thái
LLM vượt trội ở những điểm mà bộ phân loại ý định không làm được. Chúng có thể hiểu thành ngữ, mỉa mai và ngôn ngữ mơ hồ một cách dễ dàng.
Việc được huấn luyện trên dữ liệu đa dạng giúp chúng nắm bắt được những sắc thái tinh tế trong giao tiếp mà bộ phân loại ý định thường bỏ lỡ.
3. Hiểu ngữ cảnh tốt hơn
LLM không bị mất dấu cuộc trò chuyện. Chúng nhớ những gì đã nói trước đó, giúp hội thoại tự nhiên và liền mạch hơn.
Ngữ cảnh này cũng giúp chúng làm rõ các trường hợp mơ hồ. Ngay cả khi đầu vào không rõ ràng hoặc phức tạp, chúng vẫn có thể tổng hợp lại nhờ xem xét toàn bộ cuộc trò chuyện.
4. Khả năng mở rộng
LLM có khả năng mở rộng vượt trội. Chúng không cần huấn luyện lại để xử lý chủ đề mới, nhờ hiểu biết rộng về ngôn ngữ.
Điều này giúp chúng sẵn sàng xử lý hầu hết mọi trường hợp ngay từ đầu. Với hệ thống đa agent, dùng LLM thay vì bộ phân loại ý định là lựa chọn hiển nhiên.
5. Linh hoạt
LLM không dựa vào mẫu cứng nhắc. Sự linh hoạt giúp phản hồi tự nhiên, đa dạng và phù hợp với từng cuộc trò chuyện. Trải nghiệm người dùng tốt hơn nhiều so với bộ phân loại ý định cứng nhắc.
6. Ít dữ liệu huấn luyện hơn
LLM không cần dữ liệu gán nhãn riêng cho từng nhiệm vụ. Sức mạnh của chúng đến từ việc huấn luyện trước trên dữ liệu đa dạng, nên không phụ thuộc vào bộ dữ liệu được chú thích thủ công.
Nếu cần, lập trình viên luôn có thể tùy chỉnh LLM cho dự án của mình. Ví dụ, LLM có thể được tinh chỉnh với rất ít dữ liệu, giúp nhanh chóng thích nghi với các trường hợp hoặc ngành nghề đặc thù.
Tại sao các công ty khác lại sử dụng bộ phân loại ý định?
Câu hỏi hay. Nếu các LLM thực sự tốt hơn nhiều trong việc phân loại ý định, vậy tại sao vẫn còn rất nhiều công ty sử dụng bộ phân loại ý định?
Câu trả lời không đẹp đẽ, và cũng không ngoại giao: đó là vấn đề công nghệ cũ.
Hầu hết các công ty đều có lợi ích khi tiếp tục dùng bộ phân loại ý định. Họ đã xây dựng một lượng lớn người dùng dựa trên nó. Họ không có lý do gì để thuyết phục người dùng rời khỏi hệ thống mình đã xây.
Nhưng Botpress ưu tiên LLM
LLM vượt trội hơn nhiều trong việc xác định ý định so với bộ phân loại ý định truyền thống. Đó là lý do chúng tôi xây dựng lại toàn bộ để ưu tiên LLM từ năm 2020.
Chúng tôi biết công nghệ tốt hơn đã xuất hiện, và thay vì bám víu vào công nghệ cũ, chúng tôi chọn đầu tư để bứt phá.
Chúng tôi có định bổ sung bộ phân loại ý định không?
Không. Chúng tôi quan tâm đến trải nghiệm của người xây dựng và người dùng của họ.
Tương lai của phân loại ý định
Bộ phân loại ý định là công cụ của quá khứ. Đó là lý do chúng tôi chuyển sang LLM hoàn toàn.
Khi LLM ngày càng tốt hơn, các agent AI xây dựng trên Botpress cũng sẽ mạnh mẽ hơn. Chúng tôi sẵn sàng và hào hứng tiếp tục nâng tầm cho AI hội thoại.
Nếu bạn muốn xây dựng AI agent linh hoạt dựa trên LLM, hãy bắt đầu với Botpress. Miễn phí.







