Dòng mô hình o1 được mong đợi từ lâu của OpenAI đã gây chú ý nhờ khả năng suy luận vượt trội, đánh dấu một bước tiến lớn trong trí tuệ nhân tạo.
Khả năng suy luận của o1 không quá khác biệt so với một tính năng quen thuộc với người dùng Botpress – Autonomous Node. Ra mắt vào tháng 7 năm 2024, Autonomous Node là công nghệ đầu tiên thuộc loại này trên các nền tảng AI agent.
Sylvain Perron, CEO của Botpress và là kiến trúc sư trưởng đứng sau Autonomous Nodes của nền tảng, đã chia sẻ về những điểm tương đồng và khác biệt giữa hai hệ thống suy luận này.
CEO Botpress Sylvain Perron so sánh OpenAI o1 và Autonomous Node
Có đúng là có nhiều điểm tương đồng lớn giữa mô hình o1 mới của OpenAI và Botpress Autonomous Nodes không?
Đúng vậy. Thật thú vị khi thấy o1 được ra mắt. Nhưng cần lưu ý rằng chúng ta không hoàn toàn so sánh hai thứ giống hệt nhau.
OpenAI o1 rõ ràng là một LLM, còn Autonomous Nodes là một tính năng của nền tảng. Bạn thậm chí có thể tích hợp o1 vào Botpress và sử dụng cùng với Autonomous Nodes.
Nhưng cả hai đều sử dụng chuỗi suy nghĩ (chain-of-thought reasoning), một phương pháp tiếp cận từ dưới lên để đưa ra quyết định về việc cần làm và cần nói gì.
Bạn có thể giải thích về chain-of-thought reasoning và nó khác gì so với cách các mô hình ngôn ngữ thường tạo phản hồi không?
Tất nhiên – hầu hết các LLM tạo phản hồi bằng cách dự đoán từ tiếp theo dựa trên từ trước đó – chúng tạo ra từ đầu tiên, rồi dùng nó để tạo từ tiếp theo, cứ thế tiếp tục. Cách này phù hợp với các câu hỏi đơn giản, nhưng sẽ thất bại khi gặp các nhiệm vụ phức tạp cần nhiều bước suy luận.
Chuỗi suy nghĩ là khi AI chia nhỏ một nhiệm vụ thành các bước nhỏ hơn và suy nghĩ rõ ràng về từng bước trước khi chuyển sang bước tiếp theo. Nó giống như cách học sinh được yêu cầu trình bày từng bước giải trong một bài toán STEM.
Ví dụ, nếu AI đang tạo một khách hàng tiềm năng trong CRM – cần kiểm tra trùng lặp, phân công khách hàng, v.v. – nó cần sử dụng chuỗi suy nghĩ để cân nhắc từng bước và lên kế hoạch toàn bộ chuỗi hành động trước khi thực hiện. Nó sẽ không điền vào biểu mẫu trước khi xác định có bị trùng lặp hay không, nó biết điều đó ngay từ đầu.
Vì vậy hệ thống có thể xử lý các nhiệm vụ phức tạp với nhiều phụ thuộc, nhưng cũng sẽ chậm hơn vì phải dừng lại để suy nghĩ thay vì phản hồi ngay lập tức.
Cả o1 và Autonomous Nodes đều dùng suy luận chuỗi ý nghĩ – liệu quá trình này có giống nhau ở cả hai, hay có điểm khác biệt?
Có những điểm giống và khác nhau. Chúng tôi vẫn sử dụng chuỗi suy nghĩ, nhưng vì xây dựng cho khách hàng thực tế nên chúng tôi tối ưu hóa về tốc độ và hiệu quả theo một số cách khác nhau.
Với Autonomous Nodes, chúng tôi thiết kế hệ thống để xử lý nhiều hành động chỉ trong một lần gọi LLM. Ý tưởng là suy nghĩ và hành động trong cùng một quy trình, không để mất thời gian.
Autonomous Nodes vừa suy nghĩ vừa cập nhật cho người dùng, để họ không phải chờ đợi quá lâu cho quá trình xử lý. Điều này giống với hội thoại tự nhiên, nơi người đối thoại không bị bỏ lửng quá lâu. Các lập trình viên cũng có thể xem được quá trình suy nghĩ ẩn của LLM để kiểm tra lỗi.
Ngược lại, o1 chỉ trả về một câu trả lời và gần như không thể quan sát được quá trình suy nghĩ bên trong. OpenAI chỉ cung cấp bản tóm tắt chuỗi suy nghĩ mà không hiển thị chi tiết, khiến việc kiểm tra lỗi trở nên khó khăn hơn.
Còn điểm khác biệt nào nữa giữa hai bên không?
o1 yêu cầu lập trình viên hoặc nền tảng phải tự lưu trữ các hàm gọi công cụ. Mỗi bước là một lần gọi API riêng biệt, nghĩa là mô hình phải yêu cầu một hành động, chờ kết quả, rồi mới gọi tiếp bước sau. Bạn phải lặp lại quy trình này nhiều lần. Điều này khiến việc sử dụng phức tạp hơn vì bạn cần cung cấp hạ tầng chạy các hàm nền.
Autonomous Nodes thực hiện những việc này tự động ở phía sau.
o1 so sánh thế nào về chi phí và tốc độ?
Giả sử bạn đang dùng một LLM hoặc AI agent để hỗ trợ các tác vụ trên Hubspot, như trò chuyện với khách truy cập website để tạo khách hàng tiềm năng bằng AI.
Nếu bạn yêu cầu o1 điền vào biểu mẫu khách hàng tiềm năng trên Hubspot – giả sử bạn có thể kết nối mà không cần bên thứ ba – thì sẽ mất 12 giây và tốn chi phí gấp 5 lần so với làm trên Botpress.
Một phần tốc độ đến từ thiết kế dựa trên schema của nền tảng chúng tôi, nghĩa là hệ thống biết trước cần dữ liệu gì và cấu trúc dữ liệu đó ra sao.
Vì vậy khi làm việc với các công cụ như HubSpot hoặc Salesforce, hệ thống đã có sẵn schema JSON định nghĩa các trường bắt buộc – như tên, email, tên công ty, v.v.
Điều này cho phép Autonomous Nodes suy nghĩ toàn bộ nhiệm vụ ngay từ đầu, không cần dừng lại hỏi thêm thông tin ở từng bước.
Bạn có thể giảm số bước và tăng tốc bằng cách tự cung cấp ngữ cảnh, nhưng điều này sẽ khiến bạn mất nhiều thời gian hơn để xây dựng ứng dụng dựa trên o1. Vì vậy, chi phí bảo trì cũng sẽ tăng lên.
Bạn đề cập đến độ tin cậy cao hơn. Điều gì khiến Autonomous Nodes đáng tin cậy hơn o1?
Cách lớn nhất để chúng tôi tăng độ tin cậy là kết hợp chuỗi suy nghĩ với giao thức gọi công cụ mà chúng tôi phát triển.
Chúng tôi đã xây dựng một môi trường để AI có thể suy nghĩ – và tất cả đều bằng mã, không phải văn bản thường. Thực sự nó nhanh và đáng tin cậy hơn phiên bản của OpenAI, vì một số lý do.
Một lý do là nó có thể thực hiện các hành động đồng thời với việc trò chuyện trong suốt chuỗi tác vụ. Điều này mô hình của OpenAI không làm được.
Thêm nữa, AI biết về schema đầu ra. Nó biết loại JSON nào cần trả về dựa trên truy vấn nhận được.
Và các lập trình viên có thể tự điều chỉnh. Nếu họ nhận được nhiều câu hỏi giống nhau từ người dùng, họ có thể tinh chỉnh AI để luôn đưa ra câu trả lời phù hợp nhất.
Nó sử dụng JSON cho bao nhiêu phần của quy trình?
Văn bản tiếng Anh thông thường không đủ tin cậy, đúng không? Nó không đủ chính xác, không đủ chặt chẽ.
Ngôn ngữ lập trình cũng là một ngôn ngữ, nhưng nó chính xác. Đó là ngôn ngữ chuyên biệt; chỉ dùng trong những khuôn khổ và cú pháp nhất định.
Vì vậy các lệnh gọi công cụ của chúng tôi trả về bằng JSON thay vì tiếng Anh. Đầu ra là JSON với schema JSON thay vì văn bản thường.
Khi bạn gửi yêu cầu tạo biểu mẫu khách hàng tiềm năng trên Hubspot, nó được viết bằng JSON, và schema – cũng bằng JSON – liệt kê tất cả các thuộc tính cần thiết như tên, công ty, v.v.
Khác biệt lớn nhất giữa gọi công cụ của Autonomous Nodes và mô hình o1 là gì?
Gọi công cụ của chúng tôi nhận biết ngữ cảnh rất tốt. Nó hiểu toàn bộ hệ thống của bạn, các hành động có thể thực hiện, và cách dữ liệu được chuyển sang công cụ tiếp theo. Chúng tôi có thể tạo một khối mã duy nhất chứa tất cả thông tin này và trả về kết quả chỉ trong một lần gọi LLM.
Về lý thuyết, bạn có thể dùng API o1 để gọi công cụ, nhưng bị giới hạn về những gì có thể truyền vào. Còn Botpress được xây dựng để làm việc này. Chúng tôi có các biện pháp kiểm soát bổ sung cho các LLM khác, bao gồm cả GPT.
Autonomous Nodes cũng có thể trò chuyện đồng thời khi gọi công cụ, điều mà OpenAI hiện chưa hỗ trợ. Điều này giúp tiết kiệm một lượt gửi nhận với máy chủ và mang lại trải nghiệm hội thoại tốt hơn, vì người dùng được thông báo trước khi bắt đầu tác vụ kéo dài.
Hầu hết các tổ chức đều được cảnh báo không nên dùng ChatGPT với dữ liệu công việc bảo mật. Autonomous Nodes có an toàn hơn không?
Nền tảng của chúng tôi được xây dựng cho môi trường có lưu lượng lớn, độ trễ thấp, và được thiết kế phù hợp với nhu cầu thực tế của doanh nghiệp.
Điểm mạnh của Autonomous Nodes không phải là tạo ra một loại AI hoàn toàn mới – mà là chúng tôi đã áp dụng kỹ thuật thông minh lên công nghệ hiện có để phục vụ tốt hơn cho doanh nghiệp.
Chúng tôi có các sandbox bảo mật cho AI tạo ra nội dung giao tiếp. Khi bạn dùng một Autonomous Node, nó sẽ chạy trong các sandbox bí mật này hoàn toàn miễn phí. Chúng an toàn, có thể mở rộng. Và sau đó, sandbox sẽ bị xóa.
Đây là một môi trường cách ly ảo với hai lớp – kiểm tra vào và kiểm tra ra. Nó khá phức tạp. Nhưng điều này có nghĩa là chúng tôi có thể chạy mã do LLM tạo ra ở quy mô lớn với rủi ro bảo mật tối thiểu.
Nếu các nhà phát triển hoặc người đam mê AI muốn thử Autonomous Node, họ cần làm gì?
Chúng tôi có gói miễn phí rất hào phóng. Tất cả người dùng đều có thể thử. Chúng tôi nghĩ đây là một tính năng quá tuyệt vời để giới hạn. Vậy nên, chỉ cần tạo một tài khoản Botpress miễn phí là bạn có thể tự mình trải nghiệm.





.webp)
