Sau nhiều tháng suy đoán, OpenAI Dâu tây mới nhất của LLM bản phát hành đã bị hủy bỏ – và nó không được gọi là GPT -5 .
Trước đây được gọi bằng tên mã khó hiểu và hấp dẫn như Q* và Strawberry, dòng mô hình mới nhất cuối cùng đã được định hình dưới biệt danh OpenAI o1 .
Bản cập nhật lớn nhất với OpenAI Mô hình mới của nó là khả năng lý luận được nâng cao. OpenAI giải thích rằng o1 đã được huấn luyện để dành nhiều thời gian suy nghĩ hơn so với các mô hình trước đây, giúp nó gần hơn với trí thông minh của con người.
Là gì OpenAI o1?
OpenAI o1 là loạt mô hình ngôn ngữ lớn mới nhất được phát hành bởi OpenAI vào ngày 12 tháng 9 năm 2024, hiện bao gồm hai mô hình: o1-preview và o1-mini.
Sự khác biệt lớn nhất giữa o1 và các mẫu trước của công ty là lý luận tiên tiến của nó. Mặc dù chưa được phát hành đầy đủ, nhưng bản xem trước và các mẫu mini đã thổi bay GPT -4o ngoài nước trong các bài kiểm tra toán, khoa học và lập trình.
OpenAI o1 mô hình
Bản phát hành tháng 9 bao gồm hai mẫu, o1-preview và o1-mini. Chúng là mẫu đầu tiên trong một loạt các mẫu sẽ tiếp tục được phát hành dưới dạng OpenAI tinh chỉnh cái mới của họ LLM .
Sự khác biệt là gì? Mô hình o1-mini nhỏ hơn và rẻ hơn 80% so với mô hình xem trước. Nó được xây dựng cho các nhiệm vụ đòi hỏi lý luận nâng cao nhưng không phải kiến thức rộng hơn. Nó hoàn toàn phù hợp cho các nhiệm vụ liên quan đến mã hóa hoặc toán học.
Thông minh thế nào OpenAI o1?
OpenAI đã đưa ra danh sách các tiêu chuẩn STEM thể hiện khả năng suy luận của o1, bao gồm:
- Có thành tích tương tự như nghiên cứu sinh tiến sĩ trong các bài kiểm tra chuẩn về vật lý, hóa học và sinh học.
- Đạt danh hiệu 500 học sinh xuất sắc nhất vòng loại của Kỳ thi Olympic Toán Hoa Kỳ.
- Xếp hạng ở mức phần trăm thứ 89 trong Codeforces, một bài kiểm tra lập trình cạnh tranh.
Bạn có thể đọc thêm về khả năng suy luận của o1 trong OpenAI bản nghiên cứu của 's.
Lý luận chuỗi suy nghĩ là gì?
Các mô hình o1 sử dụng chuỗi suy luận tư duy , một cách dài hơn và toàn diện hơn để phân tích các yêu cầu.
Nếu mô hình o1 được nhắc nhở, nó sẽ không trả lời ngay lập tức - do đó thời gian chờ đợi lâu. Thay vào đó, nó sẽ lý luận qua từng bước, cân nhắc cẩn thận từng thông tin và ý nghĩa của nó trước khi quyết định hành động tiếp theo. Nó sẽ không đưa ra câu trả lời cho đến khi nó đã suy nghĩ kỹ lưỡng về toàn bộ chuỗi các bước được yêu cầu trong yêu cầu.
o1 khác với cái gì? GPT -4o?
1) Khả năng lý luận
Ở trung tâm của trí thông minh chung của nó là khả năng lý luận mới của o1. “Có lẽ những lĩnh vực tiến bộ quan trọng nhất sẽ xoay quanh khả năng lý luận,” Altman chia sẻ với Gates. “Ngay bây giờ, GPT -4 chỉ có thể lý luận theo những cách cực kỳ hạn chế.”
Lý luận là điều cực kỳ khó khăn. Ngay cả với con người. Và OpenAI o1 là mẫu đầu tiên tuyên bố điều này.
Các mô hình o1 có thể suy luận theo thời gian thực, thay vì dựa vào dữ liệu đào tạo trước. Đây là lý do tại sao mô hình mới tốt hơn trong các nhiệm vụ khoa học, toán học và mã hóa so với trước đây OpenAI mô hình.
2) Khó bẻ khóa hơn
Với những lo ngại về an toàn đang gia tăng như LLMs ngày càng phổ biến và mạnh mẽ, an ninh đã trở thành trọng tâm chính của OpenAI phát triển mới nhất. Công ty đã hợp tác với Viện An toàn AI của Hoa Kỳ và Vương quốc Anh trong khi phát triển dòng o1, cũng như làm việc với chính phủ Hoa Kỳ để thiết lập hoạt động thẩm định của họ.
Là một bước tiến lớn, dòng o1 khó bẻ khóa hơn nhiều – vượt qua các biện pháp an toàn – so với các mẫu trước đó.
Trong một trong những bài kiểm tra bẻ khóa khó nhất của họ, mô hình o1-preview đạt 84 điểm trên 100, so với số điểm ảm đạm là 22 của GPT -4 giờ.
3) Quy ước đặt tên mới
Mặc dù tên của nó không phải là điều thú vị nhất về cái mới OpenAI LLM , đó là sự thay đổi có ý nghĩa một cách cố ý.
OpenAI o1 là mô hình đầu tiên loại bỏ ' GPT ' biệt danh, và đó là vì công ty tuyên bố đây là giai đoạn đầu tiên của một 'mô hình lý luận' hoàn toàn mới, trong khi các mô hình cũ hơn là một phần của 'mô hình đào tạo trước'.
Mô hình mới dành thời gian suy luận theo thời gian thực, thay vì dựa vào dữ liệu đào tạo trước.
4) Giải quyết vấn đề STEM tốt hơn
Khả năng suy luận tốt hơn sẽ dẫn đến kỹ năng toán học tốt hơn.
Cả o1 và GPT -40 người được yêu cầu hoàn thành kỳ thi tuyển chọn cho Kỳ thi Olympic Toán quốc tế. GPT -4o giải quyết được 13% vấn đề, trong khi o1 giải quyết được 83%.
5) Thời gian chờ đợi lâu hơn
Lý luận theo thời gian thực mất nhiều thời gian hơn so với việc tham chiếu dữ liệu đào tạo và tạo phản hồi. Nếu bạn đặt câu hỏi cho OpenAI So với các mẫu khác, o1-preview sẽ khiến bạn phải chờ đợi lâu hơn đáng kể.
Tuy nhiên, với khả năng thuê ngoài lập luận, đây là một cái giá nhỏ phải trả. Tốc độ của các mô hình o1 có thể sẽ được cải thiện khi các mô hình tiếp theo trong series được phát hành.
Ai có thể sử dụng o1?
Tính đến ngày 12 tháng 9, ChatGPT Plus và người dùng nhóm có thể truy cập vào các mô hình o1 trong ChatGPT .
OpenAI đã thông báo rằng họ sẽ cung cấp o1-mini cho người dùng miễn phí, mặc dù chưa có ngày cụ thể.
Giới hạn tỷ lệ hàng tuần hiện tại là 30 tin nhắn cho 01-preview và 50 cho o1-mini, mặc dù chúng sẽ sớm tăng lên.
Tôi nên sử dụng o1 để làm gì?
Khả năng lý luận nâng cao của o1 đặc biệt hữu ích để giải quyết các vấn đề phức tạp trong toán học, khoa học và mã hóa. OpenAI giải thích :
Những hạn chế của OpenAI o1
Để xem trước, mô hình này vẫn chưa có tất cả các khả năng của GPT -4o. Nếu bạn đang muốn sử dụng một LLM để duyệt web để biết thông tin hoặc bạn muốn tải lên các tệp hoặc hình ảnh, bạn sẽ cần phải tuân thủ GPT -4o cho đến khi các mẫu o1 mới hơn được phát hành.
Cách nhắc nhở OpenAI o1
OpenAI Các gợi ý thúc đẩy của o1 đã thay đổi so với các mô hình trước đó, do khả năng lập luận được cải tiến của nó.
Giữ cho lời nhắc của bạn đơn giản. Đây là một mô hình thông minh và không cần nhiều hướng dẫn như GPT -4 chuỗi. Điều đó có nghĩa là tránh mọi chuỗi suy nghĩ đầu vào – mô hình đã có khả năng suy luận bên trong.
Xây dựng GPT -các tác nhân AI được hỗ trợ
Sẽ thế nào nếu tác nhân AI của bạn tự động đồng bộ hóa với mọi OpenAI cập nhật?
Botpress là một nền tảng tác nhân AI hoàn toàn mở và có thể mở rộng. stack cho phép các nhà phát triển xây dựng chatbot và tác nhân AI với mọi khả năng, trong mọi quy trình làm việc.
Nền tảng duy nhất có thể thiết lập từ mã thấp đến khả năng tùy chỉnh và mở rộng vô tận, Botpress cho phép bạn tự động nhận được sức mạnh mới nhất GPT phiên bản trên chatbot của bạn – không cần tốn công sức.
Bắt đầu xây dựng ngay hôm nay. Nó miễn phí.
Mục lục
Cập nhật thông tin mới nhất về các tác nhân AI
Chia sẻ điều này trên: