!['GPT-5' trên nền hoa văn màu xanh.](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/66854e271fa93cdd5adbdeb4_GPT-5.webp)
GPT-5 sắp ra mắt - và tin đồn cho biết ngày phát hành của nó sẽ sớm hơn là muộn.
Trong cuộc phỏng vấn podcast với Bill Gates, OpenAI Giám đốc điều hành Sam Altman xác nhận vào tháng 1/2024 rằng GPT-5 đang được phát triển. Các báo cáo cho thấy rằng chúng ta có thể thấy nó sớm hơn chúng ta nghĩ: hai nguồn ẩn danh gần gũi với OpenAI Đề nghị GPT-5 sẽ được phát hành vào giữa năm 2024, có thể là vào mùa hè này.
Là gì GPT-5?
Trong khi GPT-4 dường như mang tính cách mạng đối với chúng ta bây giờ, Altman tin rằng thế giới chỉ mới làm trầy xước bề mặt của AI. Tại Hội nghị thượng đỉnh chính phủ thế giới vào tháng 1/2024, Altman đã so sánh các mô hình hiện tại từ OpenAI Đến những ngày đầu của điện thoại di động:
Nếu có một điều chắc chắn, đó là thế hệ tiếp theo của GPT Mô hình là không thể tưởng tượng được đối với chúng tôi ngay bây giờ. Mặc dù sẽ mất thời gian để lấy từ phiên bản điện thoại nắp gập của GPT đến phiên bản iPhone, chúng ta sẽ tiến gần hơn một bước vào cuối năm nay.
GPT-5 sẽ được mong đợi nhất LLM phát hành cho đến nay. Mô hình AI sẽ có tốc độ nhanh hơn và khả năng xử lý ngôn ngữ tự nhiên được nâng cao. Vì vậy, những gì nó giữ trong cửa hàng?
"Nó thực sự tốt, giống như tốt hơn về mặt vật chất", một CEO của Advanced cho biết GPT-5 truy cập.
Thông tin chi tiết từ OpenAI
Như các GPT-5 lần phóng gần, OpenAI Các giám đốc điều hành và người trong cuộc đã tăng bình luận của họ về mô hình thế hệ tiếp theo. Đây là những gì công ty đã tuyên bố gần đây:
- Giám đốc điều hành Sam Altman tuyên bố rằng GPT-5 sẽ có thể xử lý email và chi tiết lịch, và nó sẽ có thể tùy chỉnh nhiều hơn
- CTO Mira Murati giải thích trong một cuộc phỏng vấn của Dartmouth Engineering rằng GPT-3 có trí thông minh của một đứa trẻ mới biết đi, GPT-4 tương tự như một học sinh trung học thông minh, và thế hệ tiếp theo sẽ có trí thông minh cấp tiến sĩ (trong một số nhiệm vụ nhất định)
- Giám đốc điều hành Microsoft AI Mustafa Suleyman chia sẻ rằng sẽ không phải cho đến khi GPT-6 trong thời gian hai năm mà các mô hình sẽ có thể 'hành động' trong môi trường mới
![Mira Murati đeo tai nghe và ngồi trên ghế trắng trong khi nói và ra hiệu.](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/667ec97b954379fb0f078179_mira%20murati.jpeg)
Đâu là sự khác biệt giữa GPT-4 và GPT-5?
Cũng giống như GPT-4 là một sự gia tăng đáng kể so với người tiền nhiệm của nó, không có nghi ngờ gì về phiên bản tiếp theo sẽ làm điều tương tự. Mặc dù không có bản cập nhật nào được xác nhận bởi OpenAI - và có khả năng sẽ không xuất hiện trước khi phát hành bất ngờ - những dự đoán sau đây về những gì mong đợi từ GPT-5 đã được lấy từ các cuộc phỏng vấn nội bộ, trước đó GPT cập nhật và xu hướng AI từ đối thủ cạnh tranh LLMs.
Nó thông minh hơn GPT-4
Sự khác biệt lớn nhất? Theo Altman: "Nó sẽ thông minh hơn."
Tại Hội nghị thượng đỉnh chính phủ thế giới, Altman nhấn mạnh rằng bước nhảy vọt lớn nhất từ GPT-4 đến GPT-5 rất đơn giản: nó thông minh hơn. "Điều làm cho những mô hình này trở nên kỳ diệu là chúng rất chung chung", ông giải thích. "Nó sẽ thông minh hơn, vì vậy nó sẽ tốt hơn ở mọi thứ trên bảng."
Mặc dù có rất nhiều cải tiến được mong đợi - các tính năng mới, tốc độ nhanh hơn và đa phương thức, theo cuộc phỏng vấn của Altman - một mô hình thông minh hơn sẽ tăng cường tất cả các tính năng hiện có của hiện tại LLMs.
Tăng độ tin cậy
Altman xác nhận rằng độ tin cậy sẽ là trọng tâm cốt lõi của GPTSự phát triển của Transformer (Generative Pre-trained Transformer) trong hai năm tới. "Nếu bạn hỏi GPT-4 câu hỏi nhiều nhất 10.000 lần, một trong số 10.000 câu hỏi đó có lẽ khá tốt, nhưng không phải lúc nào nó cũng biết câu hỏi nào và bạn muốn nhận được câu trả lời tốt nhất là 10.000 câu hỏi mỗi lần, và do đó việc tăng độ tin cậy sẽ rất quan trọng.
Độ tin cậy từ lâu đã là một điểm gắn bó đối với GPT-4 người dùng, với GPT-4 Turbo được phát triển một phần để thực hiện các cập nhật cần thiết cho tính nhất quán và độ chính xác đầu ra của mô hình. Turbo đã chứng kiến sự gia tăng độ ổn định của mô hình và ít ảo giác AI hơn.
![OpenAI Giám đốc điều hành Sam Altman trình bày từ một sân khấu đen tối tại buổi ra mắt GPT-4 Turbo.](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/66450c0f7955370a4fb1f45a_turbo%20launch.webp)
Vì vậy, nếu các khiếu nại của người dùng có cơ sở được lắng nghe, mô hình mới gần như chắc chắn sẽ được đào tạo để đáng tin cậy hơn GPT-4. Trên thực tế, một vô danh OpenAI Insider xác nhận rằng nhóm đang hy vọng tăng độ tin cậy trong lần lặp tiếp theo. Chúng tôi cũng hy vọng như vậy.
Nâng cao khả năng suy luận
Ở trung tâm của trí thông minh chung của nó là GPT-5 khả năng suy luận nâng cao hơn. "Có lẽ các lĩnh vực quan trọng nhất của sự tiến bộ sẽ là xung quanh khả năng suy luận", Altman chia sẻ với Gates. "Ngay bây giờ, GPT-4 chỉ có thể suy luận theo những cách cực kỳ hạn chế."
Không thiếu người dùng đăng bài của họ GPT-4 thất bại trên Reddit và Medium, từ việc nhóm giải quyết vấn đề của nó, đến những lời giải thích chính thức về khả năng suy luận hạn chế của nó. Thật dễ hiểu tại sao: lý luận nổi tiếng là khó khăn. Bất kỳ cải tiến đáng kể nào về mặt vật chất sẽ dẫn đến những bước tiến lớn cho hiệu suất của mô hình AI.
Cải thiện lý luận có nghĩa là GPT-5 sẽ hiểu ngữ cảnh, suy luận và giải quyết vấn đề tốt hơn GPT-4. Kết hợp với một cơ sở kiến thức lớn hơn, nó có nghĩa là GPT-5 có thể hiểu rõ hơn ý định của người dùng và theo dõi thông tin liên quan hơn.
Và nếu chúng ta may mắn, GPT-5 sẽ là mô hình cuối cùng tìm ra cách trả lời câu đố, đẩy nó vượt xa GPT-4.
Đa phương thức hơn
Đa phương thức là trung tâm của một vài lần lặp lại trong quá khứ của GPT. OpenAI không có dấu hiệu chậm lại.
OpenAI Giới thiệu GPT-4o vào tháng 5 năm 2024, mang theo các kỹ năng văn bản, giọng nói và thị giác tăng lên. Một hòn đá xa ném từ GPT-4 Turbo, nó có thể tham gia vào các cuộc trò chuyện tự nhiên, phân tích đầu vào hình ảnh, mô tả hình ảnh và xử lý âm thanh phức tạp.
Những thay đổi trong đa phương thức tạo ra những thay đổi lớn trong cách chúng ta tham gia GPT. Luồng hội thoại tự nhiên - khi mô hình có thể diễn giải chính xác các thay đổi âm sắc và tuân theo các mẫu lời nói giống như con người, như GPT-4o - là một bước nhảy vọt khổng lồ trong xử lý ngôn ngữ tự nhiên AI.
![Một bức ảnh tĩnh do Sora tạo ra về một người phụ nữ đi bộ qua một con phố Tokyo đông đúc vào ban đêm.](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/66450207cf90120602b51d1a_Sora%20demo%20woman%20street.png)
Và nó không chỉ là giọng nói và văn bản được nâng cao. OpenAI đã không ngại trêu chọc người mẫu chuyển văn bản thành video sắp tới của họ Sora. Mô hình AI được phát triển để bắt chước các chuyển động phức tạp của máy ảnh và tạo ra các nhân vật và phong cảnh chi tiết trong các clip lên đến 60 giây.
Nếu lịch sử đa phương thức của họ là không đủ, hãy lấy nó từ OpenAI Giám đốc điều hành. Altman xác nhận với Gates rằng xử lý video, cùng với lý luận, là ưu tiên hàng đầu cho tương lai GPT Mô hình.
Đa phương thức là một trong những từ thông dụng lớn nhất trong tương lai của các mô hình AI, và vì lý do chính đáng. Mặc dù GPT-4O nhấn mạnh vào việc mở rộng khả năng đa phương thức của mình, sẽ không có gì ngạc nhiên khi thấy nhiều tính năng thoại, hình ảnh hoặc video hơn nữa với việc phát hành mô hình mới.
Tăng kích thước thông số
Mỗi GPT Cập nhật đã tăng kích thước tham số và thế hệ tiếp theo GPT-5 có thể sẽ không ngoại lệ. Trong một máy biến áp như GPT, các tham số bao gồm trọng số và độ lệch của các lớp mạng thần kinh, như cơ chế chú ý, lớp chuyển tiếp và ma trận nhúng. Kích thước của các tham số này ảnh hưởng trực tiếp đến khả năng học hỏi từ dữ liệu đầu vào của nó.
Trong khi OpenAI Giữ bí mật kích thước tham số chính xác của chúng, ước tính đặt nó vào khoảng 1,5 nghìn tỷ thông số - một sự gia tăng đáng kể so với GPT-3 là 175 tỷ (và một bước nhảy vọt không thể tưởng tượng được từ GPT-2 là 1,5 tỷ).
Chuyên gia AI Alan Thompson, một cố vấn AI tích hợp cho Google và Microsoft, dự kiến số lượng tham số từ 2-5 nghìn tỷ, điều này sẽ làm tăng đáng kể chiều sâu của các nhiệm vụ mà nó có thể hoàn thành cho các nhà phát triển. Phân tích của ông dựa trên việc tăng gấp đôi cả sức mạnh tính toán và thời gian đào tạo - một sự gia tăng đáng kể trong thời gian thử nghiệm từ GPT-4.
Windows ngữ cảnh lớn hơn
Cửa sổ ngữ cảnh đại diện cho số lượng mã thông báo (từ hoặc từ con) mà một mô hình có thể xử lý cùng một lúc. Một cửa sổ ngữ cảnh lớn hơn cho phép mô hình hấp thụ nhiều thông tin hơn từ văn bản đầu vào, dẫn đến câu trả lời chính xác hơn.
Một trong những GPT-4 sai sót là khả năng xử lý một lượng lớn văn bản tương đối hạn chế. Chẳng hạn GPT-4 Turbo và GPT-4o có cửa sổ ngữ cảnh là 128.000 token. Nhưng mô hình Gemini của Google có cửa sổ ngữ cảnh lên tới 1 triệu token.
Ngay bây giờ, nếu mối quan tâm duy nhất của bạn là một mô hình ngôn ngữ lớn có thể hấp thụ một lượng lớn thông tin, GPT-4 có thể không phải là lựa chọn hàng đầu của bạn. Dự kiến rằng OpenAI sẽ giải quyết những khác biệt này trong mô hình mới.
![Hai vòng tròn màu xanh, một vòng tròn lớn hơn 7,6 lần so với vòng kia. Chúng đại diện cho kích thước cửa sổ ngữ cảnh của GPT-4 Turbo và Gemini.](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/66464656f9787865888acf9e_final%20context%20window%20comparison.png)
Alan Thompson dự đoán gì? Một sự gia tăng khổng lồ lên 40 nghìn tỷ mã thông báo. Một sự thay đổi về bản chất này sẽ là một tiến bộ đáng chú ý so với mô hình Gemini, thêm khả năng đáp ứng các bộ dữ liệu khổng lồ đầu vào của người dùng. Đây sẽ là một yếu tố thay đổi cuộc chơi đối với hiệu suất của mô hình AI, đặc biệt là đối vớiOpenAI khách hàng doanh nghiệp và người dùng có nhu cầu nhập liệu nhiều.
Tăng khả năng tùy chỉnh
GPT-4 thường được sử dụng như một công cụ phù hợp với tất cả. Nhưng các lần lặp lại trong tương lai sẽ trở nên cá nhân hóa hơn. Trên podcast của Gates, Altman nhắc lại rằng khả năng tùy chỉnh và cá nhân hóa sẽ là chìa khóa cho tương lai OpenAI Mô hình. "Mọi người muốn những thứ rất khác nhau từ GPT-4: phong cách khác nhau, bộ giả định khác nhau.
OpenAI đã giới thiệu Tùy chỉnh GPTs, cho phép người dùng cá nhân hóa GPT đến một nhiệm vụ cụ thể, từ việc dạy một trò chơi trên bàn cờ đến giúp trẻ em hoàn thành bài tập về nhà. Mặc dù tùy chỉnh có thể không phải là ưu tiên hàng đầu của bản cập nhật tiếp theo, nhưng nó dự kiến sẽ trở thành một xu hướng chính trong tương lai.
Trong thời gian chờ đợi, bạn có thể cá nhân hóa một chatbot AI được trang bị sức mạnh của GPT-4o miễn phí. Đó là những gì chúng tôi làm tốt nhất. Bắt đầu tại đây.
Khi nào là GPT-5 ngày phát hành?
Dự đoán về ngày phát hành đã được người dùng và nhà báo ước tính nghiêm túc, từ mùa hè năm 2024 đến đầu năm 2026.
Nhưng bản cập nhật gần đây nhất (và đáng tin cậy) đến từ CTO openAI Mira Murati: Trong cuộc phỏng vấn với Dartmouth Engineering được phát hành vào ngày 20 tháng 6, cô tuyên bố 'thế hệ tiếp theo' của người mẫu còn khoảng một năm rưỡi nữa, đưa việc phát hành gần hơn vào cuối năm 2025. Tuy nhiên, không rõ liệu mô hình thế hệ tiếp theo mà cô thảo luận với người phỏng vấn có phải là GPT-5, hoặc thế hệ tương lai.
Thời gian đào tạo dự kiến mất 4-6 tháng, gấp đôi OpenAIThời gian đào tạo 3 tháng cho GPT-4. Mô hình mới có thể sẽ trải qua quá trình học tăng cường, nhóm đỏ và thử nghiệm thêm trước khi được phát hành, mặc dù đó là một mốc thời gian mơ hồ - OpenAI có thể phải thay đổi ngày ra mắt hơn nữa nếu gặp phải các kịch bản không lường trước được trong thử nghiệm.
![CTO Mira Murati và trưởng nhóm nghiên cứu Mark Chen và Barret Zoph ngồi trên ghế dài trên sân khấu khi phát hành GPT-4o, thể hiện khả năng của mô hình để xem một vấn đề toán học bằng văn bản.](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/66450ea7e691054133415d6d_gpt%204o%20launch.webp)
Dữ liệu đào tạo nào sẽ GPT-5 sử dụng?
GPT-5 gần như chắc chắn sẽ tiếp tục sử dụng thông tin có sẵn trên internet làm dữ liệu đào tạo.
Nếu có bất kỳ tính toán nào cho OpenAI Trên con đường leo lên đỉnh cao của ngành, đó là hàng loạt vụ kiện về việc đào tạo hoàn chỉnh của các người mẫu.
GPT Các mô hình được đào tạo trên các bộ dữ liệu khổng lồ lấy từ Internet, phần lớn có bản quyền. Việc sử dụng dữ liệu trái phép này đã dẫn đến các khiếu nại và hành động pháp lý rộng rãi: một vụ kiện từ The New York Times, một vụ kiện từ một loạt các cơ quan thông tấn Hoa Kỳ và tuyên bố rằng quá trình đào tạo của mô hình vi phạm Quy định bảo vệ dữ liệu chung của EU.
Một thẩm phán California đã bác bỏ một trong những OpenAI Các vụ kiện bản quyền được đệ trình bởi một nhóm các nhà văn, bao gồm những người nổi tiếng Sarah Silverman và Ta-Nehisi Coates. Chưa có ý kiến cho rằng OpenAI Và công ty sẽ bị kìm hãm đáng kể bởi những khiếu nại này khi tiếp tục thử nghiệm.
Bao nhiêu GPT-5 chi phí?
Nếu OpenAI tiếp tục với mô hình định giá tiêu chuẩn của họ, GPT-5 sẽ tốn phí bảo hiểm để sử dụng. Hiện nay ChatGPT với GPT-4 chỉ có sẵn cho người dùng trả tiền ở mức 20 đô la mỗi tháng, trong khi ChatGPT với GPT 3.5 có sẵn miễn phí.
Đối với định giá API, GPT-4 hiện có giá 30,00 đô la cho mỗi 1 triệu mã thông báo đầu vào và 60 đô la cho mỗi 1 triệu mã thông báo đầu ra (các mức giá này tăng gấp đôi cho phiên bản 32k). Nếu mô hình mới mạnh mẽ như dự đoán, giá có thể sẽ còn cao hơn trước OpenAI GPT Mô hình.
![Đồ họa mô tả GPT-4 mô hình định giá. ChatGPT Chi phí $ 20 mỗi tháng. GPT-4 cho API có giá 30 đô la cho mỗi 1 triệu mã thông báo đầu vào và 60 đô la cho mỗi 1 triệu mã thông báo đầu ra.](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/6646470eebbb0db1f7837503_final%20gpt-4%20pricing.png)
Tuy nhiên, mới nhất OpenAI Mô hình dễ tiếp cận hơn với chi phí. GPT-4o chỉ tốn 5 đô la cho mỗi 1 triệu mã thông báo đầu vào và 15 đô la cho mỗi 1 triệu mã thông báo đầu ra. Mặc dù sự khác biệt về giá không phải là vấn đề quyết định đối với khách hàng doanh nghiệp, OpenAI đang thực hiện một bước tiến đáng ngưỡng mộ đối với khả năng tiếp cận cho các cá nhân và doanh nghiệp nhỏ.
Tin tốt? Sự ra mắt của GPT-5 ý chí - ngón tay bắt chéo - va chạm GPT-4 trở thành OpenAIcủa mô hình miễn phí mới.
Tương lai của ChatGPT
Thế hệ tiếp theo của các mô hình ngôn ngữ lớn sẽ cách mạng hóa cách chúng ta tương tác với AI trong cuộc sống hàng ngày. Tại hội nghị công nghệ của Bloomberg, OpenAI COO Brad Lightcap gợi ý về cách công ty có kế hoạch cách mạng hóa tương tác giữa người và máy tính, GPT từ một LLM đến một mô hình có khả năng giống như tác nhân.
"Sẽ có một thứ gọi là kỹ sư nhanh chóng vào năm 2026?" Lightcap nói. "Ngươi không nhắc nhở bằng hữu của ngươi."
Một mô hình có khả năng và cá nhân hóa hơn với nhiều khả năng đa phương thức hơn hứa hẹn những gì Altman và OpenAI Mong đợi: điều không thể tưởng tượng được. Dự đoán GPT-5 sẽ gần hơn một bước.
Sức mạnh của GPTTùy chỉnh
Điều gì sẽ xảy ra nếu chatbot AI của bạn tự động đồng bộ hóa với mọi GPT cập nhật?
Botpress đã cung cấp các giải pháp chatbot AI có thể tùy chỉnh từ năm 2017, cung cấp cho các nhà phát triển các công cụ họ cần để dễ dàng xây dựng chatbot với sức mạnh mới nhất LLMs. Botpress Chatbot có thể được đào tạo về các nguồn kiến thức tùy chỉnh - như trang web hoặc danh mục sản phẩm của bạn - và tích hợp liền mạch với các hệ thống kinh doanh.
Nền tảng duy nhất bao gồm từ không cần thiết lập mã đến khả năng tùy chỉnh và khả năng mở rộng vô tận, Botpress cho phép bạn tự động nhận được sức mạnh của mới nhất GPT Phiên bản trên chatbot của bạn - không cần nỗ lực.
Bắt đầu xây dựng ngay hôm nay. Nó miễn phí.
Mục lục
Luôn cập nhật thông tin mới nhất về AI chatbots
Chia sẻ điều này trên: