!['GPT-5' na niebieskim wzorzystym tle.](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/66854e271fa93cdd5adbdeb4_GPT-5.webp)
GPT-5 nadchodzi - a plotki mówią, że data premiery nastąpi raczej wcześniej niż później.
W wywiadzie dla podcastu z Billem Gatesem, dyrektor generalny OpenAI Sam Altman potwierdził w styczniu 2024 r., że GPT-5 jest w fazie rozwoju. Raporty sugerują, że możemy go zobaczyć wcześniej niż nam się wydaje: dwa anonimowe źródła bliskie OpenAI zasugerowały, że GPT-5 zostanie wydany w połowie 2024 roku, prawdopodobnie latem tego roku.
Co to jest GPT-5?
Podczas gdy GPT-4 wydaje nam się teraz rewolucyjny, Altman uważa, że świat dopiero zarysował powierzchnię sztucznej inteligencji. Podczas Światowego Szczytu Rządowego w styczniu 2024 r. Altman porównał obecne modele z OpenAI do wczesnych dni telefonów komórkowych:
Jeśli jedno jest pewne, to to, że następna generacja modeli GPT jest dla nas obecnie niewyobrażalna. Chociaż przejście od wersji GPT na telefon z klapką do wersji na iPhone'a zajmie trochę czasu, do końca roku będziemy o krok bliżej.
GPT-5 będzie najbardziej oczekiwaną wersją LLM do tej pory. Model AI będzie miał większą prędkość i zwiększone możliwości przetwarzania języka naturalnego. Co więc czeka nas w przyszłości?
"Jest naprawdę dobrze, jakby znacznie lepiej" - powiedział jeden z dyrektorów generalnych z zaawansowanym dostępem do GPT-5.
Spostrzeżenia z OpenAI
W miarę zbliżania się premiery GPT-5, kierownictwo OpenAI i osoby wtajemniczone zwiększyły liczbę komentarzy na temat modelu nowej generacji. Oto, co ostatnio powiedziała firma:
- CEO Sam Altman stwierdził, że GPT-5 będzie w stanie przetwarzać wiadomości e-mail i szczegóły kalendarza, a także będzie bardziej konfigurowalny
- CTO Mira Murati wyjaśniła w wywiadzie dla Dartmouth Engineering, że GPT-3 miał inteligencję malucha, GPT-4 był bardziej podobny do inteligentnego licealisty, a następna generacja będzie miała inteligencję na poziomie doktora (w niektórych zadaniach).
- Dyrektor generalny Microsoft AI Mustafa Suleyman podzielił się informacją, że modele będą w stanie "podejmować działania" w nowych środowiskach dopiero na stronie GPT-6 za dwa lata
![Mira Murati nosi zestaw słuchawkowy i siedzi na białym krześle, mówiąc i gestykulując.](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/667ec97b954379fb0f078179_mira%20murati.jpeg)
Jaka jest różnica między GPT-4 a GPT-5?
Tak jak GPT-4 był znacznym wzrostem w stosunku do swojego poprzednika, nie ma wątpliwości, że następna wersja zrobi to samo. Chociaż żadne aktualizacje nie zostały potwierdzone przez OpenAI - i prawdopodobnie nie pojawią się przed jego niespodziewaną premierą - poniższe przewidywania dotyczące tego, czego można się spodziewać po GPT-5 pochodzą z wywiadów wewnętrznych, poprzednich aktualizacji GPT i trendów AI konkurencji LLMs.
Mądrzejszy niż GPT-4
Największa różnica? Według Altmana: "Będzie mądrzej".
Podczas World Government Summit Altman podkreślił, że największy skok z GPT-4 do GPT-5 był zwodniczo prosty: jest bardziej inteligentny. "To, co czyni te modele tak magicznymi, to fakt, że są one ogólne" - wyjaśnił. "Będzie mądrzejszy, więc będzie lepszy we wszystkim".
Chociaż oczekuje się wielu ulepszeń - nowych funkcji, szybszych prędkości i multimodalności, zgodnie z wywiadem Altmana - bardziej inteligentny model poprawi wszystkie istniejące funkcje obecnego LLMs.
Zwiększona niezawodność
Altman potwierdził, że niezawodność będzie głównym celem ewolucji GPT(Generative Pre-trained Transformer) w ciągu najbliższych dwóch lat. "Jeśli zadasz GPT-4 większość pytań 10 000 razy, jedno z tych 10 000 jest prawdopodobnie całkiem dobre, ale nie zawsze wie, które, a chciałbyś uzyskać najlepszą odpowiedź z 10 000 za każdym razem, więc wzrost niezawodności będzie ważny".
Niezawodność od dawna była punktem spornym dla użytkowników GPT-4, a GPT-4 Turbo opracowano częściowo w celu wprowadzenia niezbędnych aktualizacji spójności i dokładności wyników modelu. Turbo zwiększyło stabilność modelu i zmniejszyło liczbę halucynacji AI.
![OpenAI CEO Sam Altman prezentuje z ciemnej sceny podczas premiery GPT-4 Turbo.](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/66450c0f7955370a4fb1f45a_turbo%20launch.webp)
Jeśli więc pojawią się uzasadnione skargi użytkowników, nowy model prawie na pewno zostanie przeszkolony, aby był bardziej niezawodny niż GPT-4. W rzeczywistości anonimowy informator OpenAI potwierdził, że zespół ma nadzieję na zwiększenie niezawodności w następnej iteracji. My również mamy taką nadzieję.
Zwiększone zdolności rozumowania
W centrum jej ogólnej inteligencji znajduje się GPT-5 bardziej zaawansowana zdolność rozumowania. "Być może najważniejsze obszary postępu będą dotyczyć zdolności rozumowania", Altman podzielił się z Gatesem. "W tej chwili GPT-4 może rozumować tylko w bardzo ograniczony sposób".
W serwisach Reddit i Medium nie brakuje użytkowników, którzy publikują na GPT-4 swoje niepowodzenia, od grupowych wynurzeń na temat rozwiązywania problemów, po formalne wyjaśnienia ograniczonych możliwości rozumowania. Łatwo zrozumieć dlaczego: rozumowanie jest notorycznie trudne. Wszelkie istotne ulepszenia doprowadziłyby do ogromnych postępów w wydajności modelu AI.
Ulepszone rozumowanie oznaczałoby, że GPT-5 byłby lepszy w rozumieniu kontekstu, wnioskowaniu i rozwiązywaniu problemów niż GPT-4. W połączeniu z większą bazą wiedzy oznaczałoby to, że GPT-5 jest w stanie lepiej zrozumieć intencje użytkownika i przekazać mu bardziej istotne informacje.
A jeśli nam się poszczęści, GPT-5 będzie modelem, który w końcu odkryje, jak odpowiadać na zagadki, wynosząc go daleko poza GPT-4.
Więcej multimodalności
Multimodalność była kluczowa dla ostatnich kilku iteracji GPT. OpenAI nie wykazuje żadnych oznak spowolnienia.
OpenAI wprowadził GPT-4o w maju 2024 roku, przynosząc ze sobą zwiększone umiejętności tekstowe, głosowe i wizyjne. Daleko od GPT-4 Turbo, jest w stanie angażować się w naturalne rozmowy, analizować dane wejściowe obrazu, opisywać wizualizacje i przetwarzać złożone dźwięki.
Zmiany w multimodalności powodują ogromne zmiany w sposobie, w jaki angażujemy się w GPT. Naturalny przepływ konwersacji - gdy model może dokładnie interpretować zmiany tonalne i podążać za wzorcami mowy podobnymi do ludzkich, takimi jak GPT-4o - to ogromny skok w przetwarzaniu języka naturalnego przez sztuczną inteligencję.
![Wygenerowany przez Sorę kadr przedstawiający kobietę idącą nocą przez ruchliwą ulicę Tokio.](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/66450207cf90120602b51d1a_Sora%20demo%20woman%20street.png)
I nie chodzi tu tylko o wzmocniony głos i tekst. OpenAI nie wstydziło się zaprezentować swojego nadchodzącego modelu Sora do konwersji tekstu na wideo. Model AI został opracowany w celu naśladowania złożonych ruchów kamery i tworzenia szczegółowych postaci i scenerii w klipach do 60 sekund.
Jeśli ich historia multimodalności nie jest wystarczająca, weź to od CEO OpenAI . Altman potwierdził Gatesowi, że przetwarzanie wideo, wraz z rozumowaniem, jest najwyższym priorytetem dla przyszłych modeli GPT .
Multimodalność jest jednym z największych haseł w przyszłości modeli AI i nie bez powodu. Pomimo tego, że GPT-4o kładzie nacisk na poszerzenie swoich multimodalnych możliwości, nie byłoby zaskoczeniem, gdyby wraz z wydaniem nowego modelu pojawiło się jeszcze więcej funkcji głosowych, graficznych lub wideo.
Zwiększony rozmiar parametru
Każda aktualizacja GPT zwiększała rozmiar parametrów, a następna generacja GPT-5 prawdopodobnie nie będzie wyjątkiem. W transformatorze takim jak GPT parametry obejmują wagi i odchylenia warstw sieci neuronowej, takie jak mechanizmy uwagi, warstwy sprzężenia zwrotnego i macierze osadzania. Wielkość tych parametrów bezpośrednio wpływa na zdolność sieci do uczenia się na podstawie danych wejściowych.
Podczas gdy OpenAI utrzymuje w tajemnicy dokładną wielkość parametrów, szacunki wskazują na około 1,5 biliona parametrów - wyraźny wzrost w porównaniu z 175 miliardami GPT-3 (i niewyobrażalny skok w porównaniu z 1,5 miliarda GPT-2).
Ekspert ds. sztucznej inteligencji Alan Thompson, zintegrowany doradca ds. sztucznej inteligencji w Google i Microsoft, spodziewa się liczby parametrów na poziomie 2-5 bilionów, co znacznie zwiększyłoby głębokość zadań, które może wykonać dla programistów. Jego analiza opiera się na podwojeniu zarówno mocy obliczeniowej, jak i czasu szkolenia - znacznym wydłużeniu czasu testowania z GPT-4.
Większe okna kontekstowe
Okna kontekstowe reprezentują liczbę tokenów (słów lub podsłów), które model może przetwarzać jednocześnie. Większe okno kontekstowe umożliwia modelowi wchłonięcie większej ilości informacji z tekstu wejściowego, co prowadzi do większej dokładności odpowiedzi.
Jedną z wad GPT-4 była jego stosunkowo ograniczona zdolność do przetwarzania dużych ilości tekstu. Na przykład, GPT-4 Turbo i GPT-4o mają okno kontekstowe 128 000 tokenów. Model Gemini firmy Google ma natomiast okno kontekstowe do 1 miliona tokenów.
W tej chwili, jeśli zależy Ci tylko na dużym modelu językowym, który może wchłonąć duże ilości informacji, GPT-4 może nie być najlepszym wyborem. Oczekuje się, że OpenAI rozwiąże te rozbieżności w nowym modelu.
![Dwa niebieskie okręgi, jeden 7,6x większy od drugiego. Reprezentują one rozmiary okien kontekstowych GPT-4 Turbo i Gemini.](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/66464656f9787865888acf9e_final%20context%20window%20comparison.png)
Co przewiduje Alan Thompson? Ogromny wzrost do 40 bilionów tokenów. Zmiana tego rodzaju byłaby znaczącym postępem w stosunku do modelu Gemini, dodając możliwość reagowania na ogromne zbiory danych wprowadzane przez użytkowników. Byłoby to przełomowe dla wydajności modelu AI, zwłaszcza dla klientów korporacyjnych OpenAI i użytkowników z dużymi potrzebami w zakresie wprowadzania danych.
Zwiększona personalizacja
GPT-4 jest często używane jako uniwersalne narzędzie. Ale przyszłe iteracje staną się bardziej spersonalizowane. W podcaście Gatesa Altman powtórzył, że możliwość dostosowania i personalizacji będzie kluczem do przyszłych modeli OpenAI . "Ludzie chcą bardzo różnych rzeczy od GPT-4: różnych stylów, różnych zestawów założeń".
OpenAI wprowadziła już Custom GPTs, umożliwiając użytkownikom spersonalizowanie GPT do konkretnego zadania, od nauczania gry planszowej po pomoc dzieciom w odrabianiu prac domowych. Chociaż personalizacja może nie być głównym elementem następnej aktualizacji, oczekuje się, że stanie się głównym trendem w przyszłości.
W międzyczasie możesz spersonalizować chatbota AI wyposażonego w moc GPT-4o za darmo. To właśnie robimy najlepiej. Zacznij tutaj.
Kiedy nastąpi premiera GPT-5?
Przewidywania dotyczące daty premiery zostały szczerze oszacowane zarówno przez użytkowników, jak i dziennikarzy, od lata 2024 roku do początku 2026 roku.
Jednak najnowsza (i wiarygodna) aktualizacja pochodzi od CTO openAI Miry Murati: w wywiadzie dla Dartmouth Engineering opublikowanym 20 czerwca twierdziła, że "następna generacja" modelu jest oddalona o około półtora roku, co plasuje jego wydanie bliżej końca 2025 roku. Nie jest jednak jasne, czy model następnej generacji, o którym rozmawiała z ankieterem, to GPT-5, czy przyszłe generacje.
Przewiduje się, że okres szkoleniowy potrwa 4-6 miesięcy, czyli dwa razy więcej niż 3-miesięczny okres szkoleniowy OpenAIdla GPT-4. Nowy model prawdopodobnie przejdzie uczenie się ze wzmocnieniem, red teaming i dalsze testy przed wydaniem, chociaż jest to mglisty harmonogram - OpenAI może być zmuszony do dalszego przesunięcia daty premiery, jeśli napotka nieprzewidziane scenariusze podczas testów.
![CTO Mira Murati i liderzy badań Mark Chen i Barret Zoph siedzą na kanapach na scenie podczas premiery GPT-4o, demonstrując zdolność modelu do przeglądania pisemnych problemów matematycznych.](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/66450ea7e691054133415d6d_gpt%204o%20launch.webp)
Jakich danych treningowych będzie używać GPT-5?
GPT-5 prawie na pewno będzie nadal wykorzystywać informacje dostępne w Internecie jako dane treningowe.
Jeśli firma OpenAI musiała się liczyć ze swoją wspinaczką na szczyt branży, to jest to seria procesów sądowych dotyczących pełnego szkolenia modelek.
GPT są trenowane na ogromnych zbiorach danych pobranych z Internetu, z których wiele jest chronionych prawem autorskim. To nieautoryzowane wykorzystanie danych doprowadziło do powszechnych skarg i działań prawnych: pozwu ze strony The New York Times, pozwu ze strony szeregu amerykańskich agencji informacyjnych oraz twierdzeń, że proces szkolenia modelu narusza ogólne rozporządzenie UE o ochronie danych.
Sędzia w Kalifornii oddalił już jeden z pozwów o naruszenie praw autorskich OpenAI złożonych przez grupę pisarzy, w tym celebrytów Sarah Silverman i Ta-Nehisi Coates. Nie ma jeszcze żadnych sugestii, że OpenAI i spółka zostaną w znacznym stopniu powstrzymani przez te skargi podczas kontynuowania testów.
Ile kosztuje GPT-5?
Jeśli OpenAI utrzyma swój standardowy model cenowy, korzystanie z GPT-5 będzie płatne. Obecnie ChatGPT z GPT-4 jest dostępny tylko dla płacących użytkowników za 20 USD miesięcznie, podczas gdy ChatGPT z GPT 3.5 jest dostępny za darmo.
Jeśli chodzi o ceny API, GPT-4 kosztuje obecnie 30,00 USD za 1 milion tokenów wejściowych i 60 USD za 1 milion tokenów wyjściowych (ceny te podwajają się dla wersji 32k). Jeśli nowy model jest tak potężny, jak przewidywano, ceny prawdopodobnie będą jeszcze wyższe niż w przypadku poprzednich modeli OpenAI GPT .
![Grafika przedstawiająca model cenowy GPT-4. ChatGPT kosztuje 20 USD miesięcznie. GPT-4 dla API kosztuje 30 USD za 1 milion tokenów wejściowych i 60 USD za 1 milion tokenów wyjściowych.](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/6646470eebbb0db1f7837503_final%20gpt-4%20pricing.png)
Najnowszy model OpenAI jest jednak znacznie bardziej przystępny cenowo. GPT-4o kosztuje tylko 5 USD za 1 milion tokenów wejściowych i 15 USD za 1 milion tokenów wyjściowych. Chociaż różnice cenowe nie są kwestią decydującą dla klientów korporacyjnych, OpenAI robi godny podziwu krok w kierunku dostępności dla osób fizycznych i małych firm.
Dobra wiadomość? Uruchomienie GPT-5 spowoduje - trzymamy kciuki - że GPT-4 stanie się nowym darmowym modelem OpenAI.
Przyszłość ChatGPT
Następna generacja dużych modeli językowych zrewolucjonizuje sposób, w jaki wchodzimy w interakcje ze sztuczną inteligencją w naszym codziennym życiu. Podczas konferencji Bloomberg's Tech,dyrektor operacyjny OpenAI Brad Lightcap zasugerował, w jaki sposób firma planuje zrewolucjonizować interakcję człowiek-komputer, przenosząc GPT z LLM do modelu z możliwościami podobnymi do agenta.
"Czy w 2026 roku będzie coś takiego jak szybki inżynier?" powiedział Lightcap. "Nie można podpowiedzieć inżyniera swojemu przyjacielowi".
Bardziej wydajny i spersonalizowany model z większymi możliwościami multimodalnymi obiecuje właśnie to, czego oczekują Altman i OpenAI : niewyobrażalne. Oczekiwane GPT-5 będzie o krok bliżej.
Moc GPT, dostosowane
A gdyby Twój chatbot AI automatycznie synchronizował się z każdą aktualizacją GPT ?
Botpress dostarcza konfigurowalne rozwiązania AI chatbot od 2017 roku, zapewniając programistom narzędzia potrzebne do łatwego tworzenia chatbotów z mocą najnowszego LLMs. Botpress chatboty można szkolić na niestandardowych źródłach wiedzy - takich jak strona internetowa lub katalog produktów - i płynnie integrować z systemami biznesowymi.
Botpress to jedyna platforma, która nie wymaga konfiguracji kodu, a jej możliwości dostosowywania i rozszerzania są nieskończone. pozwala automatycznie uzyskać moc najnowszej wersji GPT na swoim chatbocie - bez żadnego wysiłku.
Zacznij budować już dziś. To nic nie kosztuje.
Spis treści
Bądź na bieżąco z najnowszymi informacjami na temat chatbotów AI
Udostępnij to na: