Długo oczekiwany model GPT-5 od OpenAI został wydany - i nazywa się OpenAI o1.
Jeśli chcesz dowiedzieć się więcej o wersjach o1-preview i o1-mini, możesz zapoznać się z naszym przeglądem modelu o1 tutaj.
Co to jest GPT-5?
OpenAI o1 to najnowsza seria dużych modeli językowych wydana przez OpenAI 12 września 2024 r., obejmująca obecnie dwa modele: o1-preview i o1-mini.
Największą różnicą między o1 a poprzednimi modelami firmy jest rozumowanie łańcuchowe. Chociaż nie został on jeszcze w pełni wydany, modele preview i mini już zdmuchnęły GPT-4o z wody w testach matematycznych, naukowych i kodowania.
Nowy model jest pierwszym w swoim rodzaju, zdolnym do rozumowania w czasie rzeczywistym (tak jak człowiek).
Co jego zdolność rozumowania oznacza dla użytkowników? "Jest naprawdę dobrze, jakby znacznie lepiej" - powiedział jeden z dyrektorów generalnych z zaawansowanym dostępem.
Kiedy nastąpi premiera GPT-5?
OpenAINajnowsza wersja LLM została udostępniona publicznie 12 września 2024 roku. Wydanie obejmowało modele o1-preview i o1-mini.
Do momentu premiery prognozy były bardzo zróżnicowane, szacowane zarówno przez użytkowników, jak i dziennikarzy, od lata 2024 do 2026 roku.
Jak inteligentny jest GPT-5?
OpenAI przedstawiła listę testów STEM, które pokazują zdolności rozumowania o1, w tym:
- Podobne wyniki do doktorantów w testach porównawczych z fizyki, chemii i biologii.
- Miejsce w pierwszej 500 uczniów w kwalifikacjach do Olimpiady Matematycznej USA.
- Ranking w 89. percentylu w Codeforces, konkurencyjnym teście kodowania.
Więcej informacji na temat zdolności rozumowania o1 można znaleźć w komunikacie badawczym OpenAI.
Projekt Strawberry
OpenAI o1 nosił wcześniej nazwę kodową Strawberry, z dużą dozą mistycyzmu i intrygi. "Sposób działania Strawberry jest ściśle strzeżoną tajemnicą nawet w ramach OpenAI," anonimowe źródło podzieliło się z Reuters.
Mniejsza wersja tej nowej sztucznej inteligencji została uruchomiona 12 września 2024 r. w ramach aktualizacji strony ChatGPT. Większa wersja jest prawdopodobnie używana przez OpenAI do generowania danych szkoleniowych dla jej LLMs, potencjalnie zastępując potrzebę korzystania z dużych ilości danych ze świata rzeczywistego.
Wewnętrzne spotkanie wszystkich pracowników OpenAI , które odbyło się 9 lipca, obejmowało demonstrację tego, co mogło być Projektem Strawberry i rzekomo wykazywało umiejętności rozumowania podobne do ludzkich.
Jaka jest różnica między GPT-4 a GPT-5?
OpenAI CEO Sam Altman uważa, że świat dopiero zarysował powierzchnię sztucznej inteligencji. Podczas Światowego Szczytu Rządowego w styczniu 2024 r. Altman porównał obecne modele z OpenAI do wczesnych dni telefonów komórkowych:
Chociaż przejście od wersji GPT na telefon z klapką do wersji na iPhone'a zajmie trochę czasu, model o1 przybliża nas o krok.
1) Zwiększone zdolności rozumowania
W centrum jego ogólnej inteligencji znajduje się nowa zdolność o1 do rozumowania. "Być może najważniejsze obszary postępu będą dotyczyć zdolności rozumowania", Altman podzielił się z Gatesem. "W tej chwili GPT-4 może rozumować tylko w bardzo ograniczony sposób".
Rozumowanie jest notorycznie trudne. Nawet dla ludzi. A OpenAI o1 jest pierwszym modelem, który to twierdzi.
Na Reddicie i Medium nie brakuje użytkowników, którzy publikują swoje niepowodzenia na GPT-4, od grupowych pieczeni na temat rozwiązywania problemów, po formalne wyjaśnienia ograniczonych możliwości rozumowania.
2) Nowa konwencja nazewnictwa
Chociaż jego nazwa nie jest najbardziej ekscytującą rzeczą w nowym OpenAI LLM , jest to celowo znacząca zmiana.
OpenAI o1 jest pierwszym modelem, który porzucił przydomek "GPT", a to dlatego, że firma twierdzi, że jest to pierwsza faza zupełnie nowego "paradygmatu rozumowania", podczas gdy starsze modele były częścią "paradygmatu przedtreningowego".
Nowy model spędza czas na rozumowaniu w czasie rzeczywistym, zamiast polegać na danych przedtreningowych.
3) Dłuższy czas oczekiwania
Rozumowanie w czasie rzeczywistym trwa dłużej niż odwoływanie się do danych treningowych i generowanie odpowiedzi. Jeśli zadasz pytanie na OpenAI o1-preview w porównaniu do innych modeli, będziesz czekać znacznie dłużej.
Jednak dzięki możliwości outsourcingu rozumowania jest to niewielka cena do zapłacenia. Szybkość modeli o1 prawdopodobnie poprawi się wraz z wydaniem kolejnych modeli z tej serii.
4) Identyczne okna kontekstowe
Podczas gdy wielu spekulowało na temat zwiększenia okna zawartości z GPT-4 do następnego modelu, obecna seria o1 pozostaje identyczna z oknem zawartości GPT-4o wynoszącym 128 000.
Okna kontekstowe reprezentują liczbę tokenów (słów lub podsłów), które model może przetwarzać jednocześnie. Większe okno kontekstowe umożliwia modelowi wchłonięcie większej ilości informacji z tekstu wejściowego, co prowadzi do większej dokładności odpowiedzi.
Jedną z wad GPT-4 była jego stosunkowo ograniczona zdolność do przetwarzania dużych ilości tekstu. Na przykład, GPT-4 Turbo i GPT-4o mają okno kontekstowe 128 000 tokenów. Model Gemini firmy Google ma natomiast okno kontekstowe do 1 miliona tokenów.
W tej chwili, jeśli Twoim jedynym zmartwieniem jest duży model językowy, który może wchłonąć duże ilości informacji, OpenAI LLMs może nie być najlepszym wyborem. Jeśli jesteś ciekawy, który chatbot LLM jest dla Ciebie odpowiedni, sprawdź nasz artykuł na temat najlepszych chatbotów LLM .
Jakich danych treningowych używa GPT-5?
Jeśli firma OpenAI musiała się liczyć ze swoją wspinaczką na szczyt branży, to jest to seria procesów sądowych dotyczących pełnego szkolenia modelek.
GPT są trenowane na ogromnych zbiorach danych pobranych z Internetu, z których wiele jest chronionych prawem autorskim. To nieautoryzowane wykorzystanie danych doprowadziło do powszechnych skarg i działań prawnych: pozwu ze strony The New York Times, pozwu ze strony szeregu amerykańskich agencji informacyjnych oraz twierdzeń, że proces szkolenia modelu narusza ogólne rozporządzenie UE o ochronie danych.
Sędzia w Kalifornii oddalił już jeden z pozwów o naruszenie praw autorskich OpenAI złożonych przez grupę pisarzy, w tym celebrytów Sarah Silverman i Ta-Nehisi Coates. Nie ma jeszcze żadnych sugestii, że OpenAI i spółka zostaną w znacznym stopniu powstrzymani przez te skargi podczas kontynuowania testów.
Najnowszy model został wytrenowany na połączeniu publicznie dostępnych danych i danych zakupionych od firm. OpenAI poprosił o szerszą gamę zestawów danych, aby lepiej wytrenować model.
Jest również prawdopodobne, że o1 był używany do tworzenia zestawów danych do dalszego trenowania modelu. OpenAI wyjaśnił, że Strawberry będzie używany do trenowania przyszłego LLMs.
Ile kosztuje GPT-5?
Nowy model OpenAI o1 jest dostępny za darmo na ChatGPT, ale na razie z surowymi ograniczeniami.
W przypadku korzystania z interfejsu API model OpenAI o1-preview kosztuje 15 USD za 1 milion tokenów wejściowych i 60 USD za 1 milion tokenów wyjściowych.
Model o1-mini kosztuje 3 USD za 1 milion tokenów wejściowych i 12 USD za 1 milion tokenów wyjściowych, co czyni go znacznie bardziej dostępnym modelem do codziennego użytku.
Modele te są jednak droższe od poprzednich opcji OpenAI. Model GPT-4o kosztuje 5 USD za 1 milion tokenów wejściowych i 15 USD za 1 milion tokenów wyjściowych. Model GPT-4o mini kosztuje 0,150 USD za 1 milion tokenów wejściowych i 0,6 USD za 1 milion tokenów wyjściowych.
Przedpremierowe spostrzeżenia od OpenAI
Przed premierą o1 (wcześniej znanego również jako Strawberry i Q*), kierownictwo OpenAI i osoby wtajemniczone coraz częściej ujawniały informacje na temat modelu nowej generacji. Oto ślad tego, co firma oświadczyła przed premierą:
- OpenAI Japoński CEO ogłosił datę premiery w 2024 roku, a także partnerstwa między nowym produktem a Apple, Spotify i Coca-Colą.
- CEO Sam Altman stwierdził, że następny model będzie w stanie przetwarzać wiadomości e-mail i szczegóły kalendarza, a także będzie bardziej konfigurowalny.
- CTO Mira Murati wyjaśniła w wywiadzie dla Dartmouth Engineering, że GPT-3 miał inteligencję malucha, GPT-4 był bardziej podobny do inteligentnego licealisty, a OpenAI o1 ma inteligencję na poziomie doktora (w niektórych zadaniach).
- Dyrektor generalny Microsoft AI Mustafa Suleyman podzielił się informacją, że modele będą w stanie "podejmować działania" w nowych środowiskach dopiero na stronie GPT-6 za dwa lata.
- Ostrożność jest najważniejsza: Dyrektor generalny Sam Altman był ostrożny w kwestii daty premiery modelu o1, wyjaśniając, że OpenAI ma "wiele innych ważnych rzeczy do wydania w pierwszej kolejności". Stwierdził, że firma wyda model tylko wtedy, gdy będzie miała pewność, że może to zrobić bezpiecznie i odpowiedzialnie.
- Altman zażartował, że GPT-5 sprawi, że GPT-4 będzie wydawać się "lekko żenujące" w porównaniu, w wywiadzie dla Stanford.
- Amerykański Instytut Bezpieczeństwa Sztucznej Inteligencji otrzymał wczesny dostęp do kolejnego modelu OpenAI, dzięki czemu obie organizacje mogą "rozwijać naukę o ocenach sztucznej inteligencji".
- Będzie miał rozszerzony zestaw danych. GPT-5 został wytrenowany na połączeniu publicznie dostępnych danych i danych zakupionych od firm. OpenAI poprosił o szerszą gamę zestawów danych, aby lepiej wytrenować model.
Przyszłość ChatGPT
Następna generacja dużych modeli językowych zrewolucjonizuje sposób, w jaki wchodzimy w interakcje ze sztuczną inteligencją w naszym codziennym życiu. Podczas konferencji Bloomberg's Tech,dyrektor operacyjny OpenAI Brad Lightcap zasugerował, w jaki sposób firma planuje zrewolucjonizować interakcję człowiek-komputer, przenosząc GPT z LLM do modelu z możliwościami podobnymi do agenta.
"Czy w 2026 roku będzie coś takiego jak szybki inżynier?" powiedział Lightcap. "Nie można podpowiedzieć inżyniera swojemu przyjacielowi".
Bardziej wydajny i spersonalizowany model z większymi możliwościami multimodalnymi obiecuje właśnie to, czego oczekują Altman i OpenAI : niewyobrażalne. Oczekiwane GPT-5 będzie o krok bliżej.
Zwiększona personalizacja
GPT-4 jest często używane jako uniwersalne narzędzie. Ale przyszłe iteracje staną się bardziej spersonalizowane. W podcaście Gatesa Altman powtórzył, że możliwość dostosowania i personalizacji będzie kluczem do przyszłych modeli OpenAI . "Ludzie chcą bardzo różnych rzeczy od GPT-4: różnych stylów, różnych zestawów założeń".
OpenAI wprowadziła już Custom GPTs, umożliwiając użytkownikom spersonalizowanie GPT do konkretnego zadania, od nauczania gry planszowej po pomoc dzieciom w odrabianiu prac domowych. Chociaż personalizacja nie była w czołówce OpenAI o1, oczekuje się, że stanie się głównym trendem w przyszłości.
W międzyczasie możesz spersonalizować chatbota AI wyposażonego w moc GPT-4o za darmo. To właśnie robimy najlepiej. Zacznij tutaj.
Więcej multimodalności
Multimodalność była kluczowa dla ostatnich kilku iteracji GPT. OpenAI nie wykazuje żadnych oznak spowolnienia.
OpenAI wprowadził GPT-4o w maju 2024 roku, przynosząc ze sobą zwiększone umiejętności tekstowe, głosowe i wizyjne. Daleko od GPT-4 Turbo, jest w stanie angażować się w naturalne rozmowy, analizować dane wejściowe obrazu, opisywać wizualizacje i przetwarzać złożone dźwięki.
Zmiany w multimodalności powodują ogromne zmiany w sposobie, w jaki angażujemy się w GPT. Naturalny przepływ konwersacji - gdy model może dokładnie interpretować zmiany tonalne i podążać za wzorcami mowy podobnymi do ludzkich, takimi jak GPT-4o - to ogromny skok w przetwarzaniu języka naturalnego przez sztuczną inteligencję.
I nie chodzi tu tylko o wzmocniony głos i tekst. OpenAI nie wstydziło się zaprezentować swojego nadchodzącego modelu Sora do konwersji tekstu na wideo. Model AI został opracowany w celu naśladowania złożonych ruchów kamery i tworzenia szczegółowych postaci i scenerii w klipach do 60 sekund.
Jeśli ich historia multimodalności nie jest wystarczająca, weź to od CEO OpenAI . Altman potwierdził Gatesowi, że przetwarzanie wideo, wraz z rozumowaniem, jest najwyższym priorytetem dla przyszłych modeli GPT .
Moc GPT, dostosowane
A gdyby Twój chatbot AI automatycznie synchronizował się z każdą aktualizacją GPT ?
Botpress dostarcza konfigurowalne rozwiązania AI chatbot od 2017 roku, zapewniając programistom narzędzia potrzebne do łatwego tworzenia chatbotów z mocą najnowszego LLMs. Botpress chatboty można szkolić na niestandardowych źródłach wiedzy - takich jak strona internetowa lub katalog produktów - i płynnie integrować z systemami biznesowymi.
Botpress to jedyna platforma, która nie wymaga konfiguracji kodu, a jej możliwości dostosowywania i rozszerzania są nieskończone. pozwala automatycznie uzyskać moc najnowszej wersji GPT na swoim chatbocie - bez żadnego wysiłku.
Zacznij budować już dziś. To nic nie kosztuje.
Spis treści
Bądź na bieżąco z najnowszymi informacjami na temat agentów AI
Udostępnij to na: