Po miesiącach spekulacji, OpenAIwydało najnowszą wersję Strawberry LLM - i nie nazywa się ona GPT-5.
Wcześniej określana tajemniczymi, intrygującymi nazwami kodowymi, takimi jak Q* i Strawberry, najnowsza seria modeli ostatecznie przyjęła nazwę OpenAI o1.
Największą aktualizacją nowego modelu OpenAI są jego ulepszone umiejętności rozumowania. OpenAI wyjaśnił, że o1 został przeszkolony, aby spędzać więcej czasu na myśleniu niż poprzednie modele, co zbliża go do ludzkiej inteligencji.
Co to jest OpenAI o1?
OpenAI o1 to najnowsza seria dużych modeli językowych wydana przez OpenAI 12 września 2024 r., obejmująca obecnie dwa modele: o1-preview i o1-mini.
Największą różnicą między o1 a poprzednimi modelami firmy jest zaawansowane rozumowanie. Chociaż nie został on jeszcze w pełni wydany, modele preview i mini już zdmuchnęły GPT-4o z wody w testach matematycznych, naukowych i kodowania.
OpenAI modele o1
Wrześniowa premiera obejmowała dwa modele, o1-preview i o1-mini. Są to pierwsze z serii modeli, które będą nadal wydawane w miarę udoskonalania przez OpenAI nowego LLM.
Różnica? Model o1-mini jest mniejszy i o 80% tańszy od modelu preview. Jest przeznaczony do zadań wymagających zaawansowanego rozumowania, ale nie szerszej wiedzy. Doskonale nadaje się do zadań związanych z kodowaniem lub matematyką.
Jak inteligentna jest strona OpenAI o1?
OpenAI przedstawiła listę testów STEM, które pokazują zdolności rozumowania o1, w tym:
- Podobne wyniki do doktorantów w testach porównawczych z fizyki, chemii i biologii.
- Miejsce w pierwszej 500 uczniów w kwalifikacjach do Olimpiady Matematycznej USA.
- Ranking w 89. percentylu w Codeforces, konkurencyjnym teście kodowania.
Więcej informacji na temat zdolności rozumowania o1 można znaleźć w komunikacie badawczym OpenAI.
Czym jest rozumowanie łańcuchowe?
Modele o1 wykorzystują rozumowanie łańcuchowe, dłuższy i bardziej szczegółowy sposób rozkładania żądań.
Jeśli model o1 otrzyma podpowiedź, nie odpowie natychmiast - stąd długi czas oczekiwania. Zamiast tego przeanalizuje każdy z kroków, dokładnie rozważając każdą informację i jej implikacje przed podjęciem decyzji o dalszym sposobie działania. Nie udzieli odpowiedzi, dopóki nie przemyśli całej serii kroków wymaganych w pytaniu.
Czym różni się o1 od GPT-4o?
1) Zdolności rozumowania
W centrum jego ogólnej inteligencji znajduje się nowa zdolność o1 do rozumowania. "Być może najważniejsze obszary postępu będą dotyczyć zdolności rozumowania", Altman podzielił się z Gatesem. "W tej chwili GPT-4 może rozumować tylko w bardzo ograniczony sposób".
Rozumowanie jest notorycznie trudne. Nawet dla ludzi. A OpenAI o1 jest pierwszym modelem, który to twierdzi.
Modele o1 są w stanie rozumować w czasie rzeczywistym, zamiast polegać na danych przedtreningowych. Dlatego nowy model jest lepszy w zadaniach z zakresu nauk ścisłych, matematyki i kodowania niż poprzednie modele OpenAI .
2) Trudniejsze do jailbreakowania
W związku z rosnącymi obawami o bezpieczeństwo w miarę wzrostu popularności i mocy LLMs , bezpieczeństwo było kluczowym elementem najnowszego projektu OpenAI. Firma współpracowała z amerykańskimi i brytyjskimi instytutami bezpieczeństwa AI podczas opracowywania serii o1, a także współpracowała z rządem amerykańskim w celu ustalenia ich należytej staranności.
Dużym krokiem naprzód jest to, że seria o1 jest znacznie trudniejsza do jailbreaku - ominięcia zabezpieczeń - niż poprzednie modele.
W jednym z najtrudniejszych testów jailbreakingu, model o1-preview uzyskał 84 na 100 punktów, w porównaniu do ponurego wyniku 22 na GPT-4o.
3) Nowa konwencja nazewnictwa
Chociaż jego nazwa nie jest najbardziej ekscytującą rzeczą w nowym OpenAI LLM , jest to celowo znacząca zmiana.
OpenAI o1 jest pierwszym modelem, który porzucił przydomek "GPT", a to dlatego, że firma twierdzi, że jest to pierwsza faza zupełnie nowego "paradygmatu rozumowania", podczas gdy starsze modele były częścią "paradygmatu przedtreningowego".
Nowy model spędza czas na rozumowaniu w czasie rzeczywistym, zamiast polegać na danych przedtreningowych.
4) Lepiej radzą sobie z rozwiązywaniem problemów STEM
Lepsze rozumowanie oznacza lepsze umiejętności matematyczne.
Zarówno o1, jak i GPT-4o zostały poproszone o zdanie egzaminu kwalifikującego do Międzynarodowej Olimpiady Matematycznej. GPT-4o rozwiązał 13% zadań, podczas gdy o1 83%.
5) Dłuższy czas oczekiwania
Rozumowanie w czasie rzeczywistym trwa dłużej niż odwoływanie się do danych treningowych i generowanie odpowiedzi. Jeśli zadasz pytanie na OpenAI o1-preview w porównaniu do innych modeli, będziesz czekać znacznie dłużej.
Jednak dzięki możliwości outsourcingu rozumowania jest to niewielka cena do zapłacenia. Szybkość modeli o1 prawdopodobnie poprawi się wraz z wydaniem kolejnych modeli z tej serii.
Kto może korzystać z o1?
Od 12 września użytkownicy ChatGPT Plus i Team mają dostęp do modeli o1 w ChatGPT.
OpenAI ogłosiła, że udostępni o1-mini darmowym użytkownikom, choć nie podano żadnej daty.
Obecne tygodniowe limity stawek wynoszą 30 wiadomości dla 01-preview i 50 dla o1-mini, choć wkrótce zostaną one zwiększone.
Do czego powinienem używać o1?
Rozszerzone możliwości rozumowania o1 są szczególnie przydatne do rozwiązywania złożonych problemów w matematyce, naukach ścisłych i kodowaniu. Jakwyjaśnia OpenAI :
Ograniczenia OpenAI o1
Jako wersja zapoznawcza, model ten nie ma jeszcze wszystkich możliwości GPT-4o. Jeśli chcesz używać LLM do przeglądania Internetu w poszukiwaniu informacji lub chcesz przesyłać pliki lub obrazy, musisz pozostać przy GPT-4o do czasu wydania nowszych modeli o1.
Jak wyświetlić monit OpenAI o1
OpenAISugestie podpowiedzi o1 zmieniły się w porównaniu z poprzednimi modelami, ze względu na ulepszone rozumowanie.
Podpowiedzi powinny być proste. Jest to inteligentny model i nie potrzebuje tylu wskazówek, co seria GPT-4. Oznacza to, że należy unikać wprowadzania łańcucha myśli - model już wewnętrznie rozumuje.
Tworzenie agentów AI z obsługą GPT
A gdyby agent AI automatycznie synchronizował się z każdą aktualizacją OpenAI ?
Botpress to całkowicie otwarta i rozszerzalna platforma agentów AI. Nasza strona stack umożliwia programistom tworzenie chatbotów i agentów AI z dowolnymi możliwościami, w dowolnym przepływie pracy.
Botpress to jedyna platforma, która oferuje zarówno niski poziom konfiguracji kodu, jak i nieskończone możliwości dostosowywania i rozszerzania, co pozwala automatycznie uzyskać moc najnowszej wersji GPT na swoim chatbocie - bez żadnego wysiłku.
Zacznijbudować już dziś. To nic nie kosztuje.
Spis treści
Bądź na bieżąco z najnowszymi informacjami na temat agentów AI
Udostępnij to na: