Das lang erwartete Modell GPT-5 von OpenAI wurde veröffentlicht - und es heißt OpenAI o1.
Wenn Sie mehr über die Versionen o1-preview und o1-mini erfahren möchten, können Sie sich hier einen Überblick über das Modell o1 verschaffen.
Was ist GPT-5?
OpenAI o1 ist die neueste Serie von Großsprachenmodellen, die von OpenAI am 12. September 2024 veröffentlicht wurde und derzeit zwei Modelle umfasst: o1-preview und o1-mini.
Der größte Unterschied zwischen o1 und den Vorgängermodellen des Unternehmens ist die Gedankenkette. Es ist zwar noch nicht vollständig veröffentlicht, aber die Vorschau- und Mini-Modelle übertreffen bereits GPT-4o bei Tests in Mathematik, Wissenschaft und Codierung.
Das neue Modell ist das erste seiner Art, das in der Lage ist, in Echtzeit zu denken (genau wie ein Mensch).
Was bedeutet die Argumentationsfähigkeit für die Nutzer? "Es ist wirklich gut, wesentlich besser", sagte ein CEO mit fortgeschrittenem Zugang.
Wann ist der GPT-5 Veröffentlichungstermin?
OpenAIDie neueste Version von LLM wurde am 12. September 2024 der Öffentlichkeit zugänglich gemacht. Die Veröffentlichung umfasste die Modelle o1-preview und o1-mini.
Bis zur Veröffentlichung gingen die Vorhersagen weit auseinander und wurden von Nutzern und Journalisten gleichermaßen auf den Sommer 2024 bis zum Jahr 2026 geschätzt.
Wie intelligent ist GPT-5?
OpenAI hat eine Liste von MINT-Benchmarks vorgestellt, die die Denkfähigkeiten von o1 unter Beweis stellen, darunter:
- Ähnliche Leistungen wie Doktoranden bei Vergleichstests in Physik, Chemie und Biologie.
- Platzierung unter den besten 500 Schülern bei der US-Qualifikation für die Mathematik-Olympiade in den USA.
- Platz im 89. Perzentil bei Codeforces, einem wettbewerbsfähigen Codierungstest.
Mehr über die Denkfähigkeiten von o1 können Sie in der Forschungsmitteilung von OpenAI nachlesen.
Projekt Erdbeere
OpenAI o1 trug früher den Codenamen Strawberry, mit einem starken Hauch von Mystik und Intrigen. "Wie Strawberry funktioniert, ist selbst innerhalb von OpenAI ein streng gehütetes Geheimnis", sagte eine anonyme Quelle gegenüber Reuters.
Die kleinere Version dieser neuen KI wurde am 12. September 2024 im Rahmen einer Aktualisierung von ChatGPT eingeführt. Die größere Version wird wahrscheinlich von OpenAI verwendet, um Trainingsdaten für LLMs zu generieren, was den Bedarf an großen Mengen realer Daten ersetzen könnte.
Bei einem internen Treffen aller Mitarbeiter von OpenAI am 9. Juli wurde eine Demonstration dessen gezeigt, was Projekt Strawberry sein könnte, und es wurde behauptet, dass es menschenähnliche Denkfähigkeiten besitzt.
Was ist der Unterschied zwischen GPT-4 und GPT-5?
OpenAI CEO Sam Altman glaubt, dass die Welt erst an der Oberfläche der KI gekratzt hat. Auf dem World Government Summit im Januar 2024 verglich Altman die aktuellen Modelle von OpenAI mit den Anfängen der Mobiltelefone:
Es wird zwar einige Zeit dauern, bis wir von der Klapphandy-Version von GPT zur iPhone-Version kommen, aber das o1-Modell bringt uns einen Schritt weiter.
1) Verbesserte logische Fähigkeiten
Im Mittelpunkt der allgemeinen Intelligenz steht die neue Fähigkeit von o1, logisch zu denken. "Der vielleicht wichtigste Bereich des Fortschritts wird die Fähigkeit zum logischen Denken sein", sagte Altman zu Gates. "Im Moment kann GPT-4 nur in sehr begrenztem Maße logisch denken."
Das Denken ist bekanntermaßen schwierig. Selbst für Menschen. Und OpenAI o1 ist das erste Modell, das dies behauptet.
Es gibt keinen Mangel an Nutzern, die ihre GPT-4 Fehlschläge auf Reddit und Medium posten, von Gruppenverunglimpfungen seiner Problemlösung bis hin zu formalen Erklärungen seiner begrenzten Argumentationsfähigkeiten.
2) Neue Benennungskonvention
Der Name ist zwar nicht das Aufregendste an der neuen OpenAI LLM , aber es ist eine bewusst sinnvolle Veränderung.
OpenAI o1 ist das erste Modell, das den Namen "GPT" ablegt, und das liegt daran, dass das Unternehmen behauptet, es sei die erste Phase eines brandneuen "Argumentationsparadigmas", während die älteren Modelle Teil eines "Vor-Trainings-Paradigmas" waren.
Das neue Modell verbringt seine Zeit damit, in Echtzeit Schlussfolgerungen zu ziehen, anstatt sich auf die Daten vor dem Training zu verlassen.
3) Längere Wartezeit
Das Reasoning in Echtzeit dauert länger als das Abrufen von Trainingsdaten und das Generieren einer Antwort. Wenn Sie eine Frage an OpenAI o1-preview stellen, werden Sie im Vergleich zu anderen Modellen deutlich länger warten müssen.
Mit der Möglichkeit, die Argumentation auszulagern, ist dies jedoch ein geringer Preis. Die Geschwindigkeit der o1-Modelle wird sich wahrscheinlich mit der Veröffentlichung der nächsten Modelle der Serie verbessern.
4) Identische Kontextfenster
Während viele über eine Vergrößerung des Inhaltsfensters von GPT-4 zum nächsten Modell spekulierten, bleibt das Inhaltsfenster der aktuellen o1-Serie identisch mit dem von GPT-4o mit 128.000.
Kontextfenster geben an, wie viele Token (Wörter oder Teilwörter) ein Modell auf einmal verarbeiten kann. Ein größeres Kontextfenster ermöglicht es dem Modell, mehr Informationen aus dem Eingabetext aufzunehmen, was zu einer höheren Genauigkeit seiner Antwort führt.
Einer der Schwachpunkte von GPT-4 war die vergleichsweise begrenzte Fähigkeit, große Textmengen zu verarbeiten. So haben beispielsweise GPT-4 Turbo und GPT-4o ein Kontextfenster von 128.000 Token. Das Gemini-Modell von Google hingegen hat ein Kontextfenster von bis zu 1 Million Token.
Wenn es Ihnen nur um ein großes Sprachmodell geht, das große Mengen an Informationen aufnehmen kann, ist OpenAI LLMs vielleicht nicht Ihre erste Wahl. Wenn Sie wissen möchten, welcher LLM Chatbot der richtige für Sie ist, lesen Sie unseren Beitrag über die besten LLM Chatbots.
Welche Trainingsdaten werden von GPT-5 verwendet?
Wenn es eine Abrechnung für OpenAI auf seinem Weg an die Spitze der Branche gegeben hat, dann ist es die Serie von Rechtsstreitigkeiten über die vollständige Ausbildung der Models.
GPT Modelle werden auf riesigen Datensätzen aus dem Internet trainiert, von denen viele urheberrechtlich geschützt sind. Diese unerlaubte Nutzung von Daten hat zu zahlreichen Beschwerden und rechtlichen Schritten geführt: eine Klage der New York Times, eine Klage einer Reihe von US-Nachrichtenagenturen und Behauptungen, dass der Trainingsprozess des Modells gegen die Allgemeine Datenschutzverordnung der EU verstößt.
Ein kalifornischer Richter hat bereits eine der OpenAI Urheberrechtsklagen abgewiesen, die von einer Gruppe von Schriftstellern, darunter die Prominenten Sarah Silverman und Ta-Nehisi Coates, eingereicht wurden. Es gibt bisher keine Hinweise darauf, dass OpenAI und das Unternehmen durch diese Klagen bei der weiteren Erprobung erheblich behindert werden.
Das neueste Modell wurde mit einer Kombination aus öffentlich zugänglichen Daten und von Unternehmen gekauften Daten trainiert. OpenAI bat um eine größere Anzahl von Datensätzen, um das Modell besser trainieren zu können.
Es ist auch wahrscheinlich, dass o1 dazu verwendet wurde, Datensätze zu erstellen, um das Modell weiter zu trainieren. OpenAI erklärte, dass Strawberry für das Training zukünftiger LLMs verwendet werden würde.
Wie viel kostet GPT-5?
Das neue Modell OpenAI o1 kann auf ChatGPT kostenlos genutzt werden, allerdings vorerst nur mit strengen Einschränkungen.
Für die API-Nutzung kostet das Modell OpenAI o1-preview $15 pro 1 Million Input-Token und $60 pro 1 Million Output-Token.
Das o1-mini-Modell kostet 3 $ pro 1 Million Input-Token und 12 $ pro 1 Million Output-Token und ist damit für den alltäglichen Gebrauch weitaus günstiger.
Diese Modelle sind jedoch teurer als die bisherigen Optionen von OpenAI. Das Modell GPT-4o kostet $5 pro 1 Million Input-Token und $15 pro 1 Million Output-Token. Das Modell GPT-4o mini kostet $0,150 pro 1 Million Eingabemarken und $0,6 pro 1 Million Ausgabemarken.
Einblicke in die Vorveröffentlichung von OpenAI
Im Vorfeld der Markteinführung des o1 (früher auch als Strawberry und Q* bekannt) haben Führungskräfte und Insider von OpenAI immer mehr Informationen über das Modell der nächsten Generation verraten. Hier ist ein Überblick über die Aussagen des Unternehmens vor der Veröffentlichung:
- OpenAI Der japanische CEO kündigte ein Erscheinungsdatum für 2024 sowie Partnerschaften zwischen dem neuen Produkt und Apple, Spotify und Coca-Cola an.
- CEO Sam Altman erklärte, dass das nächste Modell in der Lage sein wird, E-Mails und Kalenderdetails zu verarbeiten, und dass es besser anpassbar sein wird.
- CTO Mira Murati erklärte in einem Interview mit Dartmouth Engineering, dass GPT-3 die Intelligenz eines Kleinkindes hat, GPT-4 eher einem intelligenten High-School-Schüler entspricht und dass OpenAI o1 (bei bestimmten Aufgaben) über die Intelligenz eines Doktors verfügt.
- Der KI-CEO von Microsoft, Mustafa Suleyman, teilte mit, dass die Modelle erst in zwei Jahren mit GPT-6 in der Lage sein werden, in neuartigen Umgebungen "aktiv zu werden".
- Vorsicht ist oberstes Gebot: CEO Sam Altman äußerte sich zurückhaltend über das Veröffentlichungsdatum des o1-Modells und erklärte, dass OpenAI "eine Menge anderer wichtiger Dinge zuerst veröffentlichen muss." Er erklärte, dass das Unternehmen das Modell erst dann freigeben werde, wenn es sicher und verantwortungsbewusst arbeiten könne.
- Altman scherzte in seinem Stanford-Interview, dass GPT-5 im Vergleich zu GPT-4 "leicht peinlich" wirken wird.
- Das US-amerikanische KI-Sicherheitsinstitut erhielt frühzeitigen Zugang zum nächsten Modell von OpenAI, damit die beiden Organisationen "die Wissenschaft der KI-Bewertungen vorantreiben" können.
- Es wird einen erweiterten Datensatz haben. GPT-5 wurde mit einer Kombination aus öffentlich zugänglichen Daten und von Unternehmen gekauften Daten trainiert. OpenAI hat sich um eine größere Vielfalt an Datensätzen bemüht, um das Modell besser trainieren zu können.
Die Zukunft der ChatGPT
Die nächste Generation von großen Sprachmodellen wird die Art und Weise, wie wir im Alltag mit KI interagieren, revolutionieren. Auf der Tech-Konferenz von Bloombergdeutete Brad Lightcap, COO von OpenAI , an, wie das Unternehmen die Interaktion zwischen Mensch und Computer revolutionieren will, indem es GPT von einem LLM zu einem Modell mit agentenähnlichen Fähigkeiten macht.
"Wird es im Jahr 2026 noch so etwas wie einen Souffleur geben?" sagte Lightcap. "Man macht seinen Freund nicht zum Souffleur."
Ein leistungsfähigeres und personalisiertes Modell mit mehr multimodalen Möglichkeiten verspricht genau das, was Altman und OpenAI erwarten: das Unvorstellbare. Die erwartete GPT-5 wird einen Schritt näher rücken.
Stärkere Personalisierung
GPT-4 wird oft als Einheitswerkzeug verwendet. Künftige Iterationen werden jedoch stärker personalisiert werden. In Gates' Podcast bekräftigte Altman, dass Anpassungsfähigkeit und Personalisierung der Schlüssel zu zukünftigen OpenAI Modellen sein werden. "Die Leute wollen sehr unterschiedliche Dinge von GPT-4: unterschiedliche Stile, unterschiedliche Annahmen."
OpenAI hat bereits die benutzerdefinierte Funktion GPTs eingeführt, die es den Nutzern ermöglicht, GPT für eine bestimmte Aufgabe zu personalisieren, z. B. ein Brettspiel zu unterrichten oder Kindern bei den Hausaufgaben zu helfen. Obwohl die Personalisierung bei OpenAI o1 nicht im Vordergrund stand, wird erwartet, dass sie in Zukunft ein wichtiger Trend sein wird.
In der Zwischenzeit können Sie einen KI-Chatbot mit der Leistung von GPT-4o kostenlos personalisieren. Das können wir am besten. Starten Sie hier.
Mehr multimodal
Multimodalität war in den letzten Versionen von GPT von zentraler Bedeutung. OpenAI zeigt keine Anzeichen einer Verlangsamung der Entwicklung.
OpenAI hat im Mai 2024 GPT-4o eingeführt, das verbesserte Text-, Sprach- und Sehfähigkeiten mit sich bringt. Im Vergleich zu GPT-4 Turbo ist er in der Lage, natürliche Unterhaltungen zu führen, Bilder zu analysieren, visuelle Darstellungen zu beschreiben und komplexe Audioinhalte zu verarbeiten.
Die Veränderungen in der Multimodalität führen zu enormen Verschiebungen in der Art und Weise, wie wir uns mit GPT beschäftigen. Ein natürlicher Gesprächsfluss - wenn das Modell Tonfalländerungen genau interpretieren und menschenähnlichen Sprachmustern folgen kann, wie z. B. GPT-4o - ist ein großer Sprung in der KI-Verarbeitung natürlicher Sprache.
Und es geht nicht nur um eine verbesserte Stimme und Text. OpenAI hat sich nicht gescheut, sein kommendes Text-to-Video-Modell Sora anzukündigen. Das KI-Modell wurde entwickelt, um komplexe Kamerabewegungen zu imitieren und detaillierte Charaktere und Landschaften in Clips von bis zu 60 Sekunden zu erstellen.
Wenn ihre Geschichte der Multimodalität noch nicht genug ist, lassen Sie sich vom CEO von OpenAI beraten. Altman bestätigte gegenüber Gates, dass die Videoverarbeitung zusammen mit der Argumentation eine der obersten Prioritäten für zukünftige GPT Modelle ist.
Die Macht von GPT, Maßgeschneidert
Was wäre, wenn sich Ihr KI-Chatbot automatisch mit jedem GPT -Update synchronisieren würde?
Botpress bietet seit 2017 anpassbare KI-Chatbot-Lösungen an und stellt Entwicklern die Tools zur Verfügung, die sie benötigen, um Chatbots mit der Leistung der neuesten LLMs zu erstellen. Botpress Chatbots können auf benutzerdefinierten Wissensquellen - wie Ihrer Website oder Ihrem Produktkatalog - trainiert werden und sich nahtlos in Geschäftssysteme integrieren.
Die einzige Plattform, die von der Einrichtung ohne Code bis zur endlosen Anpassbarkeit und Erweiterbarkeit reicht, Botpress ermöglicht es Ihnen, automatisch die Leistung der neuesten GPT Version auf Ihrem Chatbot zu erhalten - ohne jeglichen Aufwand.
Beginnen Sie noch heute mit dem Bau. Es ist kostenlos.
Inhaltsübersicht
Bleiben Sie auf dem Laufenden mit den neuesten Informationen über KI-Agenten
Teilen Sie dies auf: