- OpenAI o1 ist eine neue Modellreihe (beginnend mit o1-preview und o1-mini), die sich auf Echtzeit-Reasoning konzentriert und nicht nur auf Vortraining.
- o1 übertrifft GPT-4o bei MINT-Aufgaben, erreicht 83 % bei den IMO-Qualifikationen im Vergleich zu 13 % von GPT-4o und liegt im 89. Perzentil bei Codeforces.
- o1 nutzt von Haus aus Chain-of-Thought-Reasoning, was es zwar langsamer, aber bei komplexen Aufgaben deutlich präziser macht.
- o1 ist deutlich schwerer zu jailbreaken und erzielt 84/100 bei adversarialen Sicherheitstests, während GPT-4o nur 22 erreicht.
Nach Monaten der Spekulationen von ChatGPT-Fans ist das neueste Strawberry-LLM von OpenAI erschienen – und es heißt nicht GPT-5.
Zuvor unter kryptischen, spannenden Codenamen wie Q* und Strawberry bekannt, hat die neue Modellreihe nun offiziell den Namen OpenAI o1 erhalten.
Die wichtigste Neuerung des neuen Modells von OpenAI sind die verbesserten Reasoning-Fähigkeiten. OpenAI erklärte, dass o1 darauf trainiert wurde, mehr Zeit mit Nachdenken zu verbringen als frühere Modelle, was es der menschlichen Intelligenz näher bringt.
Was ist OpenAI o1?
OpenAI o1 ist die neueste Serie großer Sprachmodelle von OpenAI, veröffentlicht am 12. September 2024, und besteht derzeit aus zwei Modellen: o1-preview und o1-mini.
Der größte Unterschied zwischen o1 und den bisherigen Modellen des Unternehmens ist das fortschrittliche Reasoning. Obwohl es noch nicht vollständig veröffentlicht ist, übertreffen die Preview- und Mini-Modelle GPT-4o bereits deutlich bei Tests in Mathematik, Naturwissenschaften und Programmierung.
OpenAI o1 Modelle
Im September wurden zwei Modelle veröffentlicht: o1-preview und o1-mini. Sie sind die ersten einer Reihe von Modellen, die OpenAI weiterentwickeln und veröffentlichen wird.
Es ist für Aufgaben konzipiert, die fortgeschrittenes Reasoning erfordern, aber kein breites Wissen – ideal für Programmier- oder Mathematikaufgaben.
Wie intelligent ist OpenAI o1?
OpenAI hebt eine Reihe von MINT-Benchmarks hervor, die die Reasoning-Fähigkeiten von o1 zeigen, darunter:
- Eine vergleichbare Leistung wie Doktoranden bei Benchmark-Tests in Physik, Chemie und Biologie.
- Platzierung unter den Top 500 Teilnehmern der US-Qualifikation für die USA Math Olympiad.
- Ein Ergebnis im 89. Perzentil bei Codeforces, einem Wettbewerb für Programmieraufgaben.
Mehr zu den Reasoning-Fähigkeiten von o1 finden Sie in OpenAIs Forschungsbericht.
Was ist Chain-of-Thought-Reasoning?
Die o1-Modelle nutzen Chain-of-Thought-Reasoning, eine ausführlichere und gründlichere Methode, um Anfragen zu analysieren.
Wenn das o1-Modell eine Eingabe erhält, antwortet es nicht sofort – daher die längere Wartezeit. Stattdessen durchläuft es jeden Schritt, prüft sorgfältig alle Informationen und deren Auswirkungen, bevor es die nächste Aktion auswählt. Es gibt erst eine Antwort, wenn alle erforderlichen Schritte durchdacht wurden.
Worin unterscheidet sich o1 von GPT-4o?
1) Reasoning-Fähigkeiten
Im Zentrum seiner allgemeinen Intelligenz steht o1s neue Fähigkeit zum Reasoning. „Vielleicht werden die wichtigsten Fortschritte im Bereich Reasoning liegen“, sagte Altman zu Gates. „Derzeit kann GPT-4 nur in sehr begrenztem Umfang logisch denken.“
Reasoning ist berüchtigt schwierig – selbst für Menschen. OpenAI o1 ist das erste Modell, das diesen Anspruch erhebt.
Die o1-Modelle können in Echtzeit schlussfolgern, anstatt sich nur auf Vortrainingsdaten zu stützen. Deshalb ist das neue Modell bei Aufgaben in Wissenschaft, Mathematik und Programmierung besser als frühere OpenAI-Modelle.
2) Schwerer zu jailbreaken
Mit zunehmender Beliebtheit und Leistungsfähigkeit von LLMs rücken Sicherheitsaspekte in den Fokus. OpenAI hat bei der Entwicklung der o1-Serie eng mit den US- und UK AI Safety Institutes sowie der US-Regierung zusammengearbeitet, um Sorgfaltspflichten zu erfüllen.
Ein großer Fortschritt: Die o1-Serie ist deutlich schwerer zu jailbreaken – also Sicherheitsmaßnahmen zu umgehen – als frühere Modelle.
Bei einem der schwierigsten Jailbreak-Tests erzielte das o1-preview-Modell 84 von 100 Punkten, während GPT-4o nur 22 erreichte.
3) Neue Namensgebung
Auch wenn der Name nicht das Spannendste am neuen OpenAI-LLM ist, ist er eine bewusste und bedeutungsvolle Änderung.
OpenAI o1 ist das erste Modell, das den 'GPT'-Namen ablegt – laut Unternehmen, weil es die erste Phase eines völlig neuen 'Reasoning-Paradigmas' einläutet, während die älteren Modelle Teil eines 'Pre-Training-Paradigmas' waren.
Das neue Modell investiert Zeit in Echtzeit-Reasoning, statt sich auf Vortrainingsdaten zu verlassen.
4) Besser bei MINT-Problemlösungen
Besseres Reasoning führt zu besseren Mathematikfähigkeiten.
Sowohl o1 als auch GPT-4o mussten eine Qualifikationsprüfung für die Internationale Mathematik-Olympiade absolvieren. GPT-4o löste 13 % der Aufgaben, o1 hingegen 83 %.
5) Längere Wartezeit
Echtzeit-Reasoning dauert länger als das Abrufen von Trainingsdaten und das Generieren einer Antwort. Wer eine Frage an OpenAI o1-preview stellt, muss im Vergleich zu anderen Modellen deutlich länger warten.
Mit der Möglichkeit, Reasoning auszulagern, ist das jedoch ein kleiner Preis. Die Geschwindigkeit der o1-Modelle wird sich voraussichtlich mit den nächsten Veröffentlichungen weiter verbessern.
Wer kann o1 nutzen?
Seit dem 12. September können ChatGPT Plus- und Team-Nutzer auf o1-Modelle in ChatGPT zugreifen.
OpenAI hat angekündigt, o1-mini auch für kostenlose Nutzer bereitzustellen, ein genaues Datum steht aber noch nicht fest.
Die aktuellen Wochenlimits liegen bei 30 Nachrichten für o1-preview und 50 für o1-mini, sollen aber bald erhöht werden.
Wofür sollte ich o1 verwenden?
Die verbesserten Reasoning-Fähigkeiten von o1 sind besonders nützlich für komplexe Aufgaben in Mathematik, Naturwissenschaften und Programmierung. Wie OpenAI erklärt:
Einschränkungen von OpenAI o1
Als Preview-Version bietet dieses Modell noch nicht alle Funktionen von GPT-4o. Wer ein LLM zum Recherchieren im Web oder zum Hochladen von Dateien oder Bildern benötigt, sollte vorerst bei GPT-4o bleiben, bis spätere o1-Modelle erscheinen.
Wie promptet man OpenAI o1?
OpenAIs Vorschläge für Prompts haben sich für o1 im Vergleich zu früheren Modellen geändert – wegen der verbesserten Reasoning-Fähigkeiten.
Halten Sie Ihre Prompts einfach. Das Modell ist intelligent und benötigt weniger Anleitung als die GPT-4-Serie. Das heißt: Verzichten Sie auf Chain-of-Thought-Eingaben – das Modell denkt bereits intern nach.
Erstellen Sie KI-Agenten mit GPT-Technologie
Was wäre, wenn Ihr KI-Agent automatisch mit jedem OpenAI-Update synchronisiert würde?
Botpress ist eine vollständig offene und erweiterbare Plattform für KI-Agenten. Unsere Plattform ermöglicht es Entwicklern, Chatbots und KI-Agenten mit beliebigen Funktionen für jeden Workflow zu erstellen.
Als einzige Plattform, die von Low-Code-Einstieg bis zu grenzenloser Anpassbarkeit und Erweiterbarkeit reicht, ermöglicht Botpress, dass Ihr Chatbot automatisch die neueste GPT-Version nutzt – ganz ohne Aufwand.
Jetzt starten. Kostenlos.
FAQs
1. Wofür steht „o1“? Gibt es eine Logik für die Benennung zukünftiger Modelle (z. B. o2, o3)?
Der Name „o1“ steht vermutlich für „OpenAI 1“ und markiert den Beginn einer neuen Modellfamilie. Daher ist es wahrscheinlich, dass zukünftige Versionen in dieser Serie fortlaufend wie „o2“, „o3“ usw. benannt werden.
2. Warum hat OpenAI die „GPT“-Namensgebung aufgegeben?
OpenAI hat die Namensgebung von „GPT“ auf „o1“ umgestellt, um einen Fokuswechsel zu verdeutlichen – von allgemein vortrainierten Sprachmodellen hin zu Modellen, die für Echtzeit-Reasoning und Interaktivität optimiert sind.
3. Ist OpenAI o1 der Nachfolger von GPT-4 oder eine völlig neue Produktlinie?
OpenAI o1 ist kein direkter Nachfolger von GPT-4, sondern der Beginn einer neuen Produktlinie, die auf Echtzeit-Reasoning und Effizienz ausgelegt ist – aufbauend auf den Fortschritten von GPT-4 und GPT-4o.
4. Kann o1 mehrsprachige Eingaben besser verarbeiten als GPT-4?
OpenAI hat nicht offiziell erklärt, wie o1 im Vergleich zu GPT-4 bei mehrsprachigen Aufgaben abschneidet. Da o1 jedoch für Reasoning und neue Fähigkeiten optimiert ist, könnten zukünftige Versionen mehrsprachige Eingaben noch besser bewältigen.
5. Wann wird o1 allgemein für Nutzer des kostenlosen Tarifs verfügbar sein?
OpenAI hat bestätigt, dass eine Version namens „o1-mini“ für Nutzer des kostenlosen Tarifs veröffentlicht wird. Bislang wurde jedoch kein offizielles Datum für die allgemeine Verfügbarkeit bekannt gegeben.





.webp)
