Le modèle tant attendu GPT-5 de OpenAI est sorti - et il s'appelle OpenAI o1.
Si vous souhaitez en savoir plus sur les versions o1-preview et o1-mini, vous pouvez consulter notre aperçu du modèle o1 ici.
Qu'est-ce que GPT-5 ?
OpenAI o1 est la dernière série de modèles de grandes langues publiée par OpenAI le 12 septembre 2024, comprenant actuellement deux modèles : o1-preview et o1-mini.
La plus grande différence entre o1 et les modèles précédents de l'entreprise est son raisonnement en chaîne de pensée. Bien qu'il n'ait pas encore été publié dans son intégralité, les modèles preview et mini ont déjà fait exploser GPT-4o dans les tests de mathématiques, de sciences et de codage.
Le nouveau modèle est le premier du genre, capable de raisonner en temps réel (comme un humain).
Que signifie sa capacité de raisonnement pour les utilisateurs ? "C'est vraiment bien, c'est matériellement mieux", a déclaré un chef d'entreprise disposant d'un accès avancé.
Quelle est la date de sortie du site GPT-5 ?
OpenAILa dernière version de LLM a été mise à la disposition du public le 12 septembre 2024. Cette version comprenait les modèles o1-preview et o1-mini.
Jusqu'à la sortie, les prédictions étaient très variées, estimées par les utilisateurs et les journalistes à une date allant de l'été 2024 à 2026.
Quelle est l'intelligence de GPT-5 ?
OpenAI a présenté une liste de critères STEM qui démontrent les capacités de raisonnement de l'o1 :
- Une performance similaire à celle des doctorants dans les tests de référence en physique, chimie et biologie.
- Se classer parmi les 500 meilleurs élèves des États-Unis lors des qualifications pour les Olympiades américaines de mathématiques.
- Classement dans le 89e percentile à Codeforces, un test de codage compétitif.
Pour en savoir plus sur les capacités de raisonnement de o1, consultez le communiqué de presse de OpenAI.
Projet Fraise
OpenAI o1 portait auparavant le nom de code Strawberry, avec une forte dose de mysticisme et d'intrigue. "Le fonctionnement de Strawberry est un secret bien gardé, même au sein de OpenAI", a déclaré une source anonyme à Reuters.
La petite version de cette nouvelle IA a été lancée le 12 septembre 2024 dans le cadre d'une mise à jour de ChatGPT. La grande version est probablement utilisée par OpenAI pour générer des données d'entraînement pour son site LLMs, ce qui pourrait remplacer la nécessité de disposer de grandes quantités de données du monde réel.
Lors d'une réunion interne à l' adresse OpenAI , le 9 juillet, une démonstration de ce qui pourrait être le projet Strawberry a été présentée, affirmant qu'il présentait des capacités de raisonnement semblables à celles d'un être humain.
Quelle est la différence entre GPT-4 et GPT-5 ?
OpenAI Sam Altman, PDG de l'entreprise, estime que le monde n'a fait qu'effleurer l'IA. Lors du World Government Summit en janvier 2024, M. Altman a comparé les modèles actuels de OpenAI aux premiers jours des téléphones portables :
Il faudra du temps pour passer de la version flip phone de GPT à la version iPhone, mais le modèle o1 nous en rapproche.
1) Amélioration des capacités de raisonnement
Au centre de son intelligence générale se trouve la nouvelle capacité de raisonnement d'o1. "Les progrès les plus importants se situeront peut-être au niveau de la capacité de raisonnement", a déclaré M. Altman à M. Gates. "Pour l'instant, GPT-4 ne peut raisonner que de manière extrêmement limitée.
Le raisonnement est notoirement difficile. Même pour les humains. Et OpenAI o1 est le premier modèle à le revendiquer.
Sur Reddit et Medium, les utilisateurs ne manquent pas de publier leurs échecs sur GPT-4, qu'il s'agisse de critiques collectives de sa capacité à résoudre des problèmes ou d'explications formelles sur ses capacités de raisonnement limitées.
2) Nouvelle convention de dénomination
Bien que son nom ne soit pas l'élément le plus excitant du nouveau site OpenAI LLM , il s'agit d'un changement intentionnellement significatif.
OpenAI o1 est le premier modèle à se débarrasser de l'appellation "GPT", et ce parce que la société affirme qu'il s'agit de la première phase d'un tout nouveau " paradigme de raisonnement ", alors que les anciens modèles faisaient partie d'un " paradigme de pré-entraînement ".
Le nouveau modèle passe du temps à raisonner en temps réel, plutôt que de s'appuyer sur ses données de préformation.
3) Temps d'attente plus long
Le raisonnement en temps réel prend plus de temps que la référence aux données d'entraînement et la génération d'une réponse. Si vous posez une question à OpenAI o1-preview par rapport à d'autres modèles, vous attendrez beaucoup plus longtemps.
Cependant, avec la possibilité d'externaliser le raisonnement, c'est un petit prix à payer. La vitesse des modèles o1 s'améliorera probablement au fur et à mesure de la sortie des prochains modèles de la série.
4) Fenêtres contextuelles identiques
Bien que de nombreuses personnes aient spéculé sur une augmentation des fenêtres de contenu entre GPT-4 et le modèle suivant, la série o1 actuelle reste identique à la fenêtre de contenu de 128 000 de GPT-4o.
Les fenêtres contextuelles représentent le nombre de tokens (mots ou sous-mots) qu'un modèle peut traiter simultanément. Une fenêtre contextuelle plus large permet au modèle d'absorber plus d'informations du texte d'entrée, ce qui se traduit par une plus grande précision dans sa réponse.
L'un des défauts de GPT-4 est sa capacité relativement limitée à traiter de grandes quantités de texte. Par exemple, GPT-4 Turbo et GPT-4o ont une fenêtre contextuelle de 128 000 tokens. Mais le modèle Gemini de Google a une fenêtre contextuelle pouvant aller jusqu'à 1 million de tokens.
Pour l'instant, si votre seule préoccupation est de disposer d'un grand modèle linguistique capable d'absorber de grandes quantités d'informations, le OpenAI LLMs n'est peut-être pas votre premier choix. Si vous souhaitez savoir quel chatbot LLM est fait pour vous, consultez notre article sur les meilleurs chatbots LLM .
Quelles sont les données de formation utilisées par GPT-5 ?
S'il y a eu un bilan pour OpenAI dans son ascension vers le sommet de l'industrie, c'est la série de procès concernant la formation complète des mannequins.
GPT sont formés à partir d'énormes ensembles de données provenant de l'internet, dont une grande partie est protégée par des droits d'auteur. Cette utilisation non autorisée des données a donné lieu à de nombreuses plaintes et actions en justice : un procès intenté par le New York Times, un procès intenté par une série d'agences de presse américaines et des allégations selon lesquelles le processus d'entraînement du modèle viole le règlement général sur la protection des données de l'Union européenne.
Un juge californien a déjà rejeté l'une des actions en justice concernant les droits d'auteur ( OpenAI ) intentées par un groupe d'écrivains, dont les célébrités Sarah Silverman et Ta-Nehisi Coates. Rien n'indique pour l'instant que ces plaintes freineront considérablement OpenAI et sa société dans la poursuite des tests.
Le dernier modèle a été entraîné sur une combinaison de données accessibles au public et de données achetées à des entreprises. OpenAI a sollicité une plus grande variété d'ensembles de données afin d'améliorer l'entraînement du modèle.
Il est également probable que o1 ait été utilisé pour créer des ensembles de données afin d'entraîner davantage le modèle. OpenAI a expliqué que Strawberry serait utilisé pour entraîner les futurs LLMs.
Combien coûte GPT-5 ?
Le nouveau modèle OpenAI o1 peut être utilisé gratuitement sur ChatGPT, mais avec des limites strictes pour le moment.
Pour l'utilisation de l'API, le modèle OpenAI o1-preview coûte 15 dollars pour 1 million de jetons d'entrée et 60 dollars pour 1 million de jetons de sortie.
Le modèle o1-mini coûte 3 dollars pour 1 million de jetons d'entrée et 12 dollars pour 1 million de jetons de sortie, ce qui en fait un modèle beaucoup plus accessible pour une utilisation quotidienne.
Toutefois, ces modèles sont plus coûteux que les options précédentes de OpenAI. Le prix du modèle GPT-4o est de 5 $ pour 1 million de jetons d'entrée et de 15 $ pour 1 million de jetons de sortie. Le modèle GPT-4o mini coûte 0,150 $ pour 1 million de jetons d'entrée et 0,6 $ pour 1 million de jetons de sortie.
Aperçu de la préversion OpenAI
À l'approche du lancement de l'o1 (précédemment connu sous les noms de Strawberry et Q*), les dirigeants et les initiés de OpenAI ont donné de plus en plus d'informations sur le modèle de nouvelle génération. Voici un aperçu de ce que l'entreprise a déclaré avant sa sortie :
- OpenAI Le PDG japonais a annoncé une date de sortie en 2024, ainsi que des partenariats entre le nouveau produit et Apple, Spotify et Coca-Cola.
- Le PDG Sam Altman a déclaré que le prochain modèle serait capable de traiter les courriels et les détails du calendrier, et qu'il serait plus personnalisable.
- Mira Murati, directrice technique, a expliqué lors d'un entretien avec Dartmouth Engineering que GPT-3 avait l'intelligence d'un enfant en bas âge, que GPT-4 était plus proche d'un lycéen intelligent et que OpenAI o1 avait une intelligence de niveau doctoral (dans certaines tâches).
- Mustafa Suleyman, directeur général de Microsoft AI, a déclaré qu'il faudra attendre GPT-6, dans deux ans, pour que les modèles soient capables de "prendre des mesures" dans des environnements nouveaux.
- La prudence est de mise : Le PDG Sam Altman est resté prudent quant à la date de sortie du modèle o1, expliquant que OpenAI avait "beaucoup d'autres choses importantes à sortir en premier". Il a déclaré que l'entreprise ne sortirait le modèle que lorsqu'elle aurait la certitude de pouvoir le faire en toute sécurité et de manière responsable.
- Dans son interview à Stanford, Altman a plaisanté en disant que GPT-5 fera paraître GPT-4 "légèrement embarrassant" en comparaison.
- L'Institut américain de sécurité de l'IA a reçu un accès anticipé au prochain modèle de OpenAI, afin que les deux organisations puissent "faire avancer la science des évaluations de l'IA".
- Il disposera d'un ensemble de données étendu. GPT Le modèle -5 a été entraîné sur une combinaison de données accessibles au public et de données achetées à des entreprises. OpenAI a sollicité une plus grande variété d'ensembles de données afin d'améliorer l'entraînement du modèle.
L'avenir de la ChatGPT
La prochaine génération de grands modèles de langage révolutionnera la façon dont nous interagissons avec l'IA dans notre vie quotidienne. Lors de la conférence Tech de Bloomberg,Brad Lightcap, directeur de l'exploitation de OpenAI , a expliqué comment l'entreprise entendait révolutionner l'interaction entre l'homme et l'ordinateur, en faisant passer GPT du statut de LLM à celui de modèle doté de capacités similaires à celles d'un agent.
"En 2026, y aura-t-il encore un ingénieur rapide ? dit Lightcap. "On ne fait pas de l'ingénierie rapide avec son ami".
Un modèle plus performant et personnalisé, avec davantage de capacités multimodales, promet exactement ce qu'Altman et OpenAI attendent : l'inimaginable. Le site anticipé GPT-5 sera un peu plus proche.
Personnalisation accrue
GPT-4 est souvent utilisé comme un outil universel. Mais les futures itérations deviendront plus personnalisées. Sur le podcast de M. Gates, M. Altman a répété que l'adaptabilité et la personnalisation seront des éléments clés des futurs modèles OpenAI . "Les gens attendent des choses très différentes de -4 : des styles différents, des ensembles d'hypothèses différents. "Les gens attendent des choses très différentes de GPT-4 : des styles différents, des ensembles d'hypothèses différents.
OpenAI a déjà lancé Custom GPTs, qui permet aux utilisateurs de personnaliser un site GPT en fonction d'une tâche spécifique, qu'il s'agisse d'enseigner un jeu de société ou d'aider les enfants à faire leurs devoirs. Bien que la personnalisation n'ait pas été au premier plan sur OpenAI o1, elle devrait devenir une tendance majeure à l'avenir.
En attendant, vous pouvez personnaliser gratuitement un chatbot d'IA doté de la puissance de GPT-4o. C'est ce que nous faisons de mieux. Commencez ici.
Plus de multimodalité
La multimodalité a été au cœur des dernières itérations de GPT. OpenAI ne montre aucun signe de ralentissement.
OpenAI a introduit GPT-4o en mai 2024, apportant avec lui des compétences accrues en matière de texte, de voix et de vision. À quelques encablures de GPT-4 Turbo, il est capable d'engager des conversations naturelles, d'analyser des images, de décrire des éléments visuels et de traiter des données audio complexes.
L'évolution de la multimodalité entraîne d'énormes changements dans la manière dont nous nous engageons avec GPT. Le flux de conversation naturel - lorsque le modèle peut interpréter avec précision les changements de tonalité et suivre des schémas de parole semblables à ceux des humains, comme GPT-4o - est un pas de géant dans le traitement du langage naturel par l'IA.
Et il ne s'agit pas seulement d'une voix et d'un texte améliorés. OpenAI n'a pas hésité à dévoiler son prochain modèle de conversion de texte en vidéo, Sora. Ce modèle d'IA a été développé pour imiter les mouvements complexes de la caméra et créer des personnages et des décors détaillés dans des clips d'une durée maximale de 60 secondes.
Si l'histoire de la multimodalité n'est pas suffisante, il suffit d'écouter le PDG de OpenAI . M. Altman a confirmé à M. Gates que le traitement vidéo, ainsi que le raisonnement, constituaient une priorité absolue pour les futurs modèles de GPT .
Le pouvoir de GPT, sur mesure
Et si votre chatbot IA se synchronisait automatiquement avec chaque mise à jour de GPT ?
Botpress fournit des solutions de chatbot IA personnalisables depuis 2017, en fournissant aux développeurs les outils dont ils ont besoin pour construire facilement des chatbots avec la puissance des dernières LLMs. Botpress chatbots peuvent être formés sur des sources de connaissances personnalisées - comme votre site Web ou votre catalogue de produits - et s'intègrent de manière transparente aux systèmes d'entreprise.
La seule plateforme qui va de l'absence de code à une personnalisation et une extension infinies, Botpress vous permet d'obtenir automatiquement la puissance de la dernière version de GPT sur votre chatbot - sans aucun effort.
Commencez à construire dès aujourd'hui. C'est gratuit.
Table des matières
Restez au courant des dernières nouveautés en matière d'agents d'IA
Partager ce message sur :