- OpenAI o1 est une nouvelle série de modèles (débutant avec o1-preview et o1-mini) axée sur le raisonnement en temps réel, et pas seulement sur l’entraînement préalable.
- o1 surpasse GPT-4o dans les tâches STEM, avec un score de 83 % aux qualifications de l’IMO contre 13 % pour GPT-4o, et se classe dans le 89e percentile sur Codeforces.
- o1 utilise nativement le raisonnement par chaîne de pensée, ce qui le rend plus lent mais nettement plus précis sur les tâches complexes.
- o1 est bien plus difficile à contourner, avec un score de 84/100 aux tests de sécurité adverses, contre 22 pour GPT-4o.
Après des mois de spéculations parmi les fans de ChatGPT, la dernière version LLM Strawberry d’OpenAI est sortie – et elle ne s’appelle pas GPT-5.
Auparavant désigné par des noms de code mystérieux comme Q* et Strawberry, la nouvelle série de modèles porte désormais officiellement le nom OpenAI o1.
La principale nouveauté du nouveau modèle d’OpenAI réside dans ses capacités de raisonnement améliorées. OpenAI explique que o1 a été entraîné à réfléchir plus longtemps que les modèles précédents, ce qui le rapproche de l’intelligence humaine.
Qu'est-ce qu'OpenAI o1 ?
OpenAI o1 est la dernière série de grands modèles de langage lancée par OpenAI le 12 septembre 2024, comprenant actuellement deux modèles : o1-preview et o1-mini.
La grande différence entre o1 et les modèles précédents de la société, c’est son raisonnement avancé. Même si la version complète n’est pas encore disponible, les modèles preview et mini surpassent déjà largement GPT-4o dans les tests de mathématiques, de sciences et de programmation.
Les modèles OpenAI o1
La sortie de septembre a introduit deux modèles, o1-preview et o1-mini. Ce sont les premiers d’une série qui sera enrichie au fur et à mesure qu’OpenAI perfectionnera son nouveau LLM.
Quelle différence ? Le modèle o1-mini est plus petit et coûte 80 % moins cher que le modèle preview. Il est conçu pour les tâches nécessitant un raisonnement avancé, mais pas une connaissance générale étendue. Il est idéal pour la programmation ou les mathématiques.
À quel point OpenAI o1 est-il intelligent ?
OpenAI met en avant plusieurs benchmarks STEM qui illustrent les capacités de raisonnement de o1, notamment :
- Des performances similaires à celles d’étudiants en doctorat lors de tests de référence en physique, chimie et biologie.
- Une place parmi les 500 meilleurs candidats lors des qualifications américaines pour l’Olympiade de mathématiques des États-Unis.
- Un classement dans le 89e percentile sur Codeforces, un concours de programmation compétitif.
Vous pouvez en savoir plus sur les capacités de raisonnement de o1 dans la publication de recherche d’OpenAI.
Qu'est-ce que le raisonnement en chaîne de pensée ?
Les modèles o1 utilisent le raisonnement par chaîne de pensée, une méthode plus longue et approfondie pour décomposer les demandes.
Si le modèle o1 reçoit une consigne, il ne répondra pas immédiatement – d’où le temps d’attente plus long. Il va raisonner étape par étape, en examinant soigneusement chaque information et ses conséquences avant de décider de la suite. Il ne donnera une réponse qu’après avoir analysé toute la série d’étapes nécessaires à la demande.
En quoi o1 est-il différent de GPT-4o ?
1) Capacités de raisonnement
Au cœur de son intelligence générale se trouve la nouvelle capacité de raisonnement de o1. « Peut-être que les progrès les plus importants concerneront la capacité de raisonnement », a expliqué Altman à Gates. « Aujourd’hui, GPT-4 ne peut raisonner que de façon très limitée. »
Le raisonnement est notoirement difficile. Même pour les humains. Et OpenAI o1 est le premier modèle à s’en réclamer.
Les modèles o1 sont capables de raisonner en temps réel, sans se limiter aux données d’entraînement. C’est pourquoi ce nouveau modèle est meilleur en sciences, mathématiques et programmation que les précédents modèles d’OpenAI.
2) Plus difficile à contourner
Avec la montée des préoccupations de sécurité à mesure que les LLM gagnent en popularité et en puissance, la sécurité a été une priorité dans le développement de la série o1. L’entreprise a collaboré avec les instituts de sécurité en IA des États-Unis et du Royaume-Uni, ainsi qu’avec le gouvernement américain pour garantir leur conformité.
La série o1 est ainsi bien plus difficile à contourner – c’est-à-dire à passer outre les mesures de sécurité – que les modèles précédents.
Lors d’un de leurs tests de contournement les plus difficiles, le modèle o1-preview a obtenu 84 sur 100, contre seulement 22 pour GPT-4o.
3) Nouvelle convention de nommage
Même si le nom n’est pas l’aspect le plus marquant du nouveau LLM d’OpenAI, il s’agit d’un changement volontaire et significatif.
OpenAI o1 est le premier modèle à abandonner le nom « GPT », car la société affirme qu’il s’agit de la première étape d’un tout nouveau « paradigme du raisonnement », alors que les anciens modèles relevaient du « paradigme de l’entraînement préalable ».
Le nouveau modèle prend le temps de raisonner en temps réel, au lieu de s’appuyer uniquement sur ses données d’entraînement.
4) Meilleure résolution de problèmes STEM
Un meilleur raisonnement implique de meilleures compétences en mathématiques.
o1 et GPT-4o ont tous deux passé un examen qualificatif pour l’Olympiade internationale de mathématiques. GPT-4o a résolu 13 % des problèmes, contre 83 % pour o1.
5) Temps d’attente plus long
Raisonner en temps réel prend plus de temps que de simplement consulter les données d’entraînement et générer une réponse. Si vous posez une question à OpenAI o1-preview par rapport à d’autres modèles, l’attente sera nettement plus longue.
Cependant, la possibilité de déléguer le raisonnement compense largement ce délai. La vitesse des modèles o1 devrait s’améliorer avec les prochaines versions de la série.
Qui peut utiliser o1 ?
Depuis le 12 septembre, les utilisateurs de ChatGPT Plus et Team peuvent accéder aux modèles o1 dans ChatGPT.
OpenAI a annoncé que o1-mini sera proposé aux utilisateurs gratuits, mais aucune date n’a encore été communiquée.
Les limites hebdomadaires actuelles sont de 30 messages pour o1-preview et 50 pour o1-mini, mais elles seront bientôt augmentées.
Pour quoi utiliser o1 ?
Les capacités de raisonnement avancées de o1 sont particulièrement utiles pour résoudre des problèmes complexes en mathématiques, sciences et programmation. Comme l’explique OpenAI :
Limites d’OpenAI o1
En tant que version preview, ce modèle ne dispose pas encore de toutes les fonctionnalités de GPT-4o. Si vous souhaitez utiliser un LLM pour naviguer sur le web ou pour télécharger des fichiers ou des images, il faudra rester sur GPT-4o jusqu’à la sortie de versions ultérieures de o1.
Comment formuler une requête à OpenAI o1
Les recommandations de formulation d’OpenAI ont évolué pour o1 par rapport aux modèles précédents, en raison de ses capacités de raisonnement.
Gardez vos requêtes simples. C’est un modèle intelligent qui n’a pas besoin d’autant d’indications que la série GPT-4. Il est donc inutile d’ajouter un raisonnement en chaîne dans votre prompt – le modèle raisonne déjà de lui-même.
Créez des agents IA alimentés par GPT
Et si votre agent IA se synchronisait automatiquement à chaque mise à jour d’OpenAI ?
Botpress est une plateforme d’agents IA totalement ouverte et extensible. Notre stack permet aux développeurs de créer des chatbots et agents IA avec toutes les fonctionnalités, pour n’importe quel workflow.
Seule plateforme allant de la configuration low-code à une personnalisation et une extensibilité sans limites, Botpress vous permet de bénéficier automatiquement de la dernière version de GPT sur votre chatbot – sans effort requis.
Commencez à créer dès aujourd’hui. C’est gratuit.
FAQ
1. Que signifie « o1 » ? Y a-t-il une logique de nommage pour les futurs modèles (par exemple, o2, o3) ?
Le nom « o1 » signifie probablement « OpenAI 1 », marquant le début d’une nouvelle famille de modèles. On peut donc s’attendre à une suite logique comme « o2 », « o3 », etc., pour les prochaines versions de cette série.
2. Pourquoi OpenAI a-t-il abandonné la convention de nommage « GPT » ?
OpenAI a délaissé la convention « GPT » au profit de « o1 » pour marquer un changement de cap – passant de modèles de langage général pré-entraînés à des modèles optimisés pour le raisonnement en temps réel et l’interactivité.
3. OpenAI o1 est-il le successeur de GPT-4 ou une toute nouvelle gamme de produits ?
OpenAI o1 n’est pas un successeur direct de GPT-4, mais le début d’une nouvelle gamme de produits axée sur le raisonnement en temps réel et l’efficacité, tout en s’appuyant sur les avancées de GPT-4 et GPT-4o.
4. o1 gère-t-il mieux les entrées multilingues que GPT-4 ?
OpenAI n’a pas officiellement précisé comment o1 se compare à GPT-4 pour le multilingue, mais comme o1 est optimisé pour le raisonnement et de nouvelles capacités, il est possible que les prochaines versions gèrent encore mieux les entrées multilingues.
5. Quand o1 sera-t-il accessible à tous les utilisateurs du forfait gratuit ?
OpenAI a confirmé qu'une version appelée « o1-mini » sera proposée aux utilisateurs du forfait gratuit, mais pour l'instant, aucune date officielle de disponibilité générale n'a été annoncée.





.webp)
