Après des mois de spéculation, la dernière version de OpenAI's Strawberry LLM est sortie - et elle ne s'appelle pas GPT-5.
Précédemment désignée par des noms de code cryptiques et intrigants tels que Q* et Strawberry, la dernière série de modèles a finalement été baptisée OpenAI o1.
La principale nouveauté du nouveau modèle OpenAI est l'amélioration de ses capacités de raisonnement. OpenAI a expliqué qu'o1 a été entraîné à passer plus de temps à réfléchir que les modèles précédents, ce qui le rapproche de l'intelligence humaine.
Qu'est-ce que OpenAI o1 ?
OpenAI o1 est la dernière série de modèles de grandes langues publiée par OpenAI le 12 septembre 2024, comprenant actuellement deux modèles : o1-preview et o1-mini.
La plus grande différence entre o1 et les modèles précédents de l'entreprise est son raisonnement avancé. Bien qu'il ne soit pas encore disponible dans son intégralité, les modèles preview et mini font déjà exploser GPT-4o dans les tests de mathématiques, de sciences et de codage.
OpenAI Modèles o1
La version de septembre comprenait deux modèles, le o1-preview et le o1-mini. Ils sont les premiers d'une série de modèles qui continueront à être publiés au fur et à mesure que OpenAI affinera son nouveau LLM.
La différence ? Le modèle o1-mini est plus petit et 80 % moins cher que le modèle preview. Il est conçu pour les tâches qui nécessitent un raisonnement avancé, mais pas de connaissances plus larges. Il est parfaitement adapté aux tâches qui impliquent le codage ou les mathématiques.
Quelle est l'intelligence de OpenAI o1 ?
OpenAI a présenté une liste de critères STEM qui démontrent les capacités de raisonnement de l'o1 :
- Une performance similaire à celle des doctorants dans les tests de référence en physique, chimie et biologie.
- Se classer parmi les 500 meilleurs élèves des États-Unis lors des qualifications pour les Olympiades américaines de mathématiques.
- Classement dans le 89e percentile à Codeforces, un test de codage compétitif.
Pour en savoir plus sur les capacités de raisonnement de o1, consultez le communiqué de presse de OpenAI.
Qu'est-ce que le raisonnement par chaîne de pensée ?
Les modèles o1 utilisent le raisonnement par chaîne de pensée, une manière plus longue et plus approfondie de décomposer les demandes.
Si le modèle o1 reçoit une invite, il ne répondra pas immédiatement - d'où le long temps d'attente. Au lieu de cela, il réfléchira à chacune des étapes, examinant soigneusement chaque information et ses implications avant de décider de la marche à suivre. Il ne fournira pas de réponse tant qu'il n'aura pas réfléchi à l'ensemble des étapes requises par la question.
En quoi o1 est-il différent de GPT-4o ?
1) Capacités de raisonnement
Au centre de son intelligence générale se trouve la nouvelle capacité de raisonnement d'o1. "Les progrès les plus importants se situeront peut-être au niveau de la capacité de raisonnement", a déclaré M. Altman à M. Gates. "Pour l'instant, GPT-4 ne peut raisonner que de manière extrêmement limitée.
Le raisonnement est notoirement difficile. Même pour les humains. Et OpenAI o1 est le premier modèle à le revendiquer.
Les modèles o1 sont capables de raisonner en temps réel, plutôt que de s'appuyer sur des données de pré-entraînement. C'est pourquoi le nouveau modèle est plus performant en sciences, en mathématiques et en codage que les précédents modèles OpenAI .
2) Plus difficile à jailbreaker
Les préoccupations en matière de sécurité étant de plus en plus nombreuses à mesure que LLMs gagne en popularité et en puissance, la sécurité a été au cœur du dernier développement de OpenAI. L'entreprise s'est associée aux instituts de sécurité de l'IA des États-Unis et du Royaume-Uni lors du développement de la série o1, et a travaillé avec le gouvernement américain pour établir leur diligence raisonnable.
La série o1 constitue une avancée majeure, car elle est beaucoup plus difficile à jailbreaker - c'est-à-dire à contourner les mesures de sécurité - que les modèles précédents.
Lors de l'un des tests de jailbreaking les plus difficiles, le modèle o1-preview a obtenu un score de 84 sur 100, contre 22 pour GPT-4o.
3) Nouvelle convention de dénomination
Bien que son nom ne soit pas l'élément le plus excitant du nouveau site OpenAI LLM , il s'agit d'un changement intentionnellement significatif.
OpenAI o1 est le premier modèle à se débarrasser de l'appellation "GPT", et ce parce que la société affirme qu'il s'agit de la première phase d'un tout nouveau " paradigme de raisonnement ", alors que les anciens modèles faisaient partie d'un " paradigme de pré-entraînement ".
Le nouveau modèle passe du temps à raisonner en temps réel, plutôt que de s'appuyer sur ses données de préformation.
4) Meilleure résolution de problèmes STEM
Un meilleur raisonnement s'accompagne de meilleures compétences en mathématiques.
On a demandé à o1 et à GPT-4o de passer un examen de qualification pour l'Olympiade internationale de mathématiques. GPT-4o a résolu 13 % des problèmes, tandis que o1 en a résolu 83 %.
5) Temps d'attente plus long
Le raisonnement en temps réel prend plus de temps que la référence aux données d'entraînement et la génération d'une réponse. Si vous posez une question à OpenAI o1-preview par rapport à d'autres modèles, vous attendrez beaucoup plus longtemps.
Cependant, avec la possibilité d'externaliser le raisonnement, c'est un petit prix à payer. La vitesse des modèles o1 s'améliorera probablement au fur et à mesure de la sortie des prochains modèles de la série.
Qui peut utiliser o1 ?
Depuis le 12 septembre, ChatGPT Plus et les utilisateurs de l'équipe peuvent accéder aux modèles o1 dans ChatGPT.
OpenAI a annoncé qu'elle mettrait o1-mini à la disposition des utilisateurs gratuits, bien qu'aucune date n'ait été précisée.
Les limites hebdomadaires actuelles sont de 30 messages pour 01-preview et de 50 pour o1-mini, mais elles augmenteront bientôt.
Pourquoi utiliser o1 ?
Les capacités de raisonnement améliorées de l'o1 sont particulièrement utiles pour résoudre des problèmes complexes en mathématiques, en sciences et en codage. Comme l'explique OpenAI :
Limites de OpenAI o1
En tant qu'aperçu, ce modèle ne dispose pas encore de toutes les fonctionnalités de GPT-4o. Si vous souhaitez utiliser un LLM pour naviguer sur le web à la recherche d'informations ou pour télécharger des fichiers ou des images, vous devrez vous en tenir à GPT-4o jusqu'à la sortie des modèles ultérieurs d'o1.
Comment demander OpenAI o1
OpenAILes suggestions d'incitation de la Commission ont changé pour o1 par rapport aux modèles précédents, en raison de l'amélioration du raisonnement.
Veillez à ce que les instructions soient simples. Il s'agit d'un modèle intelligent qui n'a pas besoin d'autant de conseils que la série GPT-4. Cela signifie qu'il faut éviter toute chaîne de pensée - le modèle raisonne déjà en interne.
Construire des agents d'intelligence artificielle à l'adresse GPT
Et si votre agent d'intelligence artificielle se synchronisait automatiquement avec chaque mise à jour de OpenAI ?
Botpress est une plateforme d'agents d'intelligence artificielle totalement ouverte et extensible. Notre site stack permet aux développeurs de créer des chatbots et des agents d'IA avec n'importe quelles capacités, dans n'importe quel flux de travail.
La seule plateforme qui va de la mise en place d'un code faible à une personnalisation et une extensibilité infinies, Botpress vous permet d'obtenir automatiquement la puissance de la dernière version de GPT sur votre chatbot - sans aucun effort requis.
Startbuilding today. C'est gratuit.
Table des matières
Restez au courant des dernières nouveautés en matière d'agents d'IA
Partager ce message sur :