Después de meses de especulación, OpenAI's última fresa LLM lanzamiento ha caído - y no se llama GPT-5.
Anteriormente conocida con nombres en clave crípticos e intrigantes como Q* y Strawberry, la última serie de modelos se ha decidido finalmente por el apodo OpenAI o1.
La mayor novedad del nuevo modelo OpenAI es su mayor capacidad de razonamiento. OpenAI explica que o1 ha sido entrenado para dedicar más tiempo a pensar que los modelos anteriores, lo que lo acerca más a la inteligencia humana.
¿Qué es OpenAI o1?
OpenAI o1 es la última serie de grandes modelos lingüísticos lanzada por OpenAI el 12 de septiembre de 2024, compuesta actualmente por dos modelos: o1-preview y el o1-mini.
La mayor diferencia entre o1 y los modelos anteriores de la empresa es su razonamiento avanzado. Aunque aún no se ha lanzado al mercado en su totalidad, los modelos preview y mini ya superan a GPT-4o en pruebas de matemáticas, ciencias y codificación.
OpenAI Modelos o1
El lanzamiento de septiembre incluyó dos modelos, el o1-preview y el o1-mini. Son los primeros de una serie de modelos que seguirán saliendo al mercado a medida que OpenAI perfeccione su nuevo LLM.
¿Cuál es la diferencia? El modelo o1-mini es más pequeño y un 80% más barato que el modelo preview. Está diseñado para tareas que requieren un razonamiento avanzado, pero no un conocimiento más amplio. Es perfecto para tareas de programación o matemáticas.
¿Cómo de inteligente es OpenAI o1?
OpenAI ha presentado una lista de pruebas STEM que demuestran la capacidad de razonamiento de o1:
- Un rendimiento similar al de los estudiantes de doctorado en las pruebas de referencia sobre física, química y biología.
- Clasificarse entre los 500 mejores estudiantes en la prueba clasificatoria para la Olimpiada Matemática de Estados Unidos.
- Clasificación en el percentil 89 en Codeforces, una prueba de codificación competitiva.
Puede leer más sobre la capacidad de razonamiento de o1 en el comunicado de investigación de OpenAI.
¿Qué es el razonamiento en cadena?
Los modelos o1 utilizan el razonamiento en cadena, una forma más larga y exhaustiva de desglosar las peticiones.
Si el modelo o1 recibe una pregunta, no responderá inmediatamente, de ahí el largo tiempo de espera. En lugar de ello, razonará cada uno de los pasos, considerando cuidadosamente cada dato y sus implicaciones antes de decidir el siguiente curso de acción. No dará una respuesta hasta que haya pensado en toda la serie de pasos que requiere la pregunta.
¿En qué se diferencia o1 de GPT-4o?
1) Capacidad de razonamiento
En el centro de su inteligencia general está la nueva capacidad de razonamiento de o1. "Quizá las áreas de progreso más importantes giren en torno a la capacidad de razonamiento", explica Altman a Gates. "Ahora mismo, GPT-4 sólo puede razonar de formas extremadamente limitadas".
Razonar es notoriamente difícil. Incluso para los humanos. Y OpenAI o1 es el primer modelo que lo afirma.
Los modelos o1 son capaces de razonar en tiempo real, en lugar de basarse en datos de preentrenamiento. Por eso el nuevo modelo es mejor en tareas científicas, matemáticas y de codificación que los modelos anteriores de OpenAI .
2) Más difícil de jailbreak
Las preocupaciones por la seguridad aumentan a medida que LLMs crece en popularidad y potencia, por lo que la seguridad ha sido uno de los puntos clave del último desarrollo de OpenAI. La empresa colaboró con los institutos de seguridad de IA de EE.UU. y el Reino Unido en el desarrollo de la serie o1, así como con el gobierno estadounidense para establecer su diligencia debida.
Como gran paso adelante, la serie o1 es mucho más difícil de jailbreak - saltarse las medidas de seguridad - que los modelos anteriores.
En una de sus pruebas de jailbreaking más duras, el modelo o1-preview obtuvo una puntuación de 84 sobre 100, frente a la triste puntuación de 22 de GPT-4o.
3) Nueva nomenclatura
Aunque su nombre no es lo más emocionante del nuevo OpenAI LLM , sí es un cambio intencionadamente significativo.
OpenAI o1 es el primer modelo que se desprende del apodo 'GPT', y ello porque la empresa afirma que es la primera fase de un nuevo 'paradigma de razonamiento', mientras que los modelos anteriores formaban parte de un 'paradigma de preentrenamiento'.
El nuevo modelo dedica tiempo a razonar en tiempo real, en lugar de basarse en sus datos de preentrenamiento.
4) Mejor en tareas de resolución de problemas STEM
Un mejor razonamiento conlleva mejores habilidades matemáticas.
Tanto a o1 como a GPT-4o se les pidió que completaran un examen clasificatorio para la Olimpiada Internacional de Matemáticas. GPT-4o resolvió el 13% de los problemas, mientras que o1 resolvió el 83%.
5) Mayor tiempo de espera
Razonar en tiempo real lleva más tiempo que referenciar datos de entrenamiento y generar una respuesta. Si formula una pregunta a OpenAI o1-preview en comparación con otros modelos, esperará bastante más tiempo.
Sin embargo, con la posibilidad de externalizar el razonamiento, es un pequeño precio a pagar. Es probable que la velocidad de los modelos o1 mejore a medida que salgan al mercado los siguientes modelos de la serie.
¿Quién puede utilizar o1?
Desde el 12 de septiembre, los usuarios de ChatGPT Plus y Team pueden acceder a los modelos o1 en ChatGPT.
OpenAI ha anunciado que pondrá o1-mini a disposición de los usuarios gratuitos, aunque no ha precisado la fecha.
Los límites actuales de la tarifa semanal son 30 mensajes para 01-preview y 50 para o1-mini, aunque pronto aumentarán.
¿Para qué debo utilizar o1?
Las capacidades de razonamiento mejoradas de o1 son especialmente útiles para resolver problemas complejos de matemáticas, ciencias y codificación. Comoexplica OpenAI :
Limitaciones de OpenAI o1
Como adelanto, este modelo aún no tiene todas las capacidades de GPT-4o. Si quieres utilizar LLM para buscar información en Internet o cargar archivos o imágenes, tendrás que utilizar GPT-4o hasta que se lancen modelos posteriores de o1.
Cómo solicitar OpenAI o1
OpenAIhan cambiado para o1 en comparación con sus modelos anteriores, debido a su razonamiento mejorado.
Mantenga sus indicaciones simples. Es un modelo inteligente y no necesita tanta orientación como la serie GPT-4. Eso significa evitar cualquier cadena de entrada de pensamiento - el modelo ya está razonando internamente.
Crea GPT-agentes de IA potenciados
¿Y si su agente de IA se sincronizara automáticamente con cada actualización de OpenAI ?
Botpress es una plataforma de agentes de IA completamente abierta y ampliable. Nuestra stack permite a los desarrolladores crear chatbots y agentes de IA con cualquier capacidad, en cualquier flujo de trabajo.
Botpress , la única plataforma que ofrece desde una configuración con poco código hasta infinitas posibilidades de personalización y ampliación, le permite obtener automáticamente la potencia de la última versión de GPT en su chatbot, sin ningún esfuerzo.
Empieza aconstruir hoy mismo. Es gratis.
Índice
Manténgase al día sobre lo último en agentes de IA
Comparte esto en: