- OpenAI o1 es una nueva serie de modelos (comenzando con o1-preview y o1-mini) centrada en el razonamiento en tiempo real, no solo en el preentrenamiento.
- o1 supera a GPT-4o en tareas STEM, obteniendo un 83% en las pruebas clasificatorias de la IMO frente al 13% de GPT-4o, y se sitúa en el percentil 89 en Codeforces.
- o1 utiliza razonamiento en cadena de pensamiento de forma nativa, lo que lo hace más lento pero mucho más preciso en tareas complejas.
- o1 es mucho más difícil de vulnerar, alcanzando 84/100 en pruebas de seguridad adversarial frente al 22 de GPT-4o.
Tras meses de especulación por parte de los fans de ChatGPT, OpenAI ha lanzado su último modelo LLM Strawberry – y no se llama GPT-5.
Anteriormente conocido por nombres en clave crípticos e intrigantes como Q* y Strawberry, la última serie de modelos finalmente ha adoptado el nombre OpenAI o1.
La mayor novedad del nuevo modelo de OpenAI son sus habilidades de razonamiento mejoradas. OpenAI explicó que o1 ha sido entrenado para dedicar más tiempo a pensar que los modelos anteriores, acercándose más a la inteligencia humana.
¿Qué es OpenAI o1?
OpenAI o1 es la última serie de modelos de lenguaje a gran escala lanzada por OpenAI el 12 de septiembre de 2024, que actualmente incluye dos modelos: o1-preview y o1-mini.
La mayor diferencia entre o1 y los modelos anteriores de la compañía es su razonamiento avanzado. Aunque aún no está disponible en su versión completa, los modelos preview y mini ya superan ampliamente a GPT-4o en pruebas de matemáticas, ciencia y programación.
Modelos OpenAI o1
El lanzamiento de septiembre incluyó dos modelos, o1-preview y o1-mini. Son los primeros de una serie que OpenAI continuará lanzando a medida que perfecciona su nuevo LLM.
¿La diferencia? El modelo o1-mini es más pequeño y un 80% más barato que el modelo preview. Está diseñado para tareas que requieren razonamiento avanzado, pero no un conocimiento más amplio. Es perfectamente adecuado para tareas que impliquen programación o matemáticas.
¿Qué tan inteligente es OpenAI o1?
OpenAI ha presentado una serie de pruebas de referencia STEM que demuestran las capacidades de razonamiento de o1, incluyendo:
- Un rendimiento similar al de estudiantes de doctorado en pruebas de física, química y biología.
- Posicionarse entre los 500 mejores estudiantes en la clasificatoria estadounidense para la Olimpiada de Matemáticas de EE. UU.
- Ubicarse en el percentil 89 en Codeforces, una prueba competitiva de programación.
Puedes leer más sobre las capacidades de razonamiento de o1 en el informe de investigación de OpenAI.
¿Qué es el razonamiento en cadena de pensamiento?
Los modelos o1 utilizan razonamiento en cadena de pensamiento, una forma más extensa y detallada de descomponer las solicitudes.
Si se le da un prompt al modelo o1, no responderá de inmediato – de ahí el tiempo de espera prolongado. En su lugar, razonará cada uno de los pasos, considerando cuidadosamente cada pieza de información y sus implicaciones antes de decidir el siguiente curso de acción. No dará una respuesta hasta haber pensado en toda la secuencia de pasos requerida en la solicitud.
¿En qué se diferencia o1 de GPT-4o?
1) Capacidades de razonamiento
En el centro de su inteligencia general está la nueva capacidad de razonamiento de o1. “Quizás las áreas más importantes de avance serán en la capacidad de razonar”, compartió Altman con Gates. “Actualmente, GPT-4 solo puede razonar de formas muy limitadas.”
El razonamiento es notoriamente difícil. Incluso para los humanos. Y OpenAI o1 es el primer modelo que lo reivindica.
Los modelos o1 pueden razonar en tiempo real, en lugar de depender solo de datos de preentrenamiento. Por eso el nuevo modelo es mejor en tareas de ciencia, matemáticas y programación que los modelos anteriores de OpenAI.
2) Más difícil de vulnerar
Con el aumento de las preocupaciones de seguridad a medida que los LLM ganan popularidad y potencia, la seguridad ha sido un enfoque clave en el desarrollo más reciente de OpenAI. La empresa colaboró con los Institutos de Seguridad en IA de EE. UU. y Reino Unido durante el desarrollo de la serie o1, además de trabajar con el gobierno estadounidense para establecer los procedimientos adecuados.
Como un gran avance, la serie o1 es mucho más difícil de vulnerar – es decir, de saltarse las medidas de seguridad – que los modelos anteriores.
En una de sus pruebas de jailbreak más exigentes, el modelo o1-preview obtuvo 84 de 100, en comparación con el pobre 22 de GPT-4o.
3) Nueva convención de nombres
Aunque el nombre no es lo más emocionante del nuevo LLM de OpenAI, sí representa un cambio intencionado y significativo.
OpenAI o1 es el primer modelo que deja atrás el nombre 'GPT', y esto se debe a que la empresa afirma que es la primera fase de un nuevo 'paradigma de razonamiento', mientras que los modelos anteriores formaban parte de un 'paradigma de preentrenamiento'.
El nuevo modelo dedica tiempo a razonar en tiempo real, en lugar de depender de sus datos de preentrenamiento.
4) Mejor en tareas de resolución de problemas STEM
Un mejor razonamiento implica mejores habilidades matemáticas.
Tanto o1 como GPT-4o realizaron un examen clasificatorio para la Olimpiada Internacional de Matemáticas. GPT-4o resolvió el 13% de los problemas, mientras que o1 resolvió el 83%.
5) Mayor tiempo de espera
Razonar en tiempo real toma más tiempo que consultar datos de entrenamiento y generar una respuesta. Si haces una pregunta a OpenAI o1-preview en comparación con otros modelos, tendrás que esperar bastante más.
Sin embargo, con la capacidad de delegar el razonamiento, es un pequeño precio a pagar. Es probable que la velocidad de los modelos o1 mejore a medida que se lancen los siguientes modelos de la serie.
¿Quién puede usar o1?
Desde el 12 de septiembre, los usuarios de ChatGPT Plus y Team pueden acceder a los modelos o1 en ChatGPT.
OpenAI anunció que pondrá o1-mini a disposición de los usuarios gratuitos, aunque aún no hay una fecha concreta.
Actualmente, los límites semanales son de 30 mensajes para o1-preview y 50 para o1-mini, aunque pronto aumentarán.
¿Para qué debería usar o1?
Las capacidades de razonamiento mejoradas de o1 son especialmente útiles para resolver problemas complejos en matemáticas, ciencia y programación. Como explica OpenAI:
Limitaciones de OpenAI o1
Al ser una versión preliminar, este modelo aún no tiene todas las capacidades de GPT-4o. Si buscas usar un LLM para navegar por la web o quieres subir archivos o imágenes, tendrás que seguir usando GPT-4o hasta que se lancen versiones posteriores de o1.
Cómo hacer prompts para OpenAI o1
Las recomendaciones de OpenAI para crear prompts han cambiado con o1 respecto a los modelos anteriores, debido a su razonamiento mejorado.
Mantén tus prompts simples. Es un modelo inteligente y no necesita tanta orientación como la serie GPT-4. Eso significa que debes evitar entradas con cadenas de pensamiento – el modelo ya razona internamente.
Crea agentes de IA impulsados por GPT
¿Y si tu agente de IA se sincronizara automáticamente con cada actualización de OpenAI?
Botpress es una plataforma de agentes de IA completamente abierta y ampliable. Nuestra tecnología permite a los desarrolladores crear chatbots y agentes de IA con cualquier capacidad, en cualquier flujo de trabajo.
La única plataforma que abarca desde una configuración low-code hasta una personalización y ampliación ilimitadas, Botpress te permite aprovechar automáticamente la última versión de GPT en tu chatbot – sin esfuerzo.
Empieza a construir hoy. Es gratis.
Preguntas frecuentes
1. ¿Qué significa “o1”? ¿Hay una lógica de nombres para los futuros modelos (por ejemplo, o2, o3)?
El nombre “o1” probablemente significa “OpenAI 1”, indicando el inicio de una nueva familia de modelos. Por ello, es razonable esperar una nomenclatura secuencial como “o2”, “o3”, etc., para futuras versiones de esta serie.
2. ¿Por qué OpenAI dejó de usar la convención de nombres “GPT”?
OpenAI cambió de la convención “GPT” a “o1” para señalar un cambio de enfoque: de modelos de lenguaje preentrenados generales a modelos optimizados para el razonamiento en tiempo real y capacidades interactivas.
3. ¿Es OpenAI o1 el sucesor de GPT-4 o una línea de producto completamente nueva?
OpenAI o1 no es un sucesor directo de GPT-4, sino el inicio de una nueva línea de productos diseñada en torno al razonamiento en tiempo real y la eficiencia, aunque se basa en los avances logrados con GPT-4 y GPT-4o.
4. ¿Puede o1 manejar mejor entradas en varios idiomas que GPT-4?
OpenAI no ha declarado formalmente cómo se compara o1 con GPT-4 en rendimiento multilingüe, pero dado que o1 está optimizado para el razonamiento y nuevas capacidades, es posible que futuras versiones gestionen aún mejor la entrada multilingüe.
5. ¿Cuándo estará o1 disponible para los usuarios del plan gratuito?
OpenAI ha confirmado que una versión llamada “o1-mini” estará disponible para los usuarios del plan gratuito, pero hasta ahora no se ha anunciado una fecha oficial para su lanzamiento general.





.webp)
