El esperado modelo GPT-5 de OpenAI ya ha salido a la venta, y se llama OpenAI o1.
Si quieres saber más sobre las versiones o1-preview y o1-mini, puedes consultar nuestra descripción general del modelo o1 aquí.
¿Qué es GPT-5?
OpenAI o1 es la última serie de grandes modelos lingüísticos lanzada por OpenAI el 12 de septiembre de 2024, compuesta actualmente por dos modelos: o1-preview y el o1-mini.
La mayor diferencia entre o1 y los modelos anteriores de la empresa es su razonamiento de cadena de pensamiento. Aunque aún no se ha lanzado en su totalidad, los modelos preview y mini ya han superado con creces a GPT-4o en pruebas de matemáticas, ciencias y codificación.
El nuevo modelo es el primero de su clase, capaz de razonar en tiempo real (igual que un humano).
¿Qué significa su capacidad de razonamiento para los usuarios? "Es realmente bueno, materialmente mejor", dijo un CEO con acceso avanzado.
¿Cuándo sale a la venta GPT-5?
OpenAILa última versión de LLM se hizo pública el 12 de septiembre de 2024. La versión incluía los modelos o1-preview y o1-mini.
Hasta su lanzamiento, las predicciones eran muy variadas, y tanto usuarios como periodistas estimaban que podría llegar en verano de 2024 o en 2026.
¿Cómo de inteligente es GPT-5?
OpenAI ha presentado una lista de pruebas STEM que demuestran la capacidad de razonamiento de o1:
- Un rendimiento similar al de los estudiantes de doctorado en las pruebas de referencia sobre física, química y biología.
- Clasificarse entre los 500 mejores estudiantes en la prueba clasificatoria para la Olimpiada Matemática de Estados Unidos.
- Clasificación en el percentil 89 en Codeforces, una prueba de codificación competitiva.
Puede leer más sobre la capacidad de razonamiento de o1 en el comunicado de investigación de OpenAI.
Proyecto Fresa
OpenAI o1 recibió anteriormente el nombre en clave de Strawberry, con un fuerte componente de misticismo e intriga. "El funcionamiento de Strawberry es un secreto muy bien guardado, incluso en OpenAI", explica una fuente anónima a Reuters.
La versión más pequeña de esta nueva IA se lanzó el 12 de septiembre de 2024 como parte de una actualización de ChatGPT. Es probable que OpenAI utilice la versión más grande para generar datos de entrenamiento para su LLMs, que podría sustituir a la necesidad de grandes cantidades de datos del mundo real.
En una reunión interna de OpenAI celebrada el 9 de julio, se hizo una demostración de lo que podría ser el Proyecto Strawberry, del que se dijo que mostraba una capacidad de razonamiento similar a la humana.
¿Cuál es la diferencia entre GPT-4 y GPT-5?
OpenAI El CEO Sam Altman cree que el mundo sólo ha arañado la superficie de la IA. En la Cumbre Mundial de Gobiernos de enero de 2024, Altman comparó los modelos actuales de OpenAI con los primeros días de los teléfonos móviles:
Aunque llevará tiempo pasar de la versión flip phone de GPT a la versión iPhone, el modelo o1 nos acerca un paso más.
1) Mayor capacidad de razonamiento
En el centro de su inteligencia general está la nueva capacidad de razonamiento de o1. "Quizá las áreas de progreso más importantes giren en torno a la capacidad de razonamiento", explica Altman a Gates. "Ahora mismo, GPT-4 sólo puede razonar de formas extremadamente limitadas".
Razonar es notoriamente difícil. Incluso para los humanos. Y OpenAI o1 es el primer modelo que lo afirma.
No son pocos los usuarios que publican sus fallos en GPT-4 en Reddit y Medium, desde burlas colectivas a su resolución de problemas hasta explicaciones formales de sus limitadas capacidades de razonamiento.
2) Nueva nomenclatura
Aunque su nombre no es lo más emocionante del nuevo OpenAI LLM , sí es un cambio intencionadamente significativo.
OpenAI o1 es el primer modelo que se desprende del apodo 'GPT', y ello porque la empresa afirma que es la primera fase de un nuevo 'paradigma de razonamiento', mientras que los modelos anteriores formaban parte de un 'paradigma de preentrenamiento'.
El nuevo modelo dedica tiempo a razonar en tiempo real, en lugar de basarse en sus datos de preentrenamiento.
3) Mayor tiempo de espera
Razonar en tiempo real lleva más tiempo que referenciar datos de entrenamiento y generar una respuesta. Si formula una pregunta a OpenAI o1-preview en comparación con otros modelos, esperará bastante más tiempo.
Sin embargo, con la posibilidad de externalizar el razonamiento, es un pequeño precio a pagar. Es probable que la velocidad de los modelos o1 mejore a medida que salgan al mercado los siguientes modelos de la serie.
4) Ventanas contextuales idénticas
Aunque muchos especularon con un aumento de las ventanas de contenido de GPT-4 al siguiente modelo, la actual serie o1 sigue siendo idéntica a la ventana de contenido de GPT-4o, de 128.000.
Las ventanas de contexto representan el número de tokens (palabras o subpalabras) que un modelo puede procesar a la vez. Una ventana de contexto más amplia permite al modelo absorber más información del texto de entrada, lo que se traduce en una mayor precisión en su respuesta.
Uno de los defectos de GPT-4 ha sido su capacidad comparativamente limitada para procesar grandes cantidades de texto. Por ejemplo, GPT-4 Turbo y GPT-4o tienen una ventana de contexto de 128.000 tokens. Pero el modelo Gemini de Google tiene una ventana de contexto de hasta 1 millón de tokens.
En este momento, si su única preocupación es un modelo de lenguaje amplio que pueda absorber grandes cantidades de información, el OpenAI LLMs podría no ser su mejor opción. Si tienes curiosidad por saber qué chatbot de LLM es el más adecuado para ti, echa un vistazo a nuestro artículo sobre los mejores chatbots de LLM .
¿Qué datos de entrenamiento utiliza GPT-5?
Si ha habido algún ajuste de cuentas para OpenAI en su ascenso a la cima del sector, ha sido la serie de demandas sobre la formación completa de las modelos.
GPT se entrenan a partir de enormes conjuntos de datos extraídos de Internet, muchos de ellos protegidos por derechos de autor. Este uso no autorizado de datos ha provocado numerosas quejas y acciones legales: una demanda de The New York Times, otra de una serie de agencias de noticias estadounidenses y denuncias de que el proceso de entrenamiento del modelo vulnera el Reglamento General de Protección de Datos de la UE.
Un juez de California ya ha desestimado una de las demandas por derechos de autor de OpenAI presentadas por un grupo de escritores, entre ellos los famosos Sarah Silverman y Ta-Nehisi Coates. Aún no hay indicios de que OpenAI y compañía vayan a verse sustancialmente frenados por estas demandas mientras prosigue sus pruebas.
El último modelo se ha entrenado con una combinación de datos públicos y datos comprados a empresas. OpenAI solicitó una mayor variedad de conjuntos de datos para entrenar mejor el modelo.
También es probable que o1 se utilizara para crear conjuntos de datos para seguir entrenando el modelo. OpenAI explicó que Strawberry se utilizaría para entrenar futuros LLMs.
¿Cuánto cuesta GPT-5?
El nuevo modelo OpenAI o1 se puede utilizar libremente en ChatGPT, pero con límites estrictos por el momento.
Para el uso de la API, el modelo OpenAI o1-preview cuesta 15 dólares por cada millón de tokens de entrada y 60 dólares por cada millón de tokens de salida.
El modelo o1-mini cuesta 3 dólares por cada millón de fichas de entrada y 12 dólares por cada millón de fichas de salida, lo que lo convierte en un modelo mucho más accesible para el uso cotidiano.
Sin embargo, estos modelos son más costosos OpenAI's previous options. El modelo GPT-4o tiene un precio de 5 dólares por cada millón de fichas de entrada y 15 dólares por cada millón de fichas de salida. El modelo GPT-4o mini cuesta 0,150 dólares por cada millón de fichas de entrada y 0,6 dólares por cada millón de fichas de salida.
Información previa al lanzamiento OpenAI
En vísperas del lanzamiento del o1 (también conocido anteriormente como Strawberry y Q*), los ejecutivos e informadores de OpenAI han ido dejando caer cada vez más información sobre el modelo de nueva generación. He aquí un rastro de lo que la empresa declaró antes de su lanzamiento:
- OpenAI El CEO de Japón anunció una fecha de lanzamiento para 2024, así como asociaciones entre el nuevo producto y Apple, Spotify y Coca-Cola.
- El consejero delegado Sam Altman afirmó que el próximo modelo podrá procesar correos electrónicos y detalles del calendario, y que será más personalizable.
- La directora técnica Mira Murati explicó en una entrevista en Dartmouth Engineering que GPT-3 tenía la inteligencia de un niño pequeño, GPT-4 era más parecida a la de un estudiante de secundaria inteligente, y que OpenAI o1 tiene inteligencia de nivel de doctorado (en ciertas tareas).
- Mustafa Suleyman, Consejero Delegado de Microsoft AI, declaró que no será hasta GPT-6, dentro de dos años, cuando los modelos sean capaces de "actuar" en entornos novedosos.
- La cautela es primordial: El Consejero Delegado Sam Altman se mostró cauteloso sobre la fecha de lanzamiento del modelo o1, explicando que OpenAI tenía "muchas otras cosas importantes que lanzar primero". Afirmó que la empresa sólo lanzaría el modelo cuando tuvieran la certeza de que podían hacerlo de forma segura y responsable.
- Altman bromeó diciendo que GPT-5 hará que GPT-4 parezca "ligeramente vergonzoso" en comparación, en su entrevista en Stanford.
- El US AI Safety Institute recibió acceso anticipado al próximo modelo de OpenAI, para que ambas organizaciones puedan "impulsar la ciencia de las evaluaciones de IA".
- Dispondrá de un conjunto de datos ampliado. GPT-5 se ha entrenado con una combinación de datos públicos y datos comprados a empresas. OpenAI ha solicitado una mayor variedad de conjuntos de datos para entrenar mejor el modelo.
El futuro de ChatGPT
La próxima generación de grandes modelos lingüísticos revolucionará la forma en que interactuamos con la IA en nuestra vida cotidiana. En la conferencia Tech de Bloomberg,Brad Lightcap, director de operaciones de OpenAI , dejó entrever cómo la empresa planea revolucionar la interacción entre humanos y ordenadores, haciendo que GPT pase de ser un LLM a un modelo con capacidades similares a las de un agente.
"¿Existirá el ingeniero rápido en 2026?". Dijo Lightcap. "No se le hace ingeniería a un amigo".
Un modelo más capaz y personalizado, con más capacidades multimodales, promete justo lo que Altman y OpenAI esperan: lo inimaginable. El esperado GPT-5 estará un paso más cerca.
Mayor personalización
GPT-4 se utiliza a menudo como herramienta única. Pero las futuras iteraciones serán más personalizadas. En el podcast de Gates, Altman reiteró que la adaptabilidad y la personalización serán la clave de los futuros modelos de OpenAI . "La gente quiere cosas muy diferentes de GPT-4: estilos diferentes, conjuntos de supuestos diferentes".
OpenAI ya ha introducido Custom GPTs, que permite a los usuarios personalizar un GPT para una tarea concreta, desde enseñar un juego de mesa hasta ayudar a los niños a hacer los deberes. Aunque la personalización no estaba a la vanguardia de OpenAI o1, se espera que se convierta en una tendencia importante en el futuro.
Mientras tanto, puedes personalizar un chatbot de IA equipado con la potencia de GPT-4o de forma gratuita. Es lo que mejor sabemos hacer. Empieza aquí.
Más multimodal
La multimodalidad ha sido fundamental en las últimas iteraciones de GPT. OpenAI no muestra signos de ralentización.
OpenAI introdujo GPT-4o en mayo de 2024, trayendo consigo mayores capacidades de texto, voz y visión. Muy lejos de GPT-4 Turbo, es capaz de entablar conversaciones naturales, analizar imágenes, describir imágenes y procesar audio complejo.
Los cambios en la multimodalidad provocan enormes cambios en nuestra forma de interactuar con GPT. La fluidez natural de la conversación -cuando el modelo puede interpretar con precisión los cambios tonales y seguir patrones de habla similares a los humanos, como GPT-4o- supone un salto de gigante en el procesamiento del lenguaje natural por IA.
Y no se trata sólo de mejorar la voz y el texto. OpenAI no ha tenido reparos en anunciar su próximo modelo de conversión de texto a vídeo, Sora. Este modelo de inteligencia artificial ha sido desarrollado para imitar complejos movimientos de cámara y crear personajes y escenarios detallados en clips de hasta 60 segundos.
Si su historial de multimodalidad no es suficiente, tómelo del director general de OpenAI . Altman confirmó a Gates que el procesamiento de vídeo, junto con el razonamiento, es una de las principales prioridades de los futuros modelos de GPT .
El poder de GPT, a medida
¿Y si tu chatbot de IA se sincronizara automáticamente con cada actualización de GPT ?
Botpress ha proporcionado soluciones de chatbot de IA personalizables desde 2017, proporcionando a los desarrolladores las herramientas que necesitan para crear fácilmente chatbots con la potencia de la última LLMs. Los chatbots de Botpress pueden entrenarse en fuentes de conocimiento personalizadas -como su sitio web o catálogo de productos- e integrarse perfectamente con los sistemas empresariales.
Botpress , la única plataforma que va desde la configuración sin código hasta la personalización y ampliación infinitas, le permite obtener automáticamente la potencia de la última versión de GPT en su chatbot, sin esfuerzo.
Empieza a construir hoy mismo. Es gratis.
Índice
Manténgase al día sobre lo último en agentes de IA
Comparte esto en: