!['GPT-5' sobre fondo azul estampado.](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/66854e271fa93cdd5adbdeb4_GPT-5.webp)
GPT-5 está al caer, y los rumores apuntan a que su fecha de lanzamiento será más pronto que tarde.
En su entrevista de podcast con Bill Gates, el director general de OpenAI , Sam Altman, confirmó en enero de 2024 que GPT-5 estaba en desarrollo. Los informes sugieren que podríamos verlo antes de lo que pensamos: dos fuentes anónimas cercanas a OpenAI sugirieron que GPT-5saldría a mediados de 2024, probablemente este verano.
¿Qué es GPT-5?
Aunque GPT-4 nos parece revolucionario ahora, Altman cree que el mundo sólo ha arañado la superficie de la IA. En la Cumbre Mundial de Gobiernos de enero de 2024, Altman comparó los modelos actuales de OpenAI con los primeros días de los teléfonos móviles:
Si algo es seguro, es que la próxima generación de modelos de GPT nos resulta inimaginable ahora mismo. Aunque llevará tiempo pasar de la versión para teléfono móvil de GPT a la versión para iPhone, a finales de año estaremos un paso más cerca.
GPT-5 será el lanzamiento de LLM más esperado hasta la fecha. El modelo de IA tendrá más velocidad y mayores capacidades de procesamiento del lenguaje natural. ¿Qué nos depara?
"Es realmente bueno, materialmente mejor", dijo un director general con acceso avanzado a GPT-5.
Perspectivas de OpenAI
A medida que se acerca el lanzamiento de GPT-5, los ejecutivos y conocedores de OpenAI han aumentado sus comentarios sobre el modelo de nueva generación. Esto es lo que la empresa ha declarado recientemente:
- Sam Altman, Consejero Delegado, afirma que GPT-5 podrá procesar correos electrónicos y detalles del calendario, y que será más personalizable.
- En una entrevista concedida a Dartmouth Engineering, la directora técnica Mira Murati explicó que GPT-3 tenía la inteligencia de un niño pequeño, GPT-4 era más parecida a la de un estudiante de secundaria inteligente, y que la próxima generación buscará tener una inteligencia de nivel de doctorado (en determinadas tareas).
- Mustafa Suleyman, Consejero Delegado de Microsoft AI, ha declarado que los modelos no podrán "actuar" en entornos nuevos hasta dentro de dos años, cuando se publique GPT-6.
![Mira Murati lleva unos auriculares y se sienta en una silla blanca mientras habla y gesticula.](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/667ec97b954379fb0f078179_mira%20murati.jpeg)
¿Cuál es la diferencia entre GPT-4 y GPT-5?
Al igual que GPT-4 supuso un aumento considerable respecto a su predecesora, no cabe duda de que la próxima versión hará lo mismo. Aunque OpenAI no ha confirmado ninguna actualización -y probablemente no lo haga antes de su lanzamiento sorpresa-, las siguientes predicciones sobre lo que cabe esperar de GPT-5 se han extraído de entrevistas internas, actualizaciones anteriores de GPT y tendencias de IA de la competencia LLMs.
Es más inteligente que GPT-4
¿La mayor diferencia? Según Altman: "Va a ser más inteligente".
En la Cumbre Mundial de Gobiernos, Altman subrayó que el mayor salto de GPT-4 a GPT-5 era engañosamente sencillo: es más inteligente. "Lo que hace que estos modelos sean tan mágicos es que son generales", explicó. "Va a ser más inteligente, por lo que va a ser mejor en todo en general".
Aunque se esperan muchas mejoras -nuevas funciones, mayor velocidad y multimodalidad, según la entrevista de Altman-, un modelo más inteligente mejorará todas las características existentes en la actual LLMs.
Mayor fiabilidad
Altman confirmó que la fiabilidad será uno de los ejes centrales de la evolución de GPT(Generative Pre-trained Transformer) en los próximos dos años. "Si le haces a GPT-4 la mayoría de las preguntas 10.000 veces, una de esas 10.000 probablemente sea bastante buena, pero no siempre sabe cuál, y te gustaría obtener la mejor respuesta de 10.000 cada vez, por lo que ese aumento de la fiabilidad será importante".
La fiabilidad ha sido durante mucho tiempo un punto de fricción para los usuarios de GPT-4. GPT-4 Turbo se desarrolló en parte para introducir las actualizaciones necesarias en la coherencia y precisión de los resultados del modelo. Turbo aumentó la estabilidad del modelo y redujo las alucinaciones de la IA.
![OpenAI El Consejero Delegado Sam Altman presenta desde un escenario oscuro el lanzamiento de GPT-4 Turbo.](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/66450c0f7955370a4fb1f45a_turbo%20launch.webp)
Así que si se escuchan quejas fundadas de los usuarios, es casi seguro que el nuevo modelo será entrenado para ser más fiable que GPT-4. De hecho, una persona anónima de OpenAI confirmó que el equipo espera una mayor fiabilidad en la próxima iteración. Nosotros también lo esperamos.
Mayor capacidad de razonamiento
En el centro de su inteligencia general está GPT-5 capacidad más avanzada para razonar. "Quizá las áreas de progreso más importantes giren en torno a la capacidad de razonamiento", explica Altman a Gates. "Ahora mismo, GPT-4 sólo puede razonar de forma extremadamente limitada".
No son pocos los usuarios que publican sus fallos en GPT-4 en Reddit y Medium, desde asados en grupo sobre su resolución de problemas hasta explicaciones formales sobre sus limitadas capacidades de razonamiento. Es fácil entender por qué: el razonamiento es notoriamente difícil. Cualquier mejora significativa supondría un gran avance en el rendimiento del modelo de IA.
Un razonamiento mejorado significaría que GPT-5 sería mejor que GPT-4 a la hora de entender el contexto, hacer inferencias y resolver problemas. Combinado con una base de conocimientos más amplia, GPT-5 sería más capaz de comprender la intención del usuario y ofrecerle información más relevante.
Y si tenemos suerte, GPT-5 será el modelo que finalmente descubra cómo responder a los enigmas, impulsándolo mucho más allá de GPT-4.
Más multimodal
La multimodalidad ha sido fundamental en las últimas iteraciones de GPT. OpenAI no muestra signos de ralentización.
OpenAI introdujo GPT-4o en mayo de 2024, trayendo consigo mayores capacidades de texto, voz y visión. Muy lejos de GPT-4 Turbo, es capaz de entablar conversaciones naturales, analizar imágenes, describir imágenes y procesar audio complejo.
Los cambios en la multimodalidad provocan enormes cambios en nuestra forma de interactuar con GPT. La fluidez natural de la conversación -cuando el modelo puede interpretar con precisión los cambios tonales y seguir patrones de habla similares a los humanos, como GPT-4o- supone un salto de gigante en el procesamiento del lenguaje natural por IA.
![Fotograma generado por Sora de una mujer caminando de noche por una concurrida calle de Tokio.](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/66450207cf90120602b51d1a_Sora%20demo%20woman%20street.png)
Y no se trata sólo de mejorar la voz y el texto. OpenAI no ha tenido reparos en anunciar su próximo modelo de conversión de texto a vídeo, Sora. Este modelo de inteligencia artificial ha sido desarrollado para imitar complejos movimientos de cámara y crear personajes y escenarios detallados en clips de hasta 60 segundos.
Si su historial de multimodalidad no es suficiente, tómelo del director general de OpenAI . Altman confirmó a Gates que el procesamiento de vídeo, junto con el razonamiento, es una de las principales prioridades de los futuros modelos de GPT .
La multimodalidad es una de las palabras de moda en el futuro de los modelos de IA, y con razón. A pesar de que GPT-4o hace hincapié en ampliar sus capacidades multimodales, no sería de extrañar ver aún más funciones de voz, imagen o vídeo con el lanzamiento del nuevo modelo.
Aumento del tamaño de los parámetros
Cada actualización de GPT ha aumentado el tamaño de los parámetros, y la próxima generación de GPT-5 probablemente no será una excepción. En un transformador como GPT, los parámetros incluyen los pesos y sesgos de las capas de la red neuronal, como los mecanismos de atención, las capas feedforward y las matrices de incrustación. El tamaño de estos parámetros influye directamente en su capacidad para aprender de los datos de entrada.
Aunque OpenAI mantiene en secreto el tamaño exacto de sus parámetros, las estimaciones lo sitúan en torno a 1,5 billones de parámetros, lo que supone un notable aumento con respecto a los 175.000 millones de GPT-3 (y un salto inimaginable con respecto a los 1.500 millones de GPT-2).
El experto en IA Alan Thompson, asesor integrado en IA de Google y Microsoft, espera un recuento de parámetros de entre 2 y 5 billones, lo que aumentaría enormemente la profundidad de las tareas que pueden realizar los desarrolladores. Su análisis se basa en la duplicación tanto de la potencia de cálculo como del tiempo de entrenamiento, lo que supondría un aumento significativo del tiempo de prueba en GPT-4.
Ventanas contextuales más grandes
Las ventanas de contexto representan el número de tokens (palabras o subpalabras) que un modelo puede procesar a la vez. Una ventana de contexto más amplia permite al modelo absorber más información del texto de entrada, lo que se traduce en una mayor precisión en su respuesta.
Uno de los defectos de GPT-4 ha sido su capacidad comparativamente limitada para procesar grandes cantidades de texto. Por ejemplo, GPT-4 Turbo y GPT-4o tienen una ventana de contexto de 128.000 tokens. Pero el modelo Gemini de Google tiene una ventana de contexto de hasta 1 millón de tokens.
Ahora mismo, si lo único que le preocupa es un modelo lingüístico de gran tamaño que pueda absorber grandes cantidades de información, GPT-4 podría no ser su mejor opción. Se espera que OpenAI resuelva estas discrepancias en el nuevo modelo.
![Dos círculos azules, uno 7,6 veces mayor que el otro. Representan los tamaños de las ventanas contextuales de GPT-4 Turbo y Gemini.](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/66464656f9787865888acf9e_final%20context%20window%20comparison.png)
¿Qué predice Alan Thompson? Un aumento vertiginoso hasta los 40 billones de tokens. Un cambio de esta naturaleza supondría un notable avance con respecto al modelo Gemini, ya que añadiría la capacidad de responder a conjuntos de datos masivos introducidos por los usuarios. Esto supondría un cambio en el rendimiento del modelo de IA, especialmente para los clientes empresariales de OpenAI y los usuarios con grandes necesidades de introducción de datos.
Mayor personalización
GPT-4 se utiliza a menudo como herramienta única. Pero las futuras iteraciones serán más personalizadas. En el podcast de Gates, Altman reiteró que la adaptabilidad y la personalización serán la clave de los futuros modelos de OpenAI . "La gente quiere cosas muy diferentes de GPT-4: estilos diferentes, conjuntos de supuestos diferentes".
OpenAI ya ha introducido Custom GPTs, que permite a los usuarios personalizar un GPT para una tarea específica, desde enseñar un juego de mesa hasta ayudar a los niños a completar sus deberes. Aunque puede que la personalización no sea la protagonista de la próxima actualización, se espera que se convierta en una tendencia importante de cara al futuro.
Mientras tanto, puedes personalizar un chatbot de IA equipado con la potencia de GPT-4o de forma gratuita. Es lo que mejor sabemos hacer. Empieza aquí.
¿Cuándo sale a la venta GPT-5?
Tanto usuarios como periodistas han estimado seriamente la fecha de lanzamiento, que oscila entre el verano de 2024 y principios de 2026.
Pero la actualización más reciente (y fiable) procede de Mira Murati, CTO de openAI: en su entrevista con Dartmouth Engineering, publicada el 20 de junio, afirmó que faltaba un año y medio para la "próxima generación" del modelo, lo que situaba el lanzamiento más cerca de finales de 2025. Sin embargo, no está claro si el modelo de próxima generación del que habló con el entrevistador era GPT-5, o las generaciones futuras.
Se prevé que el periodo de formación dure entre 4 y 6 meses, el doble que los 3 meses de OpenAIpara GPT-4. Es probable que el nuevo modelo se someta a aprendizaje de refuerzo, red teaming y más pruebas antes de su lanzamiento, aunque se trata de un calendario nebuloso: OpenAI podría tener que retrasar aún más su fecha de lanzamiento si se encuentra con escenarios imprevistos en las pruebas.
![La directora de tecnología Mira Murati y los jefes de investigación Mark Chen y Barret Zoph se sientan en sofás sobre un escenario en la presentación de GPT-4o, demostrando la capacidad del modelo para ver un problema matemático escrito.](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/66450ea7e691054133415d6d_gpt%204o%20launch.webp)
¿Qué datos de entrenamiento utilizará GPT-5?
GPT-5 seguirá utilizando casi con toda seguridad la información disponible en Internet como datos de formación.
Si ha habido algún ajuste de cuentas para OpenAI en su ascenso a la cima del sector, ha sido la serie de demandas sobre la formación completa de las modelos.
GPT se entrenan a partir de enormes conjuntos de datos extraídos de Internet, muchos de ellos protegidos por derechos de autor. Este uso no autorizado de datos ha provocado numerosas quejas y acciones legales: una demanda de The New York Times, otra de una serie de agencias de noticias estadounidenses y denuncias de que el proceso de entrenamiento del modelo vulnera el Reglamento General de Protección de Datos de la UE.
Un juez de California ya ha desestimado una de las demandas por derechos de autor de OpenAI presentadas por un grupo de escritores, entre ellos los famosos Sarah Silverman y Ta-Nehisi Coates. Aún no hay indicios de que OpenAI y compañía vayan a verse sustancialmente frenados por estas demandas mientras prosigue sus pruebas.
¿Cuánto cuesta GPT-5?
Si OpenAI continúa con su modelo de precios estándar, el uso de GPT-5 tendrá un coste adicional. Actualmente, ChatGPT con GPT-4 sólo está disponible para usuarios de pago a 20 dólares al mes, mientras que ChatGPT con GPT 3.5 está disponible de forma gratuita.
En cuanto a los precios de la API, GPT-4 cuesta actualmente 30 dólares por 1 millón de fichas de entrada y 60 dólares por 1 millón de fichas de salida (estos precios se duplican para la versión de 32k). Si el nuevo modelo es tan potente como se prevé, es probable que los precios sean aún más elevados que los de los anteriores modelos de OpenAI GPT .
![Gráfico del modelo de precios de GPT-4. ChatGPT cuesta 20 dólares al mes. GPT-4 para API cuesta 30 dólares por cada millón de tokens de entrada y 60 dólares por cada millón de tokens de salida.](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/6646470eebbb0db1f7837503_final%20gpt-4%20pricing.png)
Sin embargo, el último modelo OpenAI es mucho más asequible. GPT-4o cuesta sólo 5 dólares por cada millón de tokens de entrada y 15 dólares por cada millón de tokens de salida. Aunque las diferencias de precio no son decisivas para los clientes empresariales, OpenAI está dando un paso admirable hacia la accesibilidad para particulares y pequeñas empresas.
¿La buena noticia? El lanzamiento de GPT-5 hará -crucemos los dedos- que GPT-4 se convierta en el nuevo modelo gratuito de OpenAI.
El futuro de ChatGPT
La próxima generación de grandes modelos lingüísticos revolucionará la forma en que interactuamos con la IA en nuestra vida cotidiana. En la conferencia Tech de Bloomberg,Brad Lightcap, director de operaciones de OpenAI , dejó entrever cómo la empresa planea revolucionar la interacción entre humanos y ordenadores, haciendo que GPT pase de ser un LLM a un modelo con capacidades similares a las de un agente.
"¿Existirá el ingeniero rápido en 2026?". Dijo Lightcap. "No se le hace ingeniería a un amigo".
Un modelo más capaz y personalizado, con más capacidades multimodales, promete justo lo que Altman y OpenAI esperan: lo inimaginable. El esperado GPT-5 estará un paso más cerca.
El poder de GPT, a medida
¿Y si tu chatbot de IA se sincronizara automáticamente con cada actualización de GPT ?
Botpress ha proporcionado soluciones de chatbot de IA personalizables desde 2017, proporcionando a los desarrolladores las herramientas que necesitan para crear fácilmente chatbots con la potencia de la última LLMs. Los chatbots de Botpress pueden entrenarse en fuentes de conocimiento personalizadas -como su sitio web o catálogo de productos- e integrarse perfectamente con los sistemas empresariales.
Botpress , la única plataforma que va desde la configuración sin código hasta la personalización y ampliación infinitas, le permite obtener automáticamente la potencia de la última versión de GPT en su chatbot, sin esfuerzo.
Empieza a construir hoy mismo. Es gratis.
Índice
Manténgase al día de lo último en chatbots de IA
Comparte esto en: