GPT5: El Mejor Modelo de IA de OpenAI y sus Innovaciones Clave

Introducción a GPT5

GPT5 es el nuevo modelo de inteligencia artificial desarrollado por OpenAI, considerado el mejor hasta la fecha por su capacidad avanzada en múltiples áreas. Este modelo destaca por su habilidad para generar animaciones educativas, interfaces complejas y simulaciones tridimensionales con un solo prompt.

Comparaciones Destacadas con Otros Modelos

Interfaz y programación: GPT5 supera a Cloth Opus 4 y otros modelos en la creación de interfaces como pagodas tridimensionales y juegos completos como Tetris.
Simulaciones científicas: Puede construir sistemas solares tridimensionales con información detallada y hasta recrear Minecraft con un solo comando.

Ventana de Contexto y Capacidad de Memoria

GPT5 ofrece una ventana de contexto de 400,000 tokens, con capacidad de respuesta de hasta 128,000 tokens.
Esta capacidad supera a modelos como Grock 4 (256,000 tokens) y solo es superada por Gemini 2.5 Pro de Google (1 millón de tokens).
La gestión del contexto es superior, con una retención del 95.2%, evitando el problema de "context rot" que afecta a otros modelos.

Rendimiento en Pruebas y Benchmarks

GPT5 lidera en pruebas matemáticas como Frontier Mat y en razonamiento de contexto largo con un 76% de efectividad.
Aunque Grock 4 supera a GPT5 en algunos tests específicos como GPQA Diamond y Arc AGI, GPT5 mantiene un rendimiento competitivo y consistente.

Reducción de Alucinaciones

OpenAI ha logrado minimizar significativamente las alucinaciones, es decir, la generación de datos falsos o inventados por el modelo.
Esto es crucial para aplicaciones profesionales, especialmente en programación, donde la precisión es vital. Para más información sobre este tema, consulta nuestro artículo sobre Nuevos Modelos GPT-4.1 de OpenAI: Comparativa y Análisis.

Precio y Eficiencia

GPT5 ofrece un balance óptimo entre costo y rendimiento, siendo más barato que modelos superiores y con mejor rendimiento que modelos más económicos.
Su eficiencia en tokens de entrada y salida lo posiciona favorablemente en el mercado. Para una comparación más detallada, revisa Nuevos Modelos de OpenAI: O3 y O4 Mini - Análisis y Comparativa.

Recomendaciones para Usuarios y Desarrolladores

Se aconseja mantener una mente abierta y probar diferentes modelos según las necesidades específicas, evitando el fanatismo por un solo modelo. Para entender mejor cómo funcionan estos modelos, puedes leer nuestra Introducción a los Modelos de Lenguaje Grande: ¿Qué son y cómo funcionan?.
La evolución tecnológica puede estar entrando en una fase de maduración, similar a la de los smartphones, pero las mejoras en consistencia y reducción de errores pueden ser revolucionarias.

Conclusión

GPT5 representa un avance significativo en inteligencia artificial, combinando alta capacidad de contexto, reducción de errores y eficiencia en costos. Su adopción puede transformar la forma en que se utilizan los modelos de lenguaje en entornos profesionales y educativos. La clave está en experimentar, aprender y adaptarse continuamente a las innovaciones. Para más sobre las últimas innovaciones en IA, consulta OpenAI Launches GPT-5: Expert-Level AI Revolutionizes Coding, Learning, and Healthcare.

GPT5 o GPT5 es el nuevo modelo de Open AI, el mejor modelo que sacado Open AI. Los demos son bastante impresionantes.

Por ejemplo, este es un PR donde le dicen que le enseñe con una animación robótica cómo funciona algoritmo de

ordenamiento como BL Sort y fue con un solo prom que se generó el modelo. El mismo desarrollador hizo este modelo de

cómo enseñar el problema del túnel cuántico o quantum tunneling, que es bien difícil de explicar cuando una

partícula colapsa y tiene que ser o partícula o onda. superinesante. Hay un par de comparaciones, por ejemplo, esta

es una comparación y aquí en la parte de arriba ustedes van a ver el demo de Créeme una apagoda tridimensional creado

con GPT5 que construye toda esta interfaz interesantísima comparado con la pagoda en la parte de abajo creada

por Cloth Opus 4 que es hasta ahora o era hasta ahora el mejor modelo para programar. Otro ejemplo es en la parte

de arriba ustedes ven un Tetris completo creado por GPT5, tiene una interfaz más completa, más información junto con un

Tetris creado por Cloud, que de nuevo está bastante bien, muy completo. Solamente que uno puede argumentar que

pues el de arriba es mejor que el de abajo. Por último, aquí ustedes ven un demo de cómo funciona un sistema solar

tridimensional, incluyendo las órbitas, que incluye también información del sistema, entre otras cosas, creado por

GPT5 comparado con cómo funcionaría el mismo sistema solar creado por Cloud y un demo donde le dice constrúyeme

Minecraft y aquí con un solo shot, un solo prom está construyéndome Minecraft de un solo golpe. Artificial Analis. La

empresa detrás de los análisis de inteligencia artificial más populares encontró que GPT5 en su versión de más

alto razonamiento, high, es la inteligencia artificial más inteligente en este momento, por encima de GPT5

medium. Ojo, esto no significa que GPT5 haya pasado todos los tests, solamente significa que en la suite de pruebas que

usa Artificial Analysis, cuando promedian todos los demás, encontraron que es mejor. Recuerden que hasta ayer

el número uno era Grock 4 de XII y le seguía O3 y luego Gemini 2.5 Pro. Una de las cosas interesantes de GPT5 es que va

a matar este selector de modelos. persona no tenía este selector de modelos y le tocaba elegir que si voy a

usar 4 o tres o cuatro mini, etcétera. Y pues esto era muy confuso para muchas personas, sobre todo los que no son

desarrolladores. Más alarmante aún, una inmensa cantidad de personas ni siquiera sabía que este selector existía y siguen

usando GPT4O cuando us ancha GPT, sobre todo se ancha GPT gratis, lo que significa que están atrapados en una

versión vieja de inteligencia artificial. Esto se acaba y ahora GPT5 es uno solo. Un equivalente sería que

cuando uno usa GPT5 y el prom no requiere razonamiento fuerte, eso es como el equivalente a 4o. Y cuando

requiere razonamiento fuerte, GPT5 thinking, eso es el equivalente a O3. Ya para desarrolladores les quiero dar otro

par de datos. La ventana de contexto de GPT5 es una ventana de 400,000 tokens donde tiene una capacidad máxima de

128,000 tokens de respuesta. Tengan en mente que los tokens de la ventana de contexto, un token, si no lo saben, es

una palabra, sílaba o letra. Eso lo explicamos en el curso de fundamentos de ingeniería de software de Plaxi. Y para

desarrolladores ahondamos en ello en el de fundamentos de LLMs. Si tú quieres ganar mucho dinero, tienes que estar

tomando el curso de fundamentos de LLMs de Platin. Esos son los tokens. El estos modelos toman en cuenta en su un conteo

de tokens los tokens de razonamiento, esa cadena de pensamientos están pensando antes de responder, eso también

gasta tokens. ¿Dónde se ubica? Se ubica bastante bien. GPT5 con 400,000 tokens de ventana de contexto está por arriba

de GPT de Grock 4 que tiene 256,000 tokens de la versión anterior o 3 de cloud y solamente lo supera Gemini 2.5

Pro de Google que tiene una ventana contexto de un millón de tokens. Hay un lugar que se llama LM Arena o la arena

de los grandes modelos de lenguaje donde lo que hacen es que te muestran diferentes promps y no te dicen cuál es

el modelo que están funcionando y tú a ciegas eliges cuál te parece mejor. GPT5 lleva un tiempo largo corriendo en esta

arena y hasta ahora es el mejor de todos. Es número uno en todas las categorías, en programación, en proms

difíciles, en creatividad, en todas las categorías. Para que lo veamos más de cerca, en este momento el mejor modelo

de inteligencia artificial es GPT5, seguido de Jemini 2.5 Pro, luego O3, etcétera, etcétera. Grock 4 está de

quintas, pero eso es extraño porque en algunos tests Grock gana, por ejemplo, en este test que es el test Frontier Mat

de matemáticas, GPT5 es el campeón absoluto, los borró a todos. GPT5 es el mejor modelo en este momento en cuanto a

pruebas matemáticas, pero en este otro test que se le he mostrado muchas veces, GPQA Diamond, que es un test de

preguntas de nivel de doctorado, de PhD, preguntas de ciencia, Grock 4 ganó, GPT5 está muy cerca, pero Grock 4 ganó. Y

luego está el test más famoso de todos, que es el Arc AGI. Es un test de inteligencia artificial general donde

crearon una serie de preguntas y una serie de test hechos por humanos. Ustedes ven ahí en la esquinita el panel

de humanos que está bien bien por arriba. Todavía estamos muy lejos de que ese T sea conquistado. Grock 4 está un

poquitico por arriba de GPT5. GPT5 no superó a Grock en este test. Síó a la mayoría de los Grocks, excepto el

Grock Heavy, que es el Grock con agentes que piensa por horas en Humanity SAM. Yo les he contado antes en otros videos de

Platy que Humanity Last Exam o el último examen de la humanidad es un examen gigantesco de miles y miles de preguntas

de nivel experto a lo largo de todos los contextos del conocimiento humano. En este GPT5 quedó un poquitico por detrás

de Grock y ya estamos a un 45% de haber completado este examen. Hace un año era menos del 8%.

Pero entonces, ¿qué es mejor o no? Y aquí es donde se pone como complicada la cosa porque miren este otro test. Esto

lo publica Open AI y muestra qué tanto del contexto se mantiene a lo largo de una gran conversación con GPT5. ¿A usted

no les ha pasado que a medida que el chat se hace más grande y más grande y más grande y más grande, a veces al chat

se le olvidan cosas? Como que les pregunta lo mismo que les preguntó antes. Por ejemplo, en el video de la

semana pasada o en el video de hace unos días, yo publiqué eh el lanzamiento de los modelos de código abierto, no de

código abierto, los modelos de pesos abiertos de Open AI. el Open AI OSS 20B y 120B lo estuve corriendo en mi laptop

y funcionó superb, pero empecé a hacer una de esas pruebas, hice una prueba larga, hice una prueba que más o menos

me comió el 70% de la ventana de contexto y cuando yo lle con el 30% de la ventana de contexto empezó a

olvidarse de lo que estábamos hablando y me hacía las mismas preguntas, las mismas preguntas y las mismas preguntas.

Este problema se llama context rot, que es la pérdida y degradación del contexto. Y es un problema gigantesco.

Open AI O3 se acordaba de la mitad, del 55% del contexto y más allá del 55% se empezaba a olvidar. GPT5 es el primer

modelo en su pensamiento alto que básicamente no se le olvida, su capacidad de recordación es del 95.2%.

Esta es la razón por la que casi nadie usa Grock en un entorno profesional serio. Cuando ustedes miran este

gráfico, ustedes ven aquí en verde Grock, en azul Gemini 2.5 Pro, que solía ser el mejor, y en naranja GPT5, que es

el mejor ahora. Esta prueba se llama Needle in a Hstack o la aguja en un pajar y muestra en cuanto más crece la

ventana de contexto, cuánto se le olvidan. Yo tenía una regla con mi equipo eh de ingeniería de inteligencia

artificial en Platzi, donde yo les decía que cualquier cosa que estuviera más allá del 10% de la ventana de contexto,

realmente los modelos lo iban a olvidar, porque eso era lo que era la verdad más o menos hace medio año, incluso menos.

Miren que en este caso en naranja GPT5 recuerda más del 90% en la gran mayoría de tamaños de la ventana de contexto y

un casi el 90% para los 256,000 tokens. Gemini 2.5 Pro recuerda más del 80%, pero es un poquito peor. Donde Grock

después de los 32,000 tokens simplemente se le olvida todo y más allá de 64,000 tokens, Grock es completamente

no no se puede confiar en él. es es desconfiar por defecto. Artificial Analisis lanzó un nuevo test, un nuevo

benchmark, una nueva prueba que lo llaman el long context reasoning para razonar alrededor de largas ventanas de

contexto. Esto es importante, por ejemplo, cuando uno está usando agentes que programan como Cloth Code, cursor,

Gemine Cly, etcétera. Y GPT5 es mejor, es mejor que todos por mucho. En estas pruebas GPT5 logró el 76%. Para que se

hagan una idea, eh, Quen, que es el modelo de pesos abiertos de Alibabá, tiene un 67%, Grock tiene un 68, OT es

un 69 y Cloud Sonet tiene 65%. Lo otro es que es barato, no es superbarato, pero es barato comparado

con la cantidad de memoria que tiene. Observen esto es un gráfico que hice irónicamente con Cloth Opus 4.1 donde

muestro el precio. Esto es precio por tokens de salida de respuesta y esto es precio por tokens de entrada y pero es

muy parecido. GPT5 lo tienen en toda la mitad y observen cómo está muy bien a nivel de precio. Los únicos modelos más

baratos que GPT5 son modelos inferiores a GPT5. El precio en toques de entrada es muy parecido a GMI 2.5 Pro,

igualmente en precio, en token de salida, pero a nivel de razonamiento es más fuerte. Está este gráfico que

muestra el rendimiento de un modelo comparado con su costo total. Entre más arriba y a la izquierda, el modelo es

mejor y GPT5 se los comió a todos. Miren lo caro caro que es Grock 4, por ejemplo, en este modelo. Y Jevini 2.5

Pro solía ser un modelo muy bueno y aún así no está tan bueno a nivel de precio, lo cual es sorprendente porque Google

son los pioneros en crear un chip especializado para multiplicaciones matriciales, que es uno de los problemas

más grandes de la inteligencia artificial, este chip conocido como las TPUs o tensor processor units. Otra gran

innovación que tiene GPT5 es que es aparentemente super bueno para evitar alucinaciones. Me sorprendió que cuando

estoy hablando de esto en mi cuenta de Twitter esta mañana cuando lanzó cuando lanzaron Open AI el modelo

originalmente, la pregunta más recurrente era, ¿qué son alucinaciones? Es chistoso porque pasa el tiempo y a

pesar de que uno en la industria usa y usa y usa estas estos e como estos términos, a la gente se le olvida. a la

gente se le olvida y como que no no está tan presente algo que no cree que está presente. Todo bien, yo les explico.

Solamente me pareció curioso porque las alucinaciones era de lo único que hablábamos hace año y medio. Es cuando

el modelo se inventa datos que no son verdad. También se le conoce como mentir, pero en mente que estos modelos

hablan con muchísima autoridad. Estos modelos dicen, "Por supuesto, yo te puedo decir que la cura para el cáncer

es la chiquitolina, pero pues no." E Open AI aparentemente logró solucionar el problema de las alucinaciones. Esto

es importantísimo, sobre todo cuando uno programa. A mí siempre me pasaba cuando yo programo con con estos modelos de AI,

que a veces se inventaba métodos en que no existían en un API o funciones que no existían en una librería y era

superfustrante, me tocaba decirle, "Esta esta función no existe." Oh, sí, tienes toda la razón. Eres un programador

increíble y tu lomo plateado me inspira todos los días. Voy a arreglar el código y lo volví lo volví a Es

impresionante. Esto lo solucionaron de una manera muy radical, las alucinaciones se resolvieron. Dicho eso,

yo casi que no tenía problemas con alucinaciones con O3, sobre todo en entornos de código, pero igual chévere.

Ahora sí tiene sus cosas. Por ejemplo, este es el gráfico con el que lanzaron en el streaming. Y si ustedes piensan

ese gráfico, ¿cómo es posible que el número 69.1 esté por debajo del 52.8 a la izquierda y al mismo nivel del 30.8 a

la derecha. Estos son gráficos claramente la una empresa de miles de millones de dólares con un

lanzamiento de miles de millones de dólares super importante, comete estas cagadas. Es como, "Comon, esto es un

errorzote." Y no es el único error que cometieron. Durante el streaming de Open AI lanzaron este gráfico supercool de

cómo se ve el efecto vernuli, que es un efecto que ocurre en las alas de los aviones y supuestamente aquí está

explicando cómo funciona y es un gráfico que habla de cómo se acabaron las empresas de educación y cómo aquí vamos

a enseñar mejor porque la inteligencia artificial enseña mejor y esto es un mole de frontera, ¿no? Pues resulta que

esto está mal. Este demo del efecto Bernuli que mostraron en el streaming oficial de

Open AI es un mito de cómo vuelan los aviones y cómo funciona el efecto Bernuli.

Yo sé que acabo de hablar de las alucinaciones, pero OPI. En fin, más allá de eso, este es un gráfico

artificial analysis mostrando como en inteligencia otra vez Open AI es el mejor laboratorio. Lo había superado

antes Grock y un poquito antes lo había superado Google con Gemini 2.5 Pro. Por supuesto que estos laboratorios no se

van a no se van a quedar quietos y van a salir con cosas, pero quiero que lo tengan en mente. Lo que sí me gustaría

que evitáramos es una actitud que yo creo que es increíblemente dañina. Es una actitud que les sabotea sus carreras

y esa es actitud donde ustedes van a los comentarios y dicen, pues yo me quedo con x modelo porque lo prefiero porque

bla bla bla. Esta actitud los va a sabotear, les va a arruinar sus carreras. Escúchenme. Si ustedes tienen

esta actitud, esto es esto es tan estúpido como cuando la gente es fan de un político o de un banco. Imagínense

ser fan de un banco. No, estos son servicios. Lo que ustedes tienen que hacer es probarlos porque trabajan para

ustedes como un político o como un banco. Uno los prueba y uno mira cuál genera mayor ventaja para las

condiciones que uno tiene. Y uno va haciendo experimentos, uno va probando diferentes cosas. No se casen con un

modelo de AI, así como no se deberían casar nunca con un político. What the fuck. En cambio, lo que tienen que hacer

es probar. Siempre tengan una mente abierta. Esto de ser proselitistas respecto a que les gusta algo, lo que

realmente están diciendo es que ustedes le tienen miedo al cambio y que no quieren aprender cosas nuevas y este no

es este mundo. Hay que ir a probar. Si probaron el modelo y no les gustó y se están quedando con otro modelo porque en

las evaluaciones del mundo real que hicieron el modelo les resultó superior, se los acepto. Por favor, cuéntenme todo

lo que quieran. Me encantaría aprender. Yo, por ejemplo, tengo acceso a GPT5 y aún así muchos de los gráficos que les

mostré en esta presentación los terminé haciendo con el sistema de Artifacts de Antropic porque me parece superior. De

hecho, por más de que Open haya lanzado todo esto, resulta que Antropic, los dueños de Cloud, se están comiendo el

mercado enterprise de los Large Language Models. Es el modelo, es el modelo más caro, en costo no está tan bueno, pero

miren cómo está comiéndose el market share comparado con Open AI, de pronto porque tienen mejores vendedores,

váyanos a ver, pero les estoy yendo mucho mejor. Google también está agarrando un montón del mercado donde

meta está obviamente en caída libre. Y sí, es posible que GPT5 no haya sido el artificial general intelligence, que

todo el mundo esperaba que iba a cambiarlo todo de una manera increíble. Y hay personas que están relativa o

directamente eh decepcionadas con este lanzamiento. Parte de las personas de mi equipo estn

un poco decepcionadas con el lanzamiento, pero es posible también que estemos viendo la curva S de la

tecnología. Piensen en los smartphones. Los smartphones cuando despegaron con el iPhone y con los primeros Androids

fueron una explosión de innovación y hubo smartphones que murieron en el camino. La Palm, por ejemplo, la Palm

Pre era una gran máquina y Web OS era un sistema operativo superinesante o los Nokia Lumia con Windows Phone era un

sistema operativo también superinesante, pero luego fueron cerrándose y cerrándose y cerrándose y cerrándose y

efectivamente hubo una explosión que con el análisis del rostro y con la huella y la batería y la cámara y lo delgado y el

tamaño, pero ahora estamos en la etapa de maduración de los smartphones, donde ya no son una tecnología de punta hiper

revolucionaria hiperdruptiva, sino simplemente están integrados en nuestras vidas. Quién sabe si los modelos de

lenguaje vayan a llegar ahí, pero claramente se está desacelerando un poco el efecto exponencial tirándole

simplemente chips al problema. Eso sí, no descartemos que la evolución de Open AI con GPT5 reduciendo las alucinaciones

y reduciendo la cantidad de errores que genera para hacerlo más consistente sea tan trivial. Yo creo que eso puede ser

muy revolucionario y sobre todo revolucionario en precio por rendimiento. Lo importante realmente es

qué vamos a hacer con esto. Y pues ahora mi actitud, que espero que sea la actitud de ustedes, es ir a

experimentar, aprender y sobre todo nunca parar de aprender.

Keep this summary

Save it to LunaNotes and it becomes a real note in your library — editable, searchable, and ready to turn into flashcards or a diagram. Free to start.

Save to LunaNotes

Or summarise for another video.

This summary and transcript were automatically generated using AI with the Free YouTube Transcript Summary Tool by LunaNotes.

Related summaries

Nuevos Modelos GPT-4.1 de OpenAI: Comparativa y Análisis

OpenAI ha lanzado tres nuevos modelos de la serie GPT, incluyendo el GPT-4.1, GPT-4.1 Mini y GPT-4.1 Nano, diseñados para mejorar la programación y competir con otros modelos populares. En este video, se analizan sus características, rendimiento y se comparan con modelos como Cloud Sonet 3.7 y Gemini 2.5 Pro.

Comparativa Actualizada de Modelos de IA para Programación: GPT Codex 5.3 vs Opus 4.6

Analizamos en profundidad las últimas versiones de herramientas IA para programación, incluyendo GPT Codex 5.3 y Opus 4.6 Tropic. Evaluamos velocidad, precisión y usabilidad en proyectos reales, con especial atención a la eficiencia y mejoras agénticas para preparar a los desarrolladores de cara a 2026.

OpenAI Lanza Modelos Abiertos de IA para Uso Local en Laptops y Teléfonos

OpenAI ha lanzado dos modelos de inteligencia artificial abiertos y avanzados que pueden ejecutarse localmente en laptops y teléfonos, revolucionando el acceso y control sobre IA. Estos modelos ofrecen alta capacidad de razonamiento, gran ventana de contexto y velocidad, abriendo nuevas posibilidades para aplicaciones seguras y personalizadas.

OpenAI Launches GPT-5: Expert-Level AI Revolutionizes Coding, Learning, and Healthcare

OpenAI unveils GPT-5, a groundbreaking AI model delivering expert-level intelligence, faster performance, and enhanced reliability. This major upgrade empowers users with advanced coding capabilities, personalized learning, and transformative healthcare support, available to free and paid users alike.

Anthropic Cloud Sonet 4.5: El Mejor Modelo de Código del Mundo

Anthropic lanza Cloud Sonet 4.5, el modelo de código más avanzado para agentes complejos y análisis matemático. Descubre sus nuevas funciones como checkpoints, integración en IDEs y extensión para Chrome, además de su rendimiento superior frente a GPT-5.

GPT5: El Mejor Modelo de IA de OpenAI y sus Innovaciones Clave

Introducción a GPT5

Comparaciones Destacadas con Otros Modelos

Ventana de Contexto y Capacidad de Memoria

Rendimiento en Pruebas y Benchmarks

Reducción de Alucinaciones

Precio y Eficiencia

Recomendaciones para Usuarios y Desarrolladores

Conclusión

Related summaries

Nuevos Modelos GPT-4.1 de OpenAI: Comparativa y Análisis

Comparativa Actualizada de Modelos de IA para Programación: GPT Codex 5.3 vs Opus 4.6

OpenAI Lanza Modelos Abiertos de IA para Uso Local en Laptops y Teléfonos

OpenAI Launches GPT-5: Expert-Level AI Revolutionizes Coding, Learning, and Healthcare

Anthropic Cloud Sonet 4.5: El Mejor Modelo de Código del Mundo

Most viewed summaries

A Comprehensive Guide to Using Stable Diffusion Forge UI

Kolonyalismo at Imperyalismo: Ang Kasaysayan ng Pagsakop sa Pilipinas

Mastering Inpainting with Stable Diffusion: Fix Mistakes and Enhance Your Images

Pamamaraan at Patakarang Kolonyal ng mga Espanyol sa Pilipinas

How to Install and Configure Forge: A New Stable Diffusion Web UI

Start taking better notes today with LunaNotes