Introducción a GPT5
GPT5 es el nuevo modelo de inteligencia artificial desarrollado por OpenAI, considerado el mejor hasta la fecha por su capacidad avanzada en múltiples áreas. Este modelo destaca por su habilidad para generar animaciones educativas, interfaces complejas y simulaciones tridimensionales con un solo prompt.
Comparaciones Destacadas con Otros Modelos
- Interfaz y programación: GPT5 supera a Cloth Opus 4 y otros modelos en la creación de interfaces como pagodas tridimensionales y juegos completos como Tetris.
- Simulaciones científicas: Puede construir sistemas solares tridimensionales con información detallada y hasta recrear Minecraft con un solo comando.
Ventana de Contexto y Capacidad de Memoria
- GPT5 ofrece una ventana de contexto de 400,000 tokens, con capacidad de respuesta de hasta 128,000 tokens.
- Esta capacidad supera a modelos como Grock 4 (256,000 tokens) y solo es superada por Gemini 2.5 Pro de Google (1 millón de tokens).
- La gestión del contexto es superior, con una retención del 95.2%, evitando el problema de "context rot" que afecta a otros modelos.
Rendimiento en Pruebas y Benchmarks
- GPT5 lidera en pruebas matemáticas como Frontier Mat y en razonamiento de contexto largo con un 76% de efectividad.
- Aunque Grock 4 supera a GPT5 en algunos tests específicos como GPQA Diamond y Arc AGI, GPT5 mantiene un rendimiento competitivo y consistente.
Reducción de Alucinaciones
- OpenAI ha logrado minimizar significativamente las alucinaciones, es decir, la generación de datos falsos o inventados por el modelo.
- Esto es crucial para aplicaciones profesionales, especialmente en programación, donde la precisión es vital. Para más información sobre este tema, consulta nuestro artículo sobre Nuevos Modelos GPT-4.1 de OpenAI: Comparativa y Análisis.
Precio y Eficiencia
- GPT5 ofrece un balance óptimo entre costo y rendimiento, siendo más barato que modelos superiores y con mejor rendimiento que modelos más económicos.
- Su eficiencia en tokens de entrada y salida lo posiciona favorablemente en el mercado. Para una comparación más detallada, revisa Nuevos Modelos de OpenAI: O3 y O4 Mini - Análisis y Comparativa.
Recomendaciones para Usuarios y Desarrolladores
- Se aconseja mantener una mente abierta y probar diferentes modelos según las necesidades específicas, evitando el fanatismo por un solo modelo. Para entender mejor cómo funcionan estos modelos, puedes leer nuestra Introducción a los Modelos de Lenguaje Grande: ¿Qué son y cómo funcionan?.
- La evolución tecnológica puede estar entrando en una fase de maduración, similar a la de los smartphones, pero las mejoras en consistencia y reducción de errores pueden ser revolucionarias.
Conclusión
GPT5 representa un avance significativo en inteligencia artificial, combinando alta capacidad de contexto, reducción de errores y eficiencia en costos. Su adopción puede transformar la forma en que se utilizan los modelos de lenguaje en entornos profesionales y educativos. La clave está en experimentar, aprender y adaptarse continuamente a las innovaciones. Para más sobre las últimas innovaciones en IA, consulta OpenAI Launches GPT-5: Expert-Level AI Revolutionizes Coding, Learning, and Healthcare.
GPT5 o GPT5 es el nuevo modelo de Open AI, el mejor modelo que sacado Open AI. Los demos son bastante impresionantes.
Por ejemplo, este es un PR donde le dicen que le enseñe con una animación robótica cómo funciona algoritmo de
ordenamiento como BL Sort y fue con un solo prom que se generó el modelo. El mismo desarrollador hizo este modelo de
cómo enseñar el problema del túnel cuántico o quantum tunneling, que es bien difícil de explicar cuando una
partícula colapsa y tiene que ser o partícula o onda. superinesante. Hay un par de comparaciones, por ejemplo, esta
es una comparación y aquí en la parte de arriba ustedes van a ver el demo de Créeme una apagoda tridimensional creado
con GPT5 que construye toda esta interfaz interesantísima comparado con la pagoda en la parte de abajo creada
por Cloth Opus 4 que es hasta ahora o era hasta ahora el mejor modelo para programar. Otro ejemplo es en la parte
de arriba ustedes ven un Tetris completo creado por GPT5, tiene una interfaz más completa, más información junto con un
Tetris creado por Cloud, que de nuevo está bastante bien, muy completo. Solamente que uno puede argumentar que
pues el de arriba es mejor que el de abajo. Por último, aquí ustedes ven un demo de cómo funciona un sistema solar
tridimensional, incluyendo las órbitas, que incluye también información del sistema, entre otras cosas, creado por
GPT5 comparado con cómo funcionaría el mismo sistema solar creado por Cloud y un demo donde le dice constrúyeme
Minecraft y aquí con un solo shot, un solo prom está construyéndome Minecraft de un solo golpe. Artificial Analis. La
empresa detrás de los análisis de inteligencia artificial más populares encontró que GPT5 en su versión de más
alto razonamiento, high, es la inteligencia artificial más inteligente en este momento, por encima de GPT5
medium. Ojo, esto no significa que GPT5 haya pasado todos los tests, solamente significa que en la suite de pruebas que
usa Artificial Analysis, cuando promedian todos los demás, encontraron que es mejor. Recuerden que hasta ayer
el número uno era Grock 4 de XII y le seguía O3 y luego Gemini 2.5 Pro. Una de las cosas interesantes de GPT5 es que va
a matar este selector de modelos. persona no tenía este selector de modelos y le tocaba elegir que si voy a
usar 4 o tres o cuatro mini, etcétera. Y pues esto era muy confuso para muchas personas, sobre todo los que no son
desarrolladores. Más alarmante aún, una inmensa cantidad de personas ni siquiera sabía que este selector existía y siguen
usando GPT4O cuando us ancha GPT, sobre todo se ancha GPT gratis, lo que significa que están atrapados en una
versión vieja de inteligencia artificial. Esto se acaba y ahora GPT5 es uno solo. Un equivalente sería que
cuando uno usa GPT5 y el prom no requiere razonamiento fuerte, eso es como el equivalente a 4o. Y cuando
requiere razonamiento fuerte, GPT5 thinking, eso es el equivalente a O3. Ya para desarrolladores les quiero dar otro
par de datos. La ventana de contexto de GPT5 es una ventana de 400,000 tokens donde tiene una capacidad máxima de
128,000 tokens de respuesta. Tengan en mente que los tokens de la ventana de contexto, un token, si no lo saben, es
una palabra, sílaba o letra. Eso lo explicamos en el curso de fundamentos de ingeniería de software de Plaxi. Y para
desarrolladores ahondamos en ello en el de fundamentos de LLMs. Si tú quieres ganar mucho dinero, tienes que estar
tomando el curso de fundamentos de LLMs de Platin. Esos son los tokens. El estos modelos toman en cuenta en su un conteo
de tokens los tokens de razonamiento, esa cadena de pensamientos están pensando antes de responder, eso también
gasta tokens. ¿Dónde se ubica? Se ubica bastante bien. GPT5 con 400,000 tokens de ventana de contexto está por arriba
de GPT de Grock 4 que tiene 256,000 tokens de la versión anterior o 3 de cloud y solamente lo supera Gemini 2.5
Pro de Google que tiene una ventana contexto de un millón de tokens. Hay un lugar que se llama LM Arena o la arena
de los grandes modelos de lenguaje donde lo que hacen es que te muestran diferentes promps y no te dicen cuál es
el modelo que están funcionando y tú a ciegas eliges cuál te parece mejor. GPT5 lleva un tiempo largo corriendo en esta
arena y hasta ahora es el mejor de todos. Es número uno en todas las categorías, en programación, en proms
difíciles, en creatividad, en todas las categorías. Para que lo veamos más de cerca, en este momento el mejor modelo
de inteligencia artificial es GPT5, seguido de Jemini 2.5 Pro, luego O3, etcétera, etcétera. Grock 4 está de
quintas, pero eso es extraño porque en algunos tests Grock gana, por ejemplo, en este test que es el test Frontier Mat
de matemáticas, GPT5 es el campeón absoluto, los borró a todos. GPT5 es el mejor modelo en este momento en cuanto a
pruebas matemáticas, pero en este otro test que se le he mostrado muchas veces, GPQA Diamond, que es un test de
preguntas de nivel de doctorado, de PhD, preguntas de ciencia, Grock 4 ganó, GPT5 está muy cerca, pero Grock 4 ganó. Y
luego está el test más famoso de todos, que es el Arc AGI. Es un test de inteligencia artificial general donde
crearon una serie de preguntas y una serie de test hechos por humanos. Ustedes ven ahí en la esquinita el panel
de humanos que está bien bien por arriba. Todavía estamos muy lejos de que ese T sea conquistado. Grock 4 está un
poquitico por arriba de GPT5. GPT5 no superó a Grock en este test. Síó a la mayoría de los Grocks, excepto el
Grock Heavy, que es el Grock con agentes que piensa por horas en Humanity SAM. Yo les he contado antes en otros videos de
Platy que Humanity Last Exam o el último examen de la humanidad es un examen gigantesco de miles y miles de preguntas
de nivel experto a lo largo de todos los contextos del conocimiento humano. En este GPT5 quedó un poquitico por detrás
de Grock y ya estamos a un 45% de haber completado este examen. Hace un año era menos del 8%.
Pero entonces, ¿qué es mejor o no? Y aquí es donde se pone como complicada la cosa porque miren este otro test. Esto
lo publica Open AI y muestra qué tanto del contexto se mantiene a lo largo de una gran conversación con GPT5. ¿A usted
no les ha pasado que a medida que el chat se hace más grande y más grande y más grande y más grande, a veces al chat
se le olvidan cosas? Como que les pregunta lo mismo que les preguntó antes. Por ejemplo, en el video de la
semana pasada o en el video de hace unos días, yo publiqué eh el lanzamiento de los modelos de código abierto, no de
código abierto, los modelos de pesos abiertos de Open AI. el Open AI OSS 20B y 120B lo estuve corriendo en mi laptop
y funcionó superb, pero empecé a hacer una de esas pruebas, hice una prueba larga, hice una prueba que más o menos
me comió el 70% de la ventana de contexto y cuando yo lle con el 30% de la ventana de contexto empezó a
olvidarse de lo que estábamos hablando y me hacía las mismas preguntas, las mismas preguntas y las mismas preguntas.
Este problema se llama context rot, que es la pérdida y degradación del contexto. Y es un problema gigantesco.
Open AI O3 se acordaba de la mitad, del 55% del contexto y más allá del 55% se empezaba a olvidar. GPT5 es el primer
modelo en su pensamiento alto que básicamente no se le olvida, su capacidad de recordación es del 95.2%.
Esta es la razón por la que casi nadie usa Grock en un entorno profesional serio. Cuando ustedes miran este
gráfico, ustedes ven aquí en verde Grock, en azul Gemini 2.5 Pro, que solía ser el mejor, y en naranja GPT5, que es
el mejor ahora. Esta prueba se llama Needle in a Hstack o la aguja en un pajar y muestra en cuanto más crece la
ventana de contexto, cuánto se le olvidan. Yo tenía una regla con mi equipo eh de ingeniería de inteligencia
artificial en Platzi, donde yo les decía que cualquier cosa que estuviera más allá del 10% de la ventana de contexto,
realmente los modelos lo iban a olvidar, porque eso era lo que era la verdad más o menos hace medio año, incluso menos.
Miren que en este caso en naranja GPT5 recuerda más del 90% en la gran mayoría de tamaños de la ventana de contexto y
un casi el 90% para los 256,000 tokens. Gemini 2.5 Pro recuerda más del 80%, pero es un poquito peor. Donde Grock
después de los 32,000 tokens simplemente se le olvida todo y más allá de 64,000 tokens, Grock es completamente
no no se puede confiar en él. es es desconfiar por defecto. Artificial Analisis lanzó un nuevo test, un nuevo
benchmark, una nueva prueba que lo llaman el long context reasoning para razonar alrededor de largas ventanas de
contexto. Esto es importante, por ejemplo, cuando uno está usando agentes que programan como Cloth Code, cursor,
Gemine Cly, etcétera. Y GPT5 es mejor, es mejor que todos por mucho. En estas pruebas GPT5 logró el 76%. Para que se
hagan una idea, eh, Quen, que es el modelo de pesos abiertos de Alibabá, tiene un 67%, Grock tiene un 68, OT es
un 69 y Cloud Sonet tiene 65%. Lo otro es que es barato, no es superbarato, pero es barato comparado
con la cantidad de memoria que tiene. Observen esto es un gráfico que hice irónicamente con Cloth Opus 4.1 donde
muestro el precio. Esto es precio por tokens de salida de respuesta y esto es precio por tokens de entrada y pero es
muy parecido. GPT5 lo tienen en toda la mitad y observen cómo está muy bien a nivel de precio. Los únicos modelos más
baratos que GPT5 son modelos inferiores a GPT5. El precio en toques de entrada es muy parecido a GMI 2.5 Pro,
igualmente en precio, en token de salida, pero a nivel de razonamiento es más fuerte. Está este gráfico que
muestra el rendimiento de un modelo comparado con su costo total. Entre más arriba y a la izquierda, el modelo es
mejor y GPT5 se los comió a todos. Miren lo caro caro que es Grock 4, por ejemplo, en este modelo. Y Jevini 2.5
Pro solía ser un modelo muy bueno y aún así no está tan bueno a nivel de precio, lo cual es sorprendente porque Google
son los pioneros en crear un chip especializado para multiplicaciones matriciales, que es uno de los problemas
más grandes de la inteligencia artificial, este chip conocido como las TPUs o tensor processor units. Otra gran
innovación que tiene GPT5 es que es aparentemente super bueno para evitar alucinaciones. Me sorprendió que cuando
estoy hablando de esto en mi cuenta de Twitter esta mañana cuando lanzó cuando lanzaron Open AI el modelo
originalmente, la pregunta más recurrente era, ¿qué son alucinaciones? Es chistoso porque pasa el tiempo y a
pesar de que uno en la industria usa y usa y usa estas estos e como estos términos, a la gente se le olvida. a la
gente se le olvida y como que no no está tan presente algo que no cree que está presente. Todo bien, yo les explico.
Solamente me pareció curioso porque las alucinaciones era de lo único que hablábamos hace año y medio. Es cuando
el modelo se inventa datos que no son verdad. También se le conoce como mentir, pero en mente que estos modelos
hablan con muchísima autoridad. Estos modelos dicen, "Por supuesto, yo te puedo decir que la cura para el cáncer
es la chiquitolina, pero pues no." E Open AI aparentemente logró solucionar el problema de las alucinaciones. Esto
es importantísimo, sobre todo cuando uno programa. A mí siempre me pasaba cuando yo programo con con estos modelos de AI,
que a veces se inventaba métodos en que no existían en un API o funciones que no existían en una librería y era
superfustrante, me tocaba decirle, "Esta esta función no existe." Oh, sí, tienes toda la razón. Eres un programador
increíble y tu lomo plateado me inspira todos los días. Voy a arreglar el código y lo volví lo volví a Es
impresionante. Esto lo solucionaron de una manera muy radical, las alucinaciones se resolvieron. Dicho eso,
yo casi que no tenía problemas con alucinaciones con O3, sobre todo en entornos de código, pero igual chévere.
Ahora sí tiene sus cosas. Por ejemplo, este es el gráfico con el que lanzaron en el streaming. Y si ustedes piensan
ese gráfico, ¿cómo es posible que el número 69.1 esté por debajo del 52.8 a la izquierda y al mismo nivel del 30.8 a
la derecha. Estos son gráficos claramente la una empresa de miles de millones de dólares con un
lanzamiento de miles de millones de dólares super importante, comete estas cagadas. Es como, "Comon, esto es un
errorzote." Y no es el único error que cometieron. Durante el streaming de Open AI lanzaron este gráfico supercool de
cómo se ve el efecto vernuli, que es un efecto que ocurre en las alas de los aviones y supuestamente aquí está
explicando cómo funciona y es un gráfico que habla de cómo se acabaron las empresas de educación y cómo aquí vamos
a enseñar mejor porque la inteligencia artificial enseña mejor y esto es un mole de frontera, ¿no? Pues resulta que
esto está mal. Este demo del efecto Bernuli que mostraron en el streaming oficial de
Open AI es un mito de cómo vuelan los aviones y cómo funciona el efecto Bernuli.
Yo sé que acabo de hablar de las alucinaciones, pero OPI. En fin, más allá de eso, este es un gráfico
artificial analysis mostrando como en inteligencia otra vez Open AI es el mejor laboratorio. Lo había superado
antes Grock y un poquito antes lo había superado Google con Gemini 2.5 Pro. Por supuesto que estos laboratorios no se
van a no se van a quedar quietos y van a salir con cosas, pero quiero que lo tengan en mente. Lo que sí me gustaría
que evitáramos es una actitud que yo creo que es increíblemente dañina. Es una actitud que les sabotea sus carreras
y esa es actitud donde ustedes van a los comentarios y dicen, pues yo me quedo con x modelo porque lo prefiero porque
bla bla bla. Esta actitud los va a sabotear, les va a arruinar sus carreras. Escúchenme. Si ustedes tienen
esta actitud, esto es esto es tan estúpido como cuando la gente es fan de un político o de un banco. Imagínense
ser fan de un banco. No, estos son servicios. Lo que ustedes tienen que hacer es probarlos porque trabajan para
ustedes como un político o como un banco. Uno los prueba y uno mira cuál genera mayor ventaja para las
condiciones que uno tiene. Y uno va haciendo experimentos, uno va probando diferentes cosas. No se casen con un
modelo de AI, así como no se deberían casar nunca con un político. What the fuck. En cambio, lo que tienen que hacer
es probar. Siempre tengan una mente abierta. Esto de ser proselitistas respecto a que les gusta algo, lo que
realmente están diciendo es que ustedes le tienen miedo al cambio y que no quieren aprender cosas nuevas y este no
es este mundo. Hay que ir a probar. Si probaron el modelo y no les gustó y se están quedando con otro modelo porque en
las evaluaciones del mundo real que hicieron el modelo les resultó superior, se los acepto. Por favor, cuéntenme todo
lo que quieran. Me encantaría aprender. Yo, por ejemplo, tengo acceso a GPT5 y aún así muchos de los gráficos que les
mostré en esta presentación los terminé haciendo con el sistema de Artifacts de Antropic porque me parece superior. De
hecho, por más de que Open haya lanzado todo esto, resulta que Antropic, los dueños de Cloud, se están comiendo el
mercado enterprise de los Large Language Models. Es el modelo, es el modelo más caro, en costo no está tan bueno, pero
miren cómo está comiéndose el market share comparado con Open AI, de pronto porque tienen mejores vendedores,
váyanos a ver, pero les estoy yendo mucho mejor. Google también está agarrando un montón del mercado donde
meta está obviamente en caída libre. Y sí, es posible que GPT5 no haya sido el artificial general intelligence, que
todo el mundo esperaba que iba a cambiarlo todo de una manera increíble. Y hay personas que están relativa o
directamente eh decepcionadas con este lanzamiento. Parte de las personas de mi equipo estn
un poco decepcionadas con el lanzamiento, pero es posible también que estemos viendo la curva S de la
tecnología. Piensen en los smartphones. Los smartphones cuando despegaron con el iPhone y con los primeros Androids
fueron una explosión de innovación y hubo smartphones que murieron en el camino. La Palm, por ejemplo, la Palm
Pre era una gran máquina y Web OS era un sistema operativo superinesante o los Nokia Lumia con Windows Phone era un
sistema operativo también superinesante, pero luego fueron cerrándose y cerrándose y cerrándose y cerrándose y
efectivamente hubo una explosión que con el análisis del rostro y con la huella y la batería y la cámara y lo delgado y el
tamaño, pero ahora estamos en la etapa de maduración de los smartphones, donde ya no son una tecnología de punta hiper
revolucionaria hiperdruptiva, sino simplemente están integrados en nuestras vidas. Quién sabe si los modelos de
lenguaje vayan a llegar ahí, pero claramente se está desacelerando un poco el efecto exponencial tirándole
simplemente chips al problema. Eso sí, no descartemos que la evolución de Open AI con GPT5 reduciendo las alucinaciones
y reduciendo la cantidad de errores que genera para hacerlo más consistente sea tan trivial. Yo creo que eso puede ser
muy revolucionario y sobre todo revolucionario en precio por rendimiento. Lo importante realmente es
qué vamos a hacer con esto. Y pues ahora mi actitud, que espero que sea la actitud de ustedes, es ir a
experimentar, aprender y sobre todo nunca parar de aprender.
Heads up!
This summary and transcript were automatically generated using AI with the Free YouTube Transcript Summary Tool by LunaNotes.
Generate a summary for freeRelated Summaries

Nuevos Modelos GPT-4.1 de OpenAI: Comparativa y Análisis
OpenAI ha lanzado tres nuevos modelos de la serie GPT, incluyendo el GPT-4.1, GPT-4.1 Mini y GPT-4.1 Nano, diseñados para mejorar la programación y competir con otros modelos populares. En este video, se analizan sus características, rendimiento y se comparan con modelos como Cloud Sonet 3.7 y Gemini 2.5 Pro.

OpenAI Lanza Modelos Abiertos de IA para Uso Local en Laptops y Teléfonos
OpenAI ha lanzado dos modelos de inteligencia artificial abiertos y avanzados que pueden ejecutarse localmente en laptops y teléfonos, revolucionando el acceso y control sobre IA. Estos modelos ofrecen alta capacidad de razonamiento, gran ventana de contexto y velocidad, abriendo nuevas posibilidades para aplicaciones seguras y personalizadas.

OpenAI Launches GPT-5: Expert-Level AI Revolutionizes Coding, Learning, and Healthcare
OpenAI unveils GPT-5, a groundbreaking AI model delivering expert-level intelligence, faster performance, and enhanced reliability. This major upgrade empowers users with advanced coding capabilities, personalized learning, and transformative healthcare support, available to free and paid users alike.

Grock 4: Avances, Controversias y Comparativa en IA de Última Generación
Descubre cómo Grock 4 revolucionó el panorama de la inteligencia artificial con su impresionante capacidad de razonamiento y contexto, a pesar de controversias por respuestas inapropiadas. Analizamos su desempeño en pruebas clave, costos y su posición frente a otros modelos líderes como OpenAI y Google.

Nuevos Modelos de OpenAI: O3 y O4 Mini - Análisis y Comparativa
En este video se analizan los nuevos modelos de OpenAI, O3 y O4 Mini, destacando sus capacidades de razonamiento y mejoras en programación. Se comparan con versiones anteriores y se discuten sus aplicaciones y rendimiento en benchmarks.
Most Viewed Summaries

A Comprehensive Guide to Using Stable Diffusion Forge UI
Explore the Stable Diffusion Forge UI, customizable settings, models, and more to enhance your image generation experience.

Mastering Inpainting with Stable Diffusion: Fix Mistakes and Enhance Your Images
Learn to fix mistakes and enhance images with Stable Diffusion's inpainting features effectively.

How to Use ChatGPT to Summarize YouTube Videos Efficiently
Learn how to summarize YouTube videos with ChatGPT in just a few simple steps.

Pag-unawa sa Denotasyon at Konotasyon sa Filipino 4
Alamin ang kahulugan ng denotasyon at konotasyon sa Filipino 4 kasama ang mga halimbawa at pagsasanay.

Ultimate Guide to Installing Forge UI and Flowing with Flux Models
Learn how to install Forge UI and explore various Flux models efficiently in this detailed guide.