GPT-4o mini es el último modelo rentable de OpenAI que utilizará ChatGPT gratuito. Su objetivo es mejorar a sus predecesores en términos de rendimiento y eficiencia. ¡Además, tiene capacidades de generación de imágenes!
Si bien OpenAI no ha revelado el tamaño exacto del modelo, GPT-4o mini es comparable a otros modelos de IA pequeños como Haiku de Claude y Géminis 1.5 FlashEn este artículo los compararemos para descubrir cuál es mejor. Pero primero, entendamos qué ofrece mejor el GPT-4o mini.
¿Qué es GPT-4o mini?
GPT-4o mini es el último modelo de IA de OpenAI, diseñado para reemplazar el ampliamente utilizado ChatGPT 3.5que utiliza el ChatGPT gratuito. Ofrece un rendimiento mejorado, tiempos de respuesta más rápidos y nuevas funcionalidades como la generación de imágenes, además de ser más rentable. El modelo es versátil y adecuado para diversas aplicaciones, desde la creación de contenido y la resolución de problemas hasta el análisis de datos complejos y la generación de código. Estos son sus puntos de referencia mejorados:
- MMLU (Comprensión masiva del lenguaje multitarea):El modelo obtuvo una puntuación del 82%, lo que refleja su sólida capacidad de razonamiento en diversos temas.
- MGSM (Fusión de escuelas primarias de matemáticas)Con una puntuación del 87%, GPT-4o mini destaca en el razonamiento matemático, lo que lo hace experto en la solución de problemas lógicos y la generación de bacalao.

Buenas noticias: GPT-4o mini puede generar imágenes
GPT-4o mini puede procesar tanto texto como imágenes, a diferencia de su predecesor, ChatGPT 3.5, que se limitaba a texto. Esta doble capacidad permite un procesamiento de información más completo y preciso, lo que permite que el modelo comprenda y genere contenido de múltiples fuentes simultáneamente. Entonces, ¿qué hay más?
GPT-4o mini ofrece respuestas en hasta 10 segundos, una mejora significativa con respecto al tiempo de respuesta de 20 segundos de ChatGPT 3.5. El modelo tiene una tasa de rendimiento promedio de 202 tokens por segundo, más del doble de rápido que los modelos anteriores, lo que lo hace ideal para aplicaciones que requieren respuestas rápidas.
El modelo puede procesar hasta 128.000 tokens a la vez, lo que equivale a la longitud de un libro promedio. Esta gran ventana de contexto garantiza la coherencia y la relevancia en interacciones prolongadas o cuando se trabaja con documentos extensos.

El precio de la mini API GPT-4o es su punto fuerte
Uno de los aspectos más destacables del GPT-4o mini es su relación coste-beneficio:
- Precios de la mini API GPT-4o:El modelo tiene un precio de 15 centavos por millón de tokens de entrada y 60 centavos por millón de tokens de salida. Esta estructura de precios es un 60 % más barata que GPT-3.5 Turbo, lo que hace que las capacidades avanzadas de IA sean más accesibles para un público más amplio.
El menor costo de funcionamiento del nuevo modelo OpenAI abre las puertas a una adopción más amplia en diversas industrias y regiones, lo que beneficia especialmente a las pequeñas y medianas empresas o a los desarrolladores con presupuestos limitados. Entonces, ¿es GPT-4o mini lo suficientemente potente a pesar de su rentabilidad?
Comparación de modelos OpenAI: GPT-4 Turbo vs GPT-4 vs GPT-4o vs GPT-4o mini vs GPT-3.5 Turbo
Primero, entendamos la posición de GPT-4o mini en la biblioteca OpenAI:
Modelo | Exactitud (%) | Universidad de Michigan | Acreditación de calidad general | GOTA | MSM | MATEMÁTICAS | Evaluación humana | Universidad Médica Metropolitana | Matemáticas Vista |
Turbo GPT-4 | 91.0 | 56.0 | 86.0 | 93.0 | 79.0 | 93.5 | 71.0 | 61.0 | 66.0 |
GPT-4 | 90.0 | 55.0 | 85.0 | 92.0 | 78.0 | 92,5 | 70.5 | 60.0 | 65.0 |
GPT-4o mini | 82.0 | 40.2 | 79,7 | 87.0 | 70.2 | 87.2 | 59.4 | 56,7 | 63.8 |
GPT-4o | 88.7 | 53.6 | 83.4 | 90,5 | 76.6 | 90.2 | 69.1 | 0.0 | 0.0 |
GPT-3.5 Turbo | 69.8 | 30.8 | 70.2 | 56.3 | 43.1 | 68.0 | 0.0 | 0.0 | 0.0 |
La comparación de los modelos de IA revela que GPT-4 Turbo lidera con el rendimiento general más alto, con un puntaje de 91% en precisión, 56% en MMLU, 93,5% en MATH y 79% en MGSM. GPT-4 le sigue de cerca, quedando ligeramente por detrás en la mayoría de las categorías. GPT-4o mini, si bien es menos potente que GPT-4 y GPT-4 Turbo, aún muestra capacidades significativas, particularmente con una precisión notable del 82% y un sólido desempeño en tareas matemáticas (MGSM 70,2%, MATH 87,2%). GPT-4o también se destaca como un desempeño sólido, particularmente sobresaliendo en GPQA (83,4%) y DROP (90,5%). Por el contrario, GPT-3.5 Turbo demuestra un rendimiento considerablemente menor en todas las métricas, lo que resalta los avances logrados en los modelos posteriores.
Comparación entre GPT-4o mini y Gemini Flash y Claude Haiku
Ahora es el momento de comparar el GPT-4o mini con sus competidores:
Modelo | Exactitud (%) | Universidad de Michigan | Acreditación de calidad general | GOTA | MSM | MATEMÁTICAS | Evaluación humana | Universidad Médica Metropolitana | Matemáticas Vista |
Géminis avanzado | 87.0 | 52.0 | 82.0 | 90.0 | 74.0 | 90.0 | 67.0 | 57.0 | 62.0 |
Geminis | 85.0 | 50.0 | 80.0 | 88.0 | 72.0 | 88,5 | 65.0 | 55.0 | 60.0 |
GPT-4o mini | 82.0 | 40.2 | 79,7 | 87.0 | 70.2 | 87.2 | 59.4 | 56,7 | 63.8 |
Haiku de Claude | 73.8 | 35.7 | 78.4 | 71.7 | 40.9 | 75,9 | 50.2 | 46.4 | 0.0 |
Flash de Géminis | 77,9 | 38.6 | 78.4 | 75,5 | 40.9 | 71,5 | 56.1 | 58.4 | 0.0 |
Gemini Advanced y Gemini lideran en rendimiento general. Gemini Advanced obtuvo la puntuación más alta en MMLU (52 %) y logró buenos resultados en GPQA (82 %), DROP (90 %) y MATH (90 %). Pero, aunque el nuevo modelo OpenAI se acerca a ellos, no son sus competidores naturales.
Si analizamos Claude Haiku y Gemini Flash, vemos que sus métricas de rendimiento son más bajas. Claude Haiku tiene dificultades en particular en MGSM (40,9 %) y MMMU (46,4 %), y Gemini Flash muestra resultados moderados, pero carece de puntuaciones en MathVista.

En conclusiónGPT-4o mini presenta una alternativa atractiva a los modelos anteriores como GPT-3.5 Turbo y a los competidores más nuevos como Claude Haiku y Gemini Flash. Si bien no es tan avanzado como GPT-4 Turbo o Gemini Advanced, GPT-4o mini se destaca por su rendimiento mejorado. Su capacidad dual para procesar texto e imágenes, junto con una ventana de contexto sustancial y un precio competitivo, lo posiciona como una opción versátil y accesible tanto para empresas como para desarrolladores. A pesar de la fuerte competencia de modelos como Gemini Advanced, el nuevo modelo OpenAI ofrece una combinación equilibrada de rendimiento y asequibilidad, lo que garantiza su relevancia en el panorama de la IA en constante evolución.
Crédito de la imagen destacada: Eray Eliaçik/Bing