Dataconomy ES
Subscribe
No Result
View All Result
Dataconomy ES
Subscribe
No Result
View All Result
Dataconomy ES
No Result
View All Result

GPT-5.2 todavía cuenta dos r en fresa

byKerem Gülen
15 diciembre 2025
in Inteligencia Artificial, Noticias
Home Noticias Inteligencia Artificial
Share on FacebookShare on Twitter
Google Preferred Source

ChatGPT, impulsado por el modelo GPT-5.2 de OpenAI lanzado en diciembre de 2025, identifica incorrectamente dos r en la palabra fresa, que contiene tres, porque su proceso de tokenización divide la palabra en fresa, cruda y baya, y solo dos tokens contienen r. Los sistemas de inteligencia artificial modernos demuestran competencia para generar imágenes de marketing únicas, compilar informes a través de navegadores agentes y producir canciones que encabezan las listas de éxitos. Estas capacidades destacan una amplia capacitación en vastos conjuntos de datos, lo que permite el reconocimiento de patrones para resultados complejos. Por el contrario, ciertas tareas básicas desafían estos modelos. Contar las letras de una sola palabra representa una de esas tareas, accesible sin dificultad a un niño de siete años. La pregunta específica que se examina es cuántas r aparecen en la fresa. La palabra fresa se compone de las letras fresa. La inspección visual confirma tres erres: una después de la t y dos consecutivas en la porción de bayas. Esta consulta ha persistido como prueba del rendimiento de la IA en múltiples iteraciones del modelo. Tras el lanzamiento en diciembre de 2025 de GPT-5.2las pruebas confirmaron que la respuesta de ChatGPT seguía siendo dos erres. Las versiones anteriores mostraban incertidumbre o comportamiento errático sobre esta cuestión. El último modelo arrojó una respuesta directa de dos, sin desviarse. Este resultado persiste a pesar de las inversiones que superan los miles de millones de dólares, las elevadas demandas de hardware, incluidos los aumentos de precios de la RAM, y el sustancial consumo global de agua vinculado a la infraestructura de capacitación. El problema surge del diseño tokenizado de entrada y salida de grandes modelos de lenguaje como ChatGPT. El texto ingresado se divide en tokens, que son fragmentos como palabras completas, sílabas o partes de palabras. El modelo procesa estos tokens en lugar de letras individuales. En consecuencia, el recuento de letras se basa en el contenido simbólico más que en una enumeración precisa de las letras. La herramienta OpenAI Tokenizer ilustra este proceso. Al ingresar a la fresa, se obtienen tres fichas: st, cruda, baya. La primera ficha st no contiene r. El segundo token sin procesar incluye una r. La tercera baya simbólica incluye dos r pero funciona como una sola ficha. El modelo asocia las r con dos fichas, lo que lleva a la cuenta de dos. Este patrón de tokenización afecta a palabras similares. Raspberry se divide en tokens comparables, lo que hace que ChatGPT también informe dos r para esa palabra. La ficha de baya comprime varias letras en una unidad, infravalorando las instancias de letras individuales dentro de ella. ChatGPT funciona como un motor de predicción, aprovechando patrones de datos de entrenamiento para anticipar elementos posteriores. GPT-5.x incorpora el método de tokenización o200k_harmony, introducido con los modelos OpenAI o4-mini y GPT-4o. Este esquema actualizado apunta a la eficiencia pero conserva la discrepancia en el recuento de r de fresa. ChatGPT se lanzó a finales de 2022 en medio de numerosos desafíos basados ​​en tokens. Frases específicas desencadenaron respuestas excesivas o fallas de procesamiento. OpenAI abordó muchos de ellos mediante ajustes de capacitación y mejoras del sistema en los años siguientes. Las pruebas de verificación de problemas clásicos mostraron mejoras. ChatGPT deletrea con precisión Mississippi, identificando las letras mississippi con las frecuencias correctas: una m, cuatro i, cuatro s, dos p. También invierte lollipop en popillol, preservando todas las letras en la secuencia adecuada. Los modelos de lenguaje grandes exhiben limitaciones persistentes en el conteo exacto de cantidades pequeñas. Se desempeñan bien en matemáticas y resolución de problemas, pero fallan en el recuento preciso de letras o palabras en cadenas breves. Un ejemplo histórico notable es el de la cadena solidgoldmagikarp. En GPT-3, esta frase interrumpió la tokenización, provocando resultados erráticos que incluían insultos de los usuarios y texto ininteligible. Consultar GPT-5.2 en solidgoldmagikarp produjo una alucinación. El modelo lo describió como una broma secreta de Pokémon incrustada en los repositorios de GitHub por los desarrolladores. La activación supuestamente transforma avatares, íconos de repositorio y otras características en elementos con temática de Pokémon. Esta afirmación carece de fundamento en la realidad y refleja efectos residuales de problemas de tokenización anteriores. Las pruebas comparativas con otros modelos de IA arrojaron resultados correctos para la pregunta de la fresa. La perplejidad contó las tres erres. Claude proporcionó la cuenta exacta de tres. Grok identificó las tres erres en la fresa. Géminis respondió correctamente con tres. Qwen confirmó las tres erres. Copilot también informó las tres erres. Estos modelos emplean distintos sistemas de tokenización, lo que permite una identificación precisa de las letras incluso cuando funcionan con las arquitecturas subyacentes de OpenAI.


Crédito de imagen destacada

Tags: abiertaAIchatgptgpt-5.2

Related Posts

Sony revela God of War: Laufey para PS5

Sony revela God of War: Laufey para PS5

3 junio 2026
Microsoft presenta Surface RTX Spark Dev Box para cargas de trabajo de IA

Microsoft presenta Surface RTX Spark Dev Box para cargas de trabajo de IA

3 junio 2026
Anthropic invita a 150 organizaciones más al Proyecto Glasswing

Anthropic invita a 150 organizaciones más al Proyecto Glasswing

3 junio 2026
June Android Drop trae herramientas de seguridad y funciones de búsqueda más inteligentes

June Android Drop trae herramientas de seguridad y funciones de búsqueda más inteligentes

3 junio 2026
Microsoft presenta el Proyecto Solara para un futuro en el que el agente será el primero

Microsoft presenta el Proyecto Solara para un futuro en el que el agente será el primero

3 junio 2026
X lanza respuestas en video estilo TikTok para publicaciones

X lanza respuestas en video estilo TikTok para publicaciones

3 junio 2026

Recent Posts

  • Las reglas de exclusión voluntaria de la búsqueda de IA de Google provocan el lanzamiento del navegador Enviromates
  • Sony revela God of War: Laufey para PS5
  • Los investigadores desbloquean una mejora 20 veces mayor en experimentos con láser ultrarrápidos
  • Microsoft presenta Surface RTX Spark Dev Box para cargas de trabajo de IA
  • Según los informes, los nuevos chips Core Ultra de Intel son escasos

Recent Comments

No hay comentarios que mostrar.
Dataconomy ES

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies to improve your experience. You can choose to accept or reject them. Visit our Privacy Policy.