Tencent lanzó Hunyuan 2.0, un gran modelo de lenguaje con 406 mil millones de parámetros totales, el 5 de diciembre. Esta actualización apunta a avances en matemáticas, codificación y razonamiento complejo a través de una arquitectura de combinación de expertos y métodos de capacitación refinados. El modelo se presenta en dos variantes: Think e Instruct. Su arquitectura activa 32 mil millones de parámetros durante cada inferencia, lo que permite un procesamiento eficiente. Admite una ventana de contexto de 256.000 tokens, lo que permite el manejo de entradas extensas sin truncamiento. Tencent posiciona a HY 2.0 Think entre los de “nivel superior a nivel nacional” para tareas de razonamiento complejas. Esta versión supera a su predecesora, Hunyuan-T1-20250822, en múltiples áreas de evaluación. En el punto de referencia de matemáticas IMO-AnswerBench, HY 2.0 Think registró una puntuación de 73,4, lo que refleja fuertes capacidades de resolución de problemas en dominios matemáticos. En las evaluaciones de ingeniería de software, el rendimiento mejoró notablemente en el punto de referencia SWE-bench Verified, pasando de 6,0 para el modelo anterior a 53,0. Esta mejora demuestra una mayor precisión en la generación y depuración de código para desafíos de programación del mundo real. https://twitter.com/TencentHunyuan/status/1996948083377332614 Tencent atribuye estos avances a las mejoras en la calidad de los datos previos al entrenamiento y a un enfoque de aprendizaje reforzado en dos etapas. Esta estrategia integra RLVR, o aprendizaje por refuerzo con recompensas verificables, que utiliza métricas objetivas para la capacitación, y RLHF, o aprendizaje por refuerzo a partir de la retroalimentación humana, que incorpora evaluaciones humanas para perfeccionar los resultados. HY 2.0 Think aplica estrategias de penalización por duración para evitar una verbosidad excesiva en las respuestas, lo que da como resultado lo que Tencent llama eficiencia computacional por token «líder en la industria». Este diseño optimiza el uso de recursos durante la generación, reduciendo el tiempo y los costos de procesamiento. Las funcionalidades de codificación y agente también avanzaron, con la puntuación Tau2-Bench subiendo de 17,1 a 72,4. Estas métricas evalúan la ejecución autónoma de tareas y las interacciones relacionadas con el código. La integración se extiende a las aplicaciones de consumo de Tencent, como Yuanbao e ima, donde el modelo mejora las interacciones del usuario. Los desarrolladores pueden acceder a él a través de la plataforma API de Tencent Cloud para implementaciones personalizadas. Tencent planea abrir tecnologías y modelos relacionados con el código abierto para uso comunitario.





