Alibaba liberado Qwen3, una familia de modelos de IA que la compañía afirma coincidir y, a veces, supera a los mejores modelos de Google y OpenAI, el lunes. Los modelos varían en tamaño desde 0.6 mil millones de parámetros hasta 235 mil millones de parámetros y están disponibles para descargar bajo una licencia «abierta» desde la plataforma AI Dev Cara abrazada y Github.
Los modelos QWEN3 se describen como «híbridos» porque pueden tomarse el tiempo para «razonar» a través de problemas complejos o responder solicitudes más simples rápidamente. Esta capacidad de razonamiento permite que los modelos se revisen de manera efectiva, similar al modelo O3 de OpenAI, pero con mayor latencia. Según el equipo de Qwen, tienen «modos de pensamiento y sin pensamiento sin problemas, ofreciendo a los usuarios la flexibilidad de controlar el presupuesto de pensamiento».
Algunos modelos QWEN3 adoptan una mezcla de arquitectura de expertos (MOE), que puede ser más computacionalmente eficiente para responder consultas. MOE divide las tareas en subtareas y las delega a modelos «expertos» más pequeños y especializados. Los modelos admiten 119 idiomas y fueron entrenados en un conjunto de datos de casi 36 billones de tokens, incluidos libros de texto, pares de preguntas y respuestas, fragmentos de código y datos generados por IA.

Alibaba Las afirmaciones de que las capacidades de Qwen3 han mejorado enormemente en comparación con su predecesor, QWEN2. El modelo QWEN3 más grande, QWEN-3-235B-A22B, funciona de manera competitiva en evaluaciones de referencia, superando a O3-Mini de OpenAI y Gemini 2.5 Pro de Google en CodeForces, una plataforma para concursos de programación. También supera a O3-Mini en la última versión de AIME, un punto de referencia matemático desafiante, y BFCL, una prueba para evaluar la capacidad de un modelo para razonar sobre los problemas.

Si bien QWEN-3-235B-A22B no está disponible públicamente, el modelo público público más grande, QWEN3-32B, sigue siendo competitivo con varios modelos IA propietarios y abiertos. QWEN3-32B supera el modelo O1 de OpenAI en varias pruebas, incluido el referencia de codificación LivecodeBench. Alibaba dice que QWEN3 sobresale en las capacidades de llamado de herramientas, siguientes instrucciones y copia de formatos de datos específicos.
Tuhin Srivastava, cofundador y CEO de AI Cloud Host Baseten, señaló que Qwen3 es otro ejemplo de modelos abiertos que mantienen ritmo con sistemas de código cerrado como OpenAI. Agregó que modelos como Qwen3 probablemente se utilizarán a nivel nacional, a pesar de las restricciones de los Estados Unidos en las ventas de chips a China.
Qwen3 está disponible para descargar y a través de proveedores de nubes, incluidos los fuegos artificiales IA e hiperbólicos.