QWEN3 muestra que los modelos abiertos aún pueden rivalizar con gigantes cerrados

Alibaba liberado Qwen3, una familia de modelos de IA que la compañía afirma coincidir y, a veces, supera a los mejores modelos de Google y OpenAI, el lunes. Los modelos varían en tamaño desde 0.6 mil millones de parámetros hasta 235 mil millones de parámetros y están disponibles para descargar bajo una licencia «abierta» desde la plataforma AI Dev Cara abrazada y Github.

Los modelos QWEN3 se describen como «híbridos» porque pueden tomarse el tiempo para «razonar» a través de problemas complejos o responder solicitudes más simples rápidamente. Esta capacidad de razonamiento permite que los modelos se revisen de manera efectiva, similar al modelo O3 de OpenAI, pero con mayor latencia. Según el equipo de Qwen, tienen «modos de pensamiento y sin pensamiento sin problemas, ofreciendo a los usuarios la flexibilidad de controlar el presupuesto de pensamiento».

Algunos modelos QWEN3 adoptan una mezcla de arquitectura de expertos (MOE), que puede ser más computacionalmente eficiente para responder consultas. MOE divide las tareas en subtareas y las delega a modelos «expertos» más pequeños y especializados. Los modelos admiten 119 idiomas y fueron entrenados en un conjunto de datos de casi 36 billones de tokens, incluidos libros de texto, pares de preguntas y respuestas, fragmentos de código y datos generados por IA.

QWEN3 muestra que los modelos abiertos aún pueden rivalizar con gigantes cerrados — Puntos de referencia compartidos por Alibaba

Alibaba Las afirmaciones de que las capacidades de Qwen3 han mejorado enormemente en comparación con su predecesor, QWEN2. El modelo QWEN3 más grande, QWEN-3-235B-A22B, funciona de manera competitiva en evaluaciones de referencia, superando a O3-Mini de OpenAI y Gemini 2.5 Pro de Google en CodeForces, una plataforma para concursos de programación. También supera a O3-Mini en la última versión de AIME, un punto de referencia matemático desafiante, y BFCL, una prueba para evaluar la capacidad de un modelo para razonar sobre los problemas.

QWEN3 muestra que los modelos abiertos aún pueden rivalizar con Giants_02 cerrados_02 — Puntos de referencia compartidos por Alibaba

Si bien QWEN-3-235B-A22B no está disponible públicamente, el modelo público público más grande, QWEN3-32B, sigue siendo competitivo con varios modelos IA propietarios y abiertos. QWEN3-32B supera el modelo O1 de OpenAI en varias pruebas, incluido el referencia de codificación LivecodeBench. Alibaba dice que QWEN3 sobresale en las capacidades de llamado de herramientas, siguientes instrucciones y copia de formatos de datos específicos.

Tuhin Srivastava, cofundador y CEO de AI Cloud Host Baseten, señaló que Qwen3 es otro ejemplo de modelos abiertos que mantienen ritmo con sistemas de código cerrado como OpenAI. Agregó que modelos como Qwen3 probablemente se utilizarán a nivel nacional, a pesar de las restricciones de los Estados Unidos en las ventas de chips a China.

Qwen3 está disponible para descargar y a través de proveedores de nubes, incluidos los fuegos artificiales IA e hiperbólicos.

Crédito de imagen destacado

Tags: Alibaba qwen

QWEN3 muestra que los modelos abiertos aún pueden rivalizar con gigantes cerrados

Related Posts

Alphaevolve: Cómo la nueva IA de Google apunta a la verdad con la autocorrección

Tiktok está implementando textos alternativos generados por AI para una mejor acesibilidad

La IA de YouTube ahora sabe cuándo estás a punto de comprar

El CEO de Soundcloud admite que los términos de IA no eran lo suficientemente claros, emiten nuevos compromisos

¿Listo para un chatgpt que realmente te conozca?

Lightricks presenta el modelo de video 13B LTX para la generación de videos HQ AI

Recent Posts

Recent Comments

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

QWEN3 muestra que los modelos abiertos aún pueden rivalizar con gigantes cerrados

Related Posts

Alphaevolve: Cómo la nueva IA de Google apunta a la verdad con la autocorrección

Tiktok está implementando textos alternativos generados por AI para una mejor acesibilidad

La IA de YouTube ahora sabe cuándo estás a punto de comprar

El CEO de Soundcloud admite que los términos de IA no eran lo suficientemente claros, emiten nuevos compromisos

¿Listo para un chatgpt que realmente te conozca?

Lightricks presenta el modelo de video 13B LTX para la generación de videos HQ AI

Recent Posts

Recent Comments

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

Follow Us