Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the fast-indexing-api domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /home/buwemyhm/public_html/wp-includes/functions.php on line 6121

Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the health-check domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /home/buwemyhm/public_html/wp-includes/functions.php on line 6121
Nvidia presenta modelos NVLM 1.0 de código abierto - Dataconomy ES
Dataconomy ES
Subscribe
No Result
View All Result
Dataconomy ES
Subscribe
No Result
View All Result
Dataconomy ES
No Result
View All Result

Nvidia presenta modelos NVLM 1.0 de código abierto

byEmre Çıtak
2 octubre 2024
in Artificial Intelligence
Home Artificial Intelligence

Nvidia ha entrado oficialmente al ring con un potente modelo de IA de código abierto, NVLM 1.0, desafiando a gigantes de la industria como OpenAI y Google.

La nueva familia NVLM 1.0 de grandes modelos de lenguaje multimodal de la compañía promete ofrecer capacidades de vanguardia en tareas visuales y basadas en texto.

Liderando el grupo está el NVLM-D-72B de 72 mil millones de parámetros, un modelo diseñado para funcionar al más alto nivel, generando un impacto masivo en las tareas de visión y lenguaje al tiempo que mejora los resultados tradicionales basados ​​en texto.

¿Qué hace que NVLM 1.0 sea especial?

la liberación de NVLM 1.0 Marca un cambio notable en el ecosistema de IA, que los modelos propietarios han dominado en gran medida. La decisión de Nvidia de hacer que estos pesos de modelo estén disponibles públicamente y, eventualmente, publicar el código de capacitación, ofrece a los investigadores y desarrolladores acceso a herramientas que rivalizan con las de la talla de GPT-4. Este es un movimiento poco común en una industria donde los modelos más avanzados permanecen bajo llave, estrictamente controlados por gigantes tecnológicos.

Como afirmó Nvidia en su trabajo de investigación, «NVLM 1.0 logra resultados de última generación en tareas de visión y lenguaje, rivalizando tanto con los modelos propietarios como con los de acceso abierto».

Lo que esto significa para los desarrolladores es una Nueva frontera en accesibilidad a la IAmuy parecido a lo que hizo Meta con Llama 3.2brindando a los laboratorios más pequeños y a los investigadores independientes la oportunidad de trabajar con herramientas de inteligencia artificial de primer nivel sin tener que navegar por costos a menudo prohibitivos o restricciones corporativas.

La versión de código abierto de NVLM 1.0 ha generado entusiasmo en toda la comunidad de investigación de IA. Un destacado investigador destacó la importancia del modelo en las redes sociales y afirmó:

Wow, nvidia acaba de publicar un modelo 72B que está ~ a la par con llama 3.1 405B en evaluaciones matemáticas y de codificación y también tiene visión 🤯 pic.twitter.com/c46DeXql7s

—Phill (@phill__1) 1 de octubre de 2024

La potencia multimodal NVLM-D-72B

En el centro de esta revolución del código abierto está el NVLM-D-72B modelo, que destaca por su capacidad para manejar entradas visuales y textuales sin problemas. Esta capacidad multimodal significa que el modelo puede interpretar imágenes, analizar elementos visuales complejos e incluso resolver problemas matemáticos paso a paso, todo dentro de un único marco.

Mientras que muchos modelos multimodales luchan por retener el rendimiento en tareas de solo texto después de integrar el aprendizaje visual, NVLM-D-72B contradice la tendencia.

Según Nvidia, el modelo mejoró la precisión del texto en un promedio de 4,3 puntos en varios puntos de referencia clave después del entrenamiento multimodal. Este tipo de adaptabilidad posiciona al NVLM-D-72B como una herramienta única en un mercado que normalmente obliga a los usuarios a elegir entre modelos optimizados para tareas visuales o textuales, pero no para ambas.

Abriendo nuevas puertas, planteando nuevas preguntas

El Proyecto NVLM No se trata sólo de acceso abierto. También presenta diseños arquitectónicos innovadores que combinan diferentes técnicas de procesamiento multimodal, ampliando los límites de lo que es posible en IA. El enfoque híbrido de Nvidia bien podría inspirar una nueva dirección en la investigación y el desarrollo de la IA, a medida que equipos de todo el mundo tengan en sus manos estas herramientas.

Sin embargo, como ocurre con cualquier salto tecnológico, existen riesgos. Hacer que modelos de IA tan poderosos estén ampliamente disponibles genera preocupaciones sobre el posible uso indebido y los desafíos éticos que conlleva. La comunidad de IA necesitará equilibrar el impulso hacia la innovación con la necesidad de desarrollar marcos responsables para el uso de estos modelos.

Modelos nvidia nvlm 1 0 de código abierto
NVLM 1.0 logra un rendimiento de última generación en tareas de visión y lenguaje, compitiendo con los modelos abiertos y propietarios. (Crédito de imagen)

Un momento decisivo en la IA

La decisión de Nvidia de abrir el código NVLM 1.0 podría desencadenar una ola de cambios en todo el mundo tecnológico. Otros líderes de la industria podrían sentirse presionados a hacer lo mismo, lo que podría cambiar todo el panorama del desarrollo de la IA. Si los modelos de última generación se vuelven de libre acceso, podría obligar a las empresas a repensar cómo generan valor y mantienen una ventaja competitiva en el mercado.

Aún se desconoce el impacto a largo plazo de la medida de Nvidia. En los próximos meses y años, podríamos ver una era de colaboración sin precedentes en IA, en la que investigadores de todos los rincones del mundo trabajen juntos en plataformas compartidas. O bien, este avance podría impulsar un examen más profundo de las consecuencias de lanzar tecnología avanzada sin controles estrictos.

Una cosa está clara: el lanzamiento de NVLM 1.0 por parte de Nvidia es un movimiento revolucionario que señala un cambio en el equilibrio de poder dentro de la industria de la IA. Al hacer que un modelo de tan alto calibre sea de código abierto, Nvidia está desafiando el status quo, iniciando lo que podría ser un nuevo capítulo en el desarrollo de la IA.

La pregunta ahora no es si los modelos y el mercado de la IA cambiarán, sino cuán dramáticamente y quién podrá mantenerse al día.


Crédito de imagen destacada: Emre Çıtak/Ideograma IA

Tags: NvidiaNVLM 1.0Presentado

Related Posts

Alphaevolve: Cómo la nueva IA de Google apunta a la verdad con la autocorrección

Alphaevolve: Cómo la nueva IA de Google apunta a la verdad con la autocorrección

15 mayo 2025
Tiktok está implementando textos alternativos generados por AI para una mejor acesibilidad

Tiktok está implementando textos alternativos generados por AI para una mejor acesibilidad

15 mayo 2025
La IA de YouTube ahora sabe cuándo estás a punto de comprar

La IA de YouTube ahora sabe cuándo estás a punto de comprar

15 mayo 2025
El CEO de Soundcloud admite que los términos de IA no eran lo suficientemente claros, emiten nuevos compromisos

El CEO de Soundcloud admite que los términos de IA no eran lo suficientemente claros, emiten nuevos compromisos

15 mayo 2025
¿Listo para un chatgpt que realmente te conozca?

¿Listo para un chatgpt que realmente te conozca?

14 mayo 2025
Lightricks presenta el modelo de video 13B LTX para la generación de videos HQ AI

Lightricks presenta el modelo de video 13B LTX para la generación de videos HQ AI

14 mayo 2025

Recent Posts

  • El impacto de las telas inteligentes en el rendimiento de la ropa táctica
  • Databricks apuesta grande en Postgres sin servidor con su adquisición de neón de $ 1 mil millones
  • Alphaevolve: Cómo la nueva IA de Google apunta a la verdad con la autocorrección
  • Tiktok está implementando textos alternativos generados por AI para una mejor acesibilidad
  • Trump obliga a Apple a repensar su estrategia de iPhone de la India

Recent Comments

No hay comentarios que mostrar.
Dataconomy ES

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.