Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the fast-indexing-api domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /home/buwemyhm/public_html/wp-includes/functions.php on line 6121

Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the health-check domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /home/buwemyhm/public_html/wp-includes/functions.php on line 6121
NVIDIA presenta Fugatto como “la máquina de sonido más flexible del mundo” - Dataconomy ES
Dataconomy ES
Subscribe
No Result
View All Result
Dataconomy ES
Subscribe
No Result
View All Result
Dataconomy ES
No Result
View All Result

NVIDIA presenta Fugatto como “la máquina de sonido más flexible del mundo”

byKerem Gülen
26 noviembre 2024
in News, Technology & IT
Home News

NVIDIA tiene desvelado Fugatto, un modelo de IA generativa capaz de crear y modificar contenido de audio. El modelo tiene como objetivo ayudar a los productores de música, creadores de películas y desarrolladores de juegos permitiéndoles generar sonidos novedosos a través de indicaciones de texto. Fugatto combina varias capacidades de generación de audio y emplea algoritmos avanzados para mejorar los procesos creativos en la industria del audio.

NVIDIA presenta Fugatto, una IA generativa para la creación de audio

fugatoabreviatura de Foundational Generative Audio Transformer Opus 1, fue presentado por NVIDIA, el proveedor líder mundial de chips y software para sistemas de inteligencia artificial. La tecnología puede generar y alterar sonido a partir de archivos de audio existentes, lo que la distingue de los modelos anteriores. Por ejemplo, puede transformar una melodía de piano en una voz humana o modificar el acento y el tono emocional de una grabación hablada. Esta flexibilidad permite a los creadores explorar una variedad de aplicaciones innovadoras en diferentes campos.

El equipo detrás de Fugatto está formado por más de una docena de investigadores, entre ellos Rafael Valle, director de investigación de audio aplicado de NVIDIA. Valle enfatizó el objetivo del proyecto: «Queríamos crear un modelo que entienda y genere sonido como lo hacen los humanos». La clave del diseño de Fugatto es su capacidad para integrar múltiples tareas relacionadas con la generación y transformación de audio, mostrando propiedades emergentes que surgen de sus extensos datos de entrenamiento.

Los usuarios pueden instruir a Fugatto con indicaciones de forma libre para crear paisajes sonoros, fragmentos de música o incluso efectos de sonido únicos. Por ejemplo, un productor podría crear rápidamente prototipos de diferentes estilos o instrumentos para una pista. En particular, Fugatto presenta técnicas como ComposableART, que permite a los usuarios combinar diferentes comandos. Las pruebas revelaron resultados sorprendentes, como sugirió Rohan Badlani, un investigador de inteligencia artificial involucrado con el modelo, quien describió la experiencia como artísticamente gratificante a pesar de su experiencia técnica.

NVIDIA presenta Fugatto como "La máquina de sonido más flexible del mundo."
Fugatto combina varias capacidades de generación de audio, empleando algoritmos avanzados para mejorar los procesos creativos en la industria del audio (Crédito de imagen)

Durante su formación, Fugatto utilizó 2.500 millones de parámetros y se desarrolló en los potentes sistemas DGX de NVIDIA con 32 GPU H100 Tensor Core. El entrenamiento del modelo se basó en un conjunto de datos diverso y combinado que comprende millones de muestras de audio, lo que mejoró su funcionalidad multiacento y multilingüe. Este ambicioso proyecto también tardó más de un año en desarrollarse, y el equipo superó varios desafíos en la generación de datos y la capacitación de modelos.

Fugatto ofrece varias aplicaciones potenciales, incluso para agencias de publicidad y plataformas de aprendizaje de idiomas. Se ha sugerido que las campañas de marketing podrían beneficiarse de su capacidad para adaptar locuciones con diferentes acentos o estados de ánimo. En educación, los estudiantes pueden disfrutar de cursos personalizados con voces familiares. Los desarrolladores de juegos podrían adaptar dinámicamente el audio del juego, integrando elementos interactivos que respondan a las acciones del usuario.

Si bien las capacidades de Fugatto son impresionantes, NVIDIA no ha anunciado planes inmediatos para lanzar esta tecnología al público. La compañía expresa su preocupación por el posible uso indebido de la IA generativa, y Bryan Catanzaro, vicepresidente de investigación de aprendizaje profundo aplicado de NVIDIA, destaca la importancia de tener precaución dados los riesgos asociados con dicha tecnología. OpenAI y otras empresas en el campo enfrentan desafíos similares con respecto al despliegue responsable de sus modelos, particularmente en lo que respecta a los derechos de propiedad intelectual y la desinformación.


Crédito de la imagen destacada: NVIDIA

Tags: AIinteligencia artificialNvidia

Related Posts

Alphaevolve: Cómo la nueva IA de Google apunta a la verdad con la autocorrección

Alphaevolve: Cómo la nueva IA de Google apunta a la verdad con la autocorrección

15 mayo 2025
Tiktok está implementando textos alternativos generados por AI para una mejor acesibilidad

Tiktok está implementando textos alternativos generados por AI para una mejor acesibilidad

15 mayo 2025
La IA de YouTube ahora sabe cuándo estás a punto de comprar

La IA de YouTube ahora sabe cuándo estás a punto de comprar

15 mayo 2025
El CEO de Soundcloud admite que los términos de IA no eran lo suficientemente claros, emiten nuevos compromisos

El CEO de Soundcloud admite que los términos de IA no eran lo suficientemente claros, emiten nuevos compromisos

15 mayo 2025
¿Listo para un chatgpt que realmente te conozca?

¿Listo para un chatgpt que realmente te conozca?

14 mayo 2025
Su próxima PS5 podría obtener una nueva etiqueta de precio de tarifa.

Su próxima PS5 podría obtener una nueva etiqueta de precio de tarifa.

14 mayo 2025

Recent Posts

  • El impacto de las telas inteligentes en el rendimiento de la ropa táctica
  • Databricks apuesta grande en Postgres sin servidor con su adquisición de neón de $ 1 mil millones
  • Alphaevolve: Cómo la nueva IA de Google apunta a la verdad con la autocorrección
  • Tiktok está implementando textos alternativos generados por AI para una mejor acesibilidad
  • Trump obliga a Apple a repensar su estrategia de iPhone de la India

Recent Comments

No hay comentarios que mostrar.
Dataconomy ES

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.