Nvidia lanza Fugatto, una IA que permite generar y modificar sonidos, voces y canciones a partir de archivos de texto y audio
La compañía tecnológica Nvidia desarrolló un modelo de inteligencia artificial que permite generar o modificar cualquier audio a partir de texto.
Foundational Generative Audio Transformer Opus 1 (Fugatto) puede generar o transformar desde voces, hasta canciones completas a partir de archivos de texto y audio.
La IA de Nvidia puede agregar o eliminar instrumentos de una canción, modificar el tono o la intención de la voz e incluso generar sonidos que nunca se han escuchado.
Rafael Valle, gerente de investigación de audio aplicado en NVIDIA, mencionó:
Fugatto is our first step toward a future where unsupervised multitask learning in audio synthesis and transformation emerges from data and model scale.
Una de las características que diferencian a Fugatto es que permite diseñar por completo un paisaje sonoro basado en indicaciones de texto.
Frugatto emplea 2.500 millones de parámetros y fue desarrollado en un banco de sistemas NVIDIA DGX que incluyen 32 GPU NVIDIA H100 Tensor Core.
Ido Zmishlany, productor, compositor y cofundador de One Take Audio, miembro del programa NVIDIA Inception para empresas emergentes de vanguardia, agregó:
The history of music is also a history of technology. The electric guitar gave the world rock and roll. When the sampler showed up, hip-hop was born. With AI, we’re writing the next chapter of music. We have a new instrument, a new tool for making music and that’s super exciting.