13/06/2023

Meta presenta nueva herramienta de IA para crear música a partir de texto y melodía

lectura 1 min
870 vistas

MusicGen es un modelo simple de lenguaje, desarrollado bajo un enfoque de una sola etapa con patrones de tokens eficientes entrelazados, que reduce la necesidad de conectar en cascada varios modelos.

Meta ha presentado MusicGen, un modelo de inteligencia artificial (IA) de fácil uso que puede generar música de alta calidad a partir de una descripción breve en texto y una melodía.

Suscríbete a nuestro newsletter

MusicGen es un modelo simple de lenguaje, desarrollado bajo un enfoque de una sola etapa con patrones de tokens eficientes entrelazados -con EnCodec audio de 32Khz-, que reduce la necesidad de conectar en cascada varios modelos, como explican los investigadores de Audiocraft.

A partir de este enfoque, MusicGen genera muestras de música de alta calidad, de unos doce segundos de duración, con solo introducir una breve descripción en texto y una referencia de la melodía que se busca obtener.

La compañía tecnológica ha publicado en el portal Hugging Face AI una demostración de MusicGen, con la que cualquier usuario puede generar una muestra de música. Añade, también, una serie de ejemplos de las descripciones, en algunos casos acompañados de descripción melódica.

Los investigadores han utilizado para el entrenamiento más de 20.000 horas de música con licencia, incluidas 10.000 pistas de alta calidad procedentes de una base de datos interna, y datos sacados de Shutterstock y Pond5.

MusicGen se entrenó utilizando una extensa colección de música licenciada que abarcó un total de 20.000 horas. Esta variedad de música incluyó 10.000 pistas de alta calidad procedentes de una base de datos interna, así como una biblioteca adicional de pistas obtenidas de fuentes reconocidas como Shutterstock y Pond5.

Como resultado de este proceso de entrenamiento, se generaron tres versiones del modelo con diferentes capacidades. Estas versiones cuentan con 300 millones, 1.500 millones y 3.300 millones de parámetros respectivamente, permitiendo así una mayor flexibilidad y precisión en la generación musical.

Suscríbete a nuestro newsletter