Menlo Park (Usa) – Meta ha rilasciato in forma open source il codice di MusicGen, la sua Intelligenza Artificiale in grado di generare musica a partire da istruzioni testuali e sonore. Sul sito Hugging Face è disponibile una demo gratuita che permette di creare file della durata massima di 12 secondi. Il funzionamento è simile a quello di MusicLm, il bot di Google rilasciato a gennaio (non disponibile al pubblico) addestrato con oltre 280mila ore di musica e che consente di ottenere audio a 24 kHz.

L’input iniziale può consistere di una descrizione testuale o di una traccia audio che vada a definire la melodia. MusicGen prevede l’uso di un singolo Transformer (un tipo di rete neurale) in grado di elaborare parallelamente diversi flussi di dati musicali (chiamati ‘token’). Meta ha addestrato l’IA con 20mila ore di musica, prese da tracce musicali sotto licenza e dai cataloghi di Shutterstock e Pond5. I brani sono stati campionati a 32 kHz e corredati di metadati relativi a generi, descrizioni sintetiche e Bpm. Sulla base di questi elementi, MusicGen è in grado di produrre file audio digitali monofonici a 32 kHz di frequenza di campionamento.

Sono disponibili tre diverse versioni del modello di IA: da 300 milioni di parametri, da 1,5 miliardi di parametri e da 3,3 miliardi di parametri. Quest’ultima è in grado di riprodurre una migliore qualità del suono e una maggiore aderenza alle richieste iniziali, ma ovviamente richiede una potenza di calcolo maggiore.

Clicca qui per rimanere aggiornato sul mondo dell’hitech.