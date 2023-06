Meta ha annunciato il lancio di un nuovo modello d’intelligenza artificiale battezzato MusicGen, che è in grado di generare brani musicali attraverso dei prompt di testo. Sostanzialmente il funzionamento è molto simile a DALL-E, con la differenza che il sistema di Meta si rivolge al mercato musicale.

MusicGen si basa su un modello Transformer, ed è in grado di allineare i prompt testuali anche in melodie già esistenti. Il team di ricercatori ha utilizzato oltre 20mila ore di musica su licenza per allenare il modello, ed in particolare si è basato su un set di dati interno di 10mila brani musicali ad alta qualità oltre che dati di Shutterstock e Pond5.

L’unicità di MusicGen è legata al fatto che è in grado di gestire i prompt testuali e la musica. Con il testo gli utenti possono impostare lo stile di base da applicare al file audio. Nell’esempio, si parla di una “una traccia EDM leggera e allegra con batteria sincopata, pad ariosi e forti emozioni. Ritmo: 130 BPM”, basata sulla “Toccata e fuga in re minore” di Bach (BWV 565). Il risultato è quello che si può ascoltare direttamente attraverso questo indirizzo.

Il codice ed il modello open source di MusicGen è disponibile direttamente su Github. Meta dà anche la possibilità di accedere ad una demo del modello direttamente su Hugging Face.