Microsoft presenta VALL-E: l'IA a cui bastano 3 secondi per simulare la voce di chiunque
La spinta di Microsoft nel settore dell’intelligenza artificiale non è nuova ed è confermata anche dai rumor emersi nelle scorse ore secondo cui ChatGPT potrebbe essere integrato in Office. Tuttavia, il colosso di Redmond ha svelato un nuovo modello d’IA chiamato VALL-E che si basa sulla sintesi vocale.
VALL-E infatti può simulare la voce di chiunque basandosi su un campione audio di appena tre secondi. L’intelligenza artificiale infatti è in grado di sintetizzare la voce di qualsiasi persone preservando anche il tono emotivo.
Microsoft spiega che VALL-E potrebbe essere utilizzata per l’editing vocale e la creazione di contenuti audio, se combinata con altri modelli d’intelligenza artificiale generativa come GPT-3.
Alla base di VALL-C c’è una tecnologia chiamata EnCodec che è stata annunciata da Meta nell’ottobre 2022 e che a differenza di altri modelli di sintesi vocale genera i codec audio da messaggi di testo ed acustici. Analizzando la voce di una persona, l’IA suddivide le informazioni in token che vengono utilizzati per addestrare il modello neurale.
VALL-E è stata addestrata utilizzando una libreria audio di Meta chiamata LibriLight che contiene 60mila ore di discorsi in lingua inglese pronunciati da 7mila persone, per lo più estratti da audiolibri. Alcuni esempi sono disponibili sulla repository GitHub di VALL-E.
Microsoft nel documento si sofferma anche sugli utilizzi impropri. “VALL-E potrebbe comportare potenziali rischi nell’uso improprio del modello, come lo spoofing dell’identificazione vocale o l’impersonificazione di un oratore specifico. Per mitigare tali rischi, è possibile sviluppare un sistema di rilevamento per capire se una clip audio è stata sintetizzata da VALL-E” sottolinea il colosso di Redmond.
FONTE: pcgamer
Rimani aggiornato seguendoci su Google News!
Unisciti all'orda: la chat telegramper parlare di videogiochi
Altri contenuti per Microsoft
- Copilot girerà offline, ma non per tutti: i requisiti per i chip neurali
- Microsoft è sicura: i PC Arm con Windows sono il futuro dell'industria hi-tech
- Microsoft lancia i nuovi Surface Pro 10 e Laptop 6... ma non potrete acquistarli
- Le API Work Graph arrivano su DirectX 12, più prestazioni ma non per tutti
- Volete disinstallare Copilot dal PC? Brutte notizie: Microsoft non ve lo lascia fare
Microsoft
Contenuti più Letti
- 1 commentiIPTV e pezzotto, hackerata Piracy Shield: "è uno strumento di censura mascherato"
- Xiaomi HyperOS in arrivo anche sui "vecchi" smartphone: c'è la conferma!
- MediaWorld Pasqua Tech: CROLLA il prezzo dello Smart TV Samsung QLED 4K
- Apple lancia un aggiornamento totalmente inaspettato: iOS 17.4.1 versione 2 disponibile
- iPhone 16, trapelano i modelli dummy: il design non ha più segreti
- 3 commenti"Ho creato un mostro": così afferma il creatore del Labradoodle
- Il 95% degli utenti che prova a risolvere questo test del QI si arrende
- 1 commentiQuesta illusione ottica nasconde un'animale e pochi riescono a trovarlo
- C'è un segreto oscuro della Guerra del Vietnam che sicuramente non conoscevate
- C'è una brutta notizia sui taglieri che hai bisogno di sapere