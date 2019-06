Si chiama Speech2Face ed è una intelligenza artificiale progettata per costruire un'immagine virtuale di un volto partendo dalla voce di una persona. L'IA ha ascoltato le conversazioni di oltre 100.000 persone, e sarebbe in grado di associare alcuni tratti fisionomici al timbro della voce.

L'IA sarebbe quindi in grado di costruire un'immagine in 3D fotorealisticadi un volto, e per farlo sarebbe sufficiente darle in pasto una traccia audio. Il risultato del lavoro dei ricercatori è stato pubblicato lo scorso 23 maggio sulla rivista scientifica arXiv, ma non è ancora stato sottoposto a peer-review.

I ricercatori, nelle conclusioni del loro report, spiegano che l'IA non è ovviamente in grado di ricostruire con esattezza il volto della persona che sta parlando, ma riuscirebbe ad identificare l'età, il sesso, e il gruppo etnico d'appartenenza. "Di conseguenza, l'IA riprodurrà un volto molto generico. Non produce il volto di una persona specifica".

I test effettuati mostrano che Speech2Face riesce nella maggior parte dei casi a riconoscere con precisione le caratteristiche essenziali della persona dietro alla conversazione. Esiste tuttavia un problema linguistico: se l'IA si trova a suo agio con le persone che parlano nella loro lingua madre, il discorso è differente quando si passa ad un'altra lingua. L'IA è riuscita a ricostruire i tratti essenziali di un uomo asiatico che parlava in cinese, ma quando la stessa persona parla in inglese il risultato è stato disastroso.