NVIDIA dà vita agli avatar: con Omniverse Avatar potranno vedere, conversare e parlare

NVIDIA dà vita agli avatar: con Omniverse Avatar potranno vedere, conversare e parlare
di

Giornata ricca di annunci dal fronte NVIDIA. Poco dopo aver parlato della nuova piattaforma Jetson AGX Orin, la compagnia di Santa Clara ha annunciato alla GTC Omniverse Avatar. Si tratta di una piattaforma tecnologica che permette di creare avatar interattivi basati sull'intelligenza artificiale.

Come spiegato direttamente nel comunicato stampa ufficiale di NVIDIA, Omniverse Avatar è in grado di mixare tutte le tecnologie dell'azienda per creare avatar paragonabili a tutti gli effetti a personaggi interattivi, con tanto di grafica 3D e ray tracing.

NVIDIA osserva che tali avatar sono in grado di vedere, parlare e conversare su un'ampia gamma di argomenti e comprendere il linguaggio in modo naturale.

Jensen Huang, fondatore e CEO di NVIDIA ha salutato questa novità affermando che "l'alba degli assistenti virtuali intelligenti è arrivata. Omniverse Avatar combina la grafica di base, la simulazione e le tecnologie AI di NVIDIA per realizzare alcune delle applicazioni in tempo reale più complesse mai create. I casi d'uso di robot e assistenti virtuali sono incredibili e di vasta portata".

Di fatto, Omniverse Avatar apre le porte alla creazione di assistenti virtuali facilmente personalizzabili per qualsiasi settore: si va dall'assistenza clienti alle ordinazioni per i ristoranti, passando per le transazioni bancarie alla gestione di appuntamenti e prenotazioni.

Huang ha mostrato durante la conferenza Project Tokkio per l'assistenza clienti, NVIDIA DRIVE Concierge per i servizi intelligenti dei veicoli e Project Maxine per le videoconferenze .

Il riconoscimento vocale si basa su NVIDIA Riva, un kit di sviluppo software che è in grado di riconoscere il parlato in più lingue per poi generare risposte vocali simili a quelle umane grazie all'utilizzo di funzionalità di sintesi vocale. La comprensione del linguaggio naturale invece si basa su Megatron 530B, un modello preaddestrato che può completare frasi, rispondere a domande su un ampio raggio di argomenti, generare riassunti ed effettuare traduzioni. Nel progetto è integrato anche il framework NVIDIA Merlin che permette alle aziende di creare sistemi di raccomandazione di deep learning in grado di gestire grandi quantità di dati per fornire suggerimenti intelligenti. La percezione invece si basa sul framework NVIDIA Metropolis per l'analisi dei video, mentre le animazioni dell'avatar sfruttano NVIDIA Video2Face ed Audio2Face.