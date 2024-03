L'evento più importante dell'anno per il mondo dell'Intelligenza Artificiale si è ormai concluso: la GTC 2024 di NVIDIA è giunta al termine, ma non prima di ravvivare l'interesse del pubblico sul tema dell'IA, dei modelli che ne fanno uso e dell'hardware che ne costituisce il "cervello".

Il reveal delle nuove GPU NVIDIA con architettura Blackwell rappresenta la parte centrale del keynote principale del Team Verde, che si è tenuto il 18 marzo. Ma ridurre gli annunci dell'azienda solo ai chip per l'Intelligenza Artificiale sarebbe riduttivo: al contrario, le novità vanno dai modelli IA per i veicoli a guida autonoma alle applicazioni industriali, passando per le simulazioni digitali ad alto tasso di complessità di Omniverse, la piattaforma NVIDIA che permette di creare un "gemello digitale" di ogni ambiente di lavoro per valutarne efficienza e sicurezza. Non solo: NVIDIA ha mostrato anche un modello virtuale della Terra che verrà utilizzato per rendere più precise le previsioni meteorologiche, specie in presenza di eventi estremi, e per contrastare il cambiamento climatico.

La carne al fuoco è tanta: cerchiamo di fare il punto sui principali annunci del colosso di Santa Clara.



Mostri di potenza: dalle GPU B200 al SuperPOD DGX GB200

La nostra analisi deve partire dalle vere protagoniste dello show, le GPU NVIDIA Blackwell B100 e B200: la differenza tra le due sta essenzialmente nelle prestazioni, che sono nettamente superiori nel caso dei chip B200.

Questi ultimi, infatti, sono composti da due die, per un totale di 208 miliardi di transistor, basati sul nodo 4NP di TSMC, una versione migliorata del processo 4N a 5 nm.

A ogni die è abbinata una memoria HBM3E da 96 GB su bus a 8.192-bit con una banda pari a 8 TB/s. A collegare tra loro le due porzioni, c'è l'interfaccia chip-to-chip NVI-HBI da 10 TB/s.

Al di là dei numeri, il confronto con le GPU H100 e H200 di scorsa generazione fornisce la misura del miglioramento tra un acceleratore IA e l'altro: le due GPU di nuova generazione sono quattro volte più veloci nell'addestramento dei modelli IA e fino a 30 volte più rapide nell'inferenza, per giunta con dei consumi fino a 25 volte inferiori rispetto a quelli di una scheda H200. Non è un caso, dunque, che tutte le Big Tech attive nel settore dell'Intelligenza Artificiale abbiano già piazzato ordini per i nuovi chip NVIDIA: tra i clienti confermati ci sono Meta, Microsoft, Google, OpenAI, xAI, Tesla e Amazon. L'incremento prestazionale dei chip B200 dipende da vari fattori: a quelli hardware - la nuova architettura al primo posto - si sommano l'ottimizzazione garantita dal Transformer Engine, che accelera i processi di addestramento FP8 e FP16 dell'IA, e dal nuovo Generative AI Engine, che sfrutta i Tensor Core di Blackwell per accelerare l'inferenza nei Large Language Model e nei modelli di IA generativa.



Ma non è finita qui: unite due GPU B200 e una CPU NVIDIA Grace (quest'ultima svelata da NVIDIA nel 2021 e già utilizzata sugli acceleratori con architettura Hopper) e otterrete il super-chip GB200. In questo caso, la connessione avviene mediante la quinta generazione della tecnologia NVLink chip-to-chip da 900 GB/s. E proprio il chip GB200 si trova alla base del sistema rack NVIDIA DGX GB200 NVL72, una soluzione pensata per l'immediata implementazione nei server aziendali e composta da 36 CPU Grace, 72 GPU Blackwell e da un'unità NVIDIA BlueField-3, che migliora la gestione dei dati nel cloud e la scalabilità dei sistemi.

La peculiarità del GB200 NVL72? Semplice: la velocità di interconnessione garantita dalla tecnologia NVLink permette di fatto al sistema di funzionare come se fosse un'unica GPU dalle performance impressionanti, pari a ben 1,4 exaFLOP di potenza di calcolo.

A concludere l'offerta hardware del Team Verde, la scheda server NVIDIA HGX B200, che unisce otto GPU B200 sempre tramite NVLink di quinta generazione.

Per tutti questi applicativi, poi, NVIDIA ha pensato al sistema AI Enterprise e a NIM (NVIDIA Inference Microservice), ideati appositamente per semplificare l'implementazione dell'IA a livello aziendale e per permettere a diversi acceleratori e GPU per l'Intelligenza Artificiale di "parlare" tra loro al massimo delle prestazioni.



Come dimostrano i casi di NVIDIA AI Enterprise e NIM, in effetti, a partire da quest'anno NVIDIA si sta concentrando molto sul software ancor prima che sull'hardware.

Per questo, la compagnia ha messo a disposizione delle aziende partner una lunga serie di librerie CUDA e di software utilizzabili per la gestione e il monitoraggio delle sue GPU. Inoltre, lo switch NVLink di nuova generazione dovrebbe ridurre i colli di bottiglia nel processing dei dati da parte dei sistemi con più acceleratori interconnessi, rendendo più rapido ed efficiente lo scambio di informazioni tra le singole GPU e offrendo un throughput fino a 18 volte più elevato rispetto alle precedenti soluzioni NVIDIA. Tutto ciò dovrebbe portare all'hardware-monstre del DGX SuperPOD di NVIDIA, che presenta una scalabilità fino a decine di migliaia di superchip GB200 interconnessi tramite tecnologia Quantum InfiniBand. Per ora, NVIDIA ha mostrato una soluzione composta dalla bellezza di 576 GPU Blackwell divise in otto rack DGX GB200 NVL72 connessi via NVLink, specificando però che hardware di questo tipo verranno utilizzati solo per i "sistemi IA di prossima generazione"



L'IA rivoluziona la robotica, la sicurezza industriale e... le previsioni meteo!

Andando oltre il comparto dell'hardware per l'IA, però, la GTC è stata ricca di annunci sotto una pletora di fronti diversi. Il primo è sicuramente quello delle auto a guida autonoma: NVIDIA, infatti, ha svelato che produttori cinesi del calibro di BYD e XPENG hanno deciso di implementare i computer centralizzati NVIDIA DRIVE Thor per la prossima ondata delle loro automobili commerciali e private.

La nuova generazione di Thor garantisce performance fino a tre volte superiori rispetto al predecessore, arrivando a gestire fino a 1.000 trilioni di operazioni al secondo. Come se ciò non bastasse, offre anche tre diversi livelli di guida assistita e integrerà sulle auto un'assistente IA basata sull'interpretazione del linguaggio naturale.

Spazio anche all'implementazione dell'IA nel settore biomedico, anche se in questo caso le tecnologie proposte dal Team Verde sono quelle che già conosciamo: l'Intelligenza Artificiale verrà utilizzata per l'interpretazione di immagini provenienti da radiografie, risonanze magnetiche e altri esami clinici, ma verrà anche implementata nello sviluppo e nella ricerca sui nuovi farmaci, grazie alle sue elevate capacità di generazione e simulazione digitale di cellule e molecole biologiche.



Nel campo della robotica, NVIDIA ha svelato Project GR00T, un foundation model generale pensato per i robot umanoidi: GR00T, insomma, dovrebbe utilizzare l'IA per la gestione delle operazioni più complesse legate ai robot dalle fattezze umane, con lo scopo ultimo di favorire lo sviluppo delle IA implementate direttamente nei robot.

Il modello è compatibile con la piattaforma robotica NVIDIA Isaac, che è stata a sua volta dotata di uno strumento chiamato Manipulator, grazie al quale gli automi del futuro saranno in grado di eseguire con maggiore precisione anche le operazioni più minute, come la manipolazione di oggetti e materiali.

L'obiettivo è chiaro: produrre robot più intelligenti e versatili, capaci cioè di eseguire più azioni diverse tra loro e di adattarsi dinamicamente alle richieste dell'utenza. Non aspettatevi, però, di poter mettere le mani su un cameriere o su un tuttofare robotico tanto presto: le soluzioni di NVIDIA nel comparto della robotica sono pensate solo per il settore business, almeno per il momento.



Infine, uno degli annunci più importanti nel comparto software è quello relativo all'ultimo aggiornamento di NVIDIA Omniverse che, per la verità, non è uno strumento del tutto nuovo: al contrario, Omniverse è stato lanciato da NVIDIA nel 2022, inizialmente come un software di modellazione 3D avanzato, con delle funzionalità gestite tramite IA e che non richiedeva grande conoscenza nel coding per il suo utilizzo.

In questa veste, Omniverse ha goduto di un certo successo tra gli sviluppatori, trovando applicazione in svariati settori, che vanno dalla realizzazione di ambienti tridimensionali per il cinema e i videogiochi fino alla creazione di digital twins (gemelli digitali) di aziende e linee produttive per verificarne l'efficienza e la sicurezza. Proprio sulla digitalizzazione e l'efficientamento industriale si è concentrata la demo di Omniverse alla GTC 2024: NVIDIA, infatti, ha introdotto le API Omniverse Cloud, che permetteranno alle aziende di integrare tra loro simulazioni virtuali dei propri ambienti produttivi e dati provenienti dagli impianti fisici: l'idea resta quella di utilizzare i mondi simulati in digitale dall'IA per migliorare la produttività degli impianti fisici.

Decisamente più impressionante è, invece, il modello "digital twin" dell'intero pianeta Terra, anch'esso mostrato alla GTC e basato su tecnologie non dissimili da quelle che si trovano alla base di Omniverse: il modello, già in uso da aziende specializzate nelle previsioni meteo come The Weather Company e la Central Weather Administration di Taiwan, permette di creare simulazioni e visualizzazioni ad alta risoluzione dell'andamento del clima terrestre, con previsioni accurate fino a un raggio di due chilometri da qualsiasi punto della superficie terrestre.