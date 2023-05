Insieme a NVIDIA Ace For Games, la società di Santa Clara ha annunciato al Computex 2023 anche DGX GH200, il nuovo supercomputer pensato per i modelli utili all’IA generativa applicati al settore linguistico.

Dotato di 256 Grace Hopper Superchip, che sono in grado di girare come una singola GPU, l’obiettivo di DGX GH200 è rivoluzionare l’IA generativa e l’elaborazione dei dati. In termini di performance è in grado di offrire una potenza di calcolo fino a 1 exaflop con FP8 e 144TB di memoria condivisa, quasi 500 volte più memoria rispetto al DGX A100 introdotto nel 2020.

Per fare un raffronto, l’RTX 4090 di NVIDIA può raggiungere circa 100 teraflop quando overcloccata. Ovviamente la 4090 non è una GPU per data center, ma il confronto di dati serve esclusivamente per offrire un contesto alla potenza.

Il supercomputer è basato sui superchip GH200 Grace Hopper di NVIDIA: in totale come dicevamo poco sopra sono 256, che grazie alla tecnologia NVLink sono in grado di lavorare insieme come un sistema unificato. NVIDA ha spiegato che ha utilizzato NVLink-C2C: di conseguenza, la larghezza di banda tra processore e scheda grafica dovrebbe essere notevolmente migliorata e dovrebbe offrire anche maggiore efficienza dal punto di vista energetico.

Il balzo rispetto alla precedente generazione è importante, e secondo molti è altamente probabile che il DGX GH200 venga utilizzato per migliorare Bard, ChatGPT e Bing Chat.

NVIDIA ha spiegato che NVIDIA GH200 Grace Hopper è in produzione ed è in fase di sviluppo il primo supercomputer basato su DGX GH200: NVIDIA Helios che è basato su quattro DGX GH200, ognuno dei quali connessi con NVIDIA Quantum.2 InfiniBand.