Sistemi multi GPU: fino a dove ci si può spingere?

I più appassionati impiegano fino a quattro schede grafiche in parallelo, ma se andiamo oltre il mercato consumer i numeri sono ben altri.

Sistemi multi GPU: fino a dove ci si può spingere?
Articolo a cura di

Noi giocatori amiamo seguire le ultime novità del settore gaming, che permettono di farci godere di spettacolari esperienza videoludiche, anche attraverso la realtà virtuale. La scheda grafica è, senza alcun dubbio, il componente che i PC gamers tendono a guardare di più, perché quando si tratta di giochi è questo elemento a diventare centrale. Gli utenti più appassionati ricorrono poi a più GPU in parallelo per aumentare le prestazioni, da un minimo di due fino ad un massimo di quattro. Le schede madri non permettono infatti di andare oltre le 4 schede video in parallelo, ma questo è un limite imposto al solo mercato consumer. Le DirectX 11, così come le 12, non consentono di fare meglio, per cui è un vincolo che parte direttamente dal basso.
Quando si tratta di high performance computing, però, il numero di GPU può salire enormemente. Basti pensare a NVIDIA, che con l'ultimo DGX-1 ha portato ben otto schede Tesla nello stesso sitema, per potenzialità computazionali spaventose. La domanda che ci poniamo oggi è: quante schede grafiche possono entrare al massimo in un singolo sistema?

Velocity Micro e le sue GTX 980 Ti

La GPU Technology Conference è un evento in cui il tema centrale sono ovviamente i processori e il calcolo grafico, che può ottenere per certo un'enorme spinta dal parallelismo. E' qui che Velocity Micro, società specializzata nei computer custom, ha mostrato una macchina che faceva uso di tantissime schede grafiche. L'azienda è riuscita infatti a sfruttare ben otto EVGA GeForce GTX 980 Ti, insieme a due processori Intel Xeon E5-2660 v3. Di primo acchito quindi è chiaro che non si tratta di un sistema consumer, ma piuttosto di un computer dedicato all'impiego workstation o comunque server. Per tale motivo ci sorprende notare come Velocity Micro non abbia utilizzato GPU Quadro o Tesla. Queste due ultime famiglie hanno tra l'altro modelli che rimangono in commercio per molto più tempo, avendo un ciclo di vita più lungo rispetto ai prodotti della famiglia GeForce. Sarebbe perciò stato opportuno installare dei prodotti non appartenenti alle serie GeForce. Le schede grafiche avevano un dissipatore personalizzato, e non lo stesso impiegato da EVGA. La società costruttrice ha detto che questa scelta è stata fatta "principalmente per il colpo d'occhio", piuttosto che per favorire altri aspetti, quali ad esempio la silenziosità.

One Stops Systems: Tesla per tutti!

Altra azienda che alla GTC ha voluto mostrare enorme parallelismo grafico è stata One Stops Systems, che ha innalzato la posta in gioco. Essa è infatti riuscita ad inserire ben sedici schede video, che nello specifico erano delle NVIDIA Tesla K80. Se contiamo che ognuna di queste ospita due GPU, abbiamo un totale di 32 graphic processing units. La macchina ha un nome: si chiama GPUltima e impiega uno chassis 3U di SuperMicro. La sua particolarità è che esso non ospita alcun processore, ma solo schede grafiche connesse tramite InfiniBand per il networking. One Stops System ha dichiarato che il computer è stato progettato per l'utilizzo con un server, accoppiato quindi a macchine dual-socket. La società ha portato un altro case, chiamato 42U e prodotto sempre da SuperMicro, in grado di ospitare un rack da otto macchine. Sappiamo che ogni slot ha il form factor di un cabinet 3U, e ricordiamo che esso è in grado di dare alloggio a 16 schede Tesla K80, quindi potremmo idealmente beneficiare di un numero impressionante di GPU, pari a 256. Ogni Tesla K80 offre 8,74 TFLOPS con i dati FP32 e, se la matematica non ci inganna, con un rack del genere possiederemmo in teoria 2.237 TFLOPS, una potenza assolutamente spaventosa.
Non è però tutto rose e fiori, ed integrare così tante schede grafiche non è compito da tutti. Fornire alimentazione e raffreddamento a 256 graphic processing units può essere una sfida più che ardua. Quando è a pieno regime, GPUltima consuma circa 5.000 W. Considerando che la potenza di picco è sicuramente più elevata, la casa costruttrice ha previsto tre alimentatori da 3.000 Watt ciascuno. Uno però è stato piazzato solo per ridondanza, cioè per la gestione dei fallimenti: se uno dei primi due si guasta, allora entro in gioco il terzo.

Quante GPU possono entrare in un singolo sistema Le schede grafiche integrabili parallelamente continueranno ad aumentare di anno in anno, seppur oggigiorno siamo già ad un numero davvero enorme. Qual è il motivo per utilizzare tutte queste GPU? Calcolo meteorologico, intelligenza artificiale, deep learning e, più in generale, high performance computing: sono tutti settori che hanno bisogno di quanta più potenza grafica possibile. Una decina di anni fa venivano impiegati semplici processori, ma le GPU hanno di gran lungo superato la loro capacità di calcolo in tanti ambiti. In ambito consumer invece l'utilizzo di più GPU è molto più limitato, visti gli alti costi e le prestazioni non sempre proporzionali alla spesa.