NVIDIA RTX 4090 senza segreti: trapela online la GPU AD102

NVIDIA RTX 4090 senza segreti: trapela online la GPU AD102
di

Mentre si avvicina il keynote NVIDIA al COMPUTEX 2022, durante il quale l'azienda potrebbe mostrare un teaser delle sue schede grafiche da gaming di nuova generazione, emergono oggi le prime informazioni tecniche sulla GPU AD102, ovvero il chip con architettura Ada che dovrebbe trovarsi sulla RTX 4090.

A pubblicare le informazioni è il leaker Kopite7Kimi, che ha già spiegato che la GPU AD102 sarà utilizzata nella scheda grafica flagship della serie 40 di NVIDIA, che presumibilmente sarà la RTX 4090. Sempre la stessa fonte ha anche confrontato la GPU con i chip TU102 con architettura Turing e GA102 con architettura Ampere, quest'ultimo utilizzato nelle RTX NVIDIA di serie 30.

Nello specifico, la GPU AD102 ha il 70% di Graphics Processing Clusters (GPC) in più rispetto alla GA102 (montata sulla RTX 3090): mentre quest'ultima ha un totale di 7 GPC, infatti, la seconda si spinge fino a 12 GPC complessivi. Ogni GPC sarà poi composto da 6 TPC, o Texture Processing Clusters, i quali saranno a loro volta composti da 2 SM, o Streaming Multiprocessors.

Infine, ogni SM avrà quattro Sub-Core, ciascuno dotato di 128 unità FP32 e 64 unità INT32, per un totale di 192 unità FP32+INT32. A conti fatti, cioè significa che ogni SM avrà 512 unità FP32 e 256 unità INT32, per un totale complessivo di 768 unità. Considerato che la GPU ha un totale di 24 SM, dunque, possiamo facilmente capire che ci troveremo di fronte a 12.288 unità FP32 e a 6.144 unità INT32, per un totale di 18.432 CUDA Core complessivi, il 50% in più della GPU GA102.

Un incremento simile dovrebbe riguardare poi anche la Cache, che dovrebbe essere pari a 192 KB di memoria L1 per ogni Streaming Multiprocessor, per un totale di 4,5 MB di Cache L1 sull'intera GPU. A questi si aggiungono poi fino a 96 MB di Cache L2, 16 volte in più della GPU GA102, che si fermava a soli 6 MB di Cache L2.

Infine, passando alle Render Output Units, o ROP, il leaker spiega che ne troveremo due per ogni GPC, il doppio rispetto all'architettura Ampere, per un totale di 384 ROP sulla RTX 4090 contro i 112 ROP sulla RTX 3090 Ti. Inoltre, le ROP saranno composte da dei Tensor Core di quarta generazione e da dei Ray Tracing Core di terza generazione. Su queste stesse basi, negli scorsi giorni alcuni leaker hanno stabilito che la RTX 4090 avrà una potenza doppia rispetto alla RTX 3090.

NVIDIA RTX 4090 senza segreti: trapela online la GPU AD102