NVIDIA ha rivoluzionato, ancora una volta, il mercato delle schede video. Usiamo il termine rivoluzione perché l'architettura Ada Lovelace non solo porta prestazioni e tecnologie sempre più all'avanguardia, ma anche un cambiamento importante in un settore falcidiato per più di due anni dall'assenza di GPU e da prezzi alle stelle. L'assunto secondo cui i prezzi delle schede video si abbassino all'avanzare del progresso tecnologico è stato messo in cantina per sempre, del resto la potenza della nuova RTX 4090 non poteva arrivare a buon mercato.

Il gaming su PC sta diventando troppo costoso? La realtà è ben diversa, la RTX 4090 è pensata per un pubblico d'elite, che gioca in 4K senza compromessi e magari la sfrutta anche in ambito lavorativo. Per tutti gli altri le alternative non mancano, soprattutto ora che la disponibilità della gamma RTX 3000 è tornata a livelli adeguati. Insomma, la RTX 4090 non è un prodotto per la massa, visto il prezzo di 1979 euro per questa Founders Edition, una cifra che trova un senso considerate la potenza e le tecnologie che NVIDIA ha inserito al suo interno, con una punta di diamante chiamata DLSS 3.

Specifiche da capogiro, ottima dissipazione

Il chip AD102 è il più complesso mai prodotto da NVIDIA per il mercato consumer. Per raggiungere il traguardo la casa americana ha cambiato tutto, a partire dalla fabbrica deputata alla creazione dei chip. Le RTX 3000 erano realizzate da Samsung a 8 nm, la RTX 4090 così come le altre varianti in arrivo sono create da TSMC a 4 nm.

Il dimezzamento del processo produttivo porta enormi vantaggi, di fatto nello stesso spazio NVIDIA ha potuto inserire molti più transistor, tanto che il chip AD102 ne conta ben 76.3 miliardi. Il balzo in avanti numerico è incredibile, basti pensare che la RTX 2080 Ti aveva 68 Streaming Multiprocessor e 4352 CUDA Core, mentre la RTX 3090 Ti rispettivamente 84 e 10752. Con la RTX 4090 si arriva a 128 Streaming Multiprocessor e 16384 CUDA Core.

Il dato già da solo è impressionante, ma ricordiamo che i numeri non sono tutto, perché il cambio di architettura porta in dote CUDA Core più veloci, che traggono molto vantaggio dall'aumento delle frequenze operative. La 4090 infatti è la GPU RTX più veloce di sempre in questo ambito, la RTX 2080 Ti aveva un clock di picco di 1635 MHz, passati poi a 1860 MHz con la RTX 3090 Ti: ora questo valore è balzato a 2520 MHz di fabbrica, un salto in avanti enorme e difficile da raggiungere, soprattutto se si pensa alla densità di transistor presenti nella GPU di NVIDIA.



Una frequenza di clock così elevata genera calore, il processo produttivo a 4nm e le ottimizzazioni all'architettura portate da NVIDIA da sole non bastano a gestirlo, ecco perché con la RTX 4090 viene introdotto un nuovo dissipatore, che riprende le linee viste con le schede Ampere Founders Edition. Il primo impatto con la scheda lascia quasi spiazzati per le dimensioni e soprattutto per lo spessore del sistema di dissipazione, che presenta le ventole disposte sui due lati del PCB.

Questa collocazione, che abbiamo analizzato a fondo nella recensione della RTX 3080, dà il suo meglio quando è presente un flusso d'aria proveniente dalla parte frontale del case, che viene guidato all'interno della GPU per poi essere espulso dalla ventola posteriore dello chassis. Rispetto al passato la dimensione delle ventole della GPU è cresciuta del 20%, aumentando così il potere dissipante e rendendo possibili i 2520 MHz dichiarati da NVIDIA.



Finora abbiamo visto che la RTX 4090 offre un numero nettamente superiore di CUDA Core di nuova generazione e un clock decisamente più alto rispetto al passato, ma non è finita qui. NVIDIA vuole portare il Ray Tracing a un livello superiore, ecco perché ha inserito Tensor e RT Core tutti nuovi. A bordo ci sono 512 Tensor Core di quarta generazione, le unità di calcolo dedicate al Machine Learning che compiono il miracolo del DLSS. Sulla RTX 2080 Ti ne erano disponibili 544, ma si trattava di unità di seconda generazione, molto più lente delle attuali. Nella RTX 3090 Ti erano "solo" 336 di terza generazione.

Nel caso degli RT Core invece il numero è cresciuto nel tempo, siamo passati dai 68 di prima generazione della RTX 2080 Ti agli 84 di seconda nella RTX 3090 Ti, per arrivare agli attuali 128 di terza generazione nella RTX 4090.

Come si traducono nella pratica questi numeri? NVIDIA ha fatto un esempio piuttosto chiaro: nel 2018 Battlefield V gestiva 39 operazioni al secondo per pixel legate al Ray Tracing, oggi in Cyberpunk 2077 una RTX 4090 riesce a eseguirne 635, un numero sedici volte superiore al passato. A completare le specifiche tecniche ci sono poi 24 GB di RAM GDDR6X a 21 Gbps che operano su un bus a 384 bit, con una velocità di trasferimento dei dati di 1008 GB/s.



Abbiamo lasciato per ultimo la questione legata ai consumi perché si è fatta molta confusione in merito. NVIDIA dichiara un TGP di 450 W massimi, lo stesso della RTX 3090 Ti FE, ma perché prima del lancio si parlava di 600 W al picco? Questo valore era riferito a un ipotetico utilizzo della scheda in overclock, condizioni tutt'altro che normali.

Bisogna poi tenere a mente che NVIDIA ha lasciato spazio anche per una eventuale RTX 4090 Ti, il chip AD102 totalmente sbloccato offre infatti 18432 CUDA core, 576 Tensor core e 144 RT core, mentre qui sono presenti 16384 CUDA core, 512 Tensor core e 128 RT core. Un'eventuale RTX 4090 Ti potrebbe quindi portare il TGP a 600 W, ma con l'attuale modello, se utilizzato secondo specifiche, i consumi sono nettamente più bassi e rimangono inferiori a quelli visti in diversi modelli di 3090 Ti custom.

Durante il test che abbiamo fatto con Cyberpunk 2077 la RTX 4090 assorbe circa 400 W, mentre in Idle si scende a 22-23 W. Lo scenario più impegnativo che abbiamo provato è stato con il benchmark Port Royal di 3D Mark, dove la scheda ha assorbito circa 420W di picco. Per quanto riguarda il clock invece, i 2520 MHz dichiarati da NVIDIA si traducono, nella realtà, in una frequenza di 2700-2730 MHz durante il gioco, valori che confermano l'ottimo lavoro svolto in questo ambito.

La stessa cosa vale per le temperature, il sistema di dissipazione e l'avanzamento del processo produttivo rendono la 4090 una GPU decisamente fredda, tanto che che non siamo mai saliti oltre i 67 gradi durante l'uso intenso, mentre in ambiente desktop si rimane sempre intorno ai 35 gradi.

TR e Tensor Core rinnovati, il DLSS 3.0 è un game changer

La nuova generazione di RT e Tensor Core porta le prestazioni dei giochi in Ray Tracing e del DLSS su un altro livello. L'architettura rinnovata degli RT Core permette un aumento generale delle prestazioni da 191 RT TFLOPs a 200 RT TFLOPs, a cui vanno aggiunti la capacità di gestire due volte più rapidamente le intersezioni raggio-triangolo e di creare 10 volte più velocemente le Bounding Volume Hierarchies, grazie all'utilizzo delle Displaced Micro-Meshes, occupando per altro molto meno spazio in memoria.

Per quanto riguarda i Tensor Core di quarta generazione il cambiamento è piuttosto radicale, NVIDIA afferma che le performance raddoppiano nei calcoli FP16, BF16, TF32, INT8, e INT4 Tensor TFLOPS, in più è stato implementato il Transformer Engine FP8 utilizzato sulle GPU NVIDIA Hopper, capace di generare 1.3 PetaFlops nella RTX 4090.

Questo cambiamento nelle prestazioni è probabilmente alla base della mancata compatibilità delle RTX 3000 e 2000 con il nuovo DLSS 3.0, che si preannuncia un aggiornamento molto importante per questa tecnologia.



Ma andiamo con ordine, cosa c'è di nuovo nel DLSS 3.0? Innanzitutto cambia la scala numerica nell'aumento prestazionale, se il DLSS 2.0 e le sue evoluzioni puntavano a raddoppiare il frame rate, il DLSS 3.0 si pone l'obiettivo di quadrupicarlo in alcuni giochi rispetto al rendering tradizionale.

La nuova tecnologia è fortemente dipendente dalle performance dell'Optical Flow Accelerator, presente anche nelle RTX 2000 e 3000, un componente le cui prestazioni sono raddoppiate rispetto a quelle esprimibili dalla generazione precedente.

Proprio per questo attivare il DLSS 3.0 su una scheda video Ampere o Turing è possibile, ma secondo NVIDIA non ci sarebbe alcun aumento prestazionale. Il nuovo DLSS è basato sull'Optical Multi Frame Generation, in grado di generare nuovi frame partendo dalle informazioni ricavate dall'Optical Flow Accelerator e dai vettori di movimento senza pesare sulla CPU o sulla GPU. Tutti questi dati, compresi anche geometrie, effetti e profondità, vengono poi utilizzati dalla IA per creare frame senza perdita di qualità.



Questi frame vengono generati al di fuori della pipeline grafica, sembra magia ma è pura tecnologia, e proprio per questo riescono a eliminare eventuali colli di bottiglia della CPU. Per capire l'impatto di questa tecnologia sulle prestazioni basta citare le parole di NVIDIA, secondo cui "i sette ottavi dei pixel visualizzati sullo schermo sono ricostruiti tramite DLSS 3.0".

I proclami promettono miracoli, ma è nella pratica che abbiamo visto il vero potenziale del DLSS 3.0. Parliamo di potenziale perché attualmente non è disponibile in nessun titolo, noi lo abbiamo provato in versione beta su Cyberpunk 2077 e su A Plague Tale: Requiem. Nel caso di Cyberpunk una potente RTX 3090 Ti con DLSS 2.0 settato su Qualità e con impostazioni Ultra Ray Tracing raggiunge i 43 fps in 4K, con la RTX 4090 e il DLSS 3.0 si toccano invece i 106 fps. Impostando il DLSS si Performance si arriva a 146 fps.

Abbassando la risoluzione al 1080p possiamo notare i benefici del DLSS 3.0 nel limitare il collo di bottiglia derivato dalla CPU: 233 fps in modalità Qualità e 254 fps in quella Performance indicano un potenziale enorme per questa tecnologia, non avevamo mai visto numeri simili sul titolo CD Projekt RED.

A Plague Tale: Requiem gira invece a 68 fps senza DLSS 3, salendo poi a 133 fps in modalità Qualità e a 160 fps in quella Performance, ovviamente al massimo del dettaglio e in 4K. Il verdetto, provvisorio visto che lo abbiamo provato con due giochi beta, è molto semplice: il DLSS 3.0 cambia le carte in tavola, quando utilizzato la RTX 4090 gioca in un campionato tutto suo, dove sia le RTX 3000 che la concorrenza non possono essere competitivi.

Prestazioni ai massimi livelli

Per provare il nuovo mostro di NVIDIA abbiamo utilizzato una configurazione che comprende un processore Intel i9-12900K su scheda madre ROG Maximus Z690 Hero, con 32 GB di RAM DDR5 Kingston Fury Beast a 5200 MHz.

Abbiamo usato questa configurazione con cinque titoli, Cyberpunk 2077, Marvel's Guardians of the Galaxy, Far Cry 6, Forza Horizon 5 e Horizon Zero Dawn, confrontando la RTX 4090 con la RTX 3080 Ti e con la Radeon 6900 XT. Partiamo dal presupposto che lo scontro è impari, la nuova GPU di NVIDIA è la prima di nuova generazione e lo stacco con il passato è evidente. Altra considerazione da fare sui dati che abbiamo ottenuto riguarda la risoluzione, in 1080p e in 1440p il frame rate è limitato dalla CPU, ecco perché le differenze non sono così marcate in questi ambiti. Se si esclude Cyberpunk, allo stato attuale non ci sono giochi in grado di sfruttare a dovere una RTX 4090, segno evidente che questa GPU andrebbe provata con titoli decisamente più spinti sul fronte grafico.

I benchmark sintetici parlano chiaro, sia con 3DMark Time Spy Extreme e sia con 3DMark Port Royal la RTX 4090 stacca nettamente le altre schede usate per la prova, raddoppiando i punteggi ottenuti dalla 3080 Ti e lasciandosi dietro con largo vantaggio anche la 3090 Ti. Passando invece ai giochi, partiamo Cyberpunk 2077 e dalla modalità di utilizzo più impegnativa, ovvero senza DLSS attivo. La RTX 4090 è l'unica scheda video esistente che rende possibile giocare a tutte le risoluzioni, 4K compreso, senza alcuna tecnologia di upscaling. Il frame rate è praticamente raddoppiato rispetto alla 3090 Ti e alla 3080 Ti, mentre la Radeon 6900 XT non offre prestazioni paragonabili.

Attivando il DLSS 2.0 il distacco rimane marcato, mentre con il DLSS 3.0 la RTX 4090 distrugge semplicemente gli avversari.

Marvel's Guardians of the Galaxy mostra proprio quello di cui stavamo parlando poco sopra, finché si rimane in 1080p o in 1440p il distacco è minimo, mentre in 4K si fa decisamente più corposo, un andamento che abbiamo visto anche in Far Cry 6 e in Horizon Zero Dawn. Nei titoli in cui è presente il DLSS 2 la RTX 4090 prende un vantaggio superiore, ma il problema rimane: i giochi non sono abbastanza sofisticati a livello visivo, la generazione dei frame viene rallentata dalla CPU e per questo alle risoluzioni più basse le differenze tendono ad assottigliarsi.