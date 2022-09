Gli scaler sono tecnologie presenti ormai in tantissimi aspetti delle nostre vite. Le Smart TV, per esempio, li utilizzano per aumentare la risoluzione dei programmi televisivi, ma è nel gaming che hanno dimostrato la loro importanza: li usiamo ormai da diversi anni e in questo campo NVIDIA ha fatto scuola con il suo DLSS, una tecnologia straordinaria che si appresta a raggiungere il suo terzo stadio evolutivo.

Ma cosa cambierà esattamente? Cerchiamo di capire le differenze col DLSS2 e quali saranno le sue particolarità.



A cavallo tra Hopper e Ada

Nel corso del keynote di presentazione delle RTX 4090 e 4080, è stato lo stesso Huang a spiegarci tutte le novità del DLSS3, che almeno sulla carta potrebbe scardinare ogni convinzione che avevamo a tal riguardo.

Tanto per cominciare, il Super Sampling di terza generazione porterà il grosso delle novità esclusivamente sulle nuove schede video.

Un passaggio obbligato per NVIDIA, che insieme all'architettura Ada ha svelato i Tensor Core di quarta generazione, un salto enorme in termini di inferenza, che saranno non solo di più ma anche molto più potenti.

Alla base, NVIDIA promette prestazioni raddoppiate su tutta la linea, ma ereditando i Transformer Engine FP8 dalle GPU Hopper, i nuovi Tensor potranno alzare le prestazioni nell'accelerazione e l'inferenza FP8 fino a cinque volte.



Come funzionerà il DLSS3?

Il DLSS3 utilizzerà il Deep Learning non solo per ricostruire pixel su immagini a risoluzione inferiore, ma anche per generare interi fotogrammi che andranno ad aggiungersi a quelli renderizzati dalla scheda video.

Questo risultato sarà garantito dalla presenza di nuove tecnologie come l'Optical Flow Accelerator e l'Optical Multi Frame Generator, che consentono la creazione frame intermedi confrontando il fotogramma precedente e quello attuale, ma tenendo in considerazione anche i vettori di movimento, che venivano già usati nel DLSS 2 per rendere più precisa la ricostruzione dei pixel.

Con il DLSS3, quindi, le schede video RTX Serie 40 saranno in grado di creare nuovi fotogrammi al di fuori della pipeline di rendering della GPU: questo consentirà non solo di aumentare il framerate generale del gioco, ma di farlo a prescindere dalle prestazioni della CPU, scavalcando di fatto eventuali bottleneck derivanti dall'utilizzo di un processore più datato.



Tra framerate e perplessità

Passando a qualche esempio pratico, NVIDIA ha mostrato che con il DLSS3 è possibile aumentare di cinque volte il framerate su Cyberpunk 2077 con Ray Tracing attivo, arrivando a toccare i 100 FPS con un singolo clic.

Le domande che ci stiamo facendo un po' tutti sono davvero tantissime. Tanto per cominciare, siamo proprio sicuri che non sarà compatibile con le vecchie GPU? Purtroppo, l'avanzamento tecnologico sui Tensor Core è stato quasi verticale, quindi sicuramente tutta la componente relativa alla generazione dei frame resterà appannaggio esclusivo della nuova generazione. Tecnicamente, però, non è da escludere che il DLSS3 possa funzionare in qualche sua forma anche sulla Serie 30, per esempio.

A questa domanda ha risposto lo stesso Brian Catanzaro, vicepresidente del settore ricerca sul Deep Learning di NVIDIA, il quale ha spiegato che con ulteriore lavoro di sviluppo si potrebbe riuscire a far funzionare questa tecnologia anche sulle vecchie schede in virtù della presenza di un acceleratore Optical Flow anche su Turing, ma il risultato potrebbe non essere così pronunciato, se non addirittura deleterio.



Un'altra considerazione fondamentale riguarda la latenza di sistema. Nonostante la potenza straordinaria dei nuovi Tensor Core, è ragionevole pensare che il meccanismo di Frame Generation vada in qualche modo a incidere sul processo aggiungendo latenza nella fase di analisi tra frame precedente e frame successivo.

NVIDIA, fortunatamente, ha pensato anche a questo, inserendo la pipeline di NVIDIA Reflex direttamente all'interno del pacchetto DLSS3 come componente fondamentale. Questo andrà in qualche modo a compensare l'aumento di latenza tramite un meccanismo molto efficace che mette in diretta sincronizzazione CPU e GPU riducendo la coda di istruzioni che esercitano pressione sul processore.



Insomma, NVIDIA sembra aver pensato davvero a tutto con questa nuova tecnologia, in arrivo sulla prima batteria di titoli già a ottobre insieme alle RTX 4080 e 4090, e non vediamo l'ora di provarlo!