AMD Polaris: i dettagli sulla nuova architettura

Polaris rappresenta il futuro delle schede low e mid range di AMD, che quest’anno mirano ad elevate performance-per-watt ad un prezzo interessante.

speciale AMD Polaris: i dettagli sulla nuova architettura
Articolo a cura di

Il periodo di stagnazione è giunto al termine anche per AMD. Era da tanti anni che l'azienda non progettava un'architettura da zero, limitandosi alla riproposizione di un rebranding o al raffinamento di design già esistenti. Tale pratica non ha pagato nel tempo, ed infatti il market share della società nel mercato delle GPU discrete è sceso ad uno dei minimi della sua storia. Fortunatamente Polaris mischia le carte in tavola, fa piazza pulita del passato e permette alla compagnia americana di giocarsela ad armi pari con la concorrenza. L'architettura abbassa la dimensione dei transistor dei processori grafici della casa di Sunnyvale, portandoli a 14 nanometri. I nuovi chip sono assemblati sulla base del processo produttivo FinFET, che porta la tridimensionalità al die delle schede Polaris. La tecnologia è anche responsabile di prestazioni accentuate rispetto al passato, derivanti in prima battuta dallo shrinking, ma non solo, perché abbiamo anche una rinnovata gestione energetica, che trascina con sé inusuali vette nelle performance-per-watt. Polaris è un passo decisivo per AMD, che assolutamente non può permettersi di sbagliare. Le premesse per fare bene ci sono tutte, a partire proprio dalle caratteristiche tecniche alla base delle nuove schede.

Polaris e i transistor FinFET

La società californiana ha dichiarato che i chip Polaris 10 e Polaris 11 sono stati concepiti specificatamente per i transistor FinFET. A differenza dei transistor planari, quelli FinFET aggiungono una dimensione in più inglobando il gate in uno strato di silicio 3D. L'area relativa al gate stesso aumenta, e questo permette di controllare meglio la corrente in uscita dal drain. In teoria gli switching speeds dovrebbero essere così più elevati, a causa di una maggiore passaggio di corrente. I transistor FinFET sono paradossalmente più semplici da costruire e hanno in generale più uniformità. Quest'ultima caratteristica consente ai componenti di tenere a bada gli effetti di leakage, i quali sono presenti in quantità minore rispetto alla variante in due dimensioni. E' soprattutto grazie a loro che le schede Polaris offrono un eccellente rapporto fra prestazioni e consumi. Stabilito un certo livello prestazionale, i transistor FinFET a 14 nanometri lo raggiungono con un'efficienza superiore del 55% rispetto a quella dei transistor planari a 28 nanometri. Frequency scaling è un'altra tecnologia a servizio dell'efficienza, che aggiunge più punti di controllo sul die per scegliere le frequenze in una maniera più consona alle circostanze di utilizzo.

Raja Koduri, numero uno del Radeon Technologies Group, ha affermato che la compagnia ha lavorato sulla grafica per offrire al consumatore sia i "fast pixel" che i "deep pixel". Questo è stato possibile anche per merito del processo FinFET. Il problema dei fast pixel deriva essenzialmente dalla continua corsa alle risoluzioni più elevate e all'aumento delle frequenze operative, un obbiettivo che anche i nuovi transistor aiutano a raggiungere. I deep pixel hanno invece a che fare con la tecnologia per l'eliminazione del tearing, AMD FreeSync, e con il gaming ad alta risoluzione.
La realtà virtuale è stato il campo che ha dato una decisiva scossa alla necessità di più capacità di calcolo, considerata quanta potenza computazionale richiede per gestire tutti i pixel sul doppio schermo. Raja Koduri crede che i visori abbiamo bisogno di una soluzione in grado di elaborare circa 16,6 megapixel per ciclo di refresh, cioè ad ogni fotogramma. La mission di AMD è proprio quella di mettere a disposizione di tutti una scheda abile nel fare ciò, in modo che tutti i giocatori siano in grado di godersi una "esperienza VR davvero avvolgente". E' chiaro che AMD ha dovuto incrementare le performance dei chip grafici di tante volte rispetto al passato, tenendo soprattutto i costi bassi per consentire alla maggior parte dei gamers di stare al passo. L'obiettivo della compagnia è quindi ambizioso, con tutta l'intenzione di mettere al centro di tutto gli stessi giocatori.

Il die di Polaris

Il die di Polaris è ovviamente il centro dell'architettura, per cui AMD ha posto in esso tante novità. Nel diagramma a blocchi in nostro possesso un buon 80% delle unità sono totalmente nuove o sono state rinnovate rispetto al passato. La chiave di tutto sta nel design Graphics Core Next (GCN), che arriva quest'anno alla quarta iterazione.
La cache di livello due a bordo del processore grafico è stata la prima ad essere rivisitata, insieme al memory controller. Magari potrà supportare le GDDR5X in futuro, o addirittura le High Bandwidth Memory (HBM). I multimedia cores sono nuovi e si interessano del decoding e dell'enconding hardware. Essi supportano il nuovo codec H.265, che ben presto diventerà uno standard nell'industria. L'attuale H.264 mette a disposizione la metà dell'"intensità" della compressione offerta dal più recente H.265, senza andare ad impattare sulla resa finale. Esso permette l'encoding teorico sino addirittura all'8K. Altri re-design li troviamo sul fronte Display Engine, che supporta gli ultimi standard per la connessione al monitor. Abbiamo così piena compatibilità con Display Port 1.4 ed HDMI 2.0a, aggiornamento minore della versione 2.0 e che aggiunge il supporto all'HDR (High Dynamic Range). Gli schermi HDR arriveranno sul mercato a fine anno e, grazie all'adozione di un riferimento di colore più esteso (BT.2020), promettono un gamut più ricco e una resa cromatica più gradevole.
Il Radeon Technologies Group ha ottenuto i risultati sperati anche con l'aiuto di tecniche nuove ed efficienti, basate su Light-Field Rendering, Texture-Space Rendering e Foveated Rendering. La prima è una metodologia molto utilizzata nella computer graphics, che estrapola viste in due dimensioni da un oggetto tridimensionale o quadridimensionale, renderizzandolo in prospettive differenti.

Texture-Space Rendering è invece una tecnica molto comune per effettuare lo shading degli oggetti senza introdurre blurring; questo si fa selezionando appropriate mappe di livello per ogni triangolo dell'oggetto stesso, in maniera tale che lo shading rate sia sufficientemente elevato. La terza, Foveated Rendering, è più recente ed è impiegata nel campo della realtà virtuale. In pratica, essa si basa sul fenomeno secondo cui l'occhio umano si concentra sempre su una determinata zona della scena. Tutta l'area intorno è percepita meno dettagliatamente, per cui - all'atto pratico - con la VR si può renderizzare a bassa risoluzione tutto ciò che non fa parte della porzione che l'occhio del giocatore sta guardando direttamente. Foveated Rendering quindi promette incrementi del frame rate elevatissimi, perché la potenza risparmiata è tanta. Queste tre tecnologie, insieme ad un hardware adeguato, sono in grado di accompagnare le performance al livello successivo.

La nuova architettura

Le schede Polaris, dotate di design Graphics Core Next 4.0, supportano per la prima volta nativamente le operazioni con dati a 16 bit, siano essi interi o in virgola mobile.
Grazie ai migliorati Geometry Engines le prestazioni aumentano al salire della "forza" dell'anti-aliasing MSAA, uno dei più utilizzati. Primitive Discard Accelerator seleziona infatti i triangoli inutili, privi di area o senza punti da campionare, e li elimina dalla pipeline grafica. Le prestazioni finali aumentano dal 220% al 350% con Primitive Discard Accelerator, a seconda dei triangoli per pixel da elaborare. Tra l'altro essa permette al chip il pieno supporto del feature level 12_1 delle DirectX 12 ed abilita quindi operazioni quali il Conservative Rasterization. La pipeline della cache del processore grafico contiene anche nuovi indici, che vengono stabiliti per le geometrie più semplici. Indicizzare queste ultime porta ad un risparmio di memoria, oltre che ad un minore trasferimento di dati.
Abbiamo poi più efficienza nello shading, per merito di più pixel fillrate e cicli di clock più spinti. Ciò si traduce direttamente in un frame rate migliore grazie all'instruction prefetch, che riduce gli stalli delle code e seleziona le istruzioni da mettere in cache con una modalità più efficiente. Instruction Prefetch consente inoltre a più istruzioni di entrare in una singola coda, grazie all'aumento delle dimensioni degli Instructions Buffer. Proprio la cache L2 è stata affinata da AMD, in modo che la velocità di accesso fosse superiore, anche per merito del cosiddetto grouping. Questo porta ad un incremento delle performance del 15% per ogni Compute Unit, se paragoniamo la Radeon RX 480 alla R9 290.
La Memory Compression è responsabile della compressione, appunto, dei dati e delle istruzioni contenute nella VRAM, per favorire un risparmio di memoria a fronte di una perdita qualitativa praticamente nulla. Una delle tecniche di compressione più note è la cosiddetta delta compression, essa non è una novità assoluta ed era stata già introdotta con GCN 3.0, ma in questa iterazione AMD ha introdotto, come abbiamo detto, un nuovo Memory Controller che supporta anche una modalità senza perdita. Sono disponibili vari rapporti di compressione (2;1, 4:1 e 8:1) che forniscono alla scheda un determinato incremento nella banda passante nel bus da 256-bit.
Polaris è già pronta per i display HDR, che arriveranno entro fine anno e arricchiranno i contenuti con uno spettro tonale più ampio. Si prevede che a lungo termine, con lo sviluppo della tecnologia, potremo vedere il doppio dei colori di quanto facciamo adesso, pari a ben il 75% di quelli in grado di essere percepiti dall'uomo. AMD ha previsto un SDK per lo sviluppo di titoli con motori grafici con HDR, chiamato Radeon Photon. L'architettura Polaris è capace di pilotare schermi HDR ad un massimo di 3840 x 2160 pixel e frequenza d'aggiornamento di 96 Hz.

Segnaliamo poi la compatibilità con Liquid VR, che ingloba con sé tecnologie come AMD TrueAudio Next, che grazie ad un co-processore dedicato ai calcoli più onerosi si occupa degli effetti audio, come il riverbero o manipolazioni spaziali. Essa è dedicata anche alla realtà virtuale, con la convoluzione di più sorgenti audio, ray tracing e bassa latenza. Altre funzionalità portate da LiquidVR sono Quick Response Queue, che fa leva sugli asynchronous compute per evitare rendering troppo lunghi, Compute Unit Reservation, che dedica un certo numero di CU ad uno specifico task, e Variable Rate Shading, che non fa altro che assegnare un ID ad ogni poligono, in maniera tale che ognuno di essi possa essere controllato indipendentemente. Ciò è ovviamente sfruttato per il Foveated Rendering, di cui abbiamo parlato nel paragrafo precedente.

AMD L’ovvia conclusione del processo di shrinking del nuovo die è l'aumento delle performance-per-watt della nuova architettura Polaris, che avverrà anche nel settore a più bassa potenza, come quello dei laptop da gioco. Il TDP ridotto permetterà ai produttori di progettare sistemi di raffreddamento più sottili, con un beneficio diretto alle gaming machine più ingombranti, che spesso sono difficili da trasportare. Lo stesso accadrà con i computer Small Form Factor (SFF). Il Radeon Technologies Group continua a puntare su GPUOpen, un’iniziativa stabilita da AMD che mira ad incentivare la collaborazione e la condivisione di idee fra gli sviluppatori. A detta dell’azienda, tale pratica ha le potenzialità per vincere alcune delle sfide più grandi sul lato software della computer graphic. AMD Polaris ha delle eccellenti potenzialità, messe in mostra sin dalla sua prima demo su Star Wars Battlefront al Consumer Electronics Show 2016. I presupposti per fare bene ci sono tutti, ma molto dipende dai prezzi di vendita delle varie soluzioni, sia direttamente ai consumatori finali sia ai produttori PC.