Speciale Intel Skylake: focus sulle GPU integrate

Le GPU integrate nelle nuove CPU Intel Skylake migliorano quanto visto in passato, grazie ai chip grafici GT2, GT3/e e GT4/e, che andranno a competere con le soluzioni di fascia bassa di AMD e NVIDIA.

Speciale Intel Skylake: focus sulle GPU integrate
Articolo a cura di

L'architettura delle schede grafiche integrate nei processori Skylake è giunta attualmente alla nona generazione (Gen 9). Nel corso del suo sviluppo, Intel ha sperimentato alcune tattiche per migliorarne le prestazioni, senza però stravolgere il lavoro svolto fino ad ora. Mentre per le nuove CPU l'azienda ha scelto di creare qualcosa di nuovo e che di conseguenza cercasse di cambiare le carte in tavola, per le iGPU invece i contenuti non sono stati trasformati in maniera considerevole, mantenendo molte delle caratteristiche viste nei modelli precedenti, ma in una veste potenziata e rivista. Le aggiunte più importanti riguardano la compatibilità con le nuove API DirectX 12, OpenGL 5.x e Vulkan.
In questa seconda parte dello speciale dedicato all'architettura Skylake ci concentreremo sulle migliorie messe in atto ai vari processori grafici pre-esistenti, fornendo anche un'idea del funzionamento di quelli completamente nuovi. Per un approfondimento sull'architettura Skylake invece, vi rimandiamo all'articolo dedicato.

Architettura iGPU Skylake di nona generazione

Come abbiamo già esplicitato nella prima fase di questo speciale, Intel è consueta dividere i diversi core grafici dei suoi processori in più livelli, che in questo caso sono nominati GT2, GT3/e e GT4/e. Ognuno è diversificato in quanto a potenza e a consumi, con la conseguenza che le varie GPU saranno impiegate in dispositivi differenti. Intel ha procurato ai media un diagramma a blocchi dell'i7-6700K, che mostra fisicamente in quale area del die è saldata la iGPU. Ciò che subito balza all'occhio è lo spazio relegato al calcolo grafico, che è decisamente tanto se paragonato alle precedenti architetture: il merito è tutto dei 14 nm che regalano spazio extra. Le GPU comunicano con l'esterno attraverso il bus SOC Ring, che è un canale a forma di anello con architettura full-duplex e un'ampiezza di 32 byte. Anche tutti gli scambi con la memoria passano attraverso il SOC Ring, poiché il controller RAM è anch'esso legato al Ring a mezzo del System Agent. Il Platform Controller Hub è comunque residente ancora sul chipset perché spostare anch'esso sul die della CPU avrebbe indiscutibilmente richiesto troppa superficie, ma le GPU possono comunque dialogare con la memoria RAM ed agganciarsi alle linee PCI-E senza passare per il chipset Z170.

Intel Skylake GT2

Il primo chip grafico di nona generazione del quale andremo a parlare è il meno prestante dei tre, il GT2. Questo è il core che troviamo sulla HD Graphics 530, utilizzata da entrambi i processori Skylake con moltiplicatore sbloccato attualmente disponibili. Così com'era per Haswell, Intel ha distribuito le Execution Units (EUs) in blocchi chiamati "slice". Ogni slice contiene ulteriori aggregazioni chiamate "subslice", che ospitano le vere e proprie EUs. Nelle subslice troviamo inoltre tutti gli altri blocchi fondamentali, come il Data Port per lo scambio dei dati o le varie cache per dati ed istruzioni.
Ogni EU è un'unità SMT (Simultaneous multithreading), capace quindi di essere sede di svariati thread - che per Skylake sono 7 per ogni EU. Esse offrono anche il supporto IMT (Interleaved multithreading) e possono processare istruzioni multiple con diversi thread. In realtà le EU sono proprio una combinazione di processori di tipo SMT ed IMT.
Tutte le Execution Units ospitano un buon numero di unità logiche ALU SIMD che lavorano appoggiandosi a 128 general purpose registers, ciascuno dotato di 32 bytes per memorizzare dati. Il carico computazionale in virgola mobile è affidato ad una coppia di FPU SIMD, sempre integrate nelle EUs, le quali riescono ad eseguire contemporaneamente fino ad un massimo di quattro dati a 32 bit totalmente in floating point, oppure fino a quattro elementi codificati da 16 bit in floating point e 16 bit invece in intero, dimezzando però in questa seconda maniera le capacità di calcolo a doppia precisione (FP64). L'integrazione dei 16 bit interi sono una novità per Skylake, ed è una scelta sicuramente legata alla simile mossa effettuata da NVIDIA. Quest'ultima ha constatato che i videogames fanno uso di dati a singola precisione, e si sta quindi focalizzando sul calcolo FP32. Avendo l'opportunità di lavorare su dati da 32 bit per metà in intero, si raddoppiano le capacità computazionali FP32 a tutto beneficio del gaming e siamo quindi contenti che Intel abbia intrapreso questa via.
Tornando al GT2, vediamo dall'immagine allegata che esso è costituito da uno slice da 24 EUs, accorpate in tre subslice da 8 EUs ciascuno. Tutti i sottoblocchi condividono una cache da 768 Kbytes di livello 3 legata al SOC Ring, che funge da ponte fra la iGPU e tutto il resto del die. Ogni subslice possiede un Sampler (campionatore) con due annesse memorie cache L1/L2, il quale si occupa di processare texel, superfici, di gestire la compressione e di applicare determinati filtri alle texture. Il Local Thread Dispatcher connette invece ogni subslice permettendo alla GT2 di mostrarsi all'esterno, come formata da un'unica slice da 24 EUs. Infine la Data Port, mediante l'ultima GTI (Graphics Technology Interface), consente di prelevare e scrivere dati sulla cache L3.
La HD Graphics 530 che si serve di questo GT2 ha un clock speed base di 350MHz e può spingersi fino a 1150MHz. Le 24 EUs e il design ottimizzato le regalano un corposo boost prestazionale rispetto alla Gen 8. Opzionalmente può anche arricchirsi con l'integrazione di un controller eDRAM, che eventualmente sarà posto nel System Agent. La eDRAM può essere da 64 o 128MB ed è una velocissima cache extra di livello ancora più esterno (L4), che aumenta il bandwidth grazie alla sua elevata frequenza, pari a 1,6GHz. Un clock così elevato è forse eccessivo per la memoria di una iGPU, ma constatare che è teoricamente adottabile non fa sicuramente male.

Intel Skylake GT3/e e GT4/e

Skylake GT3/e dà alloggio a 48 EUs, partizionate in due slice da 24 EUs ciascuna. Ogni slice è composta da tre subslice da 8 EUs, e queste ultime sono ovviamente identiche a quelle del GT2. Alla prova dei fatti questa GT3/e è proprio composta da due GT2 in parallelo. Ritroviamo anche due memorie cache L3, interconnesse mediante una GTI, mentre due Thread Displatcher in ogni slice amalgamano il tutto ad un blocco unico. Anche per la GT3/e è opzionalmente disponibile una eDRAM, identica a quella descritta per GT2. Il blocco Rendering Fixed Functions Units si occupa prevedibilmente di renderizzare il risultato prodotto dalle EUs, prima di mandarlo a schermo. Il chip GT3/e arriverà a fine anno in alcuni processori Skylake selezionati.
Skylake GT4/e è l'emblema della più veloce GPU mai creata da Intel. Con la nona generazione abbiamo la combinazione di ben tre slice da 24 EUs, per un totale di 72 EUs. In questo caso, di fatto i chip GT2 in parallelo sono ben tre. Sulla GT4/e la eDRAM non è facoltativa ma è sempre presente, e segnaliamo inoltre che essa può ospitare sino a 128MB di dati.
Su questo chip si baseranno le Iris Pro, che tradizionalmente rappresentano le più moderne e performanti GPU integrate di Intel. La frequenza massima del GT4/e arriva ad 1GHz e riesce a fornire in output davvero tanta potenza, se paragonata a quella dei modelli passati.

Intel Skylake Il mercato sulle GPU low-end come la GeForce GT 720/730 o la Radeon R5 230 è francamente fermo, perché queste schede grafiche non offrono prestazioni soddisfacenti. L’utente medio preferisce una GPU un po’ migliore se decide di virare su una scheda dedicata, e la GTX 950 o la R7 360 rappresentano il minimo a cui esso guarda. Data quindi l’oggettiva staticità del giro d’affari sulla grafica dedicata entry-level, viene spontaneo pensare che le GPU integrate possano dire molto in questo ambito. AMD ha ben fatto con numerose delle sue APU e l’architettura GCN, ma Intel sembra essere andata ancora oltre con la memory coherency - la quale permette a CPU e GPU di lavorare in parallelo sugli stessi dati. Ad ogni modo, entrambe hanno fiutato l’opportunità e hanno di conseguenza scelto di dedicare forza lavoro alle iGPU, in modo tale da offrire performance decenti e monopolizzare il settore dei PC a basso costo. I nuovi processori grafici sviluppati non stravolgono, ma migliorano notevolmente quanto già era stato fatto. Fondandoci anche sui vari benchmark, possiamo affermare che GT2 arriva solo ad una modesta sufficienza, ma chi acquista un 6600K/6700K non guarda di certo alla grafica integrata. La GT2 verrà inoltre presumibilmente utilizzata anche su processori dedicati a dispositivi mobili che richiedano il massimo risparmio energetico. Siamo invece curiosi di testare i chip GT3/e e GT4/e in arrivo a breve sugli ulteriori processori Skylake, i quali rappresentano senza alcun dubbio il vero aggiornamento effettuato da Intel.