NVIDIA Pascal: tutte le ultime informazioni

NVIDIA Pascal si avvicina e i dettagli iniziano a farsi più profondi e chiari, soprattutto dopo la GPU Technology Conference, che ha fornito ulteriori informazioni sulla prossima architettura della casa di Santa Clara.

NVIDIA Pascal: tutte le ultime informazioni
Articolo a cura di

Le prime schede grafiche con architettura Pascal saranno svelate al Computex 2016, che si terrà a Taipei dal 31 maggio al 4 giugno. Oramai sembra cosa certa, le voci che girano in merito sono troppe per poter saldamente affermare il contrario. Si vocifera inoltre che l'azienda di Santa Clara abbia già messo in produzione i primi esemplari, per rilasciare sul mercato le GPU subito dopo il loro annuncio. Probabilmente, NVIDIA mostrerà per prime la GeForce GTX 1070 e la GeForce GTX 1080, che faranno uso del chip GP104; la Graphic Processor Unit di punta, la GP100, per adesso sarà riservata solo agli acceleratori Tesla, soluzioni dedicate al mondo dell'High Performance Computing. L'unica proposta concreta, per adesso, non è relativa al mercato del gaming, ma a breve NVIDIA colmerà anche questo vuoto.

Quando vedremo GTX 1070 e GTX 1080?

GTX 1070 e GTX 1080 saranno rispettivamente i successori di GTX 970 e GTX 980, rilasciate oramai due anni fa. La conferenza NVIDIA si terrà il primo giorno del Computex, quindi le nuove GPU dovrebbero essere rivelate il 31 di maggio. I nomi commerciali non sono però ancora ufficiali e, considerando che sarà uno step importante, i vertici della società americana potrebbero anche decidere di cambiare nomenclatura alla prossima serie. Subito dopo l'annuncio, i partner di NVIDIA come ASUS, MSI e Gigabyte sveleranno le loro proposte, pronte con modelli custom da lanciare sul mercato. I primi esemplari potrebbero essere venduti inizialmente solo sullo store di NVIDIA, che dovrebbe mantenere una specie di esclusiva per un breve periodo di tempo. La compagnia agì in un modo simile con la GTX 980 Ti, che solo dopo qualche giorno dal rilascio ufficiale arrivò negli store autorizzati. Ancora, sappiamo che le schede con dissipatori personalizzati arriveranno solo a fine giugno o inizio luglio, periodo in cui le GPU Pascal avranno raggiunto volumi di produzione adeguati.
Gli utenti si aspettano che le migliori prestazioni offerte dalla nuova architettura rendano le prossime proposte ideali per la realtà virtuale. Le schede attuali di fascia alta offrono performance sufficienti, ma ad un prezzo a cui non tutti possono andare incontro. Oltre alla realtà virtuale, la speranza è quella di poter giocare in 4K a 60 FPS stabili. GTX 1070 e GTX 1080 dovrebbero arrivare con ben 8 GB di RAM video, che diventeranno il nuovo standard, insieme poi a tutta una serie di nuove caratteristiche (ancora non conosciute), al nuovo processo produttivo FinFET e all'ottimizzazione per le ultime librerie grafiche DirectX 12 e Vulkan.

Dettagli su GP104 e GP106

GP104 prenderà il posto di GM204, che sarà alla base delle prossime soluzioni di fascia media e alta della società. Avrà un die grande circa 300 millimetri quadrati, il che rende GP104 circa 100 mm2 più piccolo rispetto alla GM204 di GTX 970 e 980. Quest'ultimo infatti ha un'area di 398 mm2 ed ospita 5,20 miliardi di transistor, mentre il successore porterà questo valore oltre i 7 miliardi, seppur la superficie occupata sia minore. La distanza in termini di semiconduttori rispetto alla versione più castrata del chip di punta GP100 non sembra quindi essere troppa, perché esso ha 8 miliardi di transistor a sua disposizione.
Inoltre, la casa di Santa Clara ha optato per un design più "rettangolare", sul quale saranno basate anche GP100 e GP106. La diversa struttura, presa da sola, non vuol dire molto in realtà, ma secondo NVIDIA la sostituzione di un'architettura costituita da quadrati ha dato i suoi benefici. I registri a disposizione dei CUDA Core sono raddoppiati, così come il bandwidth di memoria; questi due fattori portano ad un throughput più elevato con le istruzioni, con un miglioramento diretto all'IPC. Le ultime voci di corridoio suggeriscono purtroppo che GP104 non avrà intorno a sé i chip di memoria HBM, ma che dovrà accontentarsi della tecnologia GDDR5X ad 8 Gbps. Questa dovrebbe garantire un bandwidth di 320 GB/s per GTX 1080 e di 256 GB/s per GTX 1070.
GP106 è invece la GPU destinata alla fascia entry level del mercato, e grazie ai colleghi di Videocardz possiamo adesso darvi qualche informazione nuova su questo chip. Confrontando il nuovo chip con il GM206 si scopre che il primo è più piccolo del precedente modello: GP106 ha infatti un die di 200 mm2, minori dei 227 mm2 del suo antecedente. Sappiamo poi che sarà a bordo del modulo Drive PX 2, che arriverà entro la fine di questa primavera.

Acceleratore Tesla P100 con GP100

Presentata al keynote di NVIDIA alla GTC (GPU Technology Conference) appena passata, Tesla P100 è la prima scheda in assoluto powered by GP100, la più prestante GPU con architettura Pascal. Tesla P100 è anche un importante passo in avanti nella famiglia delle soluzioni dedicate all'high performance computing, perché l'ultimo esemplare risale al 2012 e aveva architettura Kepler. E' per questo motivo che l'ultima nata dovrebbe portare un sostanzioso incremento prestazionale, grazie anche al processo produttivo FinFET a 16 nanometri. Dobbiamo precisare che però la GP100 a bordo della Tesla P100 non è la sua versione più potente, in quanto segnaliamo che alcuni CUDA Core sono bloccati a causa dei 56 SM attivi sui 60 disponibili. Rispetto a GP104 e GP106 abbiamo anche un die grande più del doppio, con un'area di 610 millimetri quadrati che dà alloggio ad un numero enorme di transistor - circa 15,3 miliardi. TSMC si sta occupando della produzione di massa del chip, apparentemente con una nuova tecnologia che fa in modo di applicare l'interposer per le memorie HBM2. Tesla P100 offre 10,6 TFLOPS di potenza FP32 e 5,3 TFLOPS FP64. Il salto prestazionale rispetto alle ultime Tesla, come la K80 ma soprattutto la K40, è quindi evidente. La memoria a bordo è pari a 16 GB HBM2 con un bus ampio 4096 bit, il tutto con un enorme bandwidth da 720 GB per secondo. Tesla P100 supporta anche NVLink, grazie a quattro controller appositi. Il TDP massimo è stato fissato da NVIDIA a 300W.
Ricordiamo che GP100 possiede 64 CUDA Core FP32 e 32 CUDA Core FP64 per ogni SM. Una delle peculiarità dell'architettura è quella di trasformare un singolo CUDA Core FP32 in due FP16, così da mettere a disposizione anche una capacità di calcolo cosiddetta mixed precision.

NVIDIA Grazie all’opera di miniaturizzazione, NVIDIA ha chiaramente lavorato molto sul die shrink, cioè sul compattare al minimo le dimensioni dei vari chip grafici. Ogni singolo transistor è più piccolo ed occupa meno spazio, quindi l’azienda ha potuto inserire più commutatori a parità di area. Avere più superficie disponibile significa anche poter saldare più chip di memoria, ed in effetti i GB dovrebbero salire ad 8 GB, raddoppiando i discussi 4 GB della GTX 970. Peccato però che al 99% non troveremo le HBM2 su GTX 1070 e GTX 1080, che daranno alloggio invece alla nuova versione delle GDDR5 di Micron. Le High Bandwidth Memory dovremmo trovarle esclusivamente sulle schede GP100, quindi sulla prossima Titan e su una eventuale GTX 1080 Ti. Sul fronte HPC, NVIDIA si sta invece concentrando sulle capacità scaling, portandole a livelli estremi. NVLink dà una grossa mano a questo fattore, in quanto permette di utilizzare anche otto schede grafiche in parallelo, che per il settore professionale sono una manna dal cielo. Appuntamento al Computex 2016 per conoscere i primi esemplari Pascal dedicati al gaming.