AMD Naples: ecco l'architettura Zen per i server, con ben 32 core

AMD vuole lanciarsi nel settore dei server sfruttando la grossa potenza di calcolo dei core Zen: ecco Naples con 32 core a bordo.

AMD Naples: ecco l'architettura Zen per i server, con ben 32 core
Articolo a cura di

L'architettura Zen, introdotta ormai da circa un mesetto con i modelli della gamma Ryzen 7, non è dedicata esclusivamente al settore consumer, ma vuole abbracciare anche l'ambito server. In tale settore, l'azienda di Sunnyvale è stata totalmente assente, almeno con le CPU, lasciando ad Intel ancora più campo libero di quanto visto in ambito consumer. Ma il successo del design Zen passa anche dai server, e le performance mostrate dai primi processori Ryzen con le applicazioni multi processo sono certamente un ottimo indizio. La potenza di calcolo pura offerta dagli eventuali modelli dedicati ai server potrebbe infatti rivelarsi eccellente per lo scopo, grazie - soprattutto - all'adozione del simultaneous multithreading, applicato sul grande numero di core di cui i suddetti processori sono solitamente dotati. Il primo componente dedicato ai server che AMD dovrebbe rilasciare con architettura Zen ha nome in codice Naples: le sue caratteristiche includono una densità di transistor elevatissima e potenza di calcolo da vendere.

32 core e 64 thread per tantissimi transistor

AMD Naples è stato progettato per mettere i bastoni fra le ruote al dominio di Intel, la quale come sappiamo è da tempo nell'ambito server grazie alla famiglia Xeon. La dura battaglia vedrà quindi da un lato AMD Naples e dall'altro Intel Xeon, ed AMD vuole giocare la partita aumentando a dismisura il numero delle unità di calcolo. Per il processore Naples si parla infatti di varianti che vanno da un numero minimo di 16 core a un numero massimo di ben 32 unità, che grazie al multithreading possono arrivare a 64 thread. Non solo però abbondanza di core ed SMT, ma ci si aspetta anche un miglioramento delle istruzioni per ciclo di clock pari a 52% se confrontato con i predecessori Opteron. Assieme alle performance, i 14 nm - che è il processo produttivo sul quale dovrebbero essere basati i transistor sul die di Naples - assicurerebbero poi una grossa efficienza energetica.
Le principali caratteristiche di Naples si fondano, oltre che sul numero molto elevato di core e sull'adozione del simultaneous multithreading, anche su un bandwidth di memoria che cerca di superare la concorrenza. Dal processore dovrebbero partire otto canali di memoria, per cui in una configurazione tipica dei server, che prevede due socket sulla stessa board, potremmo vedere la coesistenza di 16 canali di memoria che supportano quindi 32 moduli DDR4, con una capacità teorica di ben 4 TB di RAM. Le linee PCIe dovrebbero invece essere 128, ovviamente con versione 3.0, le quali dovrebbero essere abbastanza per evitare l'utilizzo di un chip simil-PLX che amplifica tale connettività. Come per i processori desktop, anche per Naples avremo una struttura di caching altamente ottimizzata e che punta alle massime prestazioni, probabilmente con degli algoritmi basati su apprendimento approfondito che abbiamo visto anche sulle CPU Ryzen. Per interconnettere i due socket di una scheda madre server avremo la tecnologia AMD Infinity Fabric, di cui abbiamo parlato qualche tempo fa.

Le performance di Naples

Come sappiamo, i core Zen sono contenuti in quella che AMD chiama CPU complex. Un CPU complex è un gruppo di quattro core che sono connessi ad una cache di livello 3 condivisa, tipicamente con capacità pari ad 8 MB. Con 32 core a bordo per il modello più prestante, Naples dovrebbe raggruppare di conseguenza otto core complex e quindi 64 MB di cache L3.
Conosciamo poi il fatto che un singolo chip Ryzen da otto core, come può essere quello di Ryzen 7 1800X, contiene 4,8 miliardi di transistor; con tale dato possiamo facilmente effettuare una stima sui transistor contenuti invece in un processore Naples a 32 core: essi potrebbero arrivare ben a 19 miliardi, che è certamente un numero molto elevato.
Per merito dei numeri da capogiro associati a Naples, le performance attese sono chiaramente molto sostanziose. Allo scopo di dare ai clienti delle informazioni circa le prestazioni, AMD ha diramato una serie di slide che confrontano una CPU Naples alla concorrenza: secondo l'azienda, infatti, Naples possiede mediamente il 45% in più dei core, si fregia di una banda verso la memoria il 122% più ampia e ha una capacità di input/output più elevata del 60% rispetto al migliore processore server di Intel, che sappiamo essere uno Xeon E5-2699 V4.

Nello specifico, un server completo basato su Zen anziché su un modello Xeon comprende 128 core contro 88, 16 canali di memoria contro gli 8 di Intel, frequenza massima delle memorie più elevata (2400 MHz contro 1866 MHz) e maggiore disponibilità di linee PCIe (128 contro 80).
"È eccitante vedere AMD tornare nel settore dei server e notare come l'azienda abbia tentato di elaborare una strategia per portare sul mercato il processore migliore per assecondare le richieste dei data center moderni e degli scenari che si fondano sul cloud computing. Guardando ai dettagli dei prodotti Naples annunciati, si può trarre la conclusione che essi sono una buona combinazione delle feature che daranno ai clienti IT delle nuove opzioni da considerare quando verrà il bisogno di effettuare un upgrade alla piattaforma", ha affermato Matt Eastwood di JWT.

128 linee PCIe che fanno la differenza...

Le più recenti diapositive mostrate da AMD sulla piattaforma Naples ci mostrano, come abbiamo detto poco fa, che le linee PCIe che si dipartiranno dal processore saranno 128. Questo enorme numero di canali è stato inserito perché in ambito server spesso i dispositivi da supportare sono tanti rispetto a quelli del settore consumer. Il diagramma a blocchi rilasciato dall'azienda di Sunnyvale mostra come un rack 1U è capace di offrire il supporto a 32 device con interfaccia NVMe e quattro schede grafiche contemporaneamente. Come da prassi, un rack 1U mette a disposizione dell'utente finale due interconnessioni InfinBand EDR per la comunicazione fra i dispositivi di storage e il server stesso. Oltre al rack 1U, il quale si focalizza sul massimizzare la densità di calcolo, avremo anche il rack noto come 2U, che invece vuole portare all'estremo le prestazioni per singolo nodo. La sua principale caratteristica è il maggiore supporto di schede grafiche in parallelo, che da 4 passano ad 8; contemporaneamente, però, si abbassano i dispositivi NVMe, che arrivano a 26. C'è anche l'utilizzo di una singola interconnessione InfiniBand EDR (anziché due).
AMD ha confermato l'adozione della tecnologia Infinity Fabric, che non è altro che il protocollo Hyper Transport evoluto. Grazie ad essa i server saranno più scalabili rispetto al passato e saranno più amalgamati, senza avere tantissimi protocolli che devono poi interfacciarsi tra loro. In un'altra slide, invece, l'azienda americana ha mostrato i rack che dovrebbero essere disponibili al lancio di Naples.

Questi vanno dal rack 1U, che offre 2 processori e 4 schede grafiche, e arrivano al rack 2U, che mette a disposizione 2 CPU ma 8 GPU, passando per configurazioni intermedie che vedono la presenza di un processore a più schede grafiche o viceversa. AMD dovrebbe mettere a disposizione dei propri clienti anche delle schede di espansione con interfaccia PCIe e formato MCM oppure MXM, con gli scopi più disparati. Ovviamente, ci sarà la possibilità di puntare alle schede grafiche Radeon Instinct, che ricordiamo essere la famiglia con architettura Vega dedicata al calcolo professionale, e che quindi punta tutto sulle prestazioni con i dati in virgola mobile rappresentati con doppia precisione.

AMD I piani per portare la piattaforma Naples sul mercato server sono, come abbiamo potuto vedere, abbastanza chiari, seppur la sua disponibilità sia prevista tra qualche mese, entro la fine del secondo quarto del 2017. I processori che AMD vuole far arrivare in mano ai clienti dovrebbero essere davvero molto potenti, e potrebbero di conseguenza competere ad armi pari con i modelli della famiglia Xeon. Intel sta però già reagendo alle informazioni condivise dalla rivale, ed in effetti si parla di una nuova variante Xeon a 32 core: la sfida è aperta.