1. AMD Fiji e memorie HBM


AMD Radeon R9 NANO 1. AMD Fiji e memorie HBM 1 


Come si può vedere dal diagramma a blocchi Fiji è una GPU decisamente densa con una organizzazione interna che richiama quella di Tonga e il progetto AMD GCN, qui in versione 1.2, in generale.

Fiji dispone infatti di otto unità ACE (Asynchronous Compute Engine - unità computazionali asincrone) esattamente come Tonga, di un Graphics Command Processors e di una porzione di memoria condivisa tra i quattro Shader Engine, i macroblocchi principali dove avvengono tutte le operazioni sui pixel.

Ogni Shader Engine comprende un Geometry Processor, un'unità di rasterizzazione, 4 unità di render back-end in grado di renderizzare 4 pixel per clock ciascuna e 16 Compute Unit che racchiudono 64 Stream Processor e 4 unità di texturing.

Facendo quindi le debite moltiplicazioni otteniamo 4096 Stream Processors (64x16x4) le 256 TMU (4x16x4) e le 64 ROP (4x4x4) che compongono Fiji.

Il tutto è collegato alla cache L2, di cui però non conosciamo le dimensioni, che fa da buffer tra le unità di elaborazione ed i controller, 8, verso le memorie HBM.

E sono proprio queste ultime che, come novità tecnologica assoluta per il mercato delle schede grafiche, meritano sicuramente un ulteriore approfondimento.

Partendo dall'assunzione che le GPU stavano evolvendo a ritmi elevatissimi, AMD si pose il problema di cosa fare in futuro quando la tecnologia GDDR sarebbe giunta al suo apice e, quindi, a un punto in cui non sarebbe più stata in grado di supportare in maniera efficiente la velocità di calcolo delle soluzioni di fascia alta.

Non si tratta solamente della banda passante offerta, ovvero della frequenza di funzionamento e dell'ampiezza del bus di memoria, ma anche di un problema energetico e di occupazione di spazio sul PCB.

Dal punto di vista energetico sappiamo che aumentare la velocità richiede maggiore tensione di alimentazione, di conseguenza sezioni VRM più robuste e costose, mentre sotto il profilo dell'ingombro la tecnologia produttiva è al limite ed i chip non possono essere ridotti ulteriormente così come i componenti necessari all'interfacciamento tra le memorie e la GPU.

Considerati tutti questi aspetti è facile capire i motivi per cui i prodotti di fascia alta abbiano tutti una certa dimensione e, ovviamente, un certo costo.

Queste le premesse che hanno portato alla creazione delle memorie HBM, una soluzione in grado di ridurre consumi e ingombri unitamente ad un incremento di banda passante tale da restare al passo con le moderne GPU.


AMD Radeon R9 NANO 1. AMD Fiji e memorie HBM 2 


Nella slide possiamo vedere le differenze tra un chip GDDR5 e una soluzione HBM: maggiore ampiezza del bus di comunicazione, ogni chip è interconnesso tramite una doppia interfaccia a 128 bit, per un totale di 1024 bit per stack di 4 chip, maggiore banda passante e consumi ridotti grazie all'inferiore tensione di alimentazione.


AMD Radeon R9 NANO 1. AMD Fiji e memorie HBM 3 


Nella vista aerea, invece, possiamo apprezzare la riduzione di spazio occupato garantita dagli stack di memoria HBM rispetto ai chip GDDR5 attuali: una riduzione degli ingombri pari al 94% (35mm2 per un chip da 1 GByte di HBM contro i 672mm2 per quattro chip GDDR5 da 256 MByte l'uno).

"Risolto" il problema dei consumi, della banda passante e in parte anche quello degli ingombri, resta però il problema dell'integrazione della tecnologia per garantirne le massime prestazioni.

Ed è qui che entra in gioco l'interposer, ovvero un'interfaccia passiva che permette di integrare le memorie HBM direttamente sul chip, sia esso una GPU o un qualsiasi altro integrato che necessita di un buffer di memoria veloce ed efficiente.


AMD Radeon R9 NANO 1. AMD Fiji e memorie HBM 4 


L'interposer si collega direttamente alle memorie e alla GPU permettendo di incrementare l'ampiezza del bus di trasferimento dati e la gestione delle frequenze di lavoro oltre ai consumi.


AMD Radeon R9 NANO 1. AMD Fiji e memorie HBM 5 


Una nuova interfaccia richiede indubbiamente anche nuovi sistemi di collegamento e qui entrano in gioco le nuove tecnologie TVS (through-silicon-vias) e µbump, che collegano tra loro i chip HBM, che ricordiamo sono impilati uno sull'altro, così come a cascata ogni stack di memoria e anche la GPU, con l'interposer che può così svolgere il suo ruolo di interfaccia tra le nuove memorie e quest'ultima.

Il tutto è poi collegato a un substrato comune che costituisce l'interfaccia di base tra il sistema GPU/memorie HBM ed il resto dei componenti che costituiscono la scheda video.


AMD Radeon R9 NANO 1. AMD Fiji e memorie HBM 6 


Ed ecco, in pratica, quale impatto ha la tecnologia di memoria HBM sulla scheda grafica: il chip risulta ovviamente più complesso, ma se si considera l'area occupata dalle memorie, che per le HBM è la medesima della GPU (in quanto si trovano sopra), il risultato finale è un risparmio di spazio notevole.

Una riduzione degli ingombri che permetterà di avere soluzioni di fascia alta in formati ultracompatti adatti ai sistemi da salotto e, sopratutto, già pensati per le integrazioni in soluzioni All in One dalle dimensioni molto contenute dall'elevata densità di potenza.


AMD Radeon R9 NANO 1. AMD Fiji e memorie HBM 7 


Concludiamo con una slide "celebrativa" della tecnologia HBM in cui sono riassunti i principali vantaggi offerti:

  • maggiore ampiezza di banda;
  • maggiore efficienza energetica;
  • ridotta occupazione di spazio che facilita la realizzazione di soluzioni potenti ma compatte;
  • innovazione, un punto a favore di AMD, rimasta decisamente in ombra per parecchio tempo in questo settore.

L'unico "lato negativo", almeno per il momento, è il quantitativo massimo di memoria installabile per chip, limitato a 4GB, ovvero quattro stack da 1GB l'uno ...

Vedremo in seguito, alla prova dei fatti, se questa limitazione risulterà penalizzante nel confronto con le schede dotate di un più ampio buffer di GDDR5.