2. GCN Graphics Core Next - Parte 2

 

Cache, Memory Controller e GDDR5

Un’architettura orientata al GP-GPU deve poter contare su un efficiente sistema di cache, necessario per garantire lo scambio consistente di informazioni tra le varie unità di calcolo e il sistema centrale.

Ogni CU può accedere alla cache L1 in lettura e scrittura con un bandwidht di 64Bytes per clock.


AMD Radeon HD 7970 ... anche in CrossFireX 2. GCN Graphics Core Next - Parte 2 1 

 

Le cache L1 sono sincronizzate dal GDS (Global Data Share) che si occupa di aggiornare le memorie cache di tutte le Compute Units.

La cache di secondo livello è condivisa tra le varie unità di elaborazione ed è collegata con sei controller di memoria a 64bit, per un totale di 384bit.

L’aggiunta di due controller aggiuntivi rispetto a quelli presenti nelle Radeon HD 6970, ha consentito ad AMD di aumentare la banda della memoria fino ad oltre 264GB/sec, utilizzando le tradizionali memorie GDDR5, e di incrementare di ulteriori 256kB la cache L2 rispetto alle HD 6970 (768kB complessivi).

Dodici sono i moduli di memoria GDDR5 installati sulla AMD Radeon HD 7970, per un totale di 3GB di V-RAM; la frequenza effettiva di funzionamento è pari a 5500MHz (1375MHz), la stessa delle HD 6970.

 

ROPs

Rispetto al passato, AMD ha cambiato anche l’architettura delle sue ROPs, ovvero le unità dedicate alle operazioni sui colori e all’MSAA.

Le ROPs non sono più accoppiate alla cache L2 e ai relativi controller di memoria, ma sono connesse con l’AMD crossbar  che collega i vari componenti.

Questa scelta è stata dettata dalla necessità di fornire un maggior bandwidth alle ROPs senza aumentarne il numero, operazione che non avrebbe comunque giovato alle prestazioni visto che già nelle GPU “Cayman” il reale utilizzo di queste unità era sotto il limite teorico.

Il numero totale di ROPs per “Tahiti” è di 32 unità, ma l’efficienza complessiva rispetto a quelle delle “vecchie” GPU AMD è decisamente superiore.

 

PCI-E 3.0

Il BUS PCI-E ha subito una rapida evoluzione nel corso negli anni, passando dalla versione 1.1 alla 3.0.

Le AMD Radeon HD 7970 sono le prime schede video dotate di interfaccia PCI-E 3.0, tuttavia le schede madri dotate di questo supporto sono ancora molto poche e anche le nuove CPU Intel SandyBride-E non sono ufficialmente certificate per funzionare in questa modalità perché, al momento del lancio, non erano disponibili un numero sufficiente di periferiche dotate di questa interfaccia.

Il PCI-E 3.0 consente di raddoppiare la banda massima per ogni canale, eliminando ogni possibile collo di bottiglia nella comunicazione tra GPU e CPU.

Nell’utilizzo di tutti i giorni e nei videogiochi il BUS PCI-E 3.0 non porta significativi vantaggi rispetto al PCI-E 2.0, neanche in configurazioni CrossFireX.

AMD ha deciso comunque di integrarlo per garantire le migliori performance possibili nel GP-GPU Computing, dove il bus PCI-E è il componente che può rallentare sensibilmente la velocità di copia tra la memoria di sistema e la V-RAM della scheda video.

La velocità finale del bus PCI-E  3.0 è di 1GB/sec bidirezionale, portando la velocità a massima di un porta 16x a 16GB/sec.

La nuova codifica utilizzata dallo standard PCI-E 3.0 (128b/130) consente inoltre di ridurre l’overhead di trasmissione dal 20% all'1,5%, massimizzando così l’efficienza dell’interfaccia.