Basata sulla architettura NVIDIA GeForce 8800, la GeForce 8800 GTS è l’ultima nata di questa fortunata generazione di GPU. Come le sorelle maggiori GTX e ULTRA, supporta pienamente le API DX10, la tecnologia SLI e tutte le altre feature della serie 8xxx. Strutturalmente è molto simile ai suoi predecessori ma utilizza la tecnologia produttiva a 65 nm, questo ha permesso di ridurre i consumi, il calore prodotto e i costi di produzione.
Design Unificato
La GeForce 8800 GTS implementa una architettura fortemente orientata al parallelismo, utilizzando shader unificati organizzati in 128 stream processor che lavorano alla frequenza di clock di 1.65 GHz. Ogni stream processor è in grado di allocare dinamicamente ognuno dei tre elementi grafici di base (vertex, pixel, geometry) oppure operazioni fisiche per un’efficiente utilizzo delle risorse e la massima flessibilità .
Utilizzando una architettura parallela,il modello a pipeline viene sostituito e più operazioni possono essere svolte in modo concorrente.
Modello tradizionale basato su Pipeline | Architettura Parallela di GeForce 8800 |
Gli Stream Processor sono organizzati a blocchi e gestiti in modo autonomo. Ogni blocco è dotato di una propria cache di primo livello per ridurre al minimo la latenza di accesso ai dati di più frequente utilizzo e la condivisioni diretta delle elaborazioni tra i vari Stream Processor.
Il modello unificato non è un requisito fondamentale per l’implementazione delle DX10, ma facilita la programmazione e la scalabilità delle GPU. Questa soluzione porta ad una grande flessibilità , infatti una scena ricca di Vertex Shader (es. grandi modelli geometrici), sarà calcolata alla stessa velocità di una scena ricca di Pixel Shader (es. rendering fotografico); in passato questo non era possibile perché esistevano unità di elaborazione dedicate ai due tipi di operazioni, e in genere, non erano in egual numero.
Architettura tradizionale | Architettura Unificata |
Stream Processing Architecture
Gli Stream Processor sono unità di elaborazione scalere molto efficienti, l’output di ogni unità può essere utilizzato come input delle altre, questo permette di alleggerire la gestione dei processi riducendo l’overhead nel passaggio dei dati. Gli Stream Processor sono raggruppati in blocchi che svolgono operazioni simili su differenti tipi di dati (tecnologia SIMD single instruction/multiple data), questo è reso possibile anche all’utilizzo di memoria on chip che permette un accesso rapido ai dati necessari per l’elaborazione e per la condivisione degli stessi tra i vari SP.
|
Diagramma a blocchi di uno Stream Processor |
Il clock degli Stream Processor è indipendente rispetto a quello del resto della circuiteria della GPU ed è gestito da un clock gen differente, questo spiega la maggior frequenza degli SP.
ROP e Memory Controller
Ogni ROP della 8800 GTS può processare 4 pixels (15 subpixel sample) per un totale di 24 pixel per ciclo di clock con la capacità di processing Z e Color. Se ci si limita al solo Z processing è possibile calcolare 192 sample per ciclo di clock, con l’utilizzo di AA 4x la capacità viene ridotta di 1/4 con la capacità di calcolare 48 pixel per ciclo di clock.
Il controller della memoria della 8800 GT è di tipo Cross Bar con ampiezza di banda di 256 Bit. L’ampiezza di banda è ridotta rispetto a quella della GTX e della GTS, ma questo non sembra influire in modo eccessivo sulle performance anche perché le frequenze di funzionamento delle ram maggiorate sopperiscono a questa limitazione, alle risoluzioni più elevate o con uso massiccio di filtri, questa limitazione può rendersi più evidente.
Lumenex Engine
Con la serie 8800 è stata introdotta una nuova modalità di Anti Aliasing 16x che permette di quadruplicare la qualità rispetto alla modalità 4x comunemente attivabile nelle soluzioni a singola GPU. Questa soluzione viene implementata attraverso la tecnologia Coverage Sampling Antialiasing (CSAA) attivabile dal pannello dei driver NVIDIA.
L’High dynamic-range (HDR) è ora attivabile anche con l’applicazione dei filtri AA e AF grazie all’implementazione della precisione 128-bit (32 bit per componente) non presente nella precedente generazione di schede video NVIDIA.
Come nella controparte ATI sono stati introdotti DAC a 10bit che aumentano la profondità di colore a milioni di colori (rispetto ai 16.7 milioni delle precedenti generazioni), purtroppo non ci sono ancora schermi di fascia consumer che supportano questa caratteristica.