1. Pillole di Ampere - Architettura


Durante l'evento ufficiale di lancio NVIDIA ha rilasciato diverse indiscrezioni riguardanti le tecnologie che caratterizzano la seconda generazione di schede RTX.

Nei paragrafi a seguire andremo ad approfondire tutti i dettagli tecnici, facendo particolare attenzione alla nuova architettura Ampere e alle novità riguardanti il supporto software.

Volendoci focalizzare sulla parte tecnica ometteremo tutte le informazioni di carattere generico, rimandando il lettore all'articolo con cui abbiamo coperto l'evento di lancio.

Non è assurdo pensare che con Turing gran parte del prezzo giustificava l'introduzione della nuova tecnologia RTX; Ampere rappresenta infatti una diretta evoluzione della prima generazione con un'architettura del tutto similare che vede l'introduzione di nuovi SMs, RT Cores e Tensor Cores, più potenti, efficienti e numerosi.

Il risultato è un incremento prestazionale impressionante e che vede la sua espressione più palese nella RTX 3070, scheda che rende obsoleta l'ex flagship RTX 2080 Ti (1279€) a soli 519€.


Modelli
GeForce RTX 3070
GeForce RTX 3080
GeForce RTX 3090
GPU
Ampere GA104-300Ampere GA102-200 Ampere GA102-300
Processo produttivo
Samsung 8nmSamsung 8nm Samsung 8nm
Dimensioni chip
395.2mm2628.4mm2 628.4mm2
Tranistor
17.4 miliardi28 miliardi 28 miliardi
CUDA Cores
5888 8704
10496
Boost Clock
1.73GHz
1.71GHz
1.7GHz
Quantitativo memoria
8/10 GB GDDR6
10/20 GB GDDR6X
24 GB GDDR6X
Interfaccia memoria
256-bit
320-bit
384-bit
Velocità memoria
14 Gbps 19 Gbps 19 Gbps
RT Cores
2a generazione
2a generazione
2a generazione
Tensor Cores
3a generazione
3a generazione
3a generazione
Architettura
Ampere
Ampere
Ampere
DirectX 12 Ultimate
Sì
Sì
Sì
NVIDIA DLSS
Sì
Sì
Sì
PCIe 4.0
Sì
Sì
Sì
NVIDIA Ansel
Sì
Sì
Sì
NVIDIA FreeStyle
Sì
Sì
Sì
NVIDIA ShadowPlay
Sì
Sì
Sì
NVIDIA Highlights
Sì
Sì
Sì
NVIDIA G-SYNC
Sì
Sì
Sì
Driver Game Ready
Sì
Sì
Sì
Driver NVIDIA Studio
Sì
Sì
Sì
NVIDIA GPU Boost
Sì
Sì
Sì
NVIDIA NVLink
-
-
Sì
Vulkan RT, OpenGL
Sì
Sì
Sì
HDMI 2.1
Sì
Sì
Sì
DisplayPort 1.4a
Sì
Sì
Sì
NVIDIA Encoder
7a generazione
7a generazione
7a generazione
NVIDIA Decoder
5a generazione
5a generazione
5a generazione


Buona parte del merito è di Samsung con il processo produttivo a 8nm appositamente pensato per queste schede, grazie al quale NVIDIA ha moltiplicato la densità di transistor a livello di GPU, 28 miliardi in soli 628 mm², più di 44 milioni per mm².

Ciò impatta direttamente sulle prestazioni per watt con un incremento che il produttore traduce in un salto del 90% rispetto alla precedente serie Turing.

Ovviamente ritroviamo, come per la precedente generazione, le tecnologie RTX e DLSS oltre che l'introduzione di una serie di nuove funzionalità come RTX IO, NVIDIA Reflex e altri prodotti appositamente progettati per i creatori di contenuti, dei quali parleremo più avanti in questa pagina.


Architettura Ampere - NVIDIA GA102

Il top di gamma di nuova generazione è il chip GA102 che, a differenza delle passate schede RTX, accomuna sia la RTX 3090 (ricordiamo essere la nuova TITAN) che la RTX 3080.

Su quest'ultima questo impressionante circuito da 28 miliardi di transistor offre 30 TFLOPS FP32, 58 RT TFLOPS e fino a 238 tensor TFLOPS con 8704 CUDA Cores suddivisi tra 68 streaming multiprocessors (SMs): parliamo di un incremento teorico del 183% rispetto alla RTX 2080 Super.


ZOTAC GeForce RTX 3070 Twin Edge 1. Pillole di Ampere - Architettura 1 


In alto possiamo osservare il diagramma a blocchi della GPU GA102-200 che equipaggia la RTX 3080.

Come già anticipato, ritroviamo una struttura praticamente identica a quella di TU102 che si differenzia per la presenza dell'interfaccia PCI Express 4.0 x16 e 10 controller di memoria da 32-bit ciascuno (320-bit totali) che si collegano a memorie GDDR6X di ultima generazione in grado di raggiungere una velocità di trasferimento di 19 Gbps.

Assente l'interfaccia NVLink alla quale NVIDIA sembrerebbe voler dire addio, abbandonando il supporto SLI per tutte le schede consumer (rimane presente solo sulla RTX 3090).


ZOTAC GeForce RTX 3070 Twin Edge 1. Pillole di Ampere - Architettura 2 


Troviamo invece la massima evoluzione del chip sulla RTX 3090 con la variante GA102-300 che ne sprigiona tutto il potenziale: 10496 CUDA Cores, 36 TFLOPs FP32, 69 RT TFLOPs e 285 Tensor-TOPs, il tutto accompagnato da ben 24GB GDDR6X con interfaccia 384-bit e velocità di 19.5 Gbps.

La GeForce RTX 3090 è sulla carta un vero e mostro di potenza, pronta a rompere la barriera del 4K e tuffarsi direttamente nel gaming 8K, pur con alcune limitazioni.

Ma il vero target di questo modello non è comunque il mercato videoludico, bensì il mondo dei creatori di contenuti che vogliono il massimo che l'hardware possa offrire.

A differenza delle due schede di fascia superiore RTX 3080 e RTX 3090, la RTX 3070 è la prima GPU a montare il chip GA104 da 17.4 miliardi di transistor.

Sotto il cofano troviamo nello specifico la variante GA104-300 con 5888 CUDA Cores suddivisi tra 46 Streaming Multiprocessors (SMs) in grado di sprigionare 20.4 Shader TFLOPs, 39.7 RT TFLOPs e 163 Tensor TFLOPSs.


ZOTAC GeForce RTX 3070 Twin Edge 1. Pillole di Ampere - Architettura 3 


La struttura evidenziata dal diagramma in alto è del tutto analoga a quella della sorella maggiore GA102 con numerosi tagli al numero di unità di calcolo e ai controller di memoria, in questo caso solo 8 da 32-bit ciascuno che andranno a gestire 8GB GDDR6 con una velocità di trasferimento di 14Gbps.

Ritroviamo il supporto al PCI Express 4.0 e rimane assente l'interfaccia NVLink.


ZOTAC GeForce RTX 3070 Twin Edge 1. Pillole di Ampere - Architettura 4


Simile anche la struttura di ogni SM, sempre composto da quattro scheduler questa volta con 32 FP32 CUDA Cores, di cui 16 in grado di effettuare parallelamente operazioni INT32 e FP32.

Anche in questo caso abbiamo 128kB di memoria cache L1.

Ritroveremo la stessa GPU nella variante depotenziata GA104-200 sulla RTX 3060 Ti con specifiche che parlano di 4864 CUDA Cores, 38 SMs, 32 RT Cores e 152 Tensor Cores ad un prezzo di lancio che potrebbe aggirarsi intorno tra i 349 ed i 399$.


Memoria GDDR6X

ZOTAC GeForce RTX 3070 Twin Edge 1. Pillole di Ampere - Architettura 5 


Una delle principali novità introdotte da NVIDIA, e frutto di una collaborazione per ora esclusiva con Micron, è la tecnologia GDDR6X.

L'applicazione è simile a quanto già avviene con le GDDR6 ma sfrutta la modulazione PAM4 (Pulse Amplitude Modulation 4) che introduce due step di tensione al segnale.

Banalmente, al posto di utilizzare unicamente i valori zero e uno come comunemente concepito dal classico sistema binario, il segnale verrà trasmesso sui livelli 00, 01, 10 e 11, permettendo così la comunicazione di 4 differenti valori all'interno dello stesso ciclo.


ZOTAC GeForce RTX 3070 Twin Edge 1. Pillole di Ampere - Architettura 6 


Al momento della stesura di questo articolo, la tecnologia GDDR6X è esclusiva di RTX 3080 e RTX 3090.