NVIDIA annuncia Ada Lovelace 1 


In data odierna NVIDIA ha svelato la sua nuova serie di schede grafiche basate sull'architettura Ada Lovelace, che porta con sé importanti novità in grado di rivoluzionare l'intero mercato.

A capitanare la lineup troviamo la tanto attesa GeForce RTX 4090, scheda pensata non solo per i più incalliti videogiocatori, ma anche per i professionisti del rendering, grazie ad un salto generazionale che si approssima al doppio di potenza bruta a risoluzione nativa ed un quasi incredibile 4x con DLSS attivo.

Al cuore della nuova top di gamma troviamo il processore grafico Ada Lovelace AD102 realizzato tramite processo produttivo TSMC 4N e con una superficie complessiva di 600mm2, dentro alla quale troviamo ben 76 miliardi di transistor organizzati in 7 differenti cluster grafici, similmente all'attuale GA102.

Analoga anche la presenza di 6 TPC e 2 SM, i quali contano al loro interno 4 sub-core ciascuno.


NVIDIA annuncia Ada Lovelace 2 


La novità principale riguarda la configurazione di core FP32 e INT32.

Ogni sub-core sarà composto da 128 unità FP32 e 192 unità combinate FP32+INT32, supportate da 192kB di cache L1 per SM, aumento complessivo del 50% rispetto alla precedente generazione che porta il totale di cache L1 a 4,5MB.

Salendo di livello troviamo un'esorbitante valore di 96MB di cache L2, ben 16 volte rispetto alla GPU GA102.

Infine, il numero di ROP per Graphics Processing Cluster viene incrementato notevolmente raggiungendo un totale di 32.

Si parla, dunque, di un importante salto dai 112 ROP della RTX 3090 Ti ai 176 ROP complessivi presenti sulla RTX 4090.


NVIDIA annuncia Ada Lovelace 3 


Tornando alle specifiche della nuova ammiraglia NVIDIA, sotto la scocca abbiamo quindi 128 SM (dei 144 totali potenzialmente disponibili sul chip) per un totale di 16.384 CUDA core, 176 ROP, 512 TMU e 96MB di cache L2.

Disponibile in un'unica configurazione di memoria, la 4090 è equipaggiata con 24GB di GDDR6X da 21 Gbps su interfaccia a 384 bit, per una larghezza di banda complessiva di 1 TB/s.

Per quanto concerne i consumi, il TBP è fissato a 450W e la scheda sarà alimentata da un singolo cavo con connettore 12VHPWR (12+4 pin).


NVIDIA annuncia Ada Lovelace 4 


Spostandoci sulle prestazioni in gioco, NVIDIA promette un incremento compreso tra 2x e 4x mostrandoci tre differenti titoli utilizzati per i test, ovvero Microsoft Flight Simulator, Warhammer 40,000: Darktide e Cyberpunk 2077.

Il prezzo di listino per il mercato americano è di 1.599 USD con disponibilità a partire dal 12 ottobre.

Parallelamente, l'azienda conferma le specifiche della sorella minore GeForce RTX 4080, questa volta in arrivo con due differenti tagli di memoria: 12GB di GDDR6X e 16GB di GDDR6X.


NVIDIA annuncia Ada Lovelace 5 


A livello di processore, la variante da 16GB dovrebbe utilizzare una versione ridotta della GPU AD103-300 composta da 76 SM attivi contro gli 84 totali affiancanti da 48MB di cache L2.

La velocità di trasferimento si attesta sui 22,4 Gbps con interfaccia a 256 bit, per una larghezza di banda complessiva di 720 GB/s.

Il TBP è fissato a 320W con un prezzo di riferimento di 1.199 USD con disponibilità a novembre.

La sorella minore da 12GB subirà dei tagli anche lato processore grafico, utilizzando una GPU AD104-400 con 60 SM e 7680 core.

La memoria cache rimane la medesima, ma l'interfaccia sarà a 192 bit, motivo per cui troviamo solo 12GB di GDDR6X.

Calano anche il TBP, che troviamo impostato a 285W, ed il prezzo di listino che è di 899 USD.

Sicuramente i due modelli offriranno differenze sostanziali in termini prestazionali se paragonate tra loro, ma entrambe surclasseranno in maniera consistente la RTX 3080 Ti con risultati compresi tra l'1,5x e il 3x in base al modello.

Ma le GPU Ada Lovelace non sono solo potenza bruta, al contrario l'azienda ha voluto concentrare gran parte delle risorse sullo sviluppo di nuove tecnologie per utilizzare in maniera ancora più efficiente la potenza di calcolo a loro disposizione.

"Ada", nickname utilizzato dal CEO, aggiorna tutti e tre le unità computazionali RTX.

Concretamente si parla di nuovi SM da 90 TFLOP con un'efficienza doppia rispetto alla precedente generazione, che potranno fare affidamento su una nuovissima tecnologia di gestione in tempo reale della pipeline chiamata "Shader Execution Reordering" (SER) la quale dovrebbe garantire una velocità di esecuzione doppia rispetto al passato.

Il concetto alla base di questa tecnologia riguarda la natura intrinseca delle moderne GPU, che operano in maniera più rapida ed efficiente mentre lavorano sul medesimo tipo di operazione.

Potendo riorganizzare la catena di esecuzione, il carico sugli Streaming Multiprocessor dovrebbe portare a tangibili incrementi prestazionali.


NVIDIA annuncia Ada Lovelace 6 


Rinnovati anche gli RT Core ed i Tensor Core, rispettivamente alla terza e quarta generazione, accoppiati a due nuovi moduli: l'Opacity Micromap Engine in grado di accelerare l'alpha-test di un fattore doppio rispetto alla corrente generazione ed il Micro-Mesh Engine, capace di incrementare la densità geometrica senza impattare su prestazioni o memorie.

Di seguito potete osservare la tabella delle caratteristiche principali delle schede presentate.


Modello scheda
GeForce RTX 4090
GeForce RTX 4080 16GB
GeForce RTX 4080 12GB
CUDA core
16.384
9.728
7.680
RT core
128
76
60
Tensor core
512
304
240
Boost Clock
2.52GHz
2.51GHz
2.61GHz
Base Clock
2.23GHz
2.21GHz
2.31GHz
Quantitativo memoria e relativa velocità
24GB di GDDR6X
da 21 Gbps
16GB di GDDR6X
da 23 Gbps
12GB di GDDR6X
da 21 Gbps
Interfaccia
384-bit
256-bit
192-bit
TBP
450W
320W
285W
Porte
1 xHDMI 2.1a,
3x DisplayPort 1.4a
1x HDMI 2.1a,
3x DisplayPort 1.4a
1x HDMI 2.1a,
3x DisplayPort 1.4a
Interfaccia
PCI Express 4.0
PCI Express 4.0
PCI Express 4.0
NVIDIA NVLink
No
No
No
Codifica e decodifica AV1
Sì
Sì
Sì
Alimentazione
3 cavi PCIe 8 pin o
1 cavo 12VHPWR
3 cavi PCIe 8 pin o
1 cavo 12VHPWR
 2 cavi PCIe 8 pin o
1 cavo 12VHPWR
Data di uscita
12 ottobre
novembre
novembre
Prezzo
1599 USD
 1979€
1199 USD
1479€
899 USD
1109€


NVIDIA annuncia Ada Lovelace 7 


Da ultimo abbiamo la tecnologia DLSS aggiornata alla versione 3.0, che apporta radicali modifiche al sistema di intelligenza artificiale generando interi frame al posto di singoli pixel.

Il suo funzionamento è garantito da quattro componenti: un nuovo Optical Flow Accelerator, i vettori di movimento di gioco, un Autoencoder AI convoluzionale e la Reflex super-low-latency pipeline.

Il DLSS 3.0 analizzerà il frame attuale ed il frame successivo in bassa risoluzione (1080p) per scoprire come la scena cambierà.

L'Optical Flow Accelerator genererà un set di vettori composti da direzione e velocità per ogni pixel che sarà poi passato alla rete neurale insieme agli elementi geometrici della scena così da generare i frame intermedi che costituiranno la nuova scena in alta risoluzione.

Il suo funzionamento autonomo, oltre a garantire incrementi prestazionali fino a 4 volte superiori, non necessita di elaborazione a livello di CPU, rimuovendo parte dei limiti imposti lato processore su alcuni titoli particolarmente intensi a livello computazionale quali Microsoft Flight Simulator.

Tra gli esempi più eclatanti, l'azienda ci mostra come, all'interno di Cyberpunk 2077, l'attivazione del DLSS 3.0 porti ad un passaggio da 23 FPS a poco meno di 100 FPS al prezzo di una perdita di dettaglio quasi impercettibile.