2. Pillole di Ampere - Tecnologie


Ray Tracing

Già introdotto su Turing, il Ray Tracing di NVIDIA è una tecnologia in grado simulare realisticamente gli effetti di illuminazione all'interno di una scena attraverso una serie di complicati procedimenti e calcoli avanzati.

Il tracciato luminoso è generato partendo dalla visuale dell'utente, attraverso un piano di pixel 2D, per poi raggiungere gli elementi 3D della scena e terminare alla sorgente luminosa.

Durante questo processo vengono generati effetti luminosi di riflessione, rifrazione e ombra, che saranno infine combinati al fine di creare la scena finale.

Intuitivamente si potrebbe pensare che il metodo più accurato e logico per tracciare gli effetti di luce generati da una sorgente luminosa sia partire dalla sorgente stessa, ed è corretto, ma l'operazione risulterebbe troppo dispendiosa in termini di risorse specialmente per applicazioni in tempo reale.


ZOTAC GeForce RTX 3090 Trinity 2. Pillole di Ampere - Tecnologie 1 


È erroneo definire la tecnologia Ray Tracing come una novità a livello assoluto anche parlando della serie Turing, in quanto già largamente diffusa all'interno del mercato cinematografico con una lieve differenza.

Il prezzo da pagare era un enorme sforzo computazionale che vedeva coinvolte decine e decine di macchine per svolgere i calcoli a livello di CPU.

NVIDIA, grazie all'introduzione di Tensor Cores e RT Cores, non solo ha incrementato la potenza bruta destinata a queste operazioni, ma ha anche ottimizzato la quantità di calcoli necessari grazie ad algoritmi di selezione basati su intelligenza artificiale, rendendone così possibile l'applicazione in tempo reale all'intero di videogiochi e altri software per creazione di contenuti.


ZOTAC GeForce RTX 3090 Trinity 2. Pillole di Ampere - Tecnologie 2 


Con Ampere abbiamo già parlato del drastico incremento di risorse destinate alle operazioni RTX, ma questa non è l'unica novità; rispetto alla tradizionale architettura è stato aggiunto un nuovo nodo logico che opera in funzione del tempo.

Secondo quanto affermato da NVIDIA, la principale applicazione è la generazione di effetti di motion blur ma, analizzando i grafici forniti, possiamo intuire che i calcoli aggiuntivi potrebbero far parte di un algoritmo di previsione del movimento atto ad ottimizzare e alleggerire le operazioni in ray tracing.


ZOTAC GeForce RTX 3090 Trinity 2. Pillole di Ampere - Tecnologie 3 
ZOTAC GeForce RTX 3090 Trinity 2. Pillole di Ampere - Tecnologie 4  ZOTAC GeForce RTX 3090 Trinity 2. Pillole di Ampere - Tecnologie 5 


Infine, NVIDIA implementa la terza generazione di Tensor Cores, chiaramente basati sul chip A100 rilasciato nella primavera 2020.

La loro funzione, ricordiamo, è quella di semplificare le matrici preservandone la precisione attraverso deep learning e reti neurali.


ZOTAC GeForce RTX 3090 Trinity 2. Pillole di Ampere - Tecnologie 6  ZOTAC GeForce RTX 3090 Trinity 2. Pillole di Ampere - Tecnologie 7 


DLSS

Una delle novità più attese è sicuramente il DLSS 3.0, iterazione che dovrebbe rappresentare un grosso salto verso un nuovo approccio ai titoli next-gen e la standardizzazione delle risoluzioni QHD, 4K e 8K.

Il Deep Learning Super Sampling (DLSS) di NVIDIA, come suggerisce il nome, permette il rendering delle scene a risoluzione ridotta con successivo upscaling con perdita di dettagli minima o nulla.

Questa tecnologia si basa interamente sulle reti neurali dei Tensor Cores garantendo un incremento prestazionale notevole rispetto al classico metodo di rendering.

Purtroppo, però, con grande disappunto del pubblico, NVIDIA ha quasi totalmente omesso informazioni a riguardo alludendo implicitamente ad una release futura.

Dovremo quindi attendere ancora un po' per scoprire tutte le indiscrezioni a riguardo ...

Per il momento l'azienda di Santa Clara si è limitata a confermare il supporto per VR e risoluzione 8K.


RTX IO

Parallelamente all'annuncio di RTX Ampere, NVIDIA ci ha parlato di diverse novità riguardanti la parte software di cui la più interessante è sicuramente RTX IO, tecnologia che mira a rivoluzionare drasticamente il flusso di interscambio di dati tra unità di archiviazione e GPU.

La suite RTX IO non è un prodotto standalone, ma lavorerà in simbiosi con la nuova API DirectStorage di Microsoft, in maniera analoga a quanto già visto sulle console di nuova generazione in arrivo sul mercato.

Ma in concreto, come funziona NVIDIA RTX IO?

Negli attuali sistemi operativi Windows, OS di riferimento per quanto concerne il gaming, i dati di gioco devono necessariamente essere elaborati dalla CPU prima di essere inviati alla GPU per il rendering finale.

In alcuni casi queste operazioni risultano essere decisamente onerose a livello di hardware, specialmente quando si parla di dati compressi, come evidenziano i test effettuati da NVIDIA che mostrano scenari dove il carico sulla CPU è tutt'altro che trascurabile.


ZOTAC GeForce RTX 3090 Trinity 2. Pillole di Ampere - Tecnologie 8 


DirectStorage (e quindi RTX IO) crea una comunicazione diretta tra archiviazione e GPU, in questo modo i processori grafici RTX saranno in grado di selezionare autonomamente i dati di gioco e decomprimere gli stessi.

Il risultato è un sistema di interscambio di dati molto più efficiente e snello che alleggerisce notevolmente il carico sulla CPU, riduce le latenze di I/O e potrebbe andare a ridurre sensibilmente le dimensioni dei file di gioco.

Tale tecnologia sarà compatibile con tutta la linea RTX, sia Turing che Ampere.

Invece che caricare grossi blocchi di dati, come avviene con le tradizionali API, le richieste di input e output vengono gestite parallelamente suddividendo le informazioni in porzioni di dimensione minore, più facili da elaborare e da selezionare in base alla scena che in quel momento deve essere visualizzata a schermo.

Il prezzo da pagare è un aumento esponenziale del numero di richieste di I/O al secondo, compatibile solo con le unità di archiviazione SSD NVMe.

Passiamo così da un limite di poche centinaia a svariate decine di migliaia di operazioni al secondo, pertanto RTX IO sarà esclusivamente compatibile con SSD NVMe e, a tale proposito, Microsoft spiega:

"I dispositivi NVMe non solo offrono una larghezza di banda elevata, ma hanno anche linee hardware di accesso ai dati chiamate code NVMe, particolarmente adatte al carico di lavoro dei giochi. Per recuperare i dati dal disco, il sistema operativo invia una richiesta al dispositivo che sfrutta queste code per l'invio delle informazioni. Un dispositivo NVMe può avere code parallele, ognuna contenente contemporaneamente molteplici richieste. DicretStorage offrirà agli sviluppatori la possibilità di sfruttare a pieno questi dispositivi hardware altamente ottimizzati."

Le attuali API, oltre a non poter sfruttare a pieno le potenzialità di questi dispositivi, richiedono un numero di passaggi superiore che rallenta ulteriormente i tempi che intercorrono tra richiesta, elaborazione e consegna delle informazioni.

DirectStorage è in grado di riconoscere quale di questi passaggi è superfluo e ridurre l'overhead di ogni richiesta.

Questa tecnologia potrà essere sfruttata solo previa ottimizzazione da parte degli sviluppatori, come specifica Microsoft, i quali riceveranno un'anteprima di DirectStorage il prossimo anno.

Ciò significa che, realisticamente, il mercato dovrà aspettare il 2022 prima di vedere RTX IO trasformarsi in realtà.


NVIDIA Reflex

Una recente ricerca condotta da NVIDIA (che potete trovare a questo link) evidenzia come, su determinati titoli eSport, latenze inferiori garantiscano maggiore accuratezza rispetto a refresh rate superiori ai 60Hz.


ZOTAC GeForce RTX 3090 Trinity 2. Pillole di Ampere - Tecnologie 9 


Sulla base di questa ricerca è stata annunciata NVIDIA Reflex, una soluzione innovativa per minimizzare le latenze hardware in tutti quei titoli dove i riflessi giocano un ruolo fondamentale.

Con latenze hardware intendiamo il tempo di decorrenza tra la registrazione del colpo tramite click del mouse e l'apparizione sullo schermo.


ZOTAC GeForce RTX 3090 Trinity 2. Pillole di Ampere - Tecnologie 10 


Come ci fa notare il grafico NVIDIA, i componenti coinvolti in questo processo sono numerosi e ognuno di essi contribuisce ad incrementare la latenza complessiva.


ZOTAC GeForce RTX 3090 Trinity 2. Pillole di Ampere - Tecnologie 11 


Grazie a Reflex, il driver NVIDIA opererà in maniera parallela con il motore di gioco così da snellire sensibilmente la pipeline di rendering e abbattere le latenze tra mouse e display.

I risultati sono, nei casi migliori, abbastanza notevoli con una riduzione che si avvicina al 50% e i benefici si vedranno in quelle situazioni dove anche pochi millisecondi possono fare la differenza come la registrazione dei colpi, i flick shot, oppure durante i peak, annullando o riducendo quello che viene denominato peaker's advantage.


ZOTAC GeForce RTX 3090 Trinity 2. Pillole di Ampere - Tecnologie 12 


NVIDIA Reflex sarà reso disponibile per tutti i possessori di GeForce (da GTX 900 in su) tramite aggiornamento driver e, ovviamente, potrà essere sfruttato solo sui titoli compatibili.

Al momento la lista comprende: Fortnite, Valorant, Apex Legends, Call of Duty Warzone e Destiny 2.

Un'altra novità parallela a Reflex è l'implementazione del Reflex Latency Analyzer sui nuovi moduli G-SYNC 360, disponibili in esclusiva su una limitata selezione di monitor 360Hz in arrivo questo autunno.

Questo sistema banalmente si interpone fisicamente tra mouse e PC, permettendo la registrazione in tempo reale delle latenze suddivise step-by-step (come mostrato nel video sottostante).



Con esso saranno compatibili tutti i mouse, ma i prodotti ASUS, Logitech, Razer e Steelseries avranno accesso a qualche funzionalità aggiuntiva.