Upsampling

Visualizzazione dei risultati da 1 a 1 su 1
  1. #1
    Moderatore L'avatar di bibo01
    Registrato
    Oct 2010
    Messaggi
    4,591
    configurazione

    Predefinito Upsampling

    Upsampling

    Introduzione - Informazioni sui dati audio
    Il suono è una serie di pressioni di onde d'aria (compressioni e rarefazioni o, più generalmente, oscillazioni) che causano la vibrazione del timpano. Le vibrazioni vengono interpretate dal cervello come suoni. L'udito umano ha una notevole gamma dinamica ~ 132dB e una sensibilità che va da 20 Hz a 20 kHz - possiamo ascoltare i suoni soffici come lo sfregamento delle dita insieme a circa 3 db o forti come il motore di un jet a oltre 110 dB.

    Il principio di base che Thomas Edison utilizzò la prima volta per la registrazione del suono rimane in uso anche oggi - vide che poteva essere catturato emulando il timpano. Nel 1877 egli riuscì a registrare oscillazioni causate dalla sua voce su un cilindro rotante in metallo avvolto in carta stagnola mentre recitava 'Mary mangiò un po' d'agnello'. Furono poi riprodotte utilizzando una seconda unità a membrana e ago.

    Le variazioni nei livelli di energia di un suono causano variazioni d'intensità nelle oscillazioni del timpano. Queste sono percepite come variazioni di volume (ampiezza). Variazioni della frequenza delle oscillazioni (quante ce ne sono in un secondo) sono percepite come cambiamenti di tono.

    In un sistema di registrazione analogica, al variar dell'ampiezza e della frequenza sonora, cambia (modula) la forma d'onda attraverso continue variazioni di tensione. Un sistema di riproduzione audio segue questa forma d'onda, la amplifica e la passa alle membrane degli altoparlanti che ricreano il suono originale.

    Nella registrazione digitale, tuttavia, i suoni non vengono registrati di continuo, sono campionati a punti discreti nel tempo. Spetta al sistema di riproduzione di “dedurre” ciò che accade tra i campioni, un processo noto come interpolazione. La frequenza con la quale vengono prelevati i campioni è conosciuta come la frequenza di campionamento (Fs). Quanto alta deve essere la Fs per consentire una riproduzione accurata lo si comprende bene a livello matematico: possono essere catturate frequenze fino a ma non inclusa Fs/2 (metà della frequenza di campionamento o il limite di Nyquist).

    In parole semplici: all'aumentare della frequenza di un segnale, ci sono meno campioni disponibili per descrivere la sua forma d'onda. Come minimo, sono necessari poco più di due per ciclo. Se sono campionate frequenze superiori a Fs/2, il risultato è una distorsione che si manifesta sotto Fs/2 come immagini 'alias' delle frequenze sopra di essa. La registrazione digitale deve quindi filtrare i suoni che vanno oltre il limite superiore di frequenza per evitare 'distorsioni aliasing'. Il processo è noto come filtro anti-alias passa-basso.



    La frequenza di campionamento utilizzata su un CD a 44.1 kHz - può riprodurre frequenze fino a 22.05 kHz. Di questo passo, una sinusoide a 44,1 Hz ha 1.000 campioni per descrivere il suo ciclo d'onda, un onda a 441 Hz dispone di 100 campioni, a 4.410 Hz ne ha dieci – a 22.050 Hz ne ha due. Frequenze uguali o superiori a 22,05 kHz vengono filtrate.

    Ogni punto del campione registra un livello di tensione. Per i CD, questo è un numero intero a 16 bit chiamato la risoluzione che va da -32768 a +32767. Ogni cambiamento intero rappresenta un diverso livello di tensione, ad esempio, un'uscita nominale da 4V varia da -2V a +2 V con 65536 livelli possibili e in mezzo tutto mappato in modo lineare. Ad una risoluzione di 24 bit, ci sono 16,8 milioni di livelli di tensione e di conseguenza diventa disponibile una maggiore precisione. È stato suggerito che l'udito umano è in grado di rilevare i cambiamenti nei suoni equivalenti ad una risoluzione di circa 22 bit.

    L'informazione temporale (tempo) è implicita in Fs: un CD può memorizzare solo diversi livelli di tensione ad intervalli di tempo discreti di 1/Fs. La forma d'onda viene ricreata a questa frequenza di campionamento. I convertitori digitale/analogico (DAC) combinano i dati digitali con un segnale di clock per creare una forma d'onda analogica continua.

    Una parentesi: i dati audio originali sono stati creati da ADC (convertitori analogico-digitale). Qui, con valori molto alti di Fs (dove Fs/2 è molto più grande di qualsiasi frequenza della forma d'onda), seguita da un ottimo livello di downsampling utilizzando un filtro digitale si ottengono i migliori risultati.

    Upsampling – Una prospettiva nel Dominio di Frequenza
    Il processo di creazione di più campioni da un dato (banda limitata) flusso di input ha molti nomi: upsampling, oversampling, ricampionamento, filtri di ricostruzione e così via. In qualsiasi maniera venga chiamato, ciò che è essenziale è l'accuratezza di calcolo nell'ampiezza del nuovo segnale.

    Nella prospettiva del dominio della frequenza abbiamo la banda passante (e relativo rumore ripple), la banda di transizione ripida (~ 2kHz per il CD) e la banda di arresto. C'è un compromesso tra la "finestra" della banda di transizione e la quantità necessaria di calcoli (ogni dimezzamento della banda di transizione richiede quasi 2 volte la potenza di calcolo). Transizioni meno ripide (ovvero con meno calcoli) influenzano la risposta ad alta frequenza nella banda passante che non è voluta. Naturalmente non finisce qui ...

    Per capire l'accuratezza dell'ampiezza del segnale, abbiamo bisogno di una prospettiva nel dominio temporale.

    Upsampling – Una prospettiva nel Dominio del Tempo
    Il suono per come lo viviamo, è un evento in tempo reale e non una trasformata di Fourier.

    Spesso i filtri di ricostruzione sono progettati per ridurre modulazione tramite la risposta in frequenza. Tali progetti non garantiscono necessariamente la precisione nel dominio del tempo, vale a dire i nuovi campioni calcolati generano una forma d'onda che non segue i campioni di input originali.

    Questo è l'errore di interpolazione che è udibile. Esistono molte tecniche di interpolazione. L'Interpolazione a Banda Limitata offre precisione per il calcolo dell'ampiezza di segnale in ogni intervallo di tempo desiderato, riducendo così la dipendenza dai filtri di ricostruzione a valle.

    "Nell'audio digitale ciò che interessa è l'udibilità di errori di interpolazione tra i campioni. Dato che il teorema di campionamento di Shannon afferma che è possibile restaurare un segnale audio esattamente dai suoi campioni, ha senso che i migliori interpolatori audio digitali si basano su quella teoria. Tale interpolazione ‘ideale’ si chiama interpolazione a banda limitata.
    ...
    Il problema consiste nel calcolare correttamente i valori dei segnali su tempi continui e arbitrari partendo da un numero discreto di campioni nel tempo del segnale di ampiezza. In poche parole, dobbiamo essere in grado di interpolare il segnale dai campioni. Dato che il segnale originale si assume sempre che abbia una banda limitata a metà della frequenza di campionamento (altrimenti s'incorrerebbe nella distorsione aliasing al momento del campionamento), Il teorema del campionamento di Shannon ci dice che è possibile restaurare un segnale audio in maniera esatta ed univoca dai suoi campioni attraverso l'interpolazione a banda limitata."
    Indipendentemente dal fatto che l'upsampling sia fatto con cura per progettazione o accada più o meno per caso, l'upsampling è inerente alla riproduzione di musica digitale. Qualsiasi DAC (sia esso un design 'off the shelf' come Burr Brown PCM 1792 o un chip proprietario come il dCS Ring DAC) o DSP dedicato implementa l'upsampling con vari gradi di successo. Le metodologie variano dal grezzo al sofisticato.

    (Ironia della sorte, mentre si è scritto molto sui rapporti segnale-rumore (SNR), la distorsione armonica totale (THD), la risoluzione, la frequenza di campionamento, la fase, i filtri e così via, la qualità dei dati originali e i calcoli successivi sono spesso ignorati nonostante i sistemi audio derivino da essi il loro segnale analogico)



    Qui sopra viene mostrata la forma d'onda di suono reale di un campione digitalizzato a un millisecondo. Questa non è una forma d'onda analogica convincente: il suono è un segnale a variazione continua, non un mucchio di punti sospesi nello spazio. Tuttavia, i CD offrono solo una serie di campioni discreti - come devono essere uniti (upsampling) per creare una forma d'onda continua è lasciato interamente aperto. Nel caso qui illustrato, un presupposto importante è stato fatto: i punti del campione, sono stati uniti con linee rette.

    Questa interpolazione è detta lineare (y = mx dove m è la pendenza). Anche se fossero aggiunti un migliaio di punti tra campioni adiacenti (partendo da una frequenza di campionamento a 44,1 MHz), il risultato sarebbe sostanzialmente lo stesso. Alcuni lettori CD e DAC, compresi quelli di fascia alta, utilizzano questo approccio.

    I primi ladder DAC mantenevano una tensione costante all'ultimo punto campione. Come arriva un nuovo punto campione, la tensione è regolata su questo nuovo livello. (Da qui il termine ladder (scala) in cui le tensioni sono abbassate o innalzate) Questo tipo di interpolazione è una forma di upsampling di base. Alcuni lettori CD e DAC (di nuovo, compresi quelli di fascia alta) utilizzano ancora questa tecnica.

    Un'altra tecnica di interpolazione è nota come interpolazione sinc. I risultati ottenuti con l'interpolatore Secret Rabbit Code (SRC) 'Best Sinc' a 24/96 rispetto al precedente 1ms generano:



    Quando sovrapposto alla forma d'onda originale, si può notare quanto sia più 'simile all'analogico' ma incontra ancora difficoltà su picchi e valli. Notare gli errori di interpolazione (le deviazioni dalla linea rossa della curva) quando si utilizza 44,1. Ci sono molti di questi anche in questo campione di un millisecondo. In un secondo il numero aumenta di mille volte: l'udibilità di questi errori di interpolazione è meglio nota come 'artefatti digitali'.

    SRC rimane l'upsampler preferito per questa applicazione, basato com'è su interpolazione a banda limitata. Per un dato insieme di campioni a banda limitata, questo fornisce una solida base matematica per il calcolo preciso della forma d'onda analogica originale entro certi margini di errore ben definiti.

    Upsampling con SRC a 24/192 si ottiene:



    Chiaramente a 24/192 otteniamo più dettaglio su picchi e valli che ci portano più vicino alla forma d'onda analogica originale. Questa opzione è ideale in quanto altri metodi di come questi campioni sono uniti (lineare o altro, ma non ladder) hanno un impatto minore. Molti DAC moderni forniscono il supporto per l'ingresso S/PDIF a 24/192k.

    Produttori di DAC e upsamplers raramente pubblicano i dettagli sulle tecniche di interpolazione impiegate (di cui ce ne sono molte), ma, come guida generale, evitare DAC o upsamplers che:

    1. Funzionano come un multiplo intero del Fs originale (ad esempio, da 44,1 a 88,2). Un upsampling corretto fornisce dati in qualsiasi punto di temporizzazione per dare una forma d'onda continua; orientarsi quindi su upsamplers asincroni tipo SRC4392, SRC4192/3, CS8421, AD1896;
    2. Adottano un numero intero - tali algoritmi danno significativi errori di arrotondamento rispetto a quelli con numeri reali: ad esempio, 1/3 processato per interi viene visualizzato come zero mentre, in numeri reali è 0,33333, vale a dire che i valori dopo la virgola sono arrotondati per eccesso o per difetto.

    Da notare che è l'errore d'interpolazione, ancora molto diffuso nei SRC hardware, a fare la vera differenza. Qui si gioca la sfida di cPlay e del suo upsampling, che ha incorporati Secret Rabbit Code e SoX con un DSP a 128bit.
    Ultima modifica di TheMic : 21-05-2013 a 17:37

Informazioni Thread

Users Browsing this Thread

Ci sono attualmente 1 utenti che stanno visualizzando questa discussione. (0 utenti e 1 ospiti)

Discussioni simili

  1. Messaggio di cics sul No Upsampling
    By bibo01 in forum cMP² = cMP + cPlay
    Risposte: 19
    Ultimo messaggio: 05-02-2011, 01:35

Tags

Regole d'invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
nexthardware.com - © 2002-2022