una volta letto il 3D relativo alle differenze all'ascolto tra MP3 e WAV, ho riflettuto un pochino sul tema ed ho voluto approfondire, per cui condivido con voi le mie riflessioni ed i miei calcoli sul tema.
A parte il fatto che faccio parte di quelli che hanno scelto il file sbagliato, spero perchè fuorviato da quanto usato per riprodurli (in genere ai meeting le orecchie mi funzionano), il messaggio corale di chi ci ha "azzeccato" è stato che il file WAV contiene più ambienza, più microinformazioni, più dettagli ambientali e così via, ognuno cercando di esprimere con i propri termini la miglior qualità percepita.
Mi sono allora chiesto:
- esiste una correlazione tra questo fatto e dei dati oggettivi e misurabili?
Se la risposta è positiva, si può inferire che tali dati oggettivi e misurabili indicano dove sta (e quindi dove non sta) la ambienza, le microinformazioni, i dettagli ambientali, ecc... che si percepiscono sul file WAV e che spariscono nel file MP3?
E se tali dati oggettivi e misurabili cambiano verso una qualità migliore/peggiore in modo correlato alla minore/maggiore perdita di informazione operata nella conversione WAV-MP3, possiamo acquisire maggiore confidenza che essi siano in grado di indicare dove è e in che misura l'ambienza, ecc.. è mantenuta o è persa?
Vi anticipo e vi dico subito che al momento, prima di poter applicare questa misura al CCI (e non solo) devo ancora risolvere un problema teorico abbastanza difficile (mai affrontato seriamente per quanto mi consta dalla scienza delle misure audio), su cui non ho ancora la certezza di avere la soluzione e che probabilmente non è proprio risolvibile con esattezza (cosa che urta il mio carattere )
Con Massimo abbiamo già fatto dei tentativi in passato e di certo mi rifarò vivo quando avrò la confidenza per farlo.
Nel caso presente di valutazione WAV versus MP3, questo problema teorico ha un impatto molto basso, per cui ho la confidenza che i risultati siano molto attendibili.
Semplificando molto per non appsantire, nei grafici seguenti, che somigliano a (ma non sono) una risposta in frequenza e che sono ottenuti in modo originale, abbiamo l'errore energetico alla generica frequenza. Se si legge -0.2 dB a 1000 Hz ad esempio, significa che il segnale misurato, rispetto al riferimento, è energeticamente deficiatario di 0.2 dB, ossia eroga 0.2 dB in meno di energia rispetto a quanto dovrebbe (rispetto alla energia del segnale di riferiemento a quella frequenza).
Il segnale privo di errori energetici è quindi la linea piatta a quota 0 dB su tutto lo spettro.
Il segnale di riferimento è il brano di Massimo in formato WAV usato per il test di perdita di informazione da WAV a MP3. Questo segnale non ha perdita di informazione. Il grafico dell'errore energetico di questo segnale è (correttamente) la linea piatta a 0 dB su tutto lo spettro.
Gli altri segnali sono quello stesso WAV convertito in MP3 a 192Kbps, 256 Kbps e 320 Kbps (ossia con perdita di informazione decrescente all'aumentare del bit rate) per cui quello a 192 Kbps dovrebbe mostrare un grafico peggiore di tutti, quello a 256 Kb uno intermedio e quello a 320 Kb quello meno peggio.
E infatti è proprio così! (vedete la legenda del grafico in basso)
Per chi è riuscito a seguirmi fin qui ecco la domanda su cui chiacchierare insieme:
La ambienza, le micro informazioni, i microdettagli, ecc... insomma il suono più bello, sono allora presenti quando il contenuto energetico del segnale riprodotto è il più vicino possibile a quello del riferimento, più vicino alla linea piatta? Ed è quindi vero il viceversa?
Notate le scale di valori e come questi sono distribuiti lungo lo spettro: non vi viene da pensare che molti di voi hanno sentito la miglior qualità potendo distinguere differenze dell'ordine dei 0.003 dB, come si evince dal grafico fortemente zoomato nell'intervallo 100 Hz-10KHz?
Questo è un vecchio tema (anche affrontato in passato con il buon Marco) tant'è che fu coniato in passato da parte della comunità scientifica il "club 0.1" per chi credeva che differenze di 0.1 dB o meno fossero udibili.
Vi do uno spunto di riflessione: tenete conto che gli errori energetici si sommano in valore assoluto lungo lo spettro. Se ho un deficit energetico di -0.01 dB a 1000 Hz ed un esubero energetico di 0.01 dB a 2000 Hz, il risultato non è un segnale privo di errore energetico, è un segnale con un errore energetico cumulato di 0.02 dB a 1000 Hz e a 2000 Hz
Abbiamo due errori ed il fatto che siano di segno opposto non può negare ciò, per cui gli errori si sommano per dare quello complessivo (che possiamo sempre separare in errore complessivo deficitario ed errore complessivo di esubero).
Ma allora l'effetto cumulativo di tanti piccoli errori lungo lo spettro può avere un effetto ampiamente udibile? Le misure e la vostra esperienza, messe vicine tra loro, sembrano dire proprio questo.
Al di là di questo topic, che è per me una divertente palestra perle misure ed un simpatico confronto con voi, ci sto lavorando
Errore energetico MP3 vs WAV da 20Hz a 10KHz
Errore energetico MP3 vs WAV da 10KHz a 20KHz
Errore energetico MP3 vs WAV da 100Hz a 10KHz
Fatemi sapere se avete problemi a visualizzare i grafici, che provengono da link su google foto.