Differenze wave - mp3 Confronto tra ascolto e misure

Salve a tutti,

una volta letto il 3D relativo alle differenze all'ascolto tra MP3 e WAV, ho riflettuto un pochino sul tema ed ho voluto approfondire, per cui condivido con voi le mie riflessioni ed i miei calcoli sul tema.

A parte il fatto che faccio parte di quelli che hanno scelto il file sbagliato, spero perchè fuorviato da quanto usato per riprodurli (in genere ai meeting le orecchie mi funzionano), il messaggio corale di chi ci ha "azzeccato" è stato che il file WAV contiene più ambienza, più microinformazioni, più dettagli ambientali e così via, ognuno cercando di esprimere con i propri termini la miglior qualità percepita.

Mi sono allora chiesto:

esiste una correlazione tra questo fatto e dei dati oggettivi e misurabili?
Se la risposta è positiva, si può inferire che tali dati oggettivi e misurabili indicano dove sta (e quindi dove non sta) la ambienza, le microinformazioni, i dettagli ambientali, ecc... che si percepiscono sul file WAV e che spariscono nel file MP3?
E se tali dati oggettivi e misurabili cambiano verso una qualità migliore/peggiore in modo correlato alla minore/maggiore perdita di informazione operata nella conversione WAV-MP3, possiamo acquisire maggiore confidenza che essi siano in grado di indicare dove è e in che misura l'ambienza, ecc.. è mantenuta o è persa?

Le mie misure (su cui, anche se non condivido spesso, non mi sono mai fermato pur procedendo a passo lento) sembrano andare in questa direzione, per cui condivido i risultati con voi per parlarne insieme.

Vi anticipo e vi dico subito che al momento, prima di poter applicare questa misura al CCI (e non solo) devo ancora risolvere un problema teorico abbastanza difficile (mai affrontato seriamente per quanto mi consta dalla scienza delle misure audio), su cui non ho ancora la certezza di avere la soluzione e che probabilmente non è proprio risolvibile con esattezza (cosa che urta il mio carattere

)

Con Massimo abbiamo già fatto dei tentativi in passato e di certo mi rifarò vivo quando avrò la confidenza per farlo.

Nel caso presente di valutazione WAV versus MP3, questo problema teorico ha un impatto molto basso, per cui ho la confidenza che i risultati siano molto attendibili.

Semplificando molto per non appsantire, nei grafici seguenti, che somigliano a (ma non sono) una risposta in frequenza e che sono ottenuti in modo originale, abbiamo l'errore energetico alla generica frequenza. Se si legge -0.2 dB a 1000 Hz ad esempio, significa che il segnale misurato, rispetto al riferimento, è energeticamente deficiatario di 0.2 dB, ossia eroga 0.2 dB in meno di energia rispetto a quanto dovrebbe (rispetto alla energia del segnale di riferiemento a quella frequenza).

Il segnale privo di errori energetici è quindi la linea piatta a quota 0 dB su tutto lo spettro.

Il segnale di riferimento è il brano di Massimo in formato WAV usato per il test di perdita di informazione da WAV a MP3. Questo segnale non ha perdita di informazione. Il grafico dell'errore energetico di questo segnale è (correttamente) la linea piatta a 0 dB su tutto lo spettro.

Gli altri segnali sono quello stesso WAV convertito in MP3 a 192Kbps, 256 Kbps e 320 Kbps (ossia con perdita di informazione decrescente all'aumentare del bit rate) per cui quello a 192 Kbps dovrebbe mostrare un grafico peggiore di tutti, quello a 256 Kb uno intermedio e quello a 320 Kb quello meno peggio.

E infatti è proprio così! (vedete la legenda del grafico in basso)

Per chi è riuscito a seguirmi fin qui ecco la domanda su cui chiacchierare insieme:

La ambienza, le micro informazioni, i microdettagli, ecc... insomma il suono più bello, sono allora presenti quando il contenuto energetico del segnale riprodotto è il più vicino possibile a quello del riferimento, più vicino alla linea piatta? Ed è quindi vero il viceversa?

Notate le scale di valori e come questi sono distribuiti lungo lo spettro: non vi viene da pensare che molti di voi hanno sentito la miglior qualità potendo distinguere differenze dell'ordine dei 0.003 dB, come si evince dal grafico fortemente zoomato nell'intervallo 100 Hz-10KHz?

Questo è un vecchio tema (anche affrontato in passato con il buon Marco) tant'è che fu coniato in passato da parte della comunità scientifica il "club 0.1" per chi credeva che differenze di 0.1 dB o meno fossero udibili.

Vi do uno spunto di riflessione: tenete conto che gli errori energetici si sommano in valore assoluto lungo lo spettro. Se ho un deficit energetico di -0.01 dB a 1000 Hz ed un esubero energetico di 0.01 dB a 2000 Hz, il risultato non è un segnale privo di errore energetico, è un segnale con un errore energetico cumulato di 0.02 dB a 1000 Hz e a 2000 Hz
Abbiamo due errori ed il fatto che siano di segno opposto non può negare ciò, per cui gli errori si sommano per dare quello complessivo (che possiamo sempre separare in errore complessivo deficitario ed errore complessivo di esubero).

Ma allora l'effetto cumulativo di tanti piccoli errori lungo lo spettro può avere un effetto ampiamente udibile? Le misure e la vostra esperienza, messe vicine tra loro, sembrano dire proprio questo.

Al di là di questo topic, che è per me una divertente palestra perle misure ed un simpatico confronto con voi, ci sto lavorando

Errore energetico MP3 vs WAV da 20Hz a 10KHz
Errore energetico MP3 vs WAV da 10KHz a 20KHz
Errore energetico MP3 vs WAV da 100Hz a 10KHz

Fatemi sapere se avete problemi a visualizzare i grafici, che provengono da link su google foto.

Molto interessante. Dell'analisi spettrale che ne pensi?
Le differenze sembrano ancora più macroscopiche.

A:

B:

DanieleB ha scritto: ↑
gio 10 set 2020, 22:34

La ambienza, le micro informazioni, i microdettagli, ecc... insomma il suono più bello, sono allora presenti quando il contenuto energetico del segnale riprodotto è il più vicino possibile a quello del riferimento, più vicino alla linea piatta? Ed è quindi vero il viceversa?

Mi pare ovvio Daniele ma non è detto che sia l'unico aspetto che viene ad avere influenza. L'analisi della differenza energetica è fatta su un segnale elettrico frequenza per frequenza ma...in ambiente possono capitare battimenti tra frequenze diverse che generano segnali percepiti dall'orecchio come frequenze aggiuntive (il terzo suono di Tartini ne è un esempio) e sulle quali possono influire gli aspetti vibrazionali degli elementi presenti in ambiente in modo passivo o attivo (ovvero voluto).

Errore energetico MP3 vs WAV da 20Hz a 10KHz

Sarebbe interessante ragionare dopo aver posto a confronto le semplici risposte in frequenza al variare della compressione. Se pure su queste si verifica tale differenza allora direi che siamo al punto di partenza.
Comunque hai fatto bene ad aprire questo argomento Daniele...si prospetta interessante

Gianfranco ha scritto: ↑
ven 11 set 2020, 0:01
Molto interessante. Dell'analisi spettrale che ne pensi?
Le differenze sembrano ancora più macroscopiche.

Ciao Gianfranco, in realtà la analisi spettrale non risponde alla domanda "WAV versus MP3" ma mostra semplicemente il contenuto spettrale (magari anche nel tempo) dei due segnali in maniera scorrelata.In tal modo diventa arbitrario inferire dalle differenze tra i due quale sia migliore.

Usando invece il segnale WAV come riferimento energetico si può evidenziare quanto quello MP3 sia energeticamente distante dal primo.

Badate bene che il confronto è puramente matematico e non è fatto riproducendo i due segnali ma solo confrontandoli tra loro, appunto matematicamente.

DanieleB ha scritto: ↑
gio 10 set 2020, 22:34

Errore energetico MP3 vs WAV da 20Hz a 10KHz
Errore energetico MP3 vs WAV da 10KHz a 20KHz
Errore energetico MP3 vs WAV da 100Hz a 10KHz

I risultati parrebbero in linea con le specifiche MP3 mettendo in evidenza il degrado agli estremi della banda audio attuato dall'algoritmo di compressione.

Per una migliore leggibilità, mi piacerebbe vedere un grafico solo in valori assoluti. Si potrebbe fare? E magari aggiungere la possibilità di applicare un fattore di smoothing?

M.Ambrosini ha scritto: ↑
ven 11 set 2020, 6:59

Sarebbe interessante ragionare dopo aver posto a confronto le semplici risposte in frequenza al variare della compressione. Se pure su queste si verifica tale differenza allora direi che siamo al punto di partenza.
Comunque hai fatto bene ad aprire questo argomento Daniele...si prospetta interessante

Non mi è chiaro come vorresti operare. IMO non è possibile qui parlare di risposte in frequenza, poichè non si tratta di misurare un sistema ma di degradare sempre di più un segnale audio e vedere cosa succede rispetto al non degradato e per fare questo questi segnali non vengono riprodotti da alcun sistema audio ma solo "masticati" da un software di misura.

Quanto rilevato da tale misura è un sempre maggiore errore della energia emessa rispetto a quella erogata in assenza di compressione. Visto che secondo la maggior parte la compressione porta al suono "meno bello" questo è necessariamente correlato con l'errore energetico rilevato, IMO il suono "bello" assoluto sta nella curva di errore di energia piatta (no errore).

Esistono di certo effetti di sovrapposizione distruttiva e costruttiva in ambiente, ma questo non c'entra nulla con le valutazioni matematiche fatte rispetto alla compressione MP3, tenuto anche conto che quasi tutti gli ascolti sono stati fatti in cuffia.

DanieleB ha scritto: ↑
ven 11 set 2020, 23:08
IMO non è possibile qui parlare di risposte in frequenza
...
Quanto rilevato da tale misura è un sempre maggiore errore della energia emessa rispetto a quella erogata in assenza di compressione.

Probabilmente non capisco io oppure c'è un problema di terminologia. E il mio dubbio è questo: visto che per tua stessa ammissione questa non è una misura di risposta in frequenza ma di "errore della energia emessa" (ammetto di non comprenderne esattamente il significato ma non è questo il punto) perché allora ritieni a priori che un "errore della energia emessa" di 0.01dB possa avere la stessa udibilità di un'alterazione della risposta in frequenza della stessa entità? Magari hanno una udibilità differente per cui un "errore della energia emessa" di 0.01dB potrebbe essere più udibile di una corrispondente alterazione di risposta in frequenza di 0.01dB. Del resto non stai forse misurano un "qualcosa" di differente dalla risposta in frequenza usando la stessa unità di misura (il dB)? Non stai forse misurando due "cose" differenti?

Vorrei evidenziare anche una ulteriore questione. Premetto che non conosco come è fatta la misura quindi potrei scrivere un sacco di castronerie. Questa "misura energetica" mi pare venga effettuata sul brano intero e quindi (suppongo) dovrebbe rilevarne il valore medio. E allora chiedo: ma questo "errore energetico" è un fenomeno all'incirca costante nel tempo oppure presenta dei picchi che si discostano in modo significativo dal valore medio?

Mi spiego con un esempio: abbiamo un brano musicale la cui durata temporale va da t(1) a t(10); supponiamo di misurare questo "errore energetico" momento per momento alla frequenza di 1000 Hz e supponiamo di rilevare questi valori:

Errore energetico a 1000 Hz;
al tempo t(1) = 0dB
al tempo t(2) = 0dB
al tempo t(3) = 0dB
al tempo t(4) = 0dB
al tempo t(5) = 0dB
al tempo t(6) = 0dB
al tempo t(7) = 0dB
al tempo t(8) = 1dB
al tempo t(9) = 0dB
al tempo t(10) = 0dB

In questo ipotetico esempio avremo complessivamente da t(1) a t(10) una media di "errore energetico" di 0.1 dB (che forse non è udibile) ma un picco al tempo t(8) di 1dB (che forse è chiaramente udibile). Quindi mi piacerebbe vedere nel grafico non solo la curva del valore medio del brano (ammesso che si tratti di una media, questo non lo so) ma anche la curva dei valori di picco (preferibilmente in valore assoluto) in modo da capire se si tratta di un fenomeno soggetto a piccole variazioni nel tempo oppure presenta irregolarità marcate.

Sbaglierò, ma secondo me non è una media, ma il "contenuto energetico" momento per momento della canzone.....è il contenuto energetico del brano di riferimento che viene parificato a zero momento per momento.
Poi la stessa "formula matematica" che ha parificato a zero il riferimento viene usata per elaborare il brano versione mp3....ed escono le differenze...... Può essere????

Il cosiddetto contenuto energetico (che poi bisogna capire bene cos'è. Io istintivamente lo considero una grandezza collegata al suono emesso, nel senso che quanto più questo è ricco di particolari ed armoniche tanto più dovrebbe essere maggiore) può essere calcolato secondo me in due modi: o misurandolo, con riferimento ad un brano, istante per istante (naturalmente a campione), quindi ottenendo una linea "zero" di riferimento relativamente a quel singolo brano, oppure si rimodula un qualcosa di scollegato dal brano e analizzato per frequenze ottenendo il contenuto energetico del brano nelle frequenze stabilite, e anche in questo caso si può costruire una linea zero. Il modello eseguito mi sembra quest'ultimo, ma se così fosse sarebbe più difficile capire in quale punto del brano ci sono le differenze. Come approccio potrebbe essere migliore il primo, potrebbe.
Secondo me va da sé che il formato wave dovrebbe avere il contenuto energetico più alto perché più ricco di informazioni, quindi il confronto si può fare anche sul totale.
Capire dove sono le singole differenze si può sempre fare matematicamente, poi bisogna vedere fin dove l'orecchio è capace di sentirle. In questo caso l'approccio per singolo brano aiuterebbe.
Non avrebbe tanto senso, secondo me, ragionare su valori medi quando Cmq le singole differenze potrebbero essere piccole. Se sono piccole le singole differenze figuriamoci le medie......

Ps: stabiliamo in cosa un suono cci dovrebbe essere superiore. In ricchezza di armoniche, dettagli? Ma questo cosa significa? Significa che un microfono cosa dovrebbe rilevare in più? Si può fare un'analisi statistica del n di frequenze rilevate invece di calcolare questo fantomatico contenuto energetico?

myfisite ha scritto: ↑
ven 11 set 2020, 20:44
I risultati parrebbero in linea con le specifiche MP3 mettendo in evidenza il degrado agli estremi della banda audio attuato dall'algoritmo di compressione.

Per una migliore leggibilità, mi piacerebbe vedere un grafico solo in valori assoluti. Si potrebbe fare? E magari aggiungere la possibilità di applicare un fattore di smoothing?

Per il valore assoluto è piuttosto semplice, appena ho un attimo riposto i grafici. Per il fattore di smoothing, non è nelle mie priorità

myfisite ha scritto: ↑
ven 11 set 2020, 23:51
Probabilmente non capisco io oppure c'è un problema di terminologia. E il mio dubbio è questo: visto che per tua stessa ammissione questa non è una misura di risposta in frequenza ma di "errore della energia emessa" (ammetto di non comprenderne esattamente il significato ma non è questo il punto) perché allora ritieni a priori che un "errore della energia emessa" di 0.01dB possa avere la stessa udibilità di un'alterazione della risposta in frequenza della stessa entità? Magari hanno una udibilità differente per cui un "errore della energia emessa" di 0.01dB potrebbe essere più udibile di una corrispondente alterazione di risposta in frequenza di 0.01dB. Del resto non stai forse misurano un "qualcosa" di differente dalla risposta in frequenza usando la stessa unità di misura (il dB)? Non stai forse misurando due "cose" differenti?

Ciao Marco, non mi sembra di avere scritto che un errore energetico possa avere la stessa udbilità di un errore della stessa ampieza in dB di un errore nella risposta in frequenza. Semplicemente non ne ho idea. Ripeto che in questo contesto la risposta in frequenza (IMO) non è un concetto applicabile perchè non stiamo misurando un sistema con un treno/sweep/chirp con un approccio IN-OUT di sinusoidi ma confrontando due segnali tra loro. Al limite la analogia può spingersi a considerare il brano non compresso l'IN di un sistema di compressione e poi si fa il confronto con quello compresso come suo OUT, ma il brano in ingresso è una canzone e non un segnale di test.

myfisite ha scritto: ↑
sab 12 set 2020, 9:44
Vorrei evidenziare anche una ulteriore questione. Premetto che non conosco come è fatta la misura quindi potrei scrivere un sacco di castronerie. Questa "misura energetica" mi pare venga effettuata sul brano intero e quindi (suppongo) dovrebbe rilevarne il valore medio. E allora chiedo: ma questo "errore energetico" è un fenomeno all'incirca costante nel tempo oppure presenta dei picchi che si discostano in modo significativo dal valore medio?

Mi spiego con un esempio: abbiamo un brano musicale la cui durata temporale va da t(1) a t(10); supponiamo di misurare questo "errore energetico" momento per momento alla frequenza di 1000 Hz e supponiamo di rilevare questi valori:

Errore energetico a 1000 Hz;
al tempo t(1) = 0dB
al tempo t(2) = 0dB
al tempo t(3) = 0dB
al tempo t(4) = 0dB
al tempo t(5) = 0dB
al tempo t(6) = 0dB
al tempo t(7) = 0dB
al tempo t(8) = 1dB
al tempo t(9) = 0dB
al tempo t(10) = 0dB

In questo ipotetico esempio avremo complessivamente da t(1) a t(10) una media di "errore energetico" di 0.1 dB (che forse non è udibile) ma un picco al tempo t(8) di 1dB (che forse è chiaramente udibile). Quindi mi piacerebbe vedere nel grafico non solo la curva del valore medio del brano (ammesso che si tratti di una media, questo non lo so) ma anche la curva dei valori di picco (preferibilmente in valore assoluto) in modo da capire se si tratta di un fenomeno soggetto a piccole variazioni nel tempo oppure presenta irregolarità marcate.

Ri-ciao Marco,

la misura energetica è ottenuta come media nel tempo, ma questo non ha alcuna correlazione con il fatto che il fenomeno di perdita di informazione sia costante nel tempo.
Più precisamente, essendo basata su FFT dei segnali, la misura considera tutta la durata del brano "masticato" per ottenerne la energia complessivamente trasportata lungo tutto lo spettro audio per la durata nel tempo. Di conseguenza ogni singola altezza del grafico generico è la energia trasportata a quella frequenza (semplificando) lungo tutta la durata nel tempo. E' vero che questo maschera fenomeni impulsivi, ma è anche vero che una compressione MP3 non fa danni tremendi al terzo secondo e danni lievi al settimo secondo, bensì fa mediamente sempre lo stesso danno nell'unità di tempo, perchè anche questa compressione agisce nel dominio della frequenza, andando a cercare frequenze vicine con intensità (energie) molto diverse, per cui la maggiore maschera la minore, da cui la minore "serve meno" per costruire il segnale compresso.
La misura non è pensata per dare l'andamento nel tempo dell'errore energetico.

Filippo ha scritto: ↑
sab 12 set 2020, 16:37
Il cosiddetto contenuto energetico (che poi bisogna capire bene cos'è. Io istintivamente lo considero una grandezza collegata al suono emesso, nel senso che quanto più questo è ricco di particolari ed armoniche tanto più dovrebbe essere maggiore) può essere calcolato secondo me in due modi: o misurandolo, con riferimento ad un brano, istante per istante (naturalmente a campione), quindi ottenendo una linea "zero" di riferimento relativamente a quel singolo brano, oppure si rimodula un qualcosa di scollegato dal brano e analizzato per frequenze ottenendo il contenuto energetico del brano nelle frequenze stabilite, e anche in questo caso si può costruire una linea zero. Il modello eseguito mi sembra quest'ultimo, ma se così fosse sarebbe più difficile capire in quale punto del brano ci sono le differenze. Come approccio potrebbe essere migliore il primo, potrebbe.
Secondo me va da sé che il formato wave dovrebbe avere il contenuto energetico più alto perché più ricco di informazioni, quindi il confronto si può fare anche sul totale.
Capire dove sono le singole differenze si può sempre fare matematicamente, poi bisogna vedere fin dove l'orecchio è capace di sentirle. In questo caso l'approccio per singolo brano aiuterebbe.
Non avrebbe tanto senso, secondo me, ragionare su valori medi quando Cmq le singole differenze potrebbero essere piccole. Se sono piccole le singole differenze figuriamoci le medie......

Ps: stabiliamo in cosa un suono cci dovrebbe essere superiore. In ricchezza di armoniche, dettagli? Ma questo cosa significa? Significa che un microfono cosa dovrebbe rilevare in più? Si può fare un'analisi statistica del n di frequenze rilevate invece di calcolare questo fantomatico contenuto energetico?

Appena ho un attimo spiego un po' meglio come funziona la misura (se siete interessati). Nel frattempo ripassatevi il teorema di Parseval per segnali di energia

https://teoriadeisegnali.it/libro/html/ ... o-2.3.html

DanieleB ha scritto: Ciao Marco, non mi sembra di avere scritto che un errore energetico possa avere la stessa udbilità di un errore della stessa ampieza in dB di un errore nella risposta in frequenza. Semplicemente non ne ho idea.

Se è così e se "la risposta in frequenza non è un concetto applicabile" allora mi pare fuorviante il parallelismo che hai scritto in apertura:

DanieleB ha scritto:Notate le scale di valori e come questi sono distribuiti lungo lo spettro: non vi viene da pensare che molti di voi hanno sentito la miglior qualità potendo distinguere differenze dell'ordine dei 0.003 dB, come si evince dal grafico fortemente zoomato nell'intervallo 100 Hz-10KHz?

Forse è un mio limite ma non capisco perché in apertura fai commenti sulla possibilità di "distinguere differenze dell'ordine dei 0.003 dB" (dove il primo pensiero di chiunque legga va al dB usato nella risposta in frequenza) senza specificare che non hai idea se "un errore energetico possa avere la stessa udibilità di un errore della stessa ampiezza in dB di un errore nella risposta in frequenza".

DanieleB ha scritto: E' vero che questo maschera fenomeni impulsivi, ma è anche vero che una compressione MP3 non fa danni tremendi al terzo secondo e danni lievi al settimo secondo, bensì fa mediamente sempre lo stesso danno nell'unità di tempo

Ho dei dubbi su questa affermazione. Chi mi assicura che la compressione MP3 faccia mediamente lo stesso tipo di danno nell'unità di tempo? Se al terzo secondo ho un segnale di 0dB mentre al settimo ne ho uno a -15dB siamo sicuri che il danno sia mediamente il medesimo? Rifacciamo l'esempio aggiungendo i livelli del segnale:

Errore energetico a 1000 Hz;
al tempo t(1); segnale -15 dB; errore = 0dB
al tempo t(2); segnale -10 dB; errore = 0dB
al tempo t(3); segnale -11 dB; errore = 0dB
al tempo t(4); segnale -9 dB; errore = 0dB
al tempo t(5); segnale -10 dB; errore = 0dB
al tempo t(6); segnale -11 dB; errore = 0dB
al tempo t(7); segnale -14 dB; errore = 0dB
al tempo t(8); segnale -12 dB; errore = 0dB
al tempo t(9); segnale 0 dB; errore = 1dB
al tempo t(10); segnale -14 dB; errore = 0dB

Oltretutto, in ottica di individuare i fenomeni connessi al CCI, una misura che mascheri i fenomeni impulsivi mi parrebbe piuttosto limitante.

Secondo me non è fuorviante quello che ha scritto, bisogna capire bene......lui fa riferimento alle frequenze ma non alla risposta in frequenza, penso di aver capito...... È difficile da spiegare. Quello che lui ha ottenuto è un grafico che rielabora l'emissione sonora di un brano musicale in maniera sconnessa dallo sviluppo temporale del brano stesso, dove indica un errore energetico totale per frequenza (che quindi non è una risposta in frequenza classica). Io userei, come dicevo, un approccio differente, collegato allo sviluppo temporale del brano, in modo da capire meglio DOVE si verificano le differenze così da potervisi soffermare all'ascolto.
Questo è quanto mi sembra di aver capito.
Inoltre lui non sa se quell'errore energetico di 0,003 a quanti db sonori effettivamente coincida perché l'errore energetico sarà una grandezza che comprende ANCHE il db acustico, ma anche altro (giusto Daniele?) ..... Se è così misurare l'errore energetico in db è...... Un errore

che effettivamente confonde.
Concordo che ragionare per medie non è proprio il massimo, mascherando i fenomeni impulsivi.

Ps: continuo a pensare che una elaborazione statistica di quanto rilevato da un microfono, senza alcuna trasformazione matematica, possa essere più easy e più evidente nel descrivere il cci. Certo bisogna individuare i parametri di base che rendono confrontabili due registrazioni, una fonte cci, l'altra quello che è......

DanieleB ha scritto: ↑
sab 12 set 2020, 18:40
Ciao Marco, non mi sembra di avere scritto che un errore energetico possa avere la stessa udbilità di un errore della stessa ampieza in dB di un errore nella risposta in frequenza. Semplicemente non ne ho idea. Ripeto che in questo contesto la risposta in frequenza (IMO) non è un concetto applicabile perchè non stiamo misurando un sistema con un treno/sweep/chirp con un approccio IN-OUT di sinusoidi ma confrontando due segnali tra loro. Al limite la analogia può spingersi a considerare il brano non compresso l'IN di un sistema di compressione e poi si fa il confronto con quello compresso come suo OUT, ma il brano in ingresso è una canzone e non un segnale di test.

Non condivido dal momento che non sappiamo se cambia ANCHE la risposta in frequenza del segnale compresso (non dovrebbe ma andrebbe misurata per sicurezza). Ovvero occorre prendere uno sweep di frequenze codificato in wav e comprimerlo in mp3 per vedere se la semplice risposta in frequenza rilevata sul nostro sistema viene impercettibilmente a cambiare

Esistono di certo effetti di sovrapposizione distruttiva e costruttiva in ambiente, ma questo non c'entra nulla con le valutazioni matematiche fatte rispetto alla compressione MP3, tenuto anche conto che quasi tutti gli ascolti sono stati fatti in cuffia.

Mi pare ovvio ma...l'effetto macroscopico sta li....noi stiamo cercando di evidenziare strumentalmente sul segnale elettrico quella che potrebbe essere la causa scatenante a cui l'orecchio è maggiormente sensibile. Per questo credo che questo topic sia interessante.

myfisite ha scritto: ↑
sab 12 set 2020, 23:52
Forse è un mio limite ma non capisco perché in apertura fai commenti sulla possibilità di "distinguere differenze dell'ordine dei 0.003 dB" (dove il primo pensiero di chiunque legga va al dB usato nella risposta in frequenza) senza specificare che non hai idea se "un errore energetico possa avere la stessa udibilità di un errore della stessa ampiezza in dB di un errore nella risposta in frequenza".

Ciao Marco, mi spiace che legga possa cadere nell'errore di pensare in temini di risposta in frequenza. Purtroppo non ho il controllo di come le mie parole vengono interpretate, ho inizilamente scritto che i miei grafici somigliano (nel senso che ci somigliano esteticamente) ma non sono la risposta in frequenza, che ripeto non ha senso poichè non stiamo misurando un sistema ma confrontando matematicamente due segnali. Se poi ho fuoriviato qualcuno mi dispiace ma penso sia dovuto anche alle abitudini mentali acquisite da decenni di "assuefazione" a questa misura (un po' come vedere bianco e pensare che le mucche bevano il latte).

myfisite ha scritto: ↑
dom 13 set 2020, 0:12
Ho dei dubbi su questa affermazione. Chi mi assicura che la compressione MP3 faccia mediamente lo stesso tipo di danno nell'unità di tempo? Se al terzo secondo ho un segnale di 0dB mentre al settimo ne ho uno a -15dB siamo sicuri che il danno sia mediamente il medesimo? Rifacciamo l'esempio aggiungendo i livelli del segnale:

Oltretutto, in ottica di individuare i fenomeni connessi al CCI, una misura che mascheri i fenomeni impulsivi mi parrebbe piuttosto limitante.

Te lo assicura l'algoritmo su cui si basa, che fa una analisi in frequenza che verifica l'intensità di ciascuna delle 576 bande dello spettro entro cui il brano è analizzato e ne valuta la "sopravvivenza" in base alla intensità rispetto alle soglie psico acustiche percettive e di mascheramento (e in questo contesto ti assicuro che intensità significa energia contenuta in quella banda)

http://www.comefunziona.net/arg/mp3/5/

myfisite ha scritto: ↑
dom 13 set 2020, 0:12
Oltretutto, in ottica di individuare i fenomeni connessi al CCI, una misura che mascheri i fenomeni impulsivi mi parrebbe piuttosto limitante.

Caro Marco questo forse è vero e forse no. La mia personale esperienza mi dice di no, poichè la grande qualità audio dei sistemi CCI si apprezza in ogni istante di riproduzione, con ogni genere musicale e rimane godibile e immutata a prescindere dalle pressioni acustiche istantanee.

A parte ciò, come spiegato a Massimo molte volte, da un po' di anni, quando di più e quando di meno, in base ai miei impegni, alle mie intuizioni, ai miei limiti e a quanto ne ho voglia, mi sto divertendo con delle misure audio. Se poi incidentalmente questo dovesse portare a misurare il CCI saremo tutti contenti.

M.Ambrosini ha scritto: ↑
dom 13 set 2020, 7:24

DanieleB ha scritto: ↑
sab 12 set 2020, 18:40
Ciao Marco, non mi sembra di avere scritto che un errore energetico possa avere la stessa udbilità di un errore della stessa ampieza in dB di un errore nella risposta in frequenza. Semplicemente non ne ho idea. Ripeto che in questo contesto la risposta in frequenza (IMO) non è un concetto applicabile perchè non stiamo misurando un sistema con un treno/sweep/chirp con un approccio IN-OUT di sinusoidi ma confrontando due segnali tra loro. Al limite la analogia può spingersi a considerare il brano non compresso l'IN di un sistema di compressione e poi si fa il confronto con quello compresso come suo OUT, ma il brano in ingresso è una canzone e non un segnale di test.
Non condivido dal momento che non sappiamo se cambia ANCHE la risposta in frequenza del segnale compresso (non dovrebbe ma andrebbe misurata per sicurezza). Ovvero occorre prendere uno sweep di frequenze codificato in wav e comprimerlo in mp3 per vedere se la semplice risposta in frequenza rilevata sul nostro sistema viene impercettibilmente a cambiare

Massimo, non riesco a capire cosa sia la risposta in frequenza di un segnale (compresso o no), per la mia esperienza è un concetto insensato. Se prendi uno sweep di frequenze e lo codifichi in MP3 ottieni sicuramente un segnale diverso per cui non puoi confrontare la risposta del tuo sistema con questo secondo sweep con la risposta allo sweep non compresso. Se puoi spiegati meglio.

Esistono di certo effetti di sovrapposizione distruttiva e costruttiva in ambiente, ma questo non c'entra nulla con le valutazioni matematiche fatte rispetto alla compressione MP3, tenuto anche conto che quasi tutti gli ascolti sono stati fatti in cuffia.

Mi pare ovvio ma...l'effetto macroscopico sta li....noi stiamo cercando di evidenziare strumentalmente sul segnale elettrico quella che potrebbe essere la causa scatenante a cui l'orecchio è maggiormente sensibile. Per questo credo che questo topic sia interessante.

Giusto, per cui proviamo insieme a pensare ad un modo (se esiste) per portare le misure in ambiente ... ovvio sempre su segnali elettrici. Se ti ricordi abbiamo già fatto brain storming su questo "scoglio" altre volte. Personalmente ancora non ne vengo fuori, perchè in ambiente gli effetti incontrollabili sono molti di più di quelli controllabili, per cui addio riferiementi certi, ma chissà che con la giusta idea

DanieleB ha scritto: ↑
dom 13 set 2020, 14:31

M.Ambrosini ha scritto: ↑
dom 13 set 2020, 7:24

Non condivido dal momento che non sappiamo se cambia ANCHE la risposta in frequenza del segnale compresso (non dovrebbe ma andrebbe misurata per sicurezza). Ovvero occorre prendere uno sweep di frequenze codificato in wav e comprimerlo in mp3 per vedere se la semplice risposta in frequenza rilevata sul nostro sistema viene impercettibilmente a cambiare
Massimo, non riesco a capire cosa sia la risposta in frequenza di un segnale (compresso o no), per la mia esperienza è un concetto insensato. Se prendi uno sweep di frequenze e lo codifichi in MP3 ottieni sicuramente un segnale diverso per cui non puoi confrontare la risposta del tuo sistema con questo secondo sweep con la risposta allo sweep non compresso. Se puoi spiegati meglio.

Giusto, per cui proviamo insieme a pensare ad un modo (se esiste) per portare le misure in ambiente ... ovvio sempre su segnali elettrici. Se ti ricordi abbiamo già fatto brain storming su questo "scoglio" altre volte. Personalmente ancora non ne vengo fuori, perchè in ambiente gli effetti incontrollabili sono molti di più di quelli controllabili, per cui addio riferiementi certi, ma chissà che con la giusta idea

.......

A noi non interessano gli effetti ambientali del ns ambiente ma quelli della registrazione (che il cci dovrebbe esaltare) quindi non si potrebbero fare registrazioni vicino agli altoparlanti per eliminare o ridurre gli effetti ambientali del ns ambiente?
Dopodiché ogni "attimo" dovrebbe avere un diagramma costituito da un complesso di frequenze di diversa intensità. Un insieme di questi diagrammi dovrebbe evidenziare delle differenze tra cci e non, penso. Si potrebbe applicare anche al discorso wave mp3.
Una volta identificate le differenze si potrebbe trovare il modo di codificarle matematicamente.

DanieleB ha scritto: ↑
dom 13 set 2020, 14:31
Massimo, non riesco a capire cosa sia la risposta in frequenza di un segnale (compresso o no), per la mia esperienza è un concetto insensato.

Non di un segnale Daniele ma del sistema audio attraversato da quel segnale. Una compressione MPEG non dovrebbe affatto influire su segnali di livello alto (come quelli di uno sweep) ma sopprimendo alcuni segnali a livello basso in base ad un particolare algoritmo. Ciò significa che non dovrebbe influire sulla risposta in frequenza. Ma è cosa da verificare. Perchè se non troviamo varianti allora le variazioni energetiche da te evidenziate diventano molto più interessanti di quanto invece lo sarebbero se fossero già evidenziate da una semplice risposta in frequenza.

Confesso che non ce'ho fatta a leggere tutti i post!

A parte la spettrografia, che da' un indicazione di massima, il problema, per me, e' difficilmente misurabile con metodi tradizionali anche se presente e verificabile strumentalmente, se si hanno gli strumenti e l'analisi adeguata. Ci vorrebbe un programmatore di algoritmi di compressione insomma.

L'analogia piu' chiara e' la compressione video. Se guardate un tramonto alla televisione digitale noterete che le sfumature non sono graduali ma si notano confini ben definiti tra una tonalita' e l'altra, un livello di luce e l'altro. C'e' una riduzione non solo del visibile, ma delle variazioni possibili.

L'mp3 si comporta allo stesso modo, elimina variazioni secondo un modello che elimina le sfumature considerate superflue. E infatti non e' semplice capire qual'e' il file compresso ascoltando con mezzi comuni, telefonini e cuffiette. L'mp3 e' ben fatto, funziona bene!

Ho detto un'ovvieta', vedi i messaggi di Massimo A.
Qui si vuole capire se si puo' misurare in modo tradizionale la perdita della compressione.
Con uno sweep non penso, la compressione e' "furba" e lo sweep e' troppo semplice. Un gong in una cattedrale, spettrografia ad altissima definizione, e zoom!

giorbe ha scritto: ↑
lun 14 set 2020, 15:23

Qui si vuole capire se si puo' misurare in modo tradizionale la perdita della compressione.

Tutt'altro.

DanieleB ha scritto: ↑
dom 13 set 2020, 14:22
La mia personale esperienza mi dice di no, poichè la grande qualità audio dei sistemi CCI si apprezza in ogni istante di riproduzione, con ogni genere musicale e rimane godibile e immutata a prescindere dalle pressioni acustiche istantanee.

Probabilmente dipende dalle abitudini d'ascolto e/o da altri fenomeni psicoacustici ma io trovo (ed è per me la caratteristica che li contraddistingue dagli impianti "normali") che le differenze su un impianto CCI siano molto più nette nei momenti dei picchi di segnale oppure di attacchi/rilasci repentini.

myfisite ha scritto: ↑
lun 14 set 2020, 21:36

DanieleB ha scritto: ↑
dom 13 set 2020, 14:22
La mia personale esperienza mi dice di no, poichè la grande qualità audio dei sistemi CCI si apprezza in ogni istante di riproduzione, con ogni genere musicale e rimane godibile e immutata a prescindere dalle pressioni acustiche istantanee.
Probabilmente dipende dalle abitudini d'ascolto e/o da altri fenomeni psicoacustici ma io trovo (ed è per me la caratteristica che li contraddistingue dagli impianti "normali") che le differenze su un impianto CCI siano molto più nette nei momenti dei picchi di segnale oppure di attacchi/rilasci repentini.

Senza polemica, non mi appartiene proprio, ma è così difficile cercare di capire prima attraverso delle risposte in frequenza le differenze del suono cci rispetto al convenzionale, invece di fare supposizioni?
Poi dopo si può trovare il metodo matematico che si vuole (cosa dall'esito incerto), ma perchè prima non analizzare seriamente risposte in frequenza dove qualcosa si dovrebbe vedere abbastanza chiaramente?????? Questo potrebbe aiutare anche a tarare il metodo matematico.....

Filippo ha scritto: ↑
lun 14 set 2020, 22:12

Senza polemica, non mi appartiene proprio, ma è così difficile cercare di capire prima attraverso delle risposte in frequenza le differenze del suono cci rispetto al convenzionale, invece di fare supposizioni?

La risposta è sì. Altrimenti, se fosse così facile non saremmo qui a discuterne. Da anni Daniele si sta dedicando alla misura.

I metodi di misura 'tradizionali' riescono a rilevare differenze troppo piccole per giustificare il palo che si evidenzia all'ascolto. Il succo è questo.
Le misure non rilevano differenze evidenti quando, ad esempio, i cavi delle casse toccano quello di alimentazione, eppure...

Sono d'accordo a metà con il mister

.
L'insieme degli accorgimenti cci realizzati in contemporanea secondo me si evidenziano eccome.
Un impianto tutto LT settato secondo i canoni cci DEVE essere distinguibile.

Accomodati...

Filippo ha scritto: ↑
lun 14 set 2020, 23:17
Sono d'accordo a metà con il mister .
L'insieme degli accorgimenti cci realizzati in contemporanea secondo me si evidenziano eccome.
Un impianto tutto LT settato secondo i canoni cci DEVE essere distinguibile.

Non lo è con misure convenzionali Filippo. Fidati, sono anni che ci cozziamo la testa.
Ciò che all'ascolto è un evidentissimo "palo" alle misure (in banda audio) non si riesce ad evidenziare se non in modo minimo (come ha in altre occasioni dimostrato la misura di confronto energetico di Daniele).
E' una cosa che fa scoppiare la testa tanto sembra irrazionale ma così purtroppo è...

Gianfranco ha scritto: ↑
lun 14 set 2020, 22:42
I metodi di misura 'tradizionali' riescono a rilevare differenze troppo piccole per giustificare il palo che si evidenzia all'ascolto. Il succo è questo.
Le misure non rilevano differenze evidenti quando, ad esempio, i cavi delle casse toccano quello di alimentazione, eppure...

Ciao Gianfranco, questa osservazione è a mio parere del tutto soggettiva. Non abbiamo nessuna idea della entità del fenomeno ma solo che è evidente all'ascolto. Questo non significa che anche la sua misura debba evidenziare "un palo" ed è secondo me sufficiente che evidenzi cosa accade in modo inequivocabile.

A mio parere permane il "vizio" di pensare in termini "lineari" il che porta a descrivere le cose nei termini che esponi tu, che io credo fuorvianti.

Per dirla tutta, ma è una mia personale convinzione basata sui dati che ho accumulato negli anni, fenomeni di entità piccola "locale" hanno effetti evidenti all'ascolto ed è proprio per questo che ho intrapreso la strada della misura dell'errore di energia, a cui occorre aggiungere la diversa sensibilità dell'orecchio in base alla posizione nello spettro, che è drammatica. Un piccolo errore di energia infatti si somma ad un altro piccolo errore di energia e l'effetto cumulato non è più piccolo, senza contare che l'orecchio è un sensibilissimo sensore logaritmico: a 1KHz basta un nulla per avvertire una differenza di pressione sonora che a 200 Hz non percepisci affatto (a conferma che non dobbiamo pensare in termini lineari).

Questo è uno dei motivi per cui ho postato questo 3D sul confronto WAV vs MP3. Molti all'ascolto hanno rilevato differenze "in termini generici" grandi ma in buona sostanza "solamente" ben riconoscibili. Ebbene dai 100 Hz ai 10KHz la differenza tra il segnale Mp3 e quello wav resta piccola punto per punto ma il suo effetto si "accumula" su tutto lo spettro e come evidenziato dalle vostre testimonianze diventa evidente all'ascolto.

Questa per me è la prova provata che effetti piccoli si accumulano e danno un effetto macroscopico ben misurabile (come è stato).

La mia personale impressione è che per il CCI, per quanto si può misurare nel regime elettrico (non in ambiente) valga la stessa cosa.

DanieleB ha scritto: ↑
mar 15 set 2020, 13:29
Per dirla tutta, ma è una mia personale convinzione basata sui dati che ho accumulato negli anni, fenomeni di entità piccola "locale" hanno effetti evidenti all'ascolto ed è proprio per questo che ho intrapreso la strada della misura dell'errore di energia, a cui occorre aggiungere la diversa sensibilità dell'orecchio in base alla posizione nello spettro, che è drammatica. .

Direi che è una specie di rivisitazione del "club dello 0,1 dB" dell'Ing. Giussani. Ricordo che era una ipotesi di cui discutemmo già molti anni fa. L'Ing. Giussani sosteneva che variazioni di segnale anche piccole (nell'ordine appunto di frazioni di dB) fossero particolarmente udibili qualora si situassero su bande di frequenze che, seppure lontane tra di loro, stabilivano una correlazione. Per esempio, piccole variazioni situate contemporaneamente su 400 Hz, 3150 Hz e 5000 Hz forniscono l'impressione di transienti più o meno veloci. Riporto qui di seguito la sua tabella che si trova facilmente nel web:

Bande di frequenza e corrispondenza all'ascolto
di R. Giussani

50 Hz: I "bassi profondi" e l'ampiezza/immanenza delle grandi orchestre/gruppi specie dal vivo. Se è abbinata alla 16000 Hz è ancora meglio.
160 Hz: Potenza. Ma anche "gommosità", se esuberano/mancano altre frequenze. Il difetto può essere corretto aumentando le gamme da 1000 Hz a 5000 Hz, ma ovviamente ci sono dei limiti...
400 Hz: Scatolarità, effetto cartone (voci entro una "scatola da scarpe", specie se maschili), quando troppo. Leggerezza del tom (batteria), del sax baritono, delle note "medio-basse" della chitarra, quando poco. E annessi e connessi. Se vi è troppo poco 400 Hz e troppi 50 Hz e 160 Hz può contribuire al famoso "basso gommoso".
1000 Hz: Se è poco si perde "effetto presenza" se è troppo aiuta a far emergere i difetti della 400 Hz.
2000 Hz: Se è poco diminuisce "effetto presenza" se è troppo interviene il "pungente/fastidio".
3150 Hz: Molto importante. Determina la caratterizzazione ed "articolazione" degli strumenti solisti e delle voci, specie femminili.
5000 Hz: Apertura della timbrica degli strumenti aventi spettri "bassi ma non bassissimi". Se è troppo "archi alla corda".
10000 Hz: Apertura/spaziosità del 99% degli strumenti e dei "rumori", applausi compresi. Se è eccedente comporta il famoso effetto durezza, freddezza, fastidio, "effetto cupole rigide" e/o "meno setosità" della gamma alta.
12500 Hz: Queste cominciano ad essere alte frequenze "vere", solo armoniche "hi-fi" e rifinitura, anche "spaziale".
16000 Hz: Come 12500 Hz, anzi meglio, ma solo per chi li sente davvero. Ariosità... Leggerezza e setosità dell'estremo alto.
400 Hz, 3150 Hz & 5000 Hz insieme: transienti più o meno "veloci"...

Sono certo che si potrebbero scoprire altre correlazioni simili in altre bande di frequenza ma continuo a pensare che il fenomeno CCI non si esaurisca in questo. Vorrei anche ricordare con affetto l'Ing Giussani raccontando un episodio che lui stesso ci svelò nel "suo salotto" (così chiamò la primissima versione del suo forum aperto agli appassionati). Pubblicò su una rivista di alta fedeltà di allora un lungo articolo di di comparazione di una dozzina di fonorivelatori. La prova era corredata di una serie di misure, grafici di risposta in frequenza e, per ogni fonorivelatore, una valutazione all'ascolto. Ebbene l'Ing Giussani ci confessò che non fece mai in realtà tutti quegli ascolti ma che, guardando le piccole variazioni di risposta in frequenza sui grafici, scrisse le impressioni di ascolto riferendosi alle sue esperienze dedotte dalle piccole variazioni nel suono dei diffusori in base alle combinazioni di bande di frequenze (come quelle riportate in tabella). Ebbene, dopo la pubblicazione dell'articolo ricevette complimenti da molte persone (che erano ovviamente all'oscuro del fatto che le prove di ascolto non erano state in realtà effettuate) perché le loro impressioni d'ascolto concordavano esattamente con quelle scritte dall'Ingegnere.

Mi piace questo approccio empirico. Una grande applicazione da questo punto di vista aiuterebbe a comprendere al volo i segnali seppur piccoli evidenziati da una risposta in frequenza.

myfisite ha scritto: ↑
mar 15 set 2020, 21:30

DanieleB ha scritto: ↑
mar 15 set 2020, 13:29
Per dirla tutta, ma è una mia personale convinzione basata sui dati che ho accumulato negli anni, fenomeni di entità piccola "locale" hanno effetti evidenti all'ascolto ed è proprio per questo che ho intrapreso la strada della misura dell'errore di energia, a cui occorre aggiungere la diversa sensibilità dell'orecchio in base alla posizione nello spettro, che è drammatica. .
Direi che è una specie di rivisitazione del "club dello 0,1 dB" dell'Ing. Giussani. Ricordo che era una ipotesi di cui discutemmo già molti anni fa. L'Ing. Giussani sosteneva che variazioni di segnale anche piccole (nell'ordine appunto di frazioni di dB) fossero particolarmente udibili qualora si situassero su bande di frequenze che, seppure lontane tra di loro, stabilivano una correlazione. Per esempio, piccole variazioni situate contemporaneamente su 400 Hz, 3150 Hz e 5000 Hz forniscono l'impressione di transienti più o meno veloci. Riporto qui di seguito la sua tabella che si trova facilmente nel web:

Bande di frequenza e corrispondenza all'ascolto
di R. Giussani

50 Hz: I "bassi profondi" e l'ampiezza/immanenza delle grandi orchestre/gruppi specie dal vivo. Se è abbinata alla 16000 Hz è ancora meglio.
160 Hz: Potenza. Ma anche "gommosità", se esuberano/mancano altre frequenze. Il difetto può essere corretto aumentando le gamme da 1000 Hz a 5000 Hz, ma ovviamente ci sono dei limiti...
400 Hz: Scatolarità, effetto cartone (voci entro una "scatola da scarpe", specie se maschili), quando troppo. Leggerezza del tom (batteria), del sax baritono, delle note "medio-basse" della chitarra, quando poco. E annessi e connessi. Se vi è troppo poco 400 Hz e troppi 50 Hz e 160 Hz può contribuire al famoso "basso gommoso".
1000 Hz: Se è poco si perde "effetto presenza" se è troppo aiuta a far emergere i difetti della 400 Hz.
2000 Hz: Se è poco diminuisce "effetto presenza" se è troppo interviene il "pungente/fastidio".
3150 Hz: Molto importante. Determina la caratterizzazione ed "articolazione" degli strumenti solisti e delle voci, specie femminili.
5000 Hz: Apertura della timbrica degli strumenti aventi spettri "bassi ma non bassissimi". Se è troppo "archi alla corda".
10000 Hz: Apertura/spaziosità del 99% degli strumenti e dei "rumori", applausi compresi. Se è eccedente comporta il famoso effetto durezza, freddezza, fastidio, "effetto cupole rigide" e/o "meno setosità" della gamma alta.
12500 Hz: Queste cominciano ad essere alte frequenze "vere", solo armoniche "hi-fi" e rifinitura, anche "spaziale".
16000 Hz: Come 12500 Hz, anzi meglio, ma solo per chi li sente davvero. Ariosità... Leggerezza e setosità dell'estremo alto.
400 Hz, 3150 Hz & 5000 Hz insieme: transienti più o meno "veloci"...

Sono certo che si potrebbero scoprire altre correlazioni simili in altre bande di frequenza ma continuo a pensare che il fenomeno CCI non si esaurisca in questo. Vorrei anche ricordare con affetto l'Ing Giussani raccontando un episodio che lui stesso ci svelò nel "suo salotto" (così chiamò la primissima versione del suo forum aperto agli appassionati). Pubblicò su una rivista di alta fedeltà di allora un lungo articolo di di comparazione di una dozzina di fonorivelatori. La prova era corredata di una serie di misure, grafici di risposta in frequenza e, per ogni fonorivelatore, una valutazione all'ascolto. Ebbene l'Ing Giussani ci confessò che non fece mai in realtà tutti quegli ascolti ma che, guardando le piccole variazioni di risposta in frequenza sui grafici, scrisse le impressioni di ascolto riferendosi alle sue esperienze dedotte dalle piccole variazioni nel suono dei diffusori in base alle combinazioni di bande di frequenze (come quelle riportate in tabella). Ebbene, dopo la pubblicazione dell'articolo ricevette complimenti da molte persone (che erano ovviamente all'oscuro del fatto che le prove di ascolto non erano state in realtà effettuate) perché le loro impressioni d'ascolto concordavano esattamente con quelle scritte dall'Ingegnere.

Condivido diciamo al 90% quanto sopra ed è il motivo per cui ritengo che qualunque valutazione debba partire dalla verifica della linearità di risposta (vedi le risposte delle amplificazioni su carico reale...), che, pur ben lungi dallo spiegare tutto, sono comunque l'unica grandezza misurabile sicuramente udibile allo stato attuale. Per quanto riguarda le testine può essere attendibile la suddetta valutazione su impianti classici (che non ne mettono in luce le reali doti di trasparenza) ma su un sistema effettivamente trasparente le testine (così come le elettroniche) hanno molto ma molto di più da evidenziare di ciò che viene espresso dalla risposta in frequenza. Vi basti pensare a quanto cambia il suono delle nostre amate Shure in funzione della costrizione con cui entra lo stilo nella guida.

Diciamo anche che ognuno porta argomenti che ritiene possano essere favorevoli alla propria tesi. Quando lessi quell'episodio dei fonorivelatori riportato dall'Ing Giussani il mio primo pensiero fu una considerazione su quanto facilmente i lettori si facciano influenzare dalle voci autorevoli sulle riviste specialistiche

(senza nulla togliere al discorso, che conserva la sua validità, dell'udibilità di piccole variazioni localizzate della risposta frequenza). Restando ferma la mia opinione (magari errata) che per smascherare il CCI si debba riuscire ad analizzare anche i fenomeni impulsivi e non solo il dominio della frequenza.

Condivido diciamo al 90% quanto sopra ed è il motivo per cui ritengo che qualunque valutazione debba partire dalla verifica della linearità di risposta (vedi le risposte delle amplificazioni su carico reale...), che, pur ben lungi dallo spiegare tutto, sono comunque l'unica grandezza misurabile sicuramente udibile allo stato attuale. Per quanto riguarda le testine può essere attendibile la suddetta valutazione su impianti classici (che non ne mettono in luce le reali doti di trasparenza) ma su un sistema effettivamente trasparente le testine (così come le elettroniche) hanno molto ma molto di più da evidenziare di ciò che viene espresso dalla risposta in frequenza. Vi basti pensare a quanto cambia il suono delle nostre amate Shure in funzione della costrizione con cui entra lo stilo nella guida.

Ma in effetti nessuno si è spinto a verificare la correlazione tra quanto è piatta la risposta in frequenza e quanto trasparente risulti un sistema. A mio parere un intervento di tipo CCI non è evidenziato da modifiche della risposta in frequenza:

perchè la sua risoluzione è insufficiente, sia sull'asse dei valori che su quello delle frequenze
perchè non tiene conto degli effetti energetici cumulati di tanti piccoli contributi all'errore di energia

E qui veniamo al mio benedetto errore di energia, che provo a spiegare in due parole. Tenete conto che per ogni passo occorrerebbero molte altre spiegazioni per non essere vaghi e indicare tutte le variabili di cui (con i miei limiti) ho dovuto tenere conto per avere risultati più precisi possibile. Quanto espongo sembrerà dunque semplice ma vi assicuro che non lo è.

Si crea/definisce un brano musicale (o molti spezzoni di brani musicali "appiccicati tra loro" per avere una certa varietà) diciamo di 30 secondi. Questo è il segnale di riferimento.
Si riproduce e registra il brano musicale di cui sopra e si ottiene il segnale riprodotto
Si allineano temporalmente i due brani nei limiti in cui è possibile farlo (drift del clock permettendo)
Si normalizza il livello del segnale riprodotto al livello del segnale di riferimento (e qui si apre un mondo su cui se volete darò maggiori dettagli. Diciamo che per me, dimostrazione alla mano, questo è il più grosso limite delle misure esistenti)
Si calcola l'energia contenuta in molte bande di frequenza consecutive sia per il segnale di riferimento che per quello riprodotto. L'energia in ogni banda di frequenza è in termini dialettali proporzionale alla pressione sonora che il segnale emette in quella generica banda di frequenze
Si calcola il rapporto tra l'energia in ogni banda del segnale riprodotto e quelle del segnali di riferimento (se volete in dB)
Si fa tutto questo usando grande precisione per potere avere una risoluzione molto spinta
Se il rapporto su quella determinata banda di frequenza è pari a 1, allora il segnale riprodotto consegna la stessa energia in quella banda del segnale di riferimento
Se il rapporto è maggiore o minore di uno, allora la consegna energetica è comunque errata e esuberante o deficitaria.
In tutto questo si deve anche tenere conto della non linearità della scheda, con operazioni di calibrazione (che hanno sempre dei limiti purtroppo)

Se pure l'errore sulla singola banda fosse piccolo, questi si cumulano e inoltre mascherano le emissioni energetiche in altre bande, da cui l'effetto macroscopico all'ascolto (ovviamente IMO)

Ah c'è corrispondenza temporale e quindi, se il sistema è tarato bene, si può capire il punto in cui ci sono le differenze e cercare di concentrarsi lì nell'ascolto.
Concettualmente è semplice, nella pratica bisogna vedere come si setta il sistema......
Un'osservazione : si legge del concetto di energia legata alla pressione sonora. Allora stiamo misurando il cci in relazione alla pressione sonora??

Filippo ha scritto: ↑
ven 18 set 2020, 21:52
Ah c'è corrispondenza temporale e quindi, se il sistema è tarato bene, si può capire il punto in cui ci sono le differenze e cercare di concentrarsi lì nell'ascolto.
Concettualmente è semplice, nella pratica bisogna vedere come si setta il sistema......
Un'osservazione : si legge del concetto di energia legata alla pressione sonora. Allora stiamo misurando il cci in relazione alla pressione sonora??

Ciao Filippo, la corrispondenza temporale c'è nei limiti in cui ottieni dei dati frequenziali medi nell'arco di tutta la durata del brano misurato. Puoi ridurre la durata del brano ma in tal modo riduci anche la precisione. Oppure puoi ripetere per 10 volte lo stesso piccolo spezzone di brano, ottenendo dati molto precisi in frequenza per una durata temporale abbastanza breve (i pochi secondi del brano ripetuto). E' sufficiente scegliere il modo in cui costruire il segnale di riferimento: quello che ci metti dentro misuri. Questo secondo me è un grosso vantaggio rispetto alle misure canoniche, legate a segnali standard che nulla hanno a che fare con la vera e propria musica, che quindi non sollecitano il sistema come in condizioni reali.
L'energia è legata fisicamente alla pressione sonora ma siamo in due domini diversi. L'energia per unità di frequenza (densità di energia nella frequenza) è da me misurata nel regime elettrico (ai morsetti), mentre la pressione sonora nel regime meccanico (in aria/in ambiente). E' più complicato di così (la pressione sonora è data istante per istante dalla composizione delle varie armoniche emesse e risente di quanto accade in ambiente, come densità dell'aria, efficienza del trasduttore, temperatura, ecc..) ma eiste tra loro un legame "diretto"

Ho letto i messaggi e penso d’aver capito la questione. La misurazione dell’energia e’ una maniera di misurare la quantita’ d’informazione. Permette di rilevare le stesse differenze in altro modo. Nel caso wav mp3 sono sicuro che limitando lo spettro agli alti, tipo dai 2000 in su’, la differenza si farebbe macroscopica. Ma si poteva vedere gia’ dalla spettrografia.
Nel caso del CCI capisco che ci avete provato... Per me la’ si arriva alla teoria quantistica dei campi e non c’e’ speranza a meno di non avere un ciclotrone in cortile.

giorbe ha scritto: ↑
gio 1 ott 2020, 18:37
Ho letto i messaggi e penso d’aver capito la questione. La misurazione dell’energia e’ una maniera di misurare la quantita’ d’informazione. Permette di rilevare le stesse differenze in altro modo. Nel caso wav mp3 sono sicuro che limitando lo spettro agli alti, tipo dai 2000 in su’, la differenza si farebbe macroscopica. Ma si poteva vedere gia’ dalla spettrografia.
Nel caso del CCI capisco che ci avete provato... Per me la’ si arriva alla teoria quantistica dei campi e non c’e’ speranza a meno di non avere un ciclotrone in cortile.

Messaggio: # 12826Messaggio **pasgal** gio 8 ott 2020, 9:47

Mah, non essendo un tecnico, anzi l'opposto, un paio di cose credo di averle capite:

1. Non è che utilizzando i migliori materiali, ottieni il miglior suono. Altrimenti non ci sarebbero i "...si è di fascia altissima ma a me non piace" (troppo velato, poco profondo, poco qua, poco la...etc etc.).

2. Le misurazioni perfette non ti dicono nulla sul suono, ti dicono se esistono limiti tecnici o dove arrivano le bontà. Altrimenti suonerebbero tutti uguali gli amp di fascia altissima, invece...

Quoto!