Ryan Maguire, Ph.D. student in Composition and Computer Technologies al Center for Computer Music dell’Università della Virginia, ha fatto una analisi accurata su ciò che l’algoritmo di compressione dell’MP3 elimina. Il tutto nell’ambito di un progetto chiamato The Ghost In The Mp3 il cui fine è, in realtà, quello di ricavare materiale compositivo da quelli che si possono definire gli scarti dell’MP3 (quella linkata è la pagina principale, ma vedi qui per discussione dettagliata ed esempi).
Degli effetti della compressione MP3 abbiamo già parlato qui, facendo notare che, a livelli di compressione maggiori di 192 kbps (cioè da 128 in giù), la perdita di frequenze alte sia sensibile anche in brani rock, cioè non particolarmente raffinati. Sull’algoritmo di compressione MP3 vedi “La Compressione MP3“.
L’analisi di Maguire, però, è più profonda della mia e mette in luce perdite che potrebbero essere significative sull’intera estensione della banda. La sua analisi è concettualmente semplice. In pratica, ha confrontato gli spettrogrammi di un brano prima e dopo la compressione lavorando, ovviamente, non sulle immagini degli spettrogrammi, ma sui dati numerici ricavati dalle analisi FFT che si eseguono per realizzare le immagini.
Ecco, per esempio, tre spettrogrammi relativi al brano di Suzanne Vega “Tom’s Diner” che è per voce sola ed è spesso utilizzato come test degli algoritmi di compressione. Le prime due si riferisco a prima e dopo la compressione a 128 kbps e non mostrano differenze visibili. La terza è lo spettrogramma differenziale ottenuto confrontando i dati binari e mostra che delle differenze esistono (click immagini per ingrandire).
A prima vista, questo risultato non mi colpisce: ho già mostrato in alcuni post che a 128 kbps c’è una differenza sensibile (vedi alla fine del post in “potrebbero interessarti anche”) e l’MP3 è una compressione con perdita, quindi qualcosa deve pur levare.
Quello che però risulta da questa comparazione è che la perdita non si limita alle alte frequenze, ma si estende su tutta la banda. Anzi, è più visibile nella parte medio-bassa della banda acustica e in alcuni punti è anche piuttosto forte. Ora bisogna capire che cosa effettivamente viene tolto, cioè quanto siano significativi quei blob che si vedono nella terza immagine.
Qui sotto potete ascoltare i tre esempi audio da soundcloud: originale, compresso e differenziale. Alzando un po’ il volume si nota come il differenziale contenga chiaramente anche una parte del cantato. Considerando che il bit rate è 128, non è una scoperta, però è un risultato interessante perché è il prodotto di una comparazione numerica precisa, non “spannometrica”.
Ora la discussione può essere impostata in modi molti diversi.
Da un punto di vista, per così dire, filosofico, è chiaro che qualsiasi riproduzione dovrebbe essere vietata e che la musica dovrebbe esistere solamente live. Considerando che le frequenze presenti negli spettri strumentali vanno ben oltre i 20.000 Hertz (vedi il post “C’è vita oltre i 20.000 Hertz!“) e che qualcuno sostiene che, anche se non le sentiamo, queste componenti hanno un qualche effetto su di noi (il che, imho, è tutto da provare), la musica registrata con gli attuali standard e riprodotta con gli attuali impianti è ben diversa dalla sua esecuzione live.
Partendo, invece, da posizioni più, diciamo, utilitaristiche, si tratta di capire quanto valore abbia la riduzione della dimensione dei file che l’MP3 assicura rispetti a ciò che va perso e qui la valutazione dipende molto dalle abitudini di ascolto di ciascuno di noi. Personalmente tengo in MP3 a 320, quindi con compressione limitata, la musica a cui tengo meno e in FLAC (compressione senza perdita) ciò che mi interessa di più, ma ho anche un bell’impianto e generalmente non ascolto con cuffiette o simili.
Invece, pur non comprando quasi più CD, ma solo da negozi online, ormai da tempo non compro musica che mi venga venduta in MP3. Come cliente, esigo sempre una registrazione non compressa o compressa senza perdita.