20110509

HI-FI " AUDIO Y SONIDO "


El debate sobre los distintos formatos de grabación/reproducción musical es un asunto recurrente en el mundo de la Alta Fidelidad. Ya sea en los ámbitos aficionado y profesional, como en las revistas del sector, cada tanto aparecen defensores, o detractores, de algún formato en particular.
Por ejemplo, los adictos al vinilo forman un grupo relevante en el sector audiófilo y es habitual escucharlos argumentar que el agrado con el que escuchan sus LP's no lo proporciona de ninguna manera la misma música presentada en formato digital. Otro grupo importante lo componen los amantes de la cinta analógica, especialmente como medio de grabación. Nunca dejan de recordarnos que, bien cuidados, los soportes magnéticos y los aparatos, tanto de grabación como de reproducción, pueden proporcionar un sonido de calidad superior a la que comunmente se reconoce.
Y luego interviene la industria electrónica promocionando los formatos digitales de alta definición: el SA-CD y el DVD-Audio. Ambos sistemas en guerra entre si y en lucha desigual frente al rey de los formatos: el CD-Audio y sus dos pistas PCM/44100 Hz/16 bits. El CD suele ser el formato abandonado a su suerte en los debates audiófilos, sin grupo especial que lo apadrine; aunque es lógico que esto sea así, ya que realmente su papel dominante en el mercado discográfico le permite defenderse por sí solo.
Por último, queda el grupo de los formatos "comprimidos" (con o sin pérdidas de información): toda la plétora de codecs digitales abanderados por el nuevo soberano del almacenamiento de música grabada, el MP3. Realmente, cuando se debate sobre la calidad sonora de estos formatos, pasamos a un mundo diferente del de los anteriores: su flexibilidad, su calidad "a la carta", la disponibilidad de codificadores/decodificadores, son los criterios dominantes a la hora de decantarse por ellos. Pero estos son aspectos ajenos al mundo de los demás formatos.
En los debates en defensa del formato favorito de cada uno suelen aparecer dos tipos de argumentaciones:

- La subjetiva: "Me suena mejor", "me gusta más". Indiscutible. Básicamente este tipo de ideas permite la reafirmación grupal.
- La de los fundamentos teóricos del formato: "Mayor margén dinámico", "mayor rango de frecuencias". Estos comentarios suelen aparecer en los debates y dan lugar a espectaculares tratados matemáticos sobre filtrados digitales, teoremas de Shannon y criterios de Nyquist.


El meollo del problema

¿Tiene sentido comparar CD vs. MP3? Si y no. A pesar de tener el mismo objetivo (la grabación y reproducción musical) son formatos con aplicaciones muy diferentes. Además, tengamos en cuenta que la calidad final no sólo depende del formato utilizado, sino también del equipo de audio, los altavoces, la forma y mobiliario de una sala, y el entorno. Entonces, acertar en su elección depende, en primer lugar, de qué es lo que se busque. MP3 posee una calidad aceptable para que una persona pueda acompañar un viaje en tren o una cena entre amigos con algo de música. EL CD, en cambio, es un concepto completamente distinto para aquellos que piensan en el disfrute de la música en sí.
Muchos han pronosticado la muerte de la Alta Fidelidad argumentando que la compresión de MP3 ha provocado la pérdida de la emoción musical y se preguntan porqué en la era de los mayores avances tecnológicos la calidad sonora empeoró como nunca. Es cierto que los formatos de compresión han degradado la calidad musical pero, además de una cuestión de mercado, se sabe que la mayoría de los audiófilos no son expertos en sonido, ni ingenieros, ni fanáticos del Hi-End. Por más éxito y expansión que tenga MP3, siempre habrán puristas dedicados a escuchar sólo en vinilo o en cinta y con equipos valvulares.
Antes de ir al grano, repasemos algo de historia. Cuando apareció el CD de la mano de Philips en 1982 se trataba, ciertamente, de un formato con muchos inconvenientes y su calidad inicial era muy pobre. Los avances y mejoras introducidas al formato gracias al desarrollo tecnológico fueron claves para que el CD se convierta en el rey del audio digital. Algo similar sucedió con el MiniDisc de Sony, lanzado en 1992, que tenía una pésima calidad de sonido en sus comienzos y, gracias al encomiable trabajo realizado, lograron mejorar tanto el algoritmo de compresión (llamado ATRAC) que el MD fue considerado como un formato de Alta Fidelidad. Con la llegada de la versión 4.5 de ATRAC, las copias realizadas desde discos compactos ofrecieron una calidad casi clónica de sus originales, con amplitud y naturalidad en altas frecuencias. Esto significó, ni más ni menos, la evolución de la tecnología de audio y representó un gran avance para el MiniDisc.
Bueno, lo mismo está sucediendo con MP3.


Tests de calidad: CD Audio vs. MP3

Sam Lin, un ingeniero de sonido, realizó en 2006 una serie de pruebas de calidad (quality tests) para determinar si un MP3 realmente puede sonar tan bien como un CD. En la entrada del blog D-audio dedicada a MP3 vimos que este formato alcanza la "transparencia" a 192 kbps. Bien, Sam utilizó ese umbral como referencia, ya que por debajo de los 192 kbps el sonido de un MP3 suena demasiado degradado. Primero ripeó dos piezas musicales bien dispares: el concierto nº 3 de Rachmaninov, por su gran rango dinámico, y el tema "Sweet Thing" de Mary J. Blige que, por su percusión con platillos, le permitió hacer pruebas respuesta en frecuencia y distorsión.
Para el proceso de codificación utilizó el software EAC (Exact Audio Copy), extrajo las pistas en tres bitrates diferentes (192, 256 y 320 kbps) y las copió en un CD-R. Sam ya sabía que la manera en que cada software codifica la información afecta a la calidad final del archivo y, desde luego, suena diferente.
Finalmente, usando el programa Cool Edit realizó varios análisis de frecuencias utilizando ruido rosa (pink noise). Los resultados obtenidos al analizar el pop de "Sweet Thing" le parecieron más interesantes, donde encontró que en todos los bitrates MP3 mostraba vacíos causados por las frecuencias desechadas por el "modelo psicoacústico" en el proceso de codificación.
Luego procedió a realizar pruebas subjetivas de escucha en su equipo de Alta Fidelidad, y encontró que
a 192 kbps se percibe una marcada diferencia de calidad respecto del CD. Sin embargo, no pudo encontrar diferencias a 256 y 320 kbps. De hecho, entre un tema ripeado a 256 kbps y otro a 320 kbps no existen diferencias audibles.
Como sabemos, el límite superior de nuestra capacidad de percibir frecuencias altas es de 20 kHz. Sin embargo, en el caso de las fuentes sonoras que emiten frecuencias por encima de los 20 kHz, la existencia de dichas frecuencias ultrasónicas y su interacción con las frecuencias de intermodulación que están dentro del rango audible tienen consecuencias en el sonido final que se percibe, como bien afirma el ingeniero Andrés Mayo en su artículo "Hay vida después de los 20 kHz". Todo esto justifica la elección del CD como fuente sonora de calidad frente a MP3, ya que las diferencias, aunque sutiles, las podemos percibir.
Volviendo a las pruebas de Sam Lin, MP3 de 192 kbps es ideal para escuchar en la computadora o en el equipo del coche, dos sistemas con una distorsión importante y una mala respuesta de frecuencias. Para el hogar, en cambio, se recomienda el CD o bien MP3 codificado a 256 o 320 kbps, ya que la diferencia de calidad de audio entre el CD original y un MP3 a 256 kbps no es significativa.


Conclusiones

En definitiva, cada uno elegirá el formato de su preferencia en base a sus necesidades, posibilidades y objetivos. Es innegable que el CD suena mejor que MP3, pero hoy en día la calidad de audio de un MP3 puede ser aceptable y hasta más que suficiente para el usuario promedio. Por ahora el mercado de la reproducción de audio sigue siendo dominado por el CD, y es lo que encontramos cuando vamos a una tienda de música. Posiblemente en MP3 las canciones suenen arruinadas o apenas empobrecidas, y muchos de nosotros nos sentimos incómodos por los cambios que imprimió este formato de compresión digital. Pero ese es el modo en el que la música sobrevivirá: como una lámina de ilustración en un libro de arte, mientras los originales se guardarán en un museo por aquellos que aún conservan sus reproductores de CD y bandejas giradiscos.
Ah, y no se preocupen, los puristas del sonido seguirán existiendo.



Formatos de compresión de audio.


La música ha acompañado nuestras vidas desde que la historia tiene memoria. Sin bien hoy en día existen cientos de diferentes géneros y estilos, el objetivo siempre ha sido el mismo: el disfrute del oyente. La llamada "era de la información" en la que vivimos no ha cambiado ese objetivo en absoluto; al contrario, lo ha maximizado. Esto se debe, en gran parte, al excelente trabajo que hace Internet permitiendo compartir todo tipo de datos, en este caso música. Pero nuestro placer no sería el mismo sin los formatos de compresión de audio que lo hacen posible. Antes de explicar en detalle cada formato repasaremos algunos conceptos básicos. Al igual que en cualquier tipo de compresión de datos, existen dos grandes categorias donde podemos agrupar a los diferentes formatos. La primera, denominada lossless, abarca a todos aquellos formatos que no pierden claridad ni calidad al comprimirse, pero que ocupan una mayor cantidad de espacio en el disco duro. La otra categoría, llamada lossy, engloba a aquellos formatos que (al comprimir el audio) sacrifican calidad por espacio en disco. No hace falta aclarar que los formatos del tipo lossy son los que más éxito han tenido, especialmente uno que todos conocen: el MP3. Sin embargo, algunos formatos lossless son muy utilizados por técnicos de sonido y entusiastas de la calidad. En la compresión de sonidos se deben tener en cuenta dos cosas. Una de ellas es el tiempo de muestreo, que almacena la tensión del audio en intervalos regulares como, por ejemplo, 44.100 veces por segundo para un CD. La resolución en que se almacena ese tiempo de muestreo es el segundo punto por considerar, que puede ser, por ejemplo, de 16 bits. La técnica más utilizada para realizar algoritmos lossy de compresión de audio es la llamada perceptual noise shaping, que se basa en las limitaciones del oído humano para eliminar aquellas partes que sean innecesarias. En cambio, los algoritmos lossless generalmente utilizan aquellos presentes en ZIP y GZIP, pero optimizados para comprimir audio. A continuación veremos en detalle los distintos formatos de compresión de audio. Primero los lossless (FLAC, APE y TTA) y luego los lossy (MPC, OGG y MP3).



FLAC (Free Lossless Audio Codec)


Hoy en día los formatos lossless gozan de muy poco éxito. Debido a Internet, los usuarios están dispuestos a perder un poco de calidad de sonido para obtener un archivo pequeño que pueda ser fácilmente transferido por la Red. Es por eso que los únicos formatos lossless que sobreviven a este arduo panorama son aquellos cuya compresión es tan buena que vale la pena usarlos. FLAC (Free Lossless Audio Codec) es uno de los mejores exponentes de este tipo de formatos. FLAC se distingue, entre otras cosas, por lograr una compresión mayor que la mayoría de los algoritmos lossless. Esto se explica porque está específicamente diseñado para comprimir audio, cosa que no sucede con otros algoritmos como ZIP o similares. En pocas palabras, los algoritmos presentes en FLAC primero convierten la información en una serie de números sin relación utilizando una técnica llamada predicción lineal, que luego son almacenados eficientemente con una forma modificada de entropy coding, también presente en MPC y OGG. Además, utiliza Run-Length Encoding para ordenar aquellos bloques similares, como los silencios. Cabe destacar que FLAC cuenta con tags, pero no del tipo ID3, lo que dificulta en parte su lectura para algunos programas. Esa es una de las pocas críticas hacia este formato, ya que sus escasos bugs le han hecho ganar la reputación de infalible. Gracias a estos algoritmos, FLAC tiene una popularidad pocas veces alcanzada por formatos de su tipo, algo de lo que sus desarrolladores deben estar muy orgullosos. FLAC puede ser utilizado, mediante plug-ins, con diversos programas tales como Windows Media Player, Winamp, VU Player y otros.


APE (Monkey's Audio)


Con un nombre más bien cómico, APE es otro formato lossless que merece una mención especial. La principal ventaja con respecto a sus competidores es que es totalmente gratuito y sin restricción alguna de uso. Los algoritmos de compresión que utiliza son los de ZIP, seguramente un viejo conocido para todos los aficionados a la informática. Esta característica hace que su compresión no sea tan buena como la de FLAC, aunque el archivo obtenido tiene, casi siempre, la mitad de tamaño que el original. Sin embargo, este formato lossless presenta tres notables armas que lo hacen sobrevivir en la ardua batalla de los formatos de audio. La primera y más original es su capacidad para detectar errores. Con otros formatos se hace imposible detectar por qué un archivo está dañado y, por consiguiente, cómo arreglarlo. La segunda parte de su armamento recae en los tags, los cuales son poco comunes en los formatos lossless. Su tipo es ID3, igual que MP3. Su última línea de ataque consiste también en una técnica original: la normalización, un proceso por el cual se normalizan los archivos para que todos estén al mismo nivel. Esto nos permite, entre otras cosas menos drásticas, escuchar música clásica y heavy metal sin sobresaltarnos. La única falla considerable de APE es su falta de soporte multichannel, algo que todos los formatos actuales deberían tener considerando el auge de los equipos 5.1 en todo el mundo. De esta manera, y gracias también a su soporte para los últimos reproductores de audio, APE logra destacarse dentro del enorme grupo de formatos lossless.


TTA (True Audio)


Para terminar con los exponentes del grupo lossless nos encontramos con TTA, uno de los formatos que más popularidad ha ganado en los últimos años. Junto con APE y FLAC, True Audio es considerado como uno de los más maduros en su tipo. ¿Porqué sucede esto? Muy sencillo: rápida y eficiente compresión, alta calidad de sonido y, sobre todo, licencia gratuita y Open Source. TTA puede trabajar en multichannel y en 8, 16 y 24 bits, algo de lo que no todos los formatos pueden jactarse. Al igual que APE, TTA utiliza métodos presentes en los algoritmos de ZIP y PKZIP, pero optimizados para comprimir audio eficientemente. De esta intensiva optimización se desprenden las principales características de TTA que le han valido fama mundial. La rapidez y la efectividad en cuanto a compresión cumplen un papel esencial en su éxito. Sus creadores aseguran que este formato es, sin lugar a dudas, el que más rápido puede comprimir archivos de audio. Además, logra reducir entre 30% y 70% el tamaño original del archivo, similar a lo que sucede con FLAC. Como su códec es capaz de compilar en cualquier sistema operativo o plataforma, TTA tiene una flexibilidad impresionante. Y por si todo esto fuera poco, tiene soporte para los reproductores de audio más populares y tags del tipo ID3. Estas fuertes características hacen que criticar a este formato sea una tarea inútil. Salvando algunos bugs menores, no posee falla alguna.


OGG Vorbis


Comenzamos con los formatos lossy. Vorbis es un códec de compresión de audio completamente Open Source y, por lo tanto, gratuito. Al ser utilizado en conjunto con el formato OGG, se convierte en lo que hoy conocemos como OGG Vorbis. Este formato nació en 1998 en respuesta a una carta en la que los creadores de MP3 decidían cobrar regalías por su patente. Cuatro años después, luego de muchas pruebas, llegó la primera versión estable. Como verán, este formato es relativamente nuevo; sin embargo, su popularidad ha crecido de manera considerable en los últimos años. Sus seguidores están por todo el mundo y la cantidad crece día a día. Al igual que MP3 y muchos otros formatos lossy, OGG Vorbis utiliza la técnica MDCT (Modified Discrete Cosine Transformation), que cambia el dominio del sonido para llevarlo al de las frecuencias, y luego aplicarle otras técnicas como quantization y entropy coding. Este formato tiene una característica particular: funciona siempre en VBR (Variable Bit Rate). Al contrario de lo que sucede con un flujo de bits constantes, lo que hace VBR es variarlo según la complejidad del sonido, optimizando la compresión y, por lo tanto, el tamaño del archivo. Las ventajas frente a MP3 se evidencian a simple vista. La más notoria es que suele llegar a lo que se denomina "transparencia" (es decir, cuando la calidad del sonido es tan similar a la del original que no se nota variación alguna) a aproximadamente 160 kbps, en contraste con MP3 que suele lograrlo a 192 kbps. Aunque parece una diferencia insignificante, logra reducir el tamaño del archivo y obtener la misma calidad, que es en definitiva el objetivo primordial de todo formato de compresión. Si bien todavía no cuenta con mucho soporte en reproductores portátiles de audio y minicadenas, la situación está cambiando. Esto puede verse en las nuevas versiones de firmware para los principales reproductores de MP3, especialmente en marcas como Apple.


MPC (Musepack)


Continuando con los formatos lossy es el turno de MPC, cuyo desarrollo comenzó en 1997. Actualmente, junto a OGG Vorbis, es uno de los formatos que, al parecer, están destinados a terminar con el reinado de MP3. Musepack utiliza como base los algoritmos presentes en MPEG Layer II, pero optimizados de tal manera que son capaces de competir con los demás formatos. Además de los presentes en la denominada Layer II, MPC utiliza otros algoritmos pertenecientes también a AAC, como el ya mencionado entropy coding y técnicas para reducir el ruido, entre otras. Al igual que OGG Vorbis, Musepack tiene siempre un bitrate variable (VBR), que puede ir desde 3 a 1300 kbits. Por último, y de manera similar que MP3, también utiliza el llamado "modelo psicoacústico" cuyo objetivo es reducir aquellas frecuencias que nuestro oído es incapaz de procesar correctamente, para optimizar la compresión del sonido. Sin embargo, las técnicas y algoritmos de este "modelo psicoacústico" difieren de las de MP3. Otra de las similitudes entre MPC y MP3 es la metadata, y aunque Musepack utiliza otro tipo de tags, el objetivo y el resultado son, en definitiva, los mismos. En cuanto a rendimiento, es muy similar al de OGG Vorbis, llegando a la llamada "transparencia" unos cuántos kbps. antes que MP3. En definitiva, se trata de una alternativa muy interesante para aquellos que desean cambiar el formato de su colección de música.

Fuentes :
www.audiohiend.com.ar