3. Audio

Como decíamos, el sonido aporta la otra mitad de la información a la experiencia audiovisual.
El sonido también es una señal que hace vibrar los altavoces para transmitir el sonido por ondas sonoras hasta nuestros oídos.
Al igual que en vídeo, esta señal puede ser analógica o digital, pero centrándonos en el sonido digital sus características son las siguientes.
 

 

3.1. Frecuencia de muestreo

Es el número de veces por segundo que tomamos muestras de la señal. Se expresa en Hz (hercios). A más Hz conseguimos captar o reproducir frecuencias de sonido más altas (más agudas). Las frecuencias de muestreo más habituales son: 

44,1 KHz (44100 Hz): es el estándar para CD de audio.
48 KHz: es el estándar para vídeo digital[1].
96 KHz: utilizado para la producción musical o de sonido antes de reducirlo a los 44,1 KHz del CD de audio o a los 48 KHz de un vídeo. También es el estándar de Blu-ray.
192 KHz: También utilizado para producción musical o de sonido.
 

 

3.2. Profundidad de bits

El audio digital se capta y reproduce a una cierta cantidad de bits. A más bits el sonido tendrá más precisión y por lo tanto mayor calidad. La profundidad de bits más común es la de 16 bits, aunque los 24 bits son ampliamente utilizados en entornos de producción profesional. La tecnología de disco Blu-ray también acepta 24 bits de sonido.

Tanto la profundidad de bits como la frecuencia de muestreo tienen como objetivo
el lograr la mayor fidelidad al sonido original posible.

 

Al igual que con el vídeo siempre podremos pasar de una mayor definición a una menor. Se suele trabajar a 96 KHz y 24 bits para luego pasarlo a 48 KHz y 16 bits. También podemos aplicar la técnica de dithering en el sonido para mejorar la sensación de calidad de un sonido de baja definición.

 

 

 

3.3. Canales

Un vídeo puede llevar uno o varios canales de sonido. Lo más habitual es que esté en stereo y por lo tanto tenga 2 canales de sonido: uno para el altavoz izquierdo y otro para el derecho. Pero también puede estar en mono (un solo canal) o tener más de 2 canales.
En el caso de ser mono, lo que se hace es que se reproduce la misma señal tanto por el altavoz izquierdo como por el derecho.
Cuando tenemos más de dos canales necesitamos sistemas especiales de sonido como son los llamados surround 5.1 y surround 7.1 utilizados en cine y home cinema.
También se pueden incluir otros canales como pueden ser el sonido en varios idiomas, comentarios del director, etc.

 

 

 

3.4. Volumen

Realmente un sonido de por sí no tiene volumen. La información en forma de onda que produce el sonido llega hasta un máximo en una escala que va del menos infinito hasta el 0 dB (decibelios). La manera en cómo aprovechemos ese rango es lo que podríamos llamar volumen pero es solo una percepción del conjunto. Podemos tener una parte del sonido con bajo volumen pero en un momento dado subir hasta el límite máximo del dispositivo de reproducción. Hay varias técnicas para aprovechar al máximo ese rango de volumen.

 


Representación gráfica de un sonido


Normalización

Normalizar una pista de sonido consiste buscar cuál es el pico más alto de volumen y subirlo todo hasta llegar a 0 dB. Por ejemplo, una pista de sonido cuyo pico máximo llegue a -6 dB, si subimos todo 6 dB conseguiremos aprovechar mejor el volumen, y lo más importante es que si tenemos dos clips de vídeo distintos, el volumen sonará igual de alto en ambos. ¿No os ha pasado nunca que al reproducir dos canciones, en una de ella sonaba en general más bajo y habéis tenido que subir el volumen de vuestros altavoces? Esto es porque no estaba normalizado. 


Señal original con poco volumen


Normalización subiendo el volumen en función del pico de mayor altura 

 

Compresión

No hay que confundir esta compresión con la de reducir tamaño. Esta compresión consiste en reducir la diferencia entre las partes con volumen más bajo y las partes con volumen más alto. Con esto se consigue que la pista de sonido esté más igualada: sube sólo las partes con menos volumen. Esto es ideal para equilibrar el volumen de una locución, o bien cuando queremos mucha potencia de sonido en una pista de música. 

 


Compresión subiendo por igual el volumen de las partes más altas y más bajas 

 

Cuando sobrepasamos el límite de los 0dB lo que ocurre es que la señal queda recortada. Esto provoca un efecto muy molesto llamado clipping. Por ello hay que vigilar no sobrepasar el volumen máximo de la pista de sonido.

Otro inconveniente de aumentar el volumen es que al hacerlo también aumenta el ruido de fondo que son imperfecciones que se producen de forma constante en el momento de la captación del audio mediante un micrófono. Este ruido, que suele tener muy poco volumen llegando a ser prácticamente imperceptible, toma mayor presencia al aumentar el volumen de la señal.

 

 

 

3.5. Archivo de audio

Formato contenedor

En un vídeo, el sonido está incluido dentro de su archivo contenedor pero también puede estar por separado en su propio archivo contenedor de audio como puede ser WAV, AIFF, MPA, MP3, WMA entre otros.

 

Códec y compresión

El audio puede estar sin comprimir o comprimido utilizando un códec.
Un WAV es un archivo de sonido sin comprimir con el que también tenemos la desventaja que ocupa mucho almacenamiento.
Un MP3 además de ser un formato contenedor, es un códec de compresión con el que logramos reducir considerablemente el tamaño del archivo de sonido. Otros códecs de compresión son AAC, OGG, WMA.

El principal parámetro para la compresión de sonido es el bitrate expresado en kbps (kilobits por segundo). En un MP3 los valores más adecuados para mantener la relación calidad / espacio son un mínimo de 128 kbps, 160 kbps o incluso 192 kbps. A menos de esos valores la calidad disminuye considerablemente. A mayor valor, el aumento de calidad es apenas inapreciable.



[1] Aunque los antiguos estándares PAL funcionan en 44,1KHz y NTSC en 44KHz.