Elementos Clave en la Mezcla Musical
Elementos Clave en la Mezcla Musical
1. INTRODUCCIÓN A LA MEZCLA
2. AUDIO DIGITAL Y PROTOCOLOS
3. HERRAMIENTAS DE ANÁLISIS
4. PROCESADORES DINÁMICOS
5. PROCESADORES DE TIEMPO
DERECHOS RESERVADOS
ESCUELA CTAUDIO 2020
Generalidades
Una de las preguntas más frecuentes en el campo de la grabación y producción musical es ¿Qué
elementos hacen una buena mezcla? Muchas veces nos encontramos con excelentes mezclas, pero
que sus creadores no pueden explicar exactamente cómo las hicieron.
Conocer los elementos que hacen una gran mezcla tiene sus obvias ventajas. En primer lugar, es
muy importante saber hacia adonde nos dirigimos y cuáles son los objetivos del trabajo ya que de
esta forma se ahorran tiempo y energía. Si podemos decir o imaginar “a priori” lo que queremos
alcanzar, será mucho más fácil conseguirlo.
Por otro lado, existen muchas opiniones diferentes acerca de cómo debe sonar una canción. Cada
uno de los miembros del grupo, el solista o el productor, tiene sus propias ideas, y en algunas
oportunidades ni siquiera ellos tienen una visión completamente terminada de lo que quieren.
Aún cuando tengan una idea sólidamente formada, algunos quizás no pueden explicarla porque
no conocen la terminología o el funcionamiento de los equipos para alcanzar ciertos resultados.
Hay casi tantas formas de mezclar una canción como personas en el mundo, sin embargo, la
mayoría coincide en que la mezcla debe ser apropiada para el estilo de música, la canción y sus
características, y la gente involucrada en el proceso. Estos tres aspectos son las guías básicas para
elegir la dinámica musical y emocional que se creará con el equipamiento del estudio.
El estilo de música
La gran mayoría de los artistas que ingresan en un estudio quieren que sus mezclas suenen como
del estilo de música que hacen. Para algunos artistas y estilos musicales las reglas son muy
estrictas.
Por ejemplo, algunos no aceptan guitarras con distorsión y baterías acústicas en música folklórica,
no aceptan un flanger en el clásico sonido de un bandoneón de tango, un delay con 10 repeticiones
en el bombo de un grupo de folklore, o por el contrario, guitarras distorsionadas escondidas o
apagadas en un grupo de heavy metal. Muchos de estos grupos no quieren que su música suene
como si fuera de otro estilo.
Con reglas tan estrictas, terminan teniendo una visión muy acabada de cómo deben sonar. Para
otros, estar abiertos a la experimentación es la base de su música. Tanto en uno como en otro
caso, siempre es conveniente investigar para conocer nuestro margen de creatividad.
A veces resulta obvio pensar en una mezcla que vaya con el estilo de música de la canción, pero
otras veces nos olvidamos de asegurarnos que también cumpla con las otras características. Estas
características incluyen el Concepto, la melodía, el ritmo, las letras, la instrumentación y los
arreglos, entre otros. Cada uno de estos aspectos nos llevarán a utilizar nuestras cuatro
herramientas básicas (el volumen, el paneo, la ecualización y los efectos) de formas determinadas.
La melodía:
Si se trata de una melodía importante en la canción, podemos considerar hacerla más grande y
utilizar algún tipo de efecto de tiempo, como un double”. En cambio si es una melodía muy
simple, podemos utilizar algunos efectos para hacer algunas partes un poco más interesantes. El
plano de las voces está muy relacionado con la línea melódica, ya que normalmente es necesario
no perder ningún detalle de la interpretación.
El ritmo:
Con las bases rítmicas, es preciso observar su complejidad. Si el ritmo tiene muchas notas,
trataremos de hacerlo un poco más claro y despejado. Quizás no exista mucho espacio para
reverbs o delays, o se necesite una ecualización con más definición. Es normal subir el ritmo un
poco, o sólo algunos pasajes complicados para que puedan entenderse en forma clara. Pero a la
vez no todos los ritmos complejos necesitan mezclarse adelante. Hay ritmos que de esta forma
molestan un poco a la canción (en este punto habría que analizar también si no hay problemas
de arreglos o de instrumentación). Los ritmos más simples o espaciados dan más posibilidades
de sumar efectos y paneos.
Las armonías:
Estas definen la apertura estéreo de la canción. Cuántas más partes existen, más ampliamente se
ubican instrumentos y efectos en el estéreo. El tipo de acordes creados por las partes armónicas
pueden alterar su posición y también su variación a lo largo de la canción.
Un acorde disonante puede tener un plano más lejano que uno dulce, o viceversa, y este último
puede aprovecharse para poner efectos de tiempo y reverbs. También se puede jugar con la
apertura estéreo con las partes en unísono, ya que la diferencia de doblaje produce efectos
interesantes. Muchas veces las letras o alguna frase en particular define un efecto en la voz, o
también puede alterar la EQ de otro instrumento para hacerlo consecuente con la frase.
Aparte de utilizar pocos efectos, los instrumentos suelen ecualizarse un poco más brillantes ya
que, cuando hay tantas notas e instrumentos en la mezcla, las frecuencias medias y altas tienden
a enmascararse más.
Si el arreglo es muy abierto, hay dos posibilidades estéticas lógicas: mantenerlo así respetando
su naturaleza, o aprovechar los espacios vacíos para colocar algunos tipos de efectos. Hay que
recordar que cuanto más espacio existe, los efectos son más notorios y pueden resultar muy
interesantes.
La estructura de la canción:
Es otra de las variables que inciden en nuestro trabajo. Existen canciones en las cuales cada
sección es casi completamente diferente de la otra. Frank Zappa, Pink Floyd, The Beatles,
Queen, por nombrar algunos, tienen canciones en donde la mezcla cambia drásticamente de una
parte a la otra. Incluso en algunos casos cambia totalmente la instrumentación.
Aún en las canciones que no cambian tanto de parte a parte, se pueden hacer cambios para
resaltar algunas cosas. Por ejemplo, el estribillo puede tener más reverb en las voces, o un break
puede ser subido de volumen. También se puede subir el tambor de la batería en el estribillo o
una guitarra puede tener diferentes volúmenes a lo largo de la canción y un puente puede tener
diferente reverb, paneo o efectos que el resto del tema para crear variedad.
Con respecto a las interpretaciones de los músicos en la canción, no es raro que cuando son muy
buenas estén más al frente en la mezcla. Pero cuando no son tan buenas, es normal tratar de
disimular una parte y no exponer demasiado los errores. No hay que bajarlas mucho de nivel o
esconderlas con mares de efectos, porque aparte de una mala ejecución, tendremos una mala
mezcla.
El técnico:
Una de las partes más difíciles de la tarea del técnico es balancear los valores y gustos de la
gente involucrada en la grabación. El trabajo del técnico consiste en tomar valores, sugerencias,
ideas, de cada uno y compararlas con sus propias experiencias, buscando lo mejor para el
proyecto.
Un profesional escucha todas las ideas que se exponen y las compara con su gusto y el de la
gran audiencia. Debe ser un referente de artistas y productores, discutiendo las posibilidades y
trabajando junto a ellos hasta obtener una decisión final satisfactoria. Esta labor, más
diplomática que técnica, es uno de los trabajos más difíciles e importantes dentro de una
producción.
Hay muchas probabilidades que se produzcan diferencia de opiniones, pero si todos están
convencidos de su postura respecto a un punto en particular, existen muchas maneras de
explicarse, pero pocas que den el resultado óptimo.
Es importante para un técnico tener un sentido desarrollado para justificar la toma de ciertas
decisiones. Después de todo si nos equivocamos, habrá que aceptar nuestras responsabilidades
en el asunto.
El técnico experimentado conoce la importancia de escuchar y valorar las ideas de los demás.
La mayoría de los clientes valoran mucho el interés demostrado hacia sus ideas, lo importante es
separar rápidamente las buenas ideas de las malas sin herir susceptibilidades. El trabajo del
técnico consiste en captar la esencia de la canción, su emotividad, comprender las letras, con el
fin de hacer la mezcla más apropiada.
El oído humano posee un enorme rango dinámico. Sabemos que nuestra forma de percibir los
diferentes cambios de niveles de presión en el aire tiene más que ver con una función
logarítmica, y no lineal.
Nuestro punto de partida en la escala ascendente se conoce como 0dB SPL (nivel de presión
sonora). Este es el punto en el que comenzamos a percibir un sonido como tal.
Sin embargo, sería un error dejar de tener en cuenta el valor de la frecuencia al momento de
considerar el 0dB.
Debido a la estructura física de nuestro oído poseemos factores de resonancia, del mismo modo
en que un recinto se comporta frente a determinadas frecuencias.
El canal auditivo, ubicado en el oído medio, posee un factor de resonancia alrededor de los 2
KHz. Esto provoca un aumento de nuestra capacidad auditiva en los niveles medios del
espectro. Por eso es que se dice que tenemos enormes pérdidas hacia los extremos. Una
frecuencia de 50 Hz. deberá ser amplificada varias veces para que podamos percibirla con el
mismo nivel subjetivo que una de 1000 Hz. Lo mismo ocurrirá con una de 15000 Hz. frente a
una de 3000 Hz.
De alguna manera esto obedece a un sentido muy práctico, y es que nuestra articulación y
consonancia posee un nivel muy importante ubicado alrededor de nuestro propio factor de
resonancia. Esto es muy sencillo de comprobar: Si grabamos dos pistas de audio paralelas, a un
mismo nivel; una conteniendo una sección hablada, y la otra conteniendo, por ejemplo una pista
musical. Mediante la utilización de un ecualizador gráfico generamos un corte a los 2000 Hz. y
sus adyacentes. Notaremos que la voz se sigue escuchando, pero se perderá la inteligibilidad de
la palabra. En tanto, este corte no afectará al cuerpo de la voz en sí mismo.
Ahora bien, decíamos que a consecuencia de la resonancia propia del oído tenemos grandes
pérdidas a las muy bajas y muy altas frecuencias. Eso quiere decir que entonces el 0dB variará
con la frecuencia. O sea, bajará nuestro piso para frecuencias medias, en tanto que subirá
considerablemente hacia los extremos del espectro.
Sin embargo, esta relación percepción / frecuencia no se comporta de igual modo para todos los
niveles de SPL. En realidad, a medida que aumenta la intensidad de SPL, nuestra percepción
parece ir equilibrándose, variando entonces las proporciones.
Este fenómeno es muy importante sobre todo en la etapa de la mezcla. Sería difícil, por ejemplo,
conocer el verdadero contenido de un bombo si lo monitoreamos a muy bajo nivel. Esto nos
podría llevar a tomar determinaciones equivocadas, sobre todo a la hora de ecualizar. (lo más
probable es que, a bajo volumen, ese bombo sonara carente de graves)
Entonces, podemos deducir que ciertos instrumentos se deberían monitorear a un alto SPL.
Sin embargo, esto no quiere decir que debamos hacer toda la mezcla a alto volumen.
Este cuasi enderezamiento de nuestra percepción del espectro a medida que aumenta el volumen
está representado por las curvas graficadas por Fletcher y Munson (1933), denominadas también
como curvas isofónicas.
INTELIGIBILIDAD DE LA PALABRA:
Una de las causas responsables del resultado de una mala mezcla, tanto sea en vivo como en el
estudio de grabación, suele ser una mala ubicación de la voz.
Cuando se trata de música cantada, o de pasajes narrados, ya sea con música de fondo, o cualquier
otro tipo de sonidos acompañando al habla; con lo que abarcaríamos desde un recital, pasando
por una locución radial, hasta el proceso integral de la realización del sonido en un largometraje,
se deberá dar fundamental importancia a la transmisión del mensaje; y en todos estos casos el
portador del mensaje es la voz.
Básicamente, se trata de lograr un balance armónico entre la voz y todos los elementos sonoros
que la rodean o acompañan. En cuanto a los niveles individuales que caracterizan este balance, la
opción es más bien del tipo personal. Sin embargo, es de suponer que en todos los casos (o la gran
mayoría) el objetivo de la transmisión del mensaje suele ser el mismo: QUE SE ENTIENDA.
Entonces, inevitablemente, nos adentramos en el terreno de la inteligibilidad de la palabra.
Considero que una manera útil para comprender las cosas es desglosándolas, o sea,
subdividiéndolas y analizando cada sector por separado. Visto de otro modo, podré sacar mejor
provecho de un automóvil si conozco el funcionamiento de cada una de sus partes. Esto supone
otra forma de ver las cosas. En muchos aspectos estamos acostumbrados a contemplar los objetos
como un todo. Entonces simplemente las cosas son así (un auto es un auto).
Volviendo a nuestro terreno (supongo que el sonido), este concepto global puede ser excelente
para el auditorio, quien apreciará la música en su contenido general, y simplemente le gustará o
no la obra.
En este punto es bueno recordar que en términos generales nuestro oído percibe un componente
de frecuencia que va de los 20Hz. a los 20.000Hz.
Otro aspecto interesante es notar que en realidad todo el tiempo están presentes todas las
frecuencias, mientras lo que varía es la cantidad de energía acústica contenida en cada una, lo cual
dará mayor ganancia a diversos sectores del espectro frente a otros, que podrán alcanzar incluso
valores imperceptibles para nuestros oídos.
Si tomamos, por ejemplo, una voz masculina, en una persona adulta, notaremos cuatro sectores
muy importantes en donde cada grupo de frecuencias cumple un papel decisivo para cada función:
120 a 200 Hz: Alrededor de esta zona se ubica lo que conocemos como cuerpo de la voz. Un
balance justo de esta porción termina de redondear. Demasiado énfasis en este sector tiende
a confundir. Demasiada atenuación pierde peso y presencia.
14.000 Hz.: Zona de aire. Ultimo sector donde la voz interactúa con el espacio atmosférico.
No todos los sistemas de altavoces pueden representar correctamente este sector del espectro,
por lo tanto, en muchos casos, es muy difícil sentir la presencia, exceso o carencia de esta
zona.
De todos estos factores, podemos separar los que significarán una alta calidad de grabación, de
los que poseerán las cualidades indispensables necesarias para que la voz sea definida.
Es importante recordar que en muchísimos casos es más importante que se entienda bien a que el
sonido sea Hi Fi. Tal es el caso de los sistemas de altavoces ubicados en los aeropuertos, o
estaciones de tren, como en determinadas publicidades para radio y televisión.
¿Qué pasa, por ejemplo, cuando el mensaje hablado va acompañado por una pista musical?
Si bien podríamos, efectivamente, hacer decaer el nivel de la música con cada entrada de la voz,
existen a su vez variantes quizá más interesantes. Como ser:
Si sabemos que la parte que contiene mayor información en el espectro acerca de la inteligibilidad
de la palabra se sitúa alrededor de los 2,5 KHz., podemos utilizar un ecualizador paramétrico para
atenuar en buena medida esta banda de frecuencias en la pista musical, manejando un ancho de
banda lo suficientemente ancho como para liberar la zona en donde la voz lleva la consonancia.
Aclaro que no en todos los casos funcionarán los mismos sectores de frecuencia, pero el punto de
partida ha de ser el mismo.
Siguiendo esto, podríamos añadir un poco de ganancia al sector de 2.5 KHz. en la voz, con un
ancho de banda un poco más contenido, y cuidando de no llegar a la estridencia.
En este caso, la zona de aire de alrededor de los 14 KHz. seguramente estará absorbida por la
música, por lo que bien podríamos cortar con un filtro LPF bajo los 15 KHz. e incluso más abajo
aún.
En cuanto al sector de los 120 Hz. podría verse en conflicto con partes muy importantes de la
pista musical, por lo que un buen paso sería trabajar mas sobre los 400 / 500 Hz. que sobre la
parte baja. Del mismo modo, un filtro HPF a los 80 ó 100 Hz. podrá ser de mucha utilidad,
impidiendo que se pierda energía en frecuencias que de ningún modo serán oídas, sobre todo al
encontrarse la voz junto con la música.
En cuanto a las eses, éstas deberán estar presentes, pues ayudarán a distinguir más a la voz.
Como se ve, el tratamiento de la voz ha de ser diferente cuando ésta se encuentra sola, de cuando
comparte la escena. Ya que lo ideal para una voz sola sería conservar todas sus características
intactas (aunque como vimos antes en el ejemplo de la estación de tren, tampoco es así en todos
los casos). En tanto que cuando la escena es compartida con otras fuentes sonoras, habrá que
400-800 Vocales
VOCES
Voces mujeres
Soprano 250Hz a 1kHz
Contra alto 200Hz a 650Hz
Voces hombre
Tenor 110Hz a 400Hz
Bajo -80Hz a 315Hz
Cuerpo de la voz
100 a 200Hz
Vocales
400 a 800 Hz
Consonantes
2.5 kHz-(2 a 4 kHz)
Sibilancia
5 A 10kHz
Aire
12 kHz -------
Instrumentos de cuerda
Violin-200Hz a 3kHz
Viola -150Hz a 1.2kHz
Cello-80 Hz a 700Hz
Contrabajo-40Hz a 220 Hz
Zampoñas
Rango 200Hz a 2kHz
§ Chilis
§ Maltas
§ Bastos
Guitarras acústicas
Rango de 82-988Hz
Fender, Gibson, Gretch, epiphone, Rickenbacker, PRS, B.C. Rich, ESP, Music
Man, Schecter, Kramer, Steinberg, Washburn, Guild, Peavey, Charvel and Parker.
BAJO ELECTRICO
41Hz-300 Hz
Instrumentos de Percusión-DRUMKIT
Kick-Bombo-BASS DRUM
18,20,22,24 pulgadas
Rango 30 Hz a 147 Hz
Snare-Tarola
Rango de 130Hz a 240 Hz
PIANOS
Rango 28 Hz a 4kHz
CONGAS Y TUMBAS
150 Hz -1,000 Hz
TIMBALES
Rango 130 Hz a 230 Hz
SHAKER
CABASA
ARPA
Rango de frecuencias 65 HZ A 4Khz
Dispositivos
– La Compresión y la limitación
– La Ecualización en Rangos medios
– Los Delays cortos (menos de 30 ms.)
– Los Reverbs y delays largos (alejan los sonidos)
En esta tabla, dividiremos el espectro de la forma más habitual, o sea, en tres secciones virtuales:
Graves, medios y agudos. Podría aumentarse esa subdivisión, pero la manera más clara que
tenemos de identificar cada rango de frecuencias (al menos la mayoría de nosotros) es esta.
GRAVES
20-50 Hz
Esta banda llega hasta el propio umbral de audición del oído humano. Las frecuencias que la
componen se sienten más que se escuchan. Corresponden a esa sensación que nos produce tener
cerca de casa una edificación en su fase de maquinaria pesada: el sonido no es muy perceptible
pero pueden moverse hasta los muebles.
Es una banda que añade un matiz bastante orgánico a la mezcla, pero hay que tratarla con
precaución porque si la amplificamos demasiado, nos encontraremos con una importante
reducción del margen dinámico y, por tanto, una disminución del volumen final de la mezcla y,
sobre todo menor definición de la misma.
63-80 Hz
Si el bajo y el bombo han quedado algo apagados, esta es la banda que hay que modificar para
conseguir esa pegada que andamos buscando. También añade calidez a la mezcla sin reducir la
definición de las voces, guitarras o metales solistas.
Un incremento desmesurado disminuirá de nuevo la inteligibilidad de la mezcla y el margen
dinámico, llegando incluso a saturar algunos altavoces.
100-160 Hz
Si empleamos percusiones de mano (congas, instrumentos étnicos, etc), cuyo sonido tiene un
fuerte componente resonante, el cual puede llegar a saturar la mezcla de bajos, esta es la frecuencia
apropiada para recortar.
Esta banda es la que proporciona una buena calidad de graves en una zona destinada a ser
reproducida en altavoces domésticos. Hay que tener cuidado con ella por los mismos motivos
citados anteriormente, a los que hay que sumar la ecualización de las demás bandas de bajos.
200-250 Hz
Estas frecuencias suelen ser las culpables de un sonido demasiado cargado de graves en las
guitarras acústicas. Un poco de ganancia en esta región puede añadir cuerpo a una mezcla
demasiado fina, pero también se puede hacer que el bajo suene poco claro.
Para definir el bajo es más interesante recortar esta banda que aumentar los medios o agudos. La
mezcla será más clara y cálida que si optamos por aumentar los agudos.
MEDIOS
315-400 Hz
Si la mezcla global parece velada y sin detalles, ésta es la banda que debe ser recortada; tanto con
las pistas individuales como las vocales. Para mejorar la inteligibilidad de la mezcla, manteniendo
la calidez, empezaremos a trabajar en esta banda, antes que aumentar los medios o agudos.
500-800 Hz
Un volumen demasiado alto de esta banda conferirá al sonido un aspecto duro o rígido; esto es,
si el mazo del bombo parece estar golpeando una caja de cartón, o parece que la reverberación
está demasiado realimentada. Esta banda suele disminuirse razonablemente para que la mezcla
no pierda cuerpo pero sin que resulte desagradable.
Suele ser el punto más bajo de las ecualizaciones en forma de uve.
1-2 kHz
Para mejorar la inteligibilidad sin añadir sibilancia se suele aumentar la ganancia de esta banda,
porque suele devolver la claridad y frecuencia fundamental de las guitarras con demasiada
distorsión.
Por otro lado, un aumento exagerado de esta banda puede hacer que el sonido de la mezcla se
parezca más a un atasco de tráfico con todos los automóviles abusando del claxon.
AGUDOS
2,5 - 4 KHz
Esta es la zona en la que el oído humano es más sensible. Esto supone que, cualquier pista que
necesite ser destacada de las demás, se beneficiará de un aumento de estas frecuencias, pero un
aumento exagerado provocará una importante fatiga acústica. Si la mezcla suena demasiado
agresiva o dura, tal vez esta banda esté demasiado alimentada en varias pistas.
5 - 10 KHz
En esta banda reside la mayor parte de la sibilancia vocal, aunque la de una voz femenina puede
llegar hasta los 11 o 12 kHz. Pero, aunque rebajar la ganancia en estas bandas mejora los
problemas de siseo, también reduce la articulación, expresividad, y respiración de la voz. Es por
esto que, para evitar que el remedio sea peor que la enfermedad, se utilicen aparatos llamados
de-esser.
Un aumento en la zona superior de esta banda supone destacar la vibración de la caja de la batería,
el golpe de la baqueta sobre los aros y el chasquido de la maza en el bombo. Lógicamente, una
ganancia exagerada provocará un exceso de siseo y agresividad.
12,5 - 20 KHz
En esta banda reside el ruido de la cinta analógica y del preamplificador. Un filtro pasa bajos es
una opción para eliminar esos ruidos en pistas individuales, siempre que no sean pistas de
percusión o contengan muchos agudos (como la guitarra eléctrica o el bajo de seis cuerdas).
Un poco de ganancia puede hacer resaltar los platos o añadir un maravilloso aire de transparencia.
A diferencia de las bandas agudas ya citadas, esta octava superior puede amplificarse sin tener
tanta precaución.
DERECHOS RESERVADOS
ESCUELA CTAUDIO 2020
Para el PCM, cada valor de esos pulsos estará representado en sistema binario llamados
bytes, compuestas de ceros y unos (0 y 1 , bits). A través de este sistema binario cualquier
valor puede ser representable sólo con combinaciones de los números 0 y 1. Quiere decir
que sólo necesitamos dos “estados” para manejar esta información:
0 1
No luz Luz
No voltaje Voltaje
No campo Campo magnético
magnético
Es interesante destacar que las formas digitales del manejo de la información, como la
grabación o el procesamiento de datos, entre otras, estarán siempre en el medio de la
cadena electroacústica, ya que los sonidos naturales, los micrófonos, los parlantes y
nuestros oídos son todos analógicos.
• La Energía acústica
• La Energía mecánica
• La Energía eléctrica.
• La Conversión A/D y el Almacenamiento.
• Almacenamiento binario a conversión D/A
• Energía eléctrica
• Energía mecánica
• Energía acústica
En los siguientes cuadros podremos apreciar 3 gráficas de la misma señal analógica, luego
la señal analógica digitalizada con baja resolución de Bits y finalmente la misma señal
digitalizada pero con una óptima resolución.
Para entender qué es un muestreo se necesita reconocer los valores básicos que la
conforman, por ello en necesario conocer quién toma estas muestras, qué valores tienen
estas muestras y qué utilidad tienen a su vez.
La “velocidad” con que el ADC tome las muestras se llamará Sample Rate o Frecuencia
de Muestreo, y estará expresada en Hertz o KiloHerzt (Hz, KHz). 1 Hz será 1 muestra
por segundo; 10Khz, 10000 muestras por seg. A cada una de esas muestras se le asignará
un valor correspondiente a la amplitud de ese instante en la señal original, a esto se
denomina Cuantización.
El enunciado del teorema de Nyquist propone como sampleo aceptable todo aquel que sea
realizado a una velocidad de sampleo (Sample Rate) que vaya al doble de la frecuencia
máxima que se utilizará en la grabación.
Frecuencia de Nyquist se le dice a la frecuencia máxima equivalente a la mitad del Sample
Rate utilizado. Por ejemplo en una grabación con un Sample Rate de 8 KHz, la frecuencia
de Nyquist será 4 KHz
Es resaltante tomar en cuenta que, todas las frecuencias que sobrepasen a la de Nyquist
(FN) entrarán en el sampleo de forma incorrecta, alterando su valor, y provocando un tipo
de distorsión resultante.
Convengamos que no sólo nos veremos afectados por una distorsión en la parte audible,
sino que también el sampleo perderá sus agudos.
Si por alguna razón nos encontramos ante una situación en la cual el Sample Rate es fijo
e inamovible (pongamos el ejemplo de 8 KHz), podremos solucionar uno de los aspectos
de este problema, aunque no los dos.
Para evitar que las frecuencias por encima de la FN causen distorsión al entrar en el
sampleo en forma desordenada, un buen método es utilizar un filtro pasabajos a la entrada
de la grabación, evitando que a la etapa de conversión A/D lleguen frecuencias por encima
de 4 KHz De este modo perderemos parte del espectro de frecuencias, pero evitaremos
la distorsión.
Otro caso es el de un sampleo hecho a un Sample Rate, por ejemplo de 44.1 KHz y la
necesidad de re-samplearlo a una frecuencia de 22.5 KHz. Nuevamente, para que no nos
ocurra lo esperado, podríamos buscar un filtro de corte justo a la medida, o aplicar durante
el re-sampleo un filtro anti Alias, el cual cortará terminantemente todas las frecuencias
por encima de la FN de destino.
Para que una frecuencia pueda ser representada digitalmente, debemos tener por lo menos
dos muestras por cada ciclo de esa frecuencia.
En un sistema de 16 bits existe un margen teórico de 96 dB y esto se debe a que cada bit
aumenta el rango en 6 dB . Entonces:
16 x 6 = 96
La pregunta es la siguiente:
Si el rango dinámico teórico del oído humano es de 140 dB, ¿Qué pasa con un
sistema que puede ofrecerme solamente 96 dB ?
Debido a que cada bit posee 6 dB, a la vez que por ser una potencia duplica el valor
anterior, obtendremos que la medida 6 dB significará el doble o la mitad de un valor dado.
Por ejemplo para subir el doble de amplitud de una señal, se le deben añadir 6 dB de
ganancia.
Por ejemplo, un sistema con una palabra binaria de 8 bits produciría un rango dinámico
de aproximadamente 48 dB (8 × 6), mientras que un sistema de 16 bits acomodaría un
rango dinámico de 96 dB (16 × 6). Un sistema de 24 bits tendría un rango dinámico
teórico de 144 dB (24 × 6).
Todos los sistemas y aparatos electrónicos generan su propio ruido, el cual se alojará
cercano a los bits inferiores. Se entiende que mientras mayor sea la distancia entre el 0dB
y el nivel de ruido, mejor será un sistema.
Esta relación varía mucho de acuerdo a cada fabricante y modelo. Habrá que tomar en
cuenta, al leer las especificaciones dadas por el fabricante, si las cifras son o no
ponderadas (medidas entre 500 Hz y 10.000 Hz, debido a la respuesta subjetiva del oído
humano respecto a las diferentes frecuencias).
Escala full:
Utilizada para mediciones en términos de decibeles, de aplicación frecuente en sistemas
de audio digital, en donde 0dB corresponde al valor máximo de bits proporcionados por
un sistema.
Tipos de dither:
ü Apogee UV-22: aumenta el nivel por arriba de 15 KHz, donde es más difícil
escucharlo.
ü Pow-r: Desarrollado por Weiss
Parametros
Noise shaping
Desplaza el Dither hacia la zona del espectro audible donde es más difícil escucharlo
(menos sensible), mejorando de esta forma la relación señal ruido.
Presente en algunos procesadores, se puede seleccionar entre Ninguno, Moderado,
Normal y ultra ó entre off, 1, 2 ó 3.
Proceso mediante el cual podemos reducir o ampliar la cantidad de muestras por segundo,
para su correcta reproducción.
Formatos de archivos
Originalmente creado para su uso en Macintosh, hoy es utilizado como archivo en común
entre Mac y PC. Puede ser mono o estéreo. Soporta archivos de 8 a 32 bits, frecuencias
de muestreo de hasta 192 KHz. y corrección Interleaved.
ü WAVE
Este formato fue desarrollado por Microsoft y es el famoso wav, que puede ser
mono o estéreo, de punto fijo o flotante, además soporta altas frecuencias de
muestreo y corrección Interleaved.
Basado en el formato WAVE, contiene datos que tienen que ver específicamente
con las aplicaciones de transmisión, como identificadores únicos de fuente y data
relacionada con la estación de transmisión.
Wordclock es usado por el dispositivo que recibe la señal para descifrar, en la gran
cadena de unos y ceros, donde empieza y termina cada Sample (cuál es el primer y
último bit de cada Sample) y si la palabra o Sample pertenece a el canal derecho o
izquierdo en una señal estéreo.
La sincronización se logra ya sea haciendo esclavo el reloj interno del equipo que recibe
la señal, a aquel del equipo que la envía, o conectado los dos equipos (pueden ser mas) a
un reloj master.
Uno de los más famosos de éste tipo es el Apogee Big Ben. Dado que estos relojes suelen
ser de muy alta calidad, se dice que incluso pueden mejorar la calidad del sonido de
algunos equipos, ya que sustituyendo su reloj por uno mejor y más estable se reduce el
Jitter1.
Jitter
El Wordclock
• Es una señal digital transmitida junto con la data que representa al audio. Determina
la sincronización de esta data entre los diferentes dispositivos.
• Se determina una relación de maestro/esclavo y los dispositivos esclavos
sincronizan su clock interno a la señal entrante de sincro.
• El digital clock representa un papel muy importante en la calidad del audio digital.
El Wordclock es una señal de reloj que viaja junto con la señal de audio digital, aunque
también puede viajar de forma independiente. Esta marca la pauta de cuándo deben
procesarse las muestras, tanto en grabación como en reproducción.
Cuando las muestras sufren pequeños retrasos o adelantos, respecto al momento en que
deberían ser procesadas, generan una modificación de las frecuencias que codifican,
produciéndose unas fluctuaciones o modulaciones, análogas en cierta manera, a las que
se producen en una cinta cuando la velocidad de giro de la misma no es constante.
Es un efecto muy sutil, difícil de describir, pero que se manifiesta en una pérdida de
definición y una imagen estéreo más pobre.
Un sistema digital con un buen equipo externo de reloj, que suministre wordclock y
sincronice todos los equipos, es la mejor garantía para evitar este problema, especialmente
en el momento de la conversión A/D. Con posterioridad, se pueden "recolocar" las
muestras, pero ya no representarán la realidad muestreada y el indeseable efecto lo
arrastraremos en toda la cadena.
Consecuencias sonoras
La falta de sincronización provoca la pérdida de muestras que pueden resultar en giltches
audibles y espureas por errores en la conversión. Un simple de sincronismo de 0.1ns,
puede producir efectos audibles.
Una onda sinusoide es muy fácil de detectar a simple vista, pero en ondas complejas
puede resultar desde complicado, hasta demasiado complicado. Es entonces cuando
debemos emplear herramientas de análisis. Estas las encontramos en Nuendo, Wavelab y
Sound Forge. En teoría, no deberíamos ser capaces de percibir este tipo de corrimientos
ya que el parlante hará el movimiento que le corresponde a la forma de onda. Sin embargo,
si el desplazamiento es significativo, el parlante se encontrara con mayor resistencia e
inductancia mecánica hacia un extremo respecto del otro. A estas alturas sí podría
percibirse de oído, ya que esto generaría distorsión entre el eje de entrada y el de salida.
Por otra parte, las bobinas de los parlantes tenderán a calentarse más cuando se encuentran
con problemas de offset, a la vez que los vúmetros indicaran niveles mayores a los que
realmente se desplaza la señal.
ü Puede ser producido por convertidores AD mal calibrados, o por malos procesos
digitales.
ü El centro de la forma de onda (reposo), no es exactamente 0 volts.
ü Se reduce el headroom en dirección al offset.
ü También podría ser confundido con ruido de piso en un sistema, ya que en un
medidor se representa de igual modo.
DERECHOS RESERVADOS
ESCUELA CTAUDIO 2020
La forma más usual es repartir las frecuencias en barras verticales, ya sea en modo lineal
(una barra para cada frecuencia -o grupo de frecuencias-), logarítmica (formato
comprimido), por octavas, o bien presentando divisiones de octava. De entre las
divisiones se destaca el tercio de octava, por mantener cierta correspondencia con la
percepción espectral del oído humano.
Los valores para el ajuste de la FFT se dan como potencias de 2, por lo tanto se
corresponden con valores de bits. En algunos casos arrancan en los 128 valores, hasta
un análisis final dado en 65.536 niveles para FFT.
Un ajuste de 128 para la FFT, en un sampleo de 44.100 Hz. produce un análisis cada
0.003 segundos (128/44100).
Un ajuste de 2048 para la FFT, en un sampleo de 44.100 Hz. produce un análisis cada
0.046 segundos (2048/44100)
Los 128 puntos convergen en 64 (128/2) bandas de frecuencias discretas, con un ancho
de banda de 345 Hz. (44100/128) por banda.
Para 2048 puntos el FFT resulta en 1024 bandas discretas, con ancho de banda de 21
Hz.
TAMAÑOS DE FFT
Cancelaciones:
Es importante tener en cuenta las cancelaciones, ya que cuando dos señales iguales se
sumen hay que saber cuál es su fase relativa. Pues pueden suceder dos cosas, una que
estén correctamente en fase y la suma nos dé el doble de amplitud y la otra es que estén
180º fuera de fase lo que nos dará como resultado una señal nula.
En caso que sucedan otros desfases las señales se restarán, no en su totalidad, pero si
habrá alguna pérdida, este fenómeno se conoce como cancelaciones. En realidad, el valor
del ángulo de fase no es muy útil. El valor realmente útil es la diferencia de fase o desfase
entre dos sitios, dos instantes o dos ondas.
El desfase entre dos ondas es la diferencia entre sus dos fases. Habitualmente, esta
diferencia de fases se mide en un mismo instante para las dos ondas. Se puede medir el
desfase como:
Para evitarlo, la regla 3 a 1 nos permitirá tener un mejor manejo de la fase. Es bueno
siempre tener un medidor o correlador de fase y un receptor mono para hacer pruebas
de escucha.
Obsérvese con cuidado también los rangos de frecuencias en Hertz, que describe el
posicionamiento 3 y su relación relativa de salida en decibeles.
Otro de los procedimientos a tener en cuenta es cuando ya se tiene grabada la sesión con
estos errores, para ello se sugiere invertir la polaridad en algunos canales o alinear en
tiempo la llegada de diferentes instrumentos, moviendo físicamente los archivos de audio.
Un error muy común que también ocurre en el bajo eléctrico y se da cuando es grabado
en 2 canales. Uno de los canales se graba con un sonido eléctrico (caja directa) y el otro
acústico (con un amplificador con gabinete). Es estos casos la señal acústica llega con
retraso y a la que muchas veces hay que alinear o invertir la fase, para solucionar el
problema.
A continuación veremos 2 gráficos donde el software muestra algunos tipos de sesiones
con errores.
Estos sonidos son los que están a lo largo de todo el tema y que a veces se encuentran
superpuestos de manera que no son compatibles en mono. En este caso podemos cambiar
el ancho de este canal (comúnmente estéreo) y cerrarlo un poco en el plano horizontal y
visualizarlo en el correlador de fase, hasta donde no exista demasiada cancelación en
mono. Lo mismo ocurre en los OH de la batería, donde 2 micrófonos no están en un
mismo eje.
Retornos de Reverberación:
Estos casos son muy comúnes por el uso de reverbs estéreo y para evitar cancelaciones
en de fase en mono,es mejor manejar el panorámico a 80 % cada lado. Pero aquí ocurre
otro error muy común, que es el uso excesivo del ensanchamiento de la base estéreo. Para
superar este problema en todo caso se sugiere el uso de fx de retorno mono, que podría
ser útil en situaciones donde la señal se ubicara con el panorámico al centro (voces,
tarolas, entre otros).
Estos son efectos, que al aplicarlos, es recomendable usar filtros pasa altos alrededor de
250 Hz aproximadamente, para evitar cualquier cancelación como consecuencia del uso
de estos procesos (basados en retardos) que afectarían la zona en frecuencias bajas.
Otra opción es hacer una copia del canal a procesar y a este añadirle el filtrado.
Este error suele ocurrir cuando se realizan las cancelaciones de fase permanentes, vale la
pena controlar el desplazamiento de ambos canales para prevenir problemas futuros.
DERECHOS RESERVADOS
ESCUELA CTAUDIO 2020
Deja pasar las frecuencias por debajo de un determinado valor, al cual denominaremos
frecuencia de corte (cut off). En la práctica estos filtros no bloquean totalmente las altas
frecuencias, sino que las atenúan una cantidad de decibeles por octava.
Los valores típicos de atenuación son: -6db/oct,-12db/oct,-18db/oct.
Estos filtros son usados para eliminar ruido de alta frecuencia en señales de banda limitada.
ú
Filtro Notch. (Rechazo banda)
Es usado para atenuar una banda muy angosta, permitiendo el paso de los extremos de la banda
de frecuencia.
También se caracteriza por la frecuencia de resonancia y el ancho de banda.
Establece 2 frecuencias de corte y elimina una banda comprometida entre 2 frecuencias.
ECUALIZADORES
Los ecualizadores son dispositivos electrónicos, o digitales, que permiten alterar la
respuesta en frecuencia de una señal. Los mismos pueden actuar sobre un grupo
extremadamente reducido de frecuencias, o bien sobre la totalidad del espectro.
-Peack o Bell
-Shelving o Shelf
-Gráfico:
Los ecualizadores de octava centran sus operadores de frecuencia ubicados entre octavas.
El modelo más empleado es el ISO, cuyas frecuencias centrales se ubican en
31Hz – 62,2 Hz – 125 Hz – 250 Hz – 500 Hz – 1KHz – 2 KHz – 4 KHz – 8 KHz - 16
KHz
Si bien el espectro audible se maneja con valores estándar de entre 20Hz y 20KHz, podría
parecer que este tipo de ecualizador, también (aunque erróneamente) llamado de 10
bandas, no abarcara nuestro espectro audible. Sin embargo, dada la separación de sus
frecuencias centrales, su diseño implica pendientes muy suaves, que incluso se solapan,
para evitar dejar sectores sin cobertura. Este hecho implica, por lo tanto, que la banda
31Hz ha de llegar hasta los 15,5Hz, así como la banda 16KHz afectará a frecuencias que
alcancen los 32KHz. Por lo tanto, el espectro queda realmente cubierto.
Los ecualizadores de tercio de octava, tal como su nombre lo indica, dividen la octava en
tres partes:
20Hz – 25Hz – 31.5Hz – 40Hz – etc.
En este caso las bandas pasan a ser 31.
Los ecualizadores de tercio de octava son los que suelen utilizarse para calibración de
sala y/o sistemas, ya sea en recitales, o en estudio de grabación.
También, cabe destacar la similitud entre estos ecualizadores (1/3) y la discriminación o
selectividad de nuestro sistema auditivo, que a grandes rasgos, también divide en tercios
de octava, aunque a bajas frecuencias, nuestra división supere el quinto de octava.
Tanto en los ecualizadores de octava, media y tercio, el usuario solo puede manejar el
parámetro de ganancia / recorte, ya que la frecuencia a emplear la define el fabricante, así
como los tipos de pendiente aplicados a los filtros.
F1 F2 F3 F4 F5 F6 F7 F8 F9 F10
20 40 80 160 320 640 1280 2560 5120 10240
Tomemos, por ejemplo, F2. Sus frecuencias adyacentes son 20Hz y 80Hz. De lo que se
deduce entonces
80 – 20 = 60Hz ancho de banda (BW)
Ahora, veamos que ocurre con F3. Sus frecuencias adyacentes son 40Hz y 160Hz. De lo
que se deduce entonces
160 – 40 = 120Hz BW
De los ecualizadores que hemos visto (gráficos), podemos deducir que el más musical
será el de octava, ya que de todos, es el que posee curvas más suaves, producto de las
pendientes de sus filtros.
-Semiparamétricos:
Llevan 2 controles, uno para seleccionar la frecuencia central, y otro para controlar
ganancia / recorte.
En este caso, tienen la ventaja frente a los ecualizadores gráficos, que el usuario tiene
acceso total a la elección de frecuencia –siempre y cuando la misma se encuentre dentro
del recorrido del filtro-.
El selector de frecuencia está compuesto por un filtro pasabanda móvil, y el recorrido del
potenciómetro suele ser del tipo logarítmico.
Los hay de Q proporcional a la frecuencia, o bien de Q constante. Es el tipo de
ecualizadores que poseen la mayoría de las consolas de mediano coste. También se los
conoce como “ecualizadores de barrido”, ya que permiten la localización de un
determinado problema por medio de la técnica de barrido de frecuencia.
En algunas consolas encontramos solamente semiparamétrico de medios, en tanto que en
modelos más caros se llega a encontrar 2 ó 3 semiparamétricos. En este último caso
medios bajos, mediod medios, medios altos.
Q = fc / (f2 – f1)
Existe ecualización Shelving de baja y de alta frecuencia, no así para los medios.
Estos ecualizadores trabajan a partir de una frecuencia de corte, aplicando ganancia /
atenuación pareja a toda la gama de bajas frecuencias, por debajo de la frecuencia de
corte, en el caso de los Low Shelf; o bien haciendo lo mismo por sobre la frecuencia de
corte, en el caso Hi Shelf.
La frecuencia de corte se establece como el punto en el que el ecualizador consigue una
variación de la respuesta en frecuencia del orden de los 3 dB.
La curva se aplana cuando llega a la ganancia / atenuación prefijada por el usuario. En
consecuencia, vale aclarar que si, por ejemplo, quisiéramos subir en 10 decibeles los
graves a partir de los 100Hz, para abajo (Low Shelf), y ajustáramos la frecuencia de corte
en 100Hz. No obtendríamos en los 100Hz una ganancia de 10dB, sino que obtendremos
la ganancia requerida en una frecuencia de menor valor.
Los ecualizadores Shelving pueden ser de pendiente fija, o móvil. Incluso pueden
presentar resonancias, de acuerdo al tipo de filtro empleado en su construcción, y su
pendiente.
Es habitual encontrar este tipo de ecualizadores en sistemas domésticos de reproducción
de audio, a cuyos controles se les suele simplemente dar el nombre de “graves” y
“agudos”.
También son los ecualizadores que suelen ubicarse en los extremos de las consolas (me
refiero a extremos en la tira de ecualización), obteniendo en muchos casos:
Hi Shelf / Parametric Mid Hi / Parametric Mid Lo / Low Shelf
Así, en las consolas, suelen emplearse valores típicos de 60, 80 ó 100Hz para Low Shelf,
y 10 ó 12KHz para Hi Shelf.
EL ARTE DE LA ECUALIZACIÓN
Al margen del instrumento del que estemos hablando, ciertas zonas del espectro
tienen sensaciones subjetivas asociadas, por ejemplo: Un realce en las frecuencias
en torno a 31-125 Hz da sensación de fuerza y potencia: en los 125-400 Hz
encontramos la calidez y el cuerpo de muchos instrumentos, en torno a los 400-
Por otro lado, los 1000 Hz confieren un sonido nasal, mientras que alrededor de
los 2 kHz los instrumentos ganan en dureza e intensidad. La zona alrededor de los
3-6 kHz es muy importante, ya que es la más sensible del oído humano y
proporciona presencia,definición y excitación.
Realzar la banda de los 8-12 kHz aporta brillo, aunque en exceso puede exagerar
la sibilancia. Mucha gente define las frecuencias a partir de los 12 kHz como la
zona del "aire" y ligereza.
La Ecualización sustractiva deja espacios en la mezcla que bien podrían quedar como
zonas de aire, o bien ser utilizados por otros instrumentos, a fin de no superponerse. La
teoría se basa en que si quiero más agudos, puedo probar primero atenuar los medios.
Como último consejo, fíate de tus oídos: si suena bien, está bien. No hay reglas. Si tienes
que emplear +17 dB para obtener el sonido que buscas, adelante. Lo importante es cómo
suena, no qué hiciste para lograrlo.
Si enfatizamos el bombo, el bajo y la guitarra rítmica 4db en 110 Hz ellos podrían sonar
bien individualmente, pero el efecto acumulativo sobre la misma frecuencia nos dará un
mal resultado. Obtendremos una mezcla artificialmente grave que sonara desequilibrada
y sin la fuerza y el volumen que debería.
Ecualización complementaria
Por ejemplo, si el bajo necesita enfatizar en 110 Hz trate de cortar el bombo en esa misma
frecuencia. Si el bombo necesita más fuerza y enfatizamos en 63Hz tratemos de cortar
esa misma frecuencia en el bajo.
Si ahora necesitamos la guitarra podemos cortar las frecuencias debajo de 140 Hz por
ejemplo, ya que el rango graves ya está cubierto por el bombo y el bajo. Siguiendo este
procedimiento obtendremos mezclas que sonaran con más volumen y con mejor
equilibrio logrando un buen resultado en distintos equipos de sonido.
El compresor es un dispositivo que reduce el rango dinámico de una señal, atenuando las
partes más fuertes y aumentando las más débiles. Básicamente es un elemento correctivo,
el cual se puede emplear en el emparejamiento de señales, como, por ejemplo, una pista
de voz en la cual hay secciones muy fuertes y otras que apenas pueden oírse.
Usos
ú Limitación de picos
ú Nivelación de dinámica
ú Mayor punch
Parámetros
Hard Knee: Trabaja casi solo con los picos en el control para hacer modificaciones
más firmes y pronunciadas. Es recomendado en sonidos percusivos o instrumentos con
ataque rápido.
Soft knee:
Trabaja desde antes de los picos. Recomendados para voces e instrumentos con ataques
más lentos.
AUTOMATIC/AUTO:
Los tiempos muy rápidos pueden crear distorsión, pues modifican la forma de onda
de las frecuencias graves, que son más lentas. Por ejemplo, un ciclo de 100 Hz dura
10 ms, con lo que un tiempo de ataque de 1 ms tiene tiempo de modificar la forma
de onda, generando así distorsión.
En general en el release, el tiempo debe ser lo más corto posible sin llegar a producir
un efecto de "bombeo" (en inglés, pumping), causado por los ciclos de activación y
desactivación de la compresión. Estos ciclos hacen que la señal predominante
(normalmente el bombo y los bajos) "module" también el ruido de fondo,
produciendo un efecto de "respiración" (breathing).
Efectos colaterales:
Excesiva compresión puede “destruir el sentimiento” de un arreglo…
Al reducir los niveles altos y amplificar con el make up gain el noise floor se amplifica
también.
“Breathing-Pumping”:Efecto que resulta debido a una mala rítmica de la
compresión causada por un mal ajuste del mismo.
Sonido “squashed”(aplastado): Demasiada compresión significará un rango dinámico
muy estrecho y “pesado”.
Medición:
Un compresor a menudo tiene varios puntos desde donde medir la señal:
INPUT: mide la señal que entra, útil para configurar el threshold.
GAIN REDUCTION: para ver cuanto está reduciendo y de qué manera.
OUTPUT: útil para configurar la ganancia de compensación (make-up).
La siguiente figura muestra la señal después de haber sido procesada por el limitador.
Con línea punteada se indica el umbral establecido por el usuario, note como el peak ha
sido restringido por el umbral pero el resto del decaimiento permanece inafectado.
Conclusiones:
§ Esta señal limitada amplificada tiene un mayor nivel promedio que la señal
original. Esta es la razón de porqué señales limitadas pueden “saltar fuera”
hacia fuera y tener más golpe (punch).
§ Los comerciales, por ejemplo, son a menudo severamente limitados así ellos
tienen el más alto posible nivel promedio.
§ Las estaciones de radio y televisión también usan limitadores para hacer frente a
medios con rango limitado.
§ Si la acción de restricción del limitador ocurre abruptamente – en otras palabras,
el limitador va de no limitar a limitar completamente- el nivel sonoro de salida
no aumentará a pesar de los cambios en los niveles de entrada.
Hay formas de tomar el control del compresor y que este actué no necesariamente
cuando la señal atraviese el umbral , sino cuando determinada banda de frecuencias
sintonizada a nuestro criterio lo haga.
El sidechain es una herramienta muy util,ya que permite tomar como señal de disparo
(trigger)solo una porción del espectro de la señal original o incluso una señal externa .
Esto es muy útil cuando se utiliza como señal de disparo una voz y cada vez que esta
exceda cierto umbral se comprime o disminuye la música de fondo.
Otro caso particular es cuando se pretende comprimir una tarola previa ecualización y
hay gran composición de bajas frecuencias en el espectro, producto del bombo y bajo
presentes en la sala,donde se utiliza como trigger un pasabanda sintonizado solo a los
golpes del tambor .
Otras aplicaciones :
Sin un bombo no se escucha lo suficiente, podremos hacer que cada vez que el bombo
suene los otros sonidos conflictivos bajen de nivel.
Para agregar subgraves a un bombo u otros instrumentos usando un oscilador.
Para hacer que dos sonidos suenen mas a ritmo, ej.: “puertear” la línea de una guitarra
usando el hi-hat como key i/p.
Por ejemplo, los instrumentos de percusión poseen mucha sonoridad en los ataques, por
ello la definición y sonoridad de los mismos radica en los sonidos transitorios. Si la señal
tiene un inicio o una caída suavizada, el efecto tímbrico sería menos notorio.
Podemos relacionar también los transitorios con el trabajo de un compresor y como las
señales de audio se verían afectadas. Imaginemos un compresor con tiempo de ataque
menor a 10 ms (tendiendo a 0 ms), donde podremos deformar señales de forma tal que se
asemejen a la señal de una onda cuadrada en determinados puntos (distorsión). En
realidad, obtenemos mayor sonoridad (y un efecto obviamente menos dañino a la señal)
y mantiene mejor el timbre dejar pasar una buena porción de señales transitorias que
realizar deformaciones abruptas (tiempos de ataques excesivamente rápidos)
No está de más aclarar que estos dispositivos realzan señales transitorias, pero aquellas
que son deseadas. Generalmente, estos transitorios están asociados a grandes
modificaciones de las envolventes dinámicas, producto de tiempos largos de ataque en
compresores, o simplemente por señales impulsivas sin comprimir. Estos procesadores
son de gran utilidad para mejorar ataques de instrumentos de percusión, especialmente
bombo, tarolas, toms o instrumentos con carácter percutido como un bajo con slap,
guitarras acústicas, eléctricas, etc. También pueden aplicarse a mezclas para ganar más
punch o recobrar dinamismo perdido.
En la siguiente figura, se puede observar la detección de envolvente dinámica y cómo es
la envolvente resultante.
Una muy buena opción para este trabajo es el Transient Designer de la compañía alemana
Sound Performance Lab (SPL) que tiene versión de emulación de hardware para la tarjeta
de acelaración de plugins UAD de Universal Audio y plugin nativo (que usa el CPU).
Su simpleza y naturalidad permite, además de añadir o sustraer ataque, ser utilizado como
si fuera una “compuerta natural”. Es de gran ayuda para filtrar las tomas de partes
independientes el baterías, ya que con un uso correcto del parámetro sustain, se puede
disminuir con una caída muy natural a los sonidos presentes posteriores al ataque inicial.
Existe una versión multibanda para este plugin, con la versatilidad adicional que nos daría
ajustar según rangos de frecuencia la cantidad de realce de transitorios o transientes.
Es un dispositivo que apaga la señal cuando está por debajo del umbral (Treshold)
asignado. Normalmente éste se coloca un poco arriba del nivel del ruido de piso
–noise floor- o ambiental. En pocas palabras es un dispositivo que apaga la señal
cuando está por debajo del umbral (threshold) asignado.
Parámetros
§ Threshold. Es el nivel que tiene que superar el sonido para que se abra la
puerta (marca el punto donde va a empezar a funcionar la compuerta.)
§ Attack. Cuán rápido se abre la puerta (marca la velocidad de inicio de
funcionamiento)
Por ejemplo, un ratio de 1:3 en un expansor significaría que por cada decibel que la
señal cae por debajo del umbral, a la salida (después del expansor), habrá caído 3dB.
Si bien las señales que se procesan con un expansor de esta forma pueden sonar
raras, los cambios de nivel resultantes pueden parecer menos bruscos que los
producidos por una compuerta, especialmente cuando se usan tiempos de ataque
y reléase cortos.
Muchas veces las señales poseen envolventes muy poco cambiantes pero con distinto
espectro según la fuente.
Como ejemplos tomaremos un Bombo y una tarola, ahora al escucharlos el canal del
bombo tiene mucha tarola, utilizando la cadena lateral (llamada en expansores/ gates
como key input ) se puede hacer un envío de la señal del bombo a un ecualizador y
enfatizar en este las frecuencias bajas o utilizar un pasabanda o pasabajos .
La señal ecualizada tendrá más amplitud en bajas frecuencias que en medias altas, lo que
nos permitirá usar la compuerta controlada por sidechain , detectando estos picos para su
apertura .
Baterías
Bombo
1. Ecualización
El golpe debe encontrarse entre 60 y 80 Hz, las frecuencias inferiores aportan
buen color, pero hay que tener cuidado con el exceso y las frecuencias cercanas
al segundo armónico son indeseadas y enmascarantes.
La zona de resonancia de la madera se encuentra entre 400 a 600 Hz y suelen
eliminarse.
El ataque y definición se da entre 2 y 5 kHz.
Las frecuencias entre 8 y 10 kHz. aportan mas definición y claridad como para
el metal
§ Compresión
ú Radios 3 .1 a 6.1 para homogenizar los golpes
ú Ataque entre 5 y 20 ms. es recomendado para evitar distorsiones y poder
percibir el impacto
ú Reléase entre 150 y 200 ms. para lograr un sonido compacto y con
sostenimiento
ú Mayor compresión mayor reducción del Kick
§ Ataques rápidos reducen el ataque del instrumento y ataques lentos generan
impacto debido a la compresión del decaimiento
Tipos de bombos
§ POP
ú Golpe entre 80 Hz y 125 Hz
ú El ataque no es muy marcado en este estilo
ú Compresiones de 3.1 a 5.1 ataque cortos y reléase moderados
§ Jazz
ú No hay gran cambio en la ecualización, se oye natural
ú Golpe en 100 hz
ú No se comprime por lo general
§ Hip. Hop
ú Mucha presencia
ú Bombo acústico o un sample de este
ú Golpe entre 80 y 150 hz y las frecuencias enmascarantes no son
removidas
ú El parche puede estar resaltado en algunos casos como en otros no
Tarola
La ecualización
§ Cuerpo entre 130 y 250 Hz dependiendo de la profundidad de la caja y de la
tensión de los parches.
§ Las resonancias se encuentran entre 400 y 800 Hz , a veces pueden ser deseadas
o indeseadas.
§ El ataque esta entre 2 y 5 kHz.
§ La bordonera entre 4 y 10 kHz.
§ La compresión
ú Si se desea contundencia y ataque, los tiempos de ataque recomendados
va entre 5 y 10 ms. .
ú Reléase rápidos entre 100 ms. y con mas sostenimiento entre 250 ms.
Toms
ú Tom 1 y Tom 2 el golpe esta entre 110 y 200 Hz respectivamente
ú El napoleón o tom de piso entre 60 y 100 Hz
ú El ataque entre los 5 kHz. .
ú Alrededor de 10 kHz. aportan claridad.
ú En rock and roll no suelen filtrarse las frecuencias entre 800 y 1000 Hz,
pero en géneros mas duros si, donde se suele acentuar los agudos.
ú En pop se comprime mucho como en el thrash
HH
§ Filtrar entre 100 y 200 Hz aporta claridad a las mezclas
§ Frecuencias alrededor de 350 Hz mantienen claro el timbre de su
instrumento,pero en muchos casos es mejor filtrarlas
§ Frecuencias de 10 a 16 kHz. definen su filo.
Bajo
Ecualización
§ Cuerpo entre 60 a 80 Hz
§ Profundidad en 40 Hz
§ Presencia entre 700 y 1000Hz
§ Ruido de cuerda entre 2.5 kHz.
Compresión
§ El radio entre 3.1 a 5.1
§ Reléase alrededor de 200 ms.
§ Ataques rápidos reducen el ataque del instrumento y ataques lentos generan
impacto debido a la compresión del decaimiento. Soft Knee es muy común, pero
puede cambiar debido al tipo de música que se maneje llegando a usar Hard
Knee.
Guitarras eléctricas
§ Cuerpo alrededor de 240 Hz
§ Ataque entre 2.5 kHz
Compresión
§ Es usado con criterio dependiendo las necesidades, pero usualmente lo que se
busca es sostenimiento.
Voces
§ Ecualización
§ Cuerpo entre 120 y 200 Hz dependiendo del tipo de voz( masculina o femenina)
§ Resonancia entre 200 y 250 Hz
§ Presencia alrededor de 2.5 kHz. y 5 kHz.
§ Sibilancia entre 7 y 10 kHz.
Compresión
§ Ataques mayores a 10 ms.
§ Radios 2.1 a 6.1
§ Reléase largos alrededor de 250 ms.
Percusiones
Pianos y Órganos
Estos instrumentos manejan un buen ancho de banda en graves alrededor de 80 - 120 Hz,
Cuerpo 240 Hz, Presencia 2.5 kHz, suelen comprimirse para manejar mejor su dinámica
y hacer un filtro paso altos alrededor de 80 Hz
Vientos
La compresión puede ser muy útil, usando como opción Hard o Soft, ataques rápido de 3
a 6 ms y release alrededor de 30 ms, ratios de 4 a 6.
Para un estudio más preciso de los instrumentos es mejor usar un analizador de espectro
y revisar instrumento por instrumento.
DERECHOS RESERVADOS
ESCUELA CTAUDIO 2020
La Reverberación
La reverberación es el resultado de las muchas reflexiones de un sonido que ocurren
en un ambiente. Desde cualquier fuente de sonido, hay una trayectoria directa que
las ondas cubren para alcanzar nuestros oídos.
Pero esa no es la única manera que el sonido puede alcanzarnos. Las ondas acústicas
pueden también tomar una trayectoria levemente más larga reflejando de una pared
o del techo, antes de llegar nuestros oídos, según lo demostrado en el cuadro
siguiente:
REVERB
Parametros
Decay Time, Reverb Time(RT60)
Es el tiempo que toma la reverberación
de un sonido en disminuir 60 dB de su
nivel original.
Se da en ms y segundos
• De este modo, la cantidad de efecto aplicado a cada pista se gestiona desde los
controles de envíos de cada pista por separado, lo que es apropiado cuando
pretendemos aplicar un mismo efecto a varias pistas diferentes.
PLATE
§ Emula la reverberación obtenida gracias a la vibración producida por una placa
metálica colocada en frente de la fuente, lo que daba un resultado brillante y en el
que las primeras reflexiones son las protagonistas
§ Densa suave y brillante, bueno para percusiones y voces
ROOM
§ Emulación de espacios reducidos (pequeñas salas, habitaciones, etc).
§ Guitarras,voces,baterias,si se le aplica suavemente a todo los instrumentos puedes
hacer que todo suene como en un mismo espacio acústico.
SPRING REVERB
§ El Spring Reverb simula la acústica de un dispositivo de reverb analógico
compuesto por un muelle, muy frecuente en los amplificadores de guitarra.
§ Suena genial en la música rock, jazz, blues o metal, pero también en las guitarras
eléctricas y órganos de rock. El spring reverb es uno de los tipos de reverb más
comunes debido a sus múltiples aplicaciones en todos los géneros.
§ Este ofrece a los instrumentos ese sonido metálico tan característico, que da vida a
las canciones.
CHAMBER REVERB
§ El Chamber reverb simula la acústica de una cámara de eco o un espacio físico
hecho para grabaciones analógicas con reverb.
§ También puede sonar bastante neutral a la vez que llena el rango de frecuencias de
una mezcla. El Chamber reverb funciona mejor con pequeños conjuntos, música
clásica y pop. Es útil también durante la mezcla, así que confía en tus oídos y
experimenta.
HALL
§ Hace referencia a salas grandes (auditorios, salas de conciertos, etc).
§ Es ideal para baladas o temas de bajo tempo ,las podemos usar en guitarras
voces,pianos,etc..
THEATRE –
En teoría simula las condiciones acústicas de un teatro, aunque en la práctica viene a ser
una Reverb hall un poco menos densa y matando un poco las reflexiones primarias.
Hay fabricantes que incluyen este tipo de presets, en principio es una Reverb tipo
ROOM adaptada para voz. Pero no queda ahí la cosa, también te puedes encontrar
DRUMS ROOM o GUITAR ROOM
DELAY
TIPS
§ Generalmente conviene eliminar de la señal que entra al efecto los componentes de
baja frecuencia, ya que los mismos, de estar presentes en el efecto, tienden a
enturbiar el sonido, dando como resultado una pérdida notoria en la definición.
§ No es buena idea evaluar el nivel de Reverb que asignaremos, si nos encontramos en
ambientes ruidosos.
§ En instrumentos percusivos que se desarrollaran a valores constantes de una
determinada figura musical, habrá tener cuidado de que la cola de la reverb no se
superponga con el próximo golpe. En este caso deberiamos averiguar el valor
temporal de la figura musical a la que se ejecuta el instrumento ,y ajustar la de los
parámetros de caida de la reverb en consecuencia.
§ Añadir una pequeña cantidad de pre delay puede evitar perder inteligibilidad en el
habla ,si el nivel del mix en el efecto es demasiado alto.
§ La mezcla de muchos diferentes tipos de reverbs dentro de una misma canción
puede resultar creativa, pero tendera a ser poco realista.
§ La correcta ecualización de la reverb puede contribuir a un mejor ensamble en la
suma de sonidos.
§ El empleo de reverb estereo en las mezclas suele dar mayor amplitud y realismo a
las mezclas.
§ La aplicación solamente de early reflections ,genera excelentes resultados en el
tratamiento de la ambiencia
§ A veces es necesario emplear una importante cantidad de tiempo en la toma de
decisión respecto de que tipo de reverb [Link] este punto suele ser de gran ayuda
partir de un preset de fabrica, que mas se acerque al sonido deseado ,para luego
entrar en sus parámetros y modificarlo hasta llegar a un sonido ideal.
Multitap Delay:
Incluye diferentes voces que pueden tener distintos tiempos de retraso .Estas pueden
ser ruteadas luego a diferentes salidas o paneadas en una salida estéreo.
Generalmente hay un control de feedback único
Multidelay:
Son varias líneas de retraso independientes, cada una con su propio control de
regeneración.
FLANGER
Parámetros Phaser
§ Modulation frequency. Velocidad de modulación
§ Modulation Depth. Amplitud de la modulación
§ Feedback gain. Numero de copias
§ Mix Proporción entre el sonido original y el procesado.
Han quedado un poco obsoletos con la llegada de procesadores digitales por software,
pero muchos multiefectos siguen incorporándolos.
§ El Octaver, como su nombre indica permite disminuir una o dos octavas la señal
original y ha sido muy usado en guitarras y bajos.
§ Pitch Shift o Pitch Change es una aplicación que manejamos en un editor de audio
y que nos permite realizar ajustes de afinación en la señal original.
Pitch Afinación de la copia en intervalos
Fine Afinación en céntimos de tono
Feedback gain Numero de copias
Feedback delay Retardo entre la señal original y las copias.
TIME SHIFTING
§ Time Shift ofrece estiramiento de tiempos y
cambios de afinación.
§ Permite cambiar una mezcla completa, para
mejorar el rendimiento de los instrumentos o para
modificar el audio para cine con cambios en la
tasa de frames.
§ Si deseas puedes alterar voces o instrumentos
solistas.
§ Puedes modificar el tempo en proyectos
multipista manteniendo la relación de fase entre
micros y pistas.
OVERDRIVE
EXCITADORES
DRY (Seco)
WET (Mojado)