Técnica de grabación para generar alta intimidad acústica en la
reproducción de una pieza musical
Alberto Zea Cortés
∗ Metodologı́a de la investigación - Proyecto final
I. R ESUMEN busca sumergirse en la música y tener la sensación de estar
La intimidad acústica es un parámetro subjetivo muy im- en vivo frente al músico.
portante a la hora de escuchar una pieza musical, ya que, esta IV. J USTIFICACI ÓN
es la sensación de cercanı́a entre la fuente de sonido grabada
y el oyente que la escucha reproducida mediante un dispos- Según un estudio subjetivo de la Audio Engineering Society
itivo. Generalmente la intimidad acústica tiene como base la hecho por A. Chesnokov y L. Soohoo[3], a cerca de los
sensación de distancia hacia la fuente en un espacio, pero atributos y caracterı́sticas de un sistema de sonido en 3
este proyecto pretende recrear esas caracterı́sticas subjetivas diferentes espacios de reproducción que evaluaba el ruido
mediante una técnica que relacione un arreglo de micrófonos de fondo, la intimidad, la intensidad vocal, la reverberación,
y un espacio con una cantidad de caracterı́sticas adecuadas el timbre, la sensación de imagen espacial, las dinámicas y
para que a la hora de reproducir esa fuente después de la distorsiones de cierto audio, se llegó a conluir que el 25%
captura haya una alta intimidad acústica. de los encuestados preferı́an caracterı́sticas acústicas, el 15%
preferı́a claridad y el 91% de ellos le gustaba la claridad
II. I NTRODUCCI ÓN combinada con la intimidad. Es importante entender estos
La sensación de cercanı́a entre la fuente y el oyente le da datos previos para darle importancia al mejoramiento de los
una caracterı́stica especı́fica el audio reproducido que general- procesos de grabación con una técnica o arreglo que genere esa
mente da a una pieza musical cierta calidad. Esa calidad es alta intimidad acústica en compañı́a de la claridad y calidez
medida según la relación de frecuencias bajas con respecto al del audio en cuestión.
tiempo de decaimiento, la relación entre claridad e intensidad
V. A NTECEDENTES
de cada sonido especı́fico del audio y la sensación de intimidad
entre el oyente y el interprete de la pieza musical. Por eso se Existen varios factores que influencian la viabilidad de la
pretende crear una técnica en la que se combine un arreglo reverberación de un lugar de conciertos, como son necesarias
de micrófonos, ciertas caracterı́sticas acústicas del lugar de las condiciones para un estudio de grabación y es impor-
grabación y ciertos efectos digitales aplicados mediante un tante la relación entre el músico y el oyente, por eso la
software de grabación y edición para generar una alta intimi- acústica del lugar importa[4]. La maximización del tiempo
dad entre el oyente y la fuente capturada. y densidad de frecuencia y el retraso del retorno de la señal
son varias de las consideraciones necesarias para obtener un
III. P LANTEAMIENTO DEL PROBLEMA sonido estéreo natural[5]. En los años 50 todo se transmitı́a
A la hora hacer música, surge la necesidad de crear una en estéreo FM y la Audio Engineering society llegó a un
sensación de cercanı́a entre el músico y el oyente. Para esto, se acuerdo que la separación de canales, el rango de frecuencias,
han hecho investigaciones distintos tipos de grabación como el desfase y la relación señal a ruido eran un estándar[6].
el estéreo[1] que implica la relación de distancia y desfase Se discute cual de las respuestas en frecuencia de uno o
entre las cápsulas de dos micrófonos que apuntan hacia una dos entradas es el mejor método o si combinados generan
fuente determinada y la grabación binaural[2] que implican la diferentes caracterı́sticas de grabación[7]. Entre los años 60
relación interaural entre dos micrófonos posicionados dentro y 70, se quiso expander el método estéreo a los audifonos
de los oı́dos de una cabeza de maniquı́. Estas y otras técnicas y se encontró preferencia a pesar de las pruebas, sobre la
han logrado darle una sensación de espacialidad e inmersión versión original de la mezcla de cada pieza musical en vez
al oyente con respecto a la fuente. Este proyecto se enfoca de su versión estéreo[8]. La espacialidad de una mezcla está
mediante un arreglo de micrófonos, unas caracterı́sticas de limitada por la reconstrucción del espacio tridimensional me-
reverberación y respuesta en frecuencia del lugar de captura diante el uso de paneo en dos dimensiones[9]. Con audı́fonos
y complementados con efectos de software de audio digital de realidad virtual, la renderización precisa de la acústica
que hagan que la fuente tenga mayor cantidad de frecuencias del lugar de grabación entregan una verdadera experiencia
bajas con respecto al tiempo de decaimiento, haciéndose ası́, inmersiva[10], pero no toda persona tiene el acceso a ese tipo
más cálido el sonido, y que sea brillante, es decir, claro y con de tecnologı́a y a veces simplemente tiene unos audı́fonos
alta cantidad de armónicos para ası́ aumentar la sensación de regulares. Los atributos perceptuales de el audio espacial
intimidad entre el oyente y el músico. Es importante lograr multi-canal de las técnicas par espaciadas pueden dar un
esta conexión entre el oyente y el músico, ya que, el oyente toque natural e la mezcla ası́ simulando el retraso acústico
entre los diferentes micrófonos de la misma[11]. La calidad de la correlación crusada interaural. El pico de la función se
espacial de un sonido reproducido es un subconjunto de la hace más ancho directamente proporcional al decaimiento de
calidad del sonido mismo y cuando el sonido reproducido las frecuencias centrales del ruido pasabandas. El nivel de
carece de claridad, sus atributos subjetivos no cumplen la presión sonora tambien afecta al ASW. Pruebas dieron como
definición de estándar[12]. La necesidad de grabación en 3D resultado que todo individuo tiene la habilidad de discriminar
para pelı́culas, realidad virtual y video juegos empezó con la el ASW por la ley del juicio [Link] o apparent
investigación de arreglos de micrófonos como ORTF y MS source with es un parametro subjetivo muy importante para el
y el contraste entre ambos llegó a definir lo más apropiado espacio a la hora es escuchar una pieza musical en un teatro de
para esta necesidad[13], y con estas técnicas se puede probar opera. Este es el grosor acústico percibido por el oyente de una
lograr una alta intimidad acústica, hasta mezclándolas. Un fuente de sonido. La percepción del ASW de una fuente con
lugar adecuado puede generar los atributos adecuados como el bajas frecuencias se ve reflejada en la función de la correlación
apparent source with(ASW) y la envolvente de escucha(LEV) crusada interaural. El pico de la función se hace más ancho
que pueden confirmar o contradecirse entre si[14]. La imagen directamente proporcional al decaimiento de las frecuencias
del sonido en muchos contextos es subjetiva y generalmente centrales del ruido pasabandas. El nivel de presión sonora
se categoriza como imágenes de reverberación y el estéreo de tambien afecta al ASW. Pruebas dieron como resultado que
una señal de audio puede generar una imagen espacial de la todo individuo tiene la habilidad de discriminar el ASW por
misma[15]. En es estéreo existe una etapa de sonido parcial, la ley del juicio comparativo.[19].
donde se reproduce el sonido de los elementos frontales en
dos canales de dos formas: muestreados por varios micrófonos VI. O BJETIVOS
ubicados alrededor de la fuente, o como una mezcla de muchos A. General
micrófonos cerca de la fuente y alrededor para capturar el Encontrar el posicionamiento adecuado de el o los
ambiente. Estás dos no crean la sensación de envolvente o micrófonos de acuerdo a la distancia y ángulo con respecto a
inmersión al lugar de la captura ya que esta reproducción la fuente de sonido, que generen alta intimidad acústica a la
no se basa en el lugar real, sino en un modelo hipotético hora de la escucha.
del mismo. En la presentación holográfica de dos canales se
tiene en cuenta la función de transferencia relacionada con la B. Especı́ficos
cabeza HRTF utilizada para crear sonido que viene de otra 1. Encontrar, mediante una encuesta, si la intimidad acústica
parte diferente al frente del oyente. Esto funciona bien en es tenida en cuenta a la hora de hacer una captura para luego
Audı́fonos. Más allá de la presentación de dos canales se puede probar que arreglo de micrófonos es el adecuado para generar
capturar un campo analı́ticamente con cierta precisión. esto alta intimidad acústica.
se logra con muchos canales tal vez colocado en una esfera 2. Encontrar el micrófono, El software de grabación y
alrededor del oyente pero resulta inviable por la velocidad edición de audio y las bocinas adecuados para la captura para
de los datos y captura real de las caracterı́sticas espaciales lograr el objetivo principal
de un lugar. Finalmente se trata de capturar la información 3. Encontrar el lugar adecuado para la captura con las
percibida a diferencia de la información analı́tica real[16]. caracterı́sticas adecuadas de aislamiento y reverberación.
En la radio se utilizan entornos de grabación abiertos para la 4. Encontrar los efectos adecuados para darle calidez y brillo
producción de audio y a veces no se utiliza la acústica de un al audio capturado.
estudio, micrófonos de estudio, medición de nivel o volumen,
monitoreo de altavoces o ingenieros de audio y esto afecta la VII. M ETODOLOG ÍA
calidad del sonido. Aquı́ se toman en cuenta los inconvenientes Primeramente, se hará una encuesta para saber si la idea
y se presentan las soluciones técnicas para mantener la calidad inicial de generar intimidad acústica es importante a la hora de
del sonido[17]. En la evolución de la tecnologı́a, la forma hacer una grabación musical. Luego se investigó si el problema
de consumo del audio se ha transformado para el uso de a plantear ya habı́a sido planteado y se buscaron referencias
dispositivos móviles y el audio 3D es mayormente utilizado en para tener conocimiento de las bases para poder hacer un
la industria cinematográfica siendo ası́ un porcentaje pequeño experimento. Más adelante se decidieron que variables depen-
con respecto a las producciones musicales. Cuando se graba dientes e independientes tendrı́a el experimento.
una agrupación en bloque o en formato acústico, regeralmente
se utilizan tecnicas estereo que proporcionan buena imagen R EFERENCES
envolvente y espacialidad de los instrumentos pero son lim- [1] C. Preston, “Adaptations of Stereo Microphone Techniques for Surround
itadas. Esos problemas de espacialidad pueden solucionarse Sound,” AES 24th International Conference on Multichannel Audio, no.
con una tecnica de grabación binaural[18]. ASW o apparent Figure 1, pp. 1–6, 2003.
[2] M. Takanen, H. Wierstorf, V. Pulkki, and A. Raake, “Evaluation of sound
source with es un parametro subjetivo muy importante para field synthesis techniques with a binaural auditory model,” Proceedings
el espacio a la hora es escuchar una pieza musical en un of the AES International Conference, vol. 2014-January, pp. 1–8, 2014.
teatro de opera. Este es el grosor acústico percibido por el [3] A. Chesnokov and L. Soohoo, “Subjective and Objective Evaluation of
Listening Rooms Acoustics,” 1997.
oyente de una fuente de sonido. La percepción del ASW de [4] J. D. Johnston and M. Hill, “Presen t ed at the 101st Convention Los
una fuente con bajas frecuencias se ve reflejada en la función Angeles , California ˆ uD , o,” vol. 1504, 1996.
[5] C. J. Yoo, “Early reflections design for natural stereo sound listening,”
130th Audio Engineering Society Convention 2011, vol. 2, pp. 1205–
1210, 2011.
[6] M. Schroeder, “Acoustics in the Audio Engineering Society,” AES:
Journal of the Audio Engineering Society, vol. 46, no. 1-2, pp. 71–73,
1998.
[7] M. Kuster, “Combining methods for multichannel room impulse re-
sponse generation and objective and subjective performance evaluation,”
AES: Journal of the Audio Engineering Society, vol. 57, no. 7-8, pp.
512–520, 2009.
[8] K. Gilchrest, “Spatial Post-Processing of Hard Panned Music for Head-
phone Reproduction,” AES 140th Convention, 2016.
[9] B. Martin and R. King, “Three dimensional spatial techniques in 22.2
multi-channel surround sound for popular music mixing,” 139th Audio
Engineering Society International Convention, AES 2015, pp. 1–9, 2015.
[10] K. Sunder and W. Woszczyk, “Investigation of impulse response record-
ing techniques in binaural rendering of virtual acoustics,” 141st Audio
Engineering Society International Convention 2016, AES 2016, 2016.
[11] D. Romblom, R. King, and C. Guastavino, “A perceptual evaluation
of recording, rendering, and reproduction techniques for multichannel
spatial audio,” 135th Audio Engineering Society Convention 2013, pp.
493–502, 2013.
[12] F. Rumsey, “Spatial quality evaluation for reproduced sound: Terminol-
ogy, meaning, and a scene-based paradigm,” AES: Journal of the Audio
Engineering Society, vol. 50, no. 9, pp. 651–666, 2002.
[13] L. Riitano and J. M. Victoria, “Comparison between different
microphone-arrays for 3D-audio,” 144th Audio Engineering Society
Convention 2018, 2018.
[14] D. Nyberg and J. Berg, “Listener envelopment - What has been done
and what future research is needed?” Audio Engineering Society - 124th
Audio Engineering Society Convention 2008, vol. 2, pp. 637–642, 2008.
[15] J. Usher and W. Woszczyk, “Interaction of source and reverberance
spatial imagery in multichannel loudspeaker audio,” Audio Engineering
Society - 118th Convention Spring Preprints 2005, vol. 2, pp. 615–639,
2005.
[16] J. D. L. Johnston, “Perceptual Soundfield Reconstruction,” Audio Engi-
neering Society Convention 109, 2000.
[17] E. B. Brixen, “Convention Paper 5945 Environments,” pp. 1–6, 2003.
[18] J. J. S. B. Toro, “Evaluación Perceptual de una producción musical
aplicando grabación binaural,” Editorial Bonaventuriana, vol. 53, no. 9,
pp. 1689–1699, 2019.
[19] S.-i. Sato and Y. Ando, “Apparent source width (ASW) of complex
noises in relation to the interaural cross-correlation function,” Journal
of Temporal Design in Architecture and the Environment, vol. 2, no. 1,
pp. 29–32, 2002.
VIII. F IGURAS
Fig. 2. Mapa de variables utilizadas para el experimento.
Fig. 1. Encuesta previa a la investigación.