Procesos Digitales
Procesos Digitales
Diseño acústico
de espacios
arquitectónicos
00-Primeras páginas ok 7/6/99 11:11 Página 19
Prólogo
Para su elaboración me ha sido de gran utilidad el extenso material preparado con moti-
vo de la impartición, en 1.996, del curso de especialización titulado “Acondicionamiento
Acústico de Espacios Arquitectónicos”, dentro de los programas de formación continuada
organizados por la Fundación Politécnica de Cataluña.
En cuanto al contenido del libro, ha sido mi intención respetar al máximo los criterios
de aquellos expertos avalados por una dilatada trayectoria profesional y considerados interna-
cionalmente como autoridades en la materia, y tan sólo me he decidido a exponer aquellos sis-
temas originales propios que han sido merecedores de un reconocimiento público en cuanto a
su valor científico.
El libro está estructurado en siete capítulos y tres apéndices. De todos ellos, solamente
el capítulo 7 y el apéndice 2 están reservados a especialistas.
En el capítulo 1 se exponen los principios básicos relativos a la generación y propaga-
ción del sonido y se describe de forma simplificada el comportamiento del mismo tanto en
espacios abiertos como cerrados.
El capítulo 2 está dedicado a describir los materiales y elementos más comúnmente uti-
lizados en el acondicionamiento acústico de recintos, como son los absorbentes, los reflecto-
res y los difusores del sonido. En el apartado de absorbentes no se han incluido tablas exhaus-
tivas de coeficientes de absorción de materiales, pues se trata de una información que se halla
en la práctica totalidad de libros dedicados a acústica.
En los capítulos 3 a 6 se estudian los diferentes espacios tipo incluidos en el libro. En
cada uno de ellos se exponen los objetivos acústicos que se deben cumplir, se presenta un
20 conjunto de criterios genéricos de diseño y se dan ejemplos prácticos de diseño. El hecho de
que existan conceptos comunes a diferentes espacios tipo ha obligado a un cierto grado de
repetición a fin de que cada capítulo tenga la máxima independencia posible respecto al
resto.
El capítulo 3 está destinado a los espacios de uso comunitario, de uso deportivo y a las
salas de conferencias/aulas. Éste es el único capítulo donde se trata la temática de los siste-
mas de megafonía, aunque de forma muy resumida. Los capítulos 4 y 5 están dedicados, res-
pectivamente, al estudio de teatros y salas de conciertos, por tratarse de espacios de mayor
complejidad y por ser representativos de espacios destinados a la palabra y a la música. En el
capítulo 6 se trata de la acústica variable aplicada a espacios multifuncionales.
Finalmente, en el capítulo 7 se expone la metodología necesaria para establecer la diag-
nosis acústica de un recinto, se presenta un programa de simulación acústica y se describen
algunos de los sistemas actuales de creación de sonido virtual. Asimismo, se presentan dos
ejemplos prácticos de diagnosis acústica de recintos.
Por lo que a los apéndices se refiere, el apéndice 1 está destinado al diseño de difuso-
res unidimensionales de residuo cuadrático, como ampliación de lo expuesto en el capítulo 2
sobre difusores del sonido. En el apéndice 2 se incluye toda la formulación matemática de los
parámetros definidos en los diferentes capítulos. En el apéndice 3 se presenta una tabla con
información relativa a 66 salas de conciertos de prestigio internacional, extraída del libro de
L. Beranek titulado Concert & Opera Halls: How They Sound, publicado en 1.996.
En cuanto a la bibliografía, he optado por dar exclusivamente una bibliografía básica, y
por tanto muy limitada, partiendo de la base de que el lector puede hallar una bibliografía
mucho más extensa simplemente consultando los libros referidos.
π PRÓLOGO
Espero que este libro sirva para aumentar el grado de sensibilización hacia la acústica,
a la vez que sea útil para concienciar a los diferentes colectivos sobre la importancia y tras-
cendencia que el diseño acústico tiene en la calidad final de una sala. Sólo así será posible que
la acústica adquiera el protagonismo que se merece en el contexto de un proyecto de obra civil
ya desde sus primeras etapas de gestación.
Antoni Carrión
Junio de 1998
21
Introducción
pal ingrediente era la suerte: suerte en la definición de las formas y suerte en la elección de
los materiales constructivos.
A pesar del desconocimiento reinante, es bien cierto que ya los primeros compositores
escribían su música pensando en el recinto donde había de ser interpretada, e incluso la ade-
cuaban para que el resultado final fuese óptimo. Es el caso, por ejemplo, de la Pasión según
San Mateo, de J.S. Bach, escrita especialmente para la Thomaskirche, de Leipzig, donde él
había sido cantor. Así las cosas, cabría preguntarse hasta qué punto también los arquitectos
diseñaban conscientemente sus edificios de acuerdo con las necesidades específicas acústico-
musicales, con objeto de lograr una perfecta conjunción entre forma y función. La evolución
de la arquitectura de las iglesias protestantes constituye un buen ejemplo del efecto de las exi-
gencias acústicas sobre el volumen de la sala. Cuando el sermón se convirtió en un elemento
primordial del servicio, el volumen de las iglesias de nueva construcción fue reducido, obte-
niéndose así una mejor comprensión de la palabra como consecuencia de la disminución de
la reverberación.
A finales del siglo XIX, y concretamente en 1.877, el físico inglés lord Rayleigh publi-
có un tratado con el título de Theory of Sound, que contenía los fundamentos teóricos de esta
ciencia y que aún hoy en día sirve de referencia. Con todo, las explicaciones allí vertidas sobre
acústica de salas se limitaban a generalidades del siguiente tipo:
“En relación con la acústica de edificios públicos, hay varios puntos que permanecen
oscuros. ... A fin de evitar la reverberación, a menudo se hace necesario colocar moquetas o
cortinas para absorber el sonido. En algunos casos, la presencia de la audiencia es ya sufi-
24 ciente para conseguir el efecto deseado.”
No es, pues, de extrañar que los arquitectos de la época se mostrasen abiertamente que-
josos por la falta de criterios claros a los que recurrir a la hora de definir las formas de una
sala para obtener una acústica óptima. Éste es el caso de Charles Garnier, arquitecto de la
Ópera de París, que en 1.880 hacía las siguientes manifestaciones:
“Es lamentable que la acústica y yo nunca hayamos llegado a entendernos. Me produ-
ce gran dolor no dominar esta extraña ciencia, pero después de una labor de quince años, ape-
nas he progresado en relación al primer día. ... He leído libros y he hablado con expertos; en
ninguna parte he encontrado una luz que me guíe; al contrario, únicamente afirmaciones con-
trapuestas.”
No deja de ser curioso que en una época caracterizada por descubrimientos revolucio-
narios en campos como el de la física atómica, el progreso de la acústica, que pretende expli-
car un fenómeno tan cotidiano como es el comportamiento del sonido en un recinto, fuese tan
lento. Con toda seguridad, el motivo principal de tal paradójica situación no era otro que la
falta de equipamiento electrónico con el que poder hacer mediciones objetivas. En efecto, el
único sistema del que se disponía era el oído humano, pero su rápida adaptación a cualquier
tipo de recinto con independencia de su comportamiento acústico imposibilitaba su empleo
como instrumento de medida.
Los ruegos de Garnier y otros prestigiosos arquitectos fueron atendidos al otro lado del
Atlántico cuando, en 1.895, Wallace Clement Sabine empezó su trabajo pionero encaminado
a la aplicación de la acústica en la arquitectura.
W.C. Sabine, profesor asociado del departamento de Física de la Universidad de Har-
vard, se había dedicado inicialmente a los campos de la óptica y la electricidad. Su cambio de
π INTRODUCCIÓN
26
1
Principios básicos del sonido
El sonido se puede definir de formas muy diversas. De todas ellas, las más habituales son las
siguientes:
El elemento generador del sonido se denomina fuente sonora (tambor, cuerda de un violín,
cuerdas vocales, etc.). La generación del sonido tiene lugar cuando dicha fuente entra en
vibración. Dicha vibración es transmitida a las partículas de aire adyacentes a la misma que,
a su vez, la transmiten a nuevas partículas contiguas.
Las partículas no se desplazan con la perturbación, sino que simplemente oscilan alre-
dedor de su posición de equilibrio. La manera en que la perturbación se traslada de un lugar
a otro se denomina propagación de la onda sonora.
Si se considera como fuente sonora, por ejemplo, un tambor, un golpe sobre su mem-
brana provoca una oscilación. Cuando la membrana se desplaza hacia fuera, las partículas de
aire próximas a su superficie se acumulan creándose una zona de compresión, mientras que
en el caso contrario, dichas partículas se separan, lo cual da lugar a una zona de enrareci-
miento o dilatación (figura 1.1).
La oscilación de las partículas tiene lugar en la misma dirección que la de propagación
de la onda. En este caso se habla de ondas sonoras longitudinales, en contraposición a las
Fig. 1.1 Zonas de compresión y dilatación de las partículas de aire en la propagación de una onda sonora
El número de oscilaciones por segundo de la presión sonora p se denomina frecuencia (f) del
sonido y se mide en hertzios (Hz) o ciclos por segundo (c/s).
Lógicamente, la frecuencia del sonido coincide con la frecuencia de la vibración mecá-
nica que lo ha generado (en el ejemplo anterior, la frecuencia de oscilación de la membrana
del tambor).
0 0
Tiempo (s) Tiempo (s)
-P -P
1s 1s
La gran mayoría de los sonidos que percibimos no constan únicamente de una sola frecuen-
cia, sino que están constituidos por múltiples frecuencias superpuestas. Incluso cada uno de
los sonidos generados por un instrumento musical están formados por más de una frecuencia. 29
Se puede conocer qué frecuencias componen un sonido observando el denominado espec-
tro frecuencial (o simplemente espectro) del mismo, entendiendo por tal la representación grá-
fica de las frecuencias que lo integran junto con su correspondiente nivel de presión sonora.
Es el tipo más simple de sonido existente en la naturaleza. Se compone de una única frecuen-
cia (f0) constante, por lo que su espectro está constituido por una sola raya (figura 1.4). El
sonido producido por un diapasón es de este tipo.
Tiempo (s)
f0 Frecuencia (Hz)
Sonido caracterizado por una frecuencia origen, denominada fundamental o primer armónico,
y un conjunto finito (y a veces infinito) de frecuencias múltiplos de ésta, denominados armó-
nicos. Por regla general, la frecuencia fundamental es la que lleva asociada más potencia sono-
ra. La mayoría de instrumentos musicales producen este tipo de sonidos.
En la figura 1.5 se representa un sonido de este tipo formado por una frecuencia fun-
30 damental o primer armónico (f0) y su tercer armónico (3f0).
Presión sonora p
Tiempo (s)
Sonido resultante de la brusca liberación de energía bajo la forma, por ejemplo, de explosio-
nes o impactos. Es de aparición repentina y tiene una duración breve. A diferencia de los soni-
dos periódicos comentados anteriormente, contiene un gran número de componentes frecuen-
ciales que no guardan una relación armónica entre sí, sino que forman un espectro continuo.
Una palmada constituye un ejemplo de este tipo de sonidos.
En la figura 1.6 se representa un sonido transitorio denominado pulso rectangular, así
como su espectro frecuencial.
Tiempo (s)
Frecuencia (Hz)
Las notas inferior y superior de un piano de 88 teclas tienen unas frecuencias fundamentales
de 27,5 Hz y 4.400 Hz, respectivamente. La primera corresponde a un sonido muy grave,
mientras que la segunda va asociada a uno muy agudo. Por consiguiente, un sonido grave está
caracterizado por una frecuencia baja, en tanto que uno agudo lo está por una frecuencia alta.
El conjunto de frecuencias situado entre ambos extremos se denomina banda o margen de fre-
cuencias del piano. Dicha definición es válida para cualquier fuente sonora.
En la figura 1.8 se muestran las bandas de frecuencias asociadas a diversos instrumen-
tos musicales y a la voz humana.
VIENTO-MADERA
Pícolo
Flauta
Oboe
Clarinete
VIENTO-METAL
Trompeta
Trompa
Trombón
32 Tuba
CUERDA
Violín
Viola
Violoncelo
Contrabajo
Guitarra
TECLADO
Piano
Órgano
PERCUSIÓN
Celeste
Xilófono
16 31,5 63 125 250 500 1.000 2.000 4.000 8.000 16.000 Frecuencia (Hz)
La velocidad de propagación del sonido (c) es función de la elasticidad y densidad del medio
de propagación. Debido a que, en el aire, ambas magnitudes dependen de la presión atmosfé-
Una vez definidos los conceptos fundamentales de frecuencia y velocidad de propagación del
sonido, es preciso definir otro concepto básico que guarda una estrecha relación con ambos:
la longitud de onda del sonido (λ).
Se define como la distancia entre dos puntos consecutivos del campo sonoro que se
hallan en el mismo estado de vibración en cualquier instante de tiempo. Por ejemplo, si en un
instante dado se seleccionan dos puntos consecutivos del espacio donde los valores de presión
son máximos, la longitud de onda es precisamente la distancia entre ambos puntos (figura 1.9).
33
Presión sonora total PT
P 0+ P
P0
Distancia (m)
P 0- P
La relación entre las tres magnitudes: frecuencia (f), velocidad de propagación (c) y
longitud de onda (λ), viene dada por la siguiente expresión:
λ = c/f
Según se observa, para cada frecuencia, la longitud de onda depende del medio de pro-
pagación, ya que es proporcional a la velocidad, y ésta varía para cada medio.
Por otro lado, se puede ver que la longitud de onda y la frecuencia son inversamente
proporcionales, es decir, cuanto mayor es f menor es λ, y viceversa.
Por ejemplo, en el aire, las longitudes de onda correspondientes a la banda de frecuen-
cias audibles se hallan situadas entre 17,25 m (f = 20 Hz) y 1,72 cm (f = 20 kHz).
Frecuencia f (Hz)
Fig. 1.10 Relación entre longitud de onda (λ) y frecuencia (f) en el aire
34 Según se ha mencionado en el apartado 1.2, la presión sonora constituye la manera más habi-
tual de expresar la magnitud de un campo sonoro. La unidad de medida es el Newton/metro2
(N/m2) o Pascal (Pa).
En principio, el valor a considerar es la diferencia entre el valor fluctuante de la presión
sonora total PT y su valor de equilibrio P0. Debido a la variación de dicha magnitud con el
tiempo, se utiliza como valor representativo su promedio temporal, que recibe el nombre de
valor eficaz o r.m.s. (“root-mean-square”).
Ahora bien, la utilización de dicho valor eficaz da lugar a una serie de problemas cuyo
origen se halla en el comportamiento del oído humano y que a continuación se exponen:
➤ La gama de presiones a las que responde el oído, desde el valor umbral de audición
hasta el que causa dolor, es extraordinariamente amplia. En concreto, la presión eficaz
sonora más débil que puede ser detectada por una persona, a la frecuencia de 1 kHz, es
de 2 x 10-5 Pa, mientras que el umbral de dolor tiene lugar para una presión eficaz del
orden de 100 Pa (milésima parte de la presión atmosférica estática P0 ≈ 105 Pa, equiva-
lente a 1 atmósfera). En consecuencia, la escala de presiones audibles cubre una gama
dinámica de, aproximadamente, 1 a 5.000.000. Es obvio, pues, que la aplicación direc-
ta de una escala lineal conduciría al uso de números inmanejables.
➤ Nuestro sistema auditivo no responde linealmente a los estímulos que recibe, sino que
más bien lo hace de forma logarítmica. Por ejemplo, si la presión de un tono puro de 1
kHz se dobla, la sonoridad, o sensación subjetiva producida por el mismo, no llegará a
ser el doble. De hecho, para obtener una sonoridad doble, es necesario multiplicar la
presión sonora por un factor de 3,16.
Por los dos motivos expuestos, resulta razonable y conveniente hacer uso de una esca-
la logarítmica para representar la presión sonora. Dicha escala se expresa en valores relativos
a un valor de referencia. Se trata de la presión eficaz correspondiente al umbral de audición,
a 1 kHz (2 x 10-5 Pa). En tal caso, se habla de nivel de presión sonora SPL o Lp. La unidad uti-
lizada es el decibelio (dB). En el apéndice 2 se da la correspondiente expresión matemática.
La utilización del umbral de audición como referencia tiene como objetivo que todos
los sonidos audibles sean representados por valores SPL positivos.
El uso de dB reduce la dinámica de presiones sonoras de 1:5 x 106 a niveles de presión
sonora de 0 a 135 dB, donde 0 dB representa una presión igual al umbral de audición (no sig-
nifica, por tanto, ausencia de sonido) y 135 dB el umbral aproximado de dolor. De esta mane-
ra, las cifras manejadas son mucho más simples y, además, se dan las siguientes relaciones
entre cambios de nivel sonoro y su efecto subjetivo:
En la tabla 1.1 se muestran los niveles de presión sonora correspondientes a una serie
de sonidos y ruidos típicos, junto con la valoración subjetiva asociada.
35
FUENTE SONORA NIVEL DE PRESIÓN SONORA SPL (dB) VALORACIÓN SUBJETIVA DEL NIVEL
Tabla 1.1 Niveles de presión sonora correspondientes a sonidos y ruidos típicos, y valoración subjetiva asociada
90
70
60
50
Baja Normal Alta Muy alta Grito
Intensidad de la voz
Como se ha comentado en el apartado 1.6, la banda de frecuencias audibles para una persona
joven con una audición normal, va desde 20 Hz (sonidos más graves) hasta 20.000 Hz ó 20
36 kHz (sonidos más agudos).
Ahora bien, el oído humano no tiene la misma sensibilidad para todo este margen de
frecuencias. En la figura 1.12 se observa la variación de los umbrales de audición y de dolor
en función de la frecuencia.
140
Umbral de dolor
Nivel de presión sonora SPL (dB)
120
100
80
60
40
20
Umbral de audición
0
Frecuencia (Hz)
140
Umbral de dolor
120
Nivel de presión sonora SPL (dB)
100
Música
80
60
Palabra
40
20
Umbral de audición
0
Frecuencia (Hz)
Fig. 1.13 Niveles audibles en función de la frecuencia junto
con las zonas correspondientes a la música y a la palabra
Cuando el oído está expuesto a dos o más tonos puros de frecuencias diferentes, existe la posi-
bilidad de que uno de ellos enmascare los demás y, por tanto, evite su percepción de forma
parcial o total. Del mismo modo, es evidente la dificultad que entraña entender una conver-
sación en presencia de ruido.
El fenómeno del enmascaramiento se explica de una manera simplificada consideran-
do la forma en que la denominada membrana basilar es excitada por tonos puros de diferente
frecuencia. La membrana basilar se extiende a lo largo de la cóclea (conducto en forma de
caracol de sección prácticamente circular alojado en el interior del oído interno), desde la lla-
mada ventana oval (zona de separación entre el oído medio y el oído interno) hasta el extre-
mo superior de aquélla.
En la figura 1.14 se muestra la amplitud relativa del desplazamiento de la membrama
basilar en función de la distancia a la ventana oval, para cuatro tonos de frecuencia diferente.
1600
1.600 Hz 400
400 Hz 200
200 Hz 50HzHz
50
Amplitud relativa
38
0
0 10 20
20 30
30 40
40
Distancia a la ventana oval (mm)
Fig. 1.14 Amplitud relativa del desplazamiento de la membrana basilar para diferentes tonos puros
d) La frecuencia y el nivel del tono A son superiores a las del tono B → el enmascara-
miento producido es mínimo
Alta frecuencia Baja frecuencia
A B
(a)
Ventana Oval
A B
(b)
B
A
(c)
A
B
(d)
Debido a la complejidad del funcionamiento del oído humano, hasta el momento actual no 39
ha sido posible diseñar un aparato de medida objetiva del sonido que sea capaz de dar unos
resultados del todo equivalentes, para cualquier tipo de sonido, a las valoraciones subjetivas
asociadas al mismo. Sin embargo, resulta evidente la necesidad de disponer de un instru-
mento electrónico que permita medir sonidos bajo unas condiciones rigurosamente prefija-
das, de manera que los resultados obtenidos sean siempre objetivos y repetitivos, dentro de
unos márgenes de tolerancia conocidos. Dicho aparato recibe el nombre de sonómetro (f igu-
ra 1.16).
La medida del nivel de presión sonora SPL o Lp utilizando dicha escala significa que no se
aplica ningún tipo de acentuación ni atenuación a ninguna de las frecuencias integrantes del
sonido objeto de análisis.
10
-10
-20
-30
-40
-50
-60
-70
10 100 1.000 10.000
Frecuencia (Hz)
Los niveles de presión sonora medidos con la red de ponderación A se representan con
las letras LA y se expresan en dBA o dB(A).
Tabla 1.2 Frecuencias centrales de las bandas de octava estandarizadas según la norma ISO 266, en Hz
41
Por otra parte, las 6 bandas de octava cuyas frecuencias centrales están comprendidas
entre 125 Hz y 4.000 Hz son las que generalmente se consideran tanto en la fase de diseño
acústico como en la de diagnosis acústica de recintos, según se verá a lo largo de los próxi-
mos capítulos.
El sonómetro integrador realiza medidas del nivel de presión sonora obtenido como resultado
de promediar linealmente la presión sonora cuadrática instantánea a lo largo del tiempo de
medida. Dicha medida se denomina nivel continuo equivalente de presión sonora y se desig-
na por Leq.
Este tipo de sonómetro representa la alternativa actual al sonómetro convencional, ya
que permite disponer de tiempos de promediado más largos, pudiendo llegar a muchos minu-
tos o, incluso, horas.
Habitualmente, las medidas se realizan utilizando la red de ponderación A, en cuyo caso
la designación correcta sería LAeq. Ahora bien, como la ponderación A está totalmente gene-
ralizada, la representación mediante las letras Leq supone implícitamente el uso de la ponde-
ración A, a menos que se indique expresamente lo contrario.
El nivel Leq se utiliza como criterio de valoración del ruido ocupacional, de acuerdo con
la norma ISO 1999.
La evaluación objetiva del grado de molestia que un determinado ruido ambiental provoca en
un oyente se realiza por comparación de los niveles de ruido existentes en un recinto, en cada
banda de octava comprendida entre 63 Hz y 8 kHz, con un conjunto de curvas de referencia
denominadas NC (“Noise Criteria”).
Las curvas NC son, además, utilizadas de forma generalizada para establecer los nive-
les de ruido máximos recomendables para diferentes tipos de recintos en función de su apli-
cación (oficinas, salas de conferencias, teatros, salas de conciertos, etc.).
Se dice que un recinto cumple una determinada especificación NC (por ejemplo: NC-
20) cuando los niveles de ruido de fondo, medidos en cada una de dichas bandas de octava,
están por debajo de la curva NC correspondiente (figura 1.18).
Nivel de presión sonora SPL (dB)
100
90
80
NC 70
70
60 NC 60
50 NC 50
40 NC 40
30 NC 30
20 NC 20
42 10 NC 15
0
63 125 250 500 1.000 2.000 4.000 8.000
Frecuencia (Hz)
Estudios de grabación 15 28
Salas de conciertos y teatros 15-25 28-38
Hoteles (habitaciones individuales) 20-30 33-42
Salas de conferencias / Aulas 20-30 33-42
Despachos de oficinas / Bibliotecas 30-35 42-46
Hoteles (vestíbulos y pasillos) 35-40 46-50
Restaurantes 35-40 46-50
Salas de ordenadores 35-45 46-55
Cafeterías 40-45 50-55
Polideportivos 40-50 50-60
Talleres (maquinaria ligera) 45-55 55-65
Talleres (maquinaria pesada) 50-65 60-75
Tabla 1.3 Curvas NC recomendadas y niveles de ruido de fondo equivalentes (en dBA)
Finalmente, cabe mencionar que existen otros criterios de evaluación del ruido de
fondo, como las curvas PNC (“Preferred Noise Criteria”) y las NR (“Noise Rating”), de fun-
cionamiento operativo análogo a las curvas NC.
43
1.13 El sistema de fonación humana
Los órganos que forman parte del sistema de fonación humana y que constituyen el denomi-
nado tracto vocal son: los pulmones, la laringe, la faringe, la cavidad nasal y la cavidad bucal
(figura 1.19).
Cavidad Cavidad
nasal nasal
Salida
Faringe nasal
Faringe Cavidad
bucal Laringe Salida
bucal
Cuerdas
Cuerdas Cavidad
vocales
Laringe vocales bucal
Tráquea
Tráquea
Volumen
pulmonar
Contracción muscular
El flujo de aire impulsado por los pulmones pasa por la laringe. En ella se encuentran
situadas las cuerdas vocales. Dicho aire provoca un movimiento rápido de abertura y cierre de
las mismas (vibración), produciéndose una modulación del mencionado flujo (figura 1.20).
generan sin vibración alguna de las cuerdas vocales, simplemente mediante una constricción
del flujo de aire que atraviesa la cavidad bucal. A este grupo pertenecen la mayoría de conso-
nantes (/s/, /f/, /p/, /t/, /k/, etc.).
Cuando una persona emite un mensaje, emplea un tiempo mayor en la emisión de las vocales
que en la de las consonantes. Es por ello que las vocales constituyen el llamado régimen per-
manente del habla, mientras que las consonantes se asocian al régimen transitorio.
La duración en promedio de una vocal es del orden de 90 ms, reduciéndose a 20 ms en
el caso de una consonante.
El hecho de que la duración de las vocales sea más elevada hace que el nivel de presión
sonora asociado a las mismas sea, en promedio, del orden de 12 dB mayor que el correspon-
diente a las consonantes. Por otra parte, su contenido frecuencial es más rico en bajas fre-
cuencias, mientras que las consonantes presentan una mayor contribución de altas frecuencias.
Por otro lado, el grado de inteligibilidad de la palabra está estrechamente relacionado
con la correcta percepción de las altas frecuencias. En consecuencia, son las consonantes las
que determinan la comprensión del mensaje oral. En cambio, la información contenida en las
vocales es redundante. En la tabla 1.4 se resumen las características mencionadas.
DURACIÓN CONTENIDO NIVEL CONTRIBUCIÓN
(PROMEDIO) FRECUENCIAL (PROMEDIO) A LA INTELIGIBILIDAD
DOMINANTE DE LA PALABRA 45
VOCALES ≈ 90 ms bajas frecuencias nivel vocales ≈ baja
nivel consonantes +
CONSONANTES ≈ 20 ms altas frecuencias 12 dB alta
En general, cualquier fuente sonora radia más potencia en unas direcciones que en otras y, por
tanto, presenta una cierta directividad. Dicha directividad depende de la frecuencia y aumen-
ta con la misma.
La manera de expresar la directividad de una fuente sonora en un punto cualquiera del
espacio es mediante el denominado factor de directividad Q. El factor Q depende de la rela-
ción entre el nivel de presión sonora producido por dicha fuente en la dirección considerada
y el nivel que se obtendría si la fuente no fuese directiva. Cuanto mayor sea el nivel de pre-
sión sonora en una dirección determinada, mayor será el valor de Q en dicha dirección.
80
70
Voz muy alta
60
Voz alta
50
Voz normal
40
Voz baja
30
125 250 500 1.000 2.000 4.000 8.000
Frecuencia (Hz)
0 dB
-5 dB
-10 dB
-15 dB
4 kHz
2 kHz
1 kHz
500 Hz
500 Hz
Detrás del locutor
E l S o l De C ad aA u ro ra
Delante del locutor
4 kHz
Cuando una fuente sonora situada en un recinto cerrado es activada, genera una onda sonora
que se propaga en todas las direcciones. Un oyente ubicado en un punto cualquiera del mismo
recibe dos tipos de sonido: el denominado sonido directo, es decir, aquél que le llega directa-
mente desde la fuente sin ningún tipo de interferencia, y el sonido indirecto o reflejado origi-
nado como consecuencia de las diferentes reflexiones que sufre la onda sonora al incidir sobre
las superficies límite del recinto.
Mientras que las características del sonido reflejado serán objeto de estudio en el apar-
tado 1.15, a continuación se exponen una serie de conceptos asociados al sonido directo, que
es el único que llegaría a dicho oyente si estuviese situado en el espacio libre.
En primer lugar, se considera una fuente sonora omnidireccional, es decir, una fuente
que radia energía de manera uniforme en todas las direcciones (factor de directividad Q=1).
El hecho de que la radiación sea uniforme implica que, a una distancia cualquiera de la
fuente, el nivel de presión sonora SPL será siempre el mismo, con independencia de la direc-
ción de propagación considerada. Es la llamada propagación esférica.
A medida que uno se aleja de la fuente, la energía sonora se reparte sobre una esfera
cada vez mayor, por lo que el nivel SPL en cada punto va disminuyendo progresivamente. En
concreto, la disminución del mismo es de 6 dB cada vez que se dobla la distancia a la fuente.
Es la denominada ley cuadrática inversa y significa que el valor de la presión sonora se redu-
ce a la mitad. En la figura 1.26 se muestra la mencionada disminución del nivel SPL con la
distancia en el caso de que la fuente sonora sea un avión.
25 m
50 m
120 dB
100 m
114 dB
108 dB 200 m
48
102 dB
Para que una fuente sonora radie de forma omnidireccional es necesario que sus dimen-
siones sean pequeñas respecto a la longitud de onda del sonido emitido y que el receptor esté
alejado de la misma.
Si bien existe toda una variedad de fuentes sonoras omnidireccionales, también es cier-
to que el cumplimiento simultáneo de ambos requisitos es difícil, sobre todo si la banda de
frecuencias considerada es amplia. Es el caso de la voz humana que, como se ha visto en el
apartado anterior, constituye un claro ejemplo de fuente directiva.
En la figura 1.27 se representa el mapa de niveles SPL producidos por un orador situa-
do en el espacio libre, en la banda de 2 kHz, en función de la distancia y del ángulo referido
a su eje frontal. Se puede observar la disminución del nivel con la distancia, así como el efec-
to de directividad de la voz humana, evidenciado por la reducción del nivel a medida que
aumenta dicho ángulo.
A través de la realización de una serie de experimentos, se ha podido averiguar que un
mensaje oral emitido en una zona silenciosa (en ausencia de fenómenos atmosféricos ruido-
sos) puede ser oído de forma satisfactoria a una distancia máxima de 42 m en la dirección
frontal del orador, de 30 m lateralmente y de 17 m en la dirección posterior. A distancias supe-
riores, el mensaje deja de ser inteligible debido a que queda inmerso en el ruido de fondo exis-
tente, independientemente del lugar elegido para llevar a cabo la experiencia.
Fig. 1.27 Niveles de presión sonora producidos por un orador en el espacio libre, banda de 2 kHz
Según se acaba de comentar, la energía radiada por una fuente sonora en un recinto cerrado
llega a un oyente ubicado en un punto cualquiera del mismo de dos formas diferentes: una
parte de la energía llega de forma directa (sonido directo), es decir, como si fuente y receptor
estuviesen en el espacio libre, mientras que la otra parte lo hace de forma indirecta (sonido
reflejado), al ir asociada a las sucesivas reflexiones que sufre la onda sonora cuando incide 49
sobre las diferentes superficies del recinto.
En un punto cualquiera del recinto, la energía correspondiente al sonido directo depen-
de exclusivamente de la distancia a la fuente sonora, mientras que la energía asociada a cada
reflexión depende del camino recorrido por el rayo sonoro, así como del grado de absorción
acústica de los materiales utilizados como revestimientos de las superficies implicadas. Lógi-
camente, cuanto mayor sea la distancia recorrida y más absorbentes sean los materiales emple-
ados, menor será la energía asociada tanto al sonido directo como a las sucesivas reflexiones.
Al analizar la evolución temporal del sonido reflejado en un punto cualquiera del recinto obje-
to de estudio, se observan básicamente dos zonas de características notablemente diferencia-
das: una primera zona que engloba todas aquellas reflexiones que llegan inmediatamente des-
pués del sonido directo, y que reciben el nombre de primeras reflexiones o reflexiones
tempranas (“early reflections”), y una segunda formada por reflexiones tardías que constitu-
yen la denominada cola reverberante.
Si bien la llegada de reflexiones al punto en cuestión se produce de forma continua, y
por tanto sin cambios bruscos, también es cierto que las primeras reflexiones llegan de forma
más discretizada que las tardías, debido a que se trata de reflexiones de orden bajo (habitual-
mente, orden ≤ 3). Se dice que una reflexión es de orden “n” cuando el rayo sonoro asociado
ha incidido “n” veces sobre las diferentes superficies del recinto antes de llegar al receptor.
Desde un punto de vista práctico, se suele establecer un límite temporal para la zona de
primeras reflexiones de aproximadamente 100 ms desde la llegada del sonido directo, aunque
dicho valor varía en cada caso concreto en función de la forma y del volumen del recinto.
La representación gráfica temporal de la llegada de las diversas reflexiones, acompa-
ñadas de su nivel energético correspondiente, se denomina ecograma o reflectograma. En la
figura 1.28 se representa de forma esquemática la llegada de los diferentes rayos sonoros a un
receptor junto con el ecograma asociado, con indicación del sonido directo, la zona de pri-
meras reflexiones y la zona de reflexiones tardías (cola reverberante).
Fuente
sonora
Receptor
Nivel de presión sonora (dB)
50
Tiempo (ms)
100 ms
60
50
40
Amplitud (dB)
30
20
10
-10
-20
0 125 250 375 500 625 750 875 1.000
Tiempo (ms)
En general, las primeras reflexiones presentan un nivel energético mayor que las correspon-
dientes a la cola reverberante, ya que son de orden más bajo (según se ha comentado en el
apartado anterior, se suelen considerar primeras reflexiones hasta un orden 3).
Además, por el hecho de depender directamente de las formas geométricas de la sala, 51
son específicas de cada punto y, por tanto, determinan las características acústicas propias del
mismo, juntamente con el sonido directo (figura 1.30).
o )
ch
(te
ión
lex
f
Re
Reflexió d)
n ( esc are
enario)
ió n (p
flex
Re
Fig. 1.30 Ejemplo de llegada del sonido directo y de las primeras reflexiones a un receptor
i
= ángulo de incidencia
mente veraz. r
= ángulo de reflexión
Para que en la práctica se produzca una reflexión
marcadamente especular es necesario que se cumplan los Fig. 1.31 Reflexión especular del
siguientes requisitos, por lo que a la superficie de refle- sonido sobre una superficie
xión se refiere:
52 En el caso de que las dimensiones sean menores o similares a la longitud de onda del
sonido, la onda sonora rodea la superficie y sigue propagándose como si el obstáculo que
representa la misma no existiese. Dicho fenómeno se conoce con el nombre de difracción
(apartado 2.3.1).
Por otra parte, si la superficie presenta irregularidades de dimensiones comparables con
la longitud de onda, se produce una reflexión de la onda incidente en múltiples direcciones.
Dicho fenómeno se conoce con el nombre de difusión del sonido (apartado 2.4).
En este punto conviene destacar el hecho de que existen programas informáticos avan-
zados de simulación acústica que permiten el análisis teniendo en cuenta tanto el fenómeno
de la difracción como el de la difusión del sonido. Obviamente, los resultados obtenidos con
dichos programas se aproximan más a los obtenidos mediante mediciones reales efectuadas
“in situ” que en el caso de utilizar programas de simulación más simples.
Por otro lado, como se ha comentado anteriormente, la cola reverberante está formada
por las reflexiones tardías (por regla general, se consideran las reflexiones de orden superior
a 3). Debido a que la densidad temporal de reflexiones en un punto cualquiera de un recinto
cerrado aumenta de forma cuadrática con el tiempo, existe una gran concentración de dichas
reflexiones en cualquier punto de recepción y, además, sus características son prácticamente
iguales con independencia del punto considerado. Es por ello que el estudio de la cola rever-
berante se efectúa siempre mediante criterios basados en la denominada acústica estadística,
en lugar de la acústica geométrica, según se verá en el apartado 1.15.7.
A título de ejemplo, en un auditorio de tamaño medio un oyente recibe alrededor de
8.000 reflexiones en el primer segundo después de la llegada del sonido directo. De todas for-
mas, debido a que el oído humano es incapaz de discriminar la llegada discreta de todas y cada
una de las reflexiones, lo que generalmente se percibe es un sonido continuo. Sólo en deter-
minados casos es posible percibir individualmente una o varias reflexiones. Para ello es nece-
sario que su nivel y retardo respecto al sonido directo sean significativos, como se verá a con-
tinuación.
Todas aquellas reflexiones que llegan a un oyente dentro de los primeros 50 ms desde la lle-
gada del sonido directo son integradas por el oído humano y, en consecuencia, su percepción
no es diferenciada respecto al sonido directo.
Cuando el sonido emitido es un mensaje oral, tales reflexiones contribuyen a mejorar
la inteligibilidad o comprensión del mensaje y, al mismo tiempo, producen un aumento de
sonoridad (o sensación de amplitud del sonido).
Por el contrario, la aparición en un punto de escucha de una reflexión de nivel elevado
con un retardo superior a los 50 ms es totalmente contraproducente para la obtención de una
buena inteligibilidad de la palabra, ya que es percibida como una repetición del sonido direc-
to (suceso discreto). En tal caso, dicha reflexión se denomina eco. El retardo de 50 ms equi-
vale a una diferencia de caminos entre el sonido directo y la reflexión de, aproximadamente,
17 m.
En la figura 1.32 se representa gráficamente dicho efecto.
53
Fig. 1.32 Superposición de sonidos con diferentes retardos e impresión subjetiva asociada
De forma más precisa, en la figura 1.33 se muestran las cuatro zonas características por
lo que a relación entre sonido retardado e inteligibilidad de la palabra se refiere. En el eje de
abscisas se indica el retardo temporal entre la reflexión (sonido retardado) y el sonido direc-
to, mientras que en el eje de ordenadas aparece la diferencia de niveles entre ambos sonidos.
La curva de separación entre las cuatro zonas es sólo aproximada.
-4
-8
A
-12
-16
C
-20
10 30 50 70 90
Fig. 1.33 Relación entre sonido retardado e inteligibilidad de la palabra (zonas características)
a) Zona A
La reflexión llega antes de los 50 ms: el oído integra la reflexión y se produce un aumento de
inteligibilidad y de sonoridad.
En la figura 1.34 se representa una curva de decaimiento energético ETC donde se
observa la existencia de una reflexión perteneciente a dicha zona A.
54
70
60
50
Amplitud (dB)
40
30
20
10
0
50 60 70 80 90 100 110 120
Tiempo (ms)
Sonido directo
Reflexión (retardo relativo de 17 ms)
Fig. 1.34 Curva energía-tiempo ETC mostrando la llegada del sonido directo
y de una reflexión significativa beneficiosa para la inteligibilidad
b) Zona B
La reflexión llega antes de los 50 ms, si bien con un nivel relativo más elevado: el oído integra
la reflexión, pero se produce un desplazamiento de la localización de la fuente sonora, genera-
dora del sonido directo, hacia la superficie generadora de la reflexión (“image shift”).
60
50
Amplitud (dB)
40
30
20
10
0
60 70 80 90 100 110 120 130
Tiempo (ms)
Sonido directo
Reflexión (retardo relativo de 18 ms)
Fig. 1.35 Curva energía-tiempo ETC mostrando la llegada del sonido directo y de una reflexión
significativa causante de una falsa localización de la fuente sonora
c) Zona C
d) Zona D
La reflexión llega después de los 50 ms, si bien con un nivel relativo más elevado: la reflexión
es percibida como un eco y se produce una pérdida de inteligibilidad.
En la figura 1.36 se representa una curva de decaimiento energético ETC donde apare-
ce una reflexión perteneciente a dicha zona D.
70
60
50
Amplitud (dB)
40
30
20
10
0
40 50 60 70 80 90 100 110 120 130
Tiempo (ms)
El eco flotante (“flutter echo”) consiste en una repetición múltiple, en un breve intervalo de
tiempo, de un sonido generado por una fuente sonora, y aparece cuando ésta se sitúa entre dos
superficies paralelas, lisas y muy reflectantes (figuras 1.37 y 1.38).
80
70
60
Amplitud (dB)
Fuente sonora 50
40
30
20
10
0
0 10 20 30 40 50 60 70 80 90 100
Tiempo (ms)
Fig. 1.37 Eco flotante aparecido al Fig. 1.38 Curva energía-tiempo ETC ilustrativa
colocar la fuente sonora entre dos paredes de la existencia de eco flotante
paralelas, lisas y muy reflectantes
56
1.15.5 Modos propios de una sala. Acústica ondulatoria
√( k
) ( ) ( )
2 m 2 n 2
sala de reducidas dimensiones
fk,m,n = 172,5 + +
Lx Ly Lz
donde:
Lx, Ly y Lz representan las dimensiones de la sala (en metros)
k, m, n pueden tomar cualquier valor entero (0, 1, 2, 3, ..).
Cada combinación de valores k, m, n da lugar a una frecuencia y modo propio asociado, que
recibe el nombre de modo propio k, m, n. Por ejemplo, la combinación: 57
k = 2, m = 1, n=1
da lugar al modo propio 2, 1, 1.
Partiendo de que la existencia de modos propios es inevitable, conviene elegir una rela-
ción entre las dimensiones de la sala tal que la distribución de los mismos en el eje frecuen-
cial sea lo más uniforme posible. De esta manera se consigue evitar concentraciones de
energía en bandas estrechas de frecuencias o, lo que es lo mismo, coloraciones intensas del
sonido.
A título de ejemplo, en la figura 1.41 se representa la distribución de los modos pro-
pios más significativos de dos salas: la primera, con una relación óptima entre sus dimensio-
nes (6,25 x 3,75 x 2,5 m), y la segunda, de forma cúbica (4 x 4 x 4 m).
a) Sala de : Lx= 6,25 m, Ly= 3,75 m, Lz= 2,5 m
Hz
27,6
46,0
53,6
69,0
82,8
92,0
115,0
107,3
127,6
138,0
61,0
74,7
86,3
96,4
Hz
105,6
122,0
129,4
136,4
143,0
2,6
2,4
2,2
Longitud
2,0
1,8
Altura = 1
1,6
1,4
58 1,0 1,2 1,4 1,6 1,8 2,0
Anchura
Fig. 1.42 Relaciones recomendadas entre las dimensiones de una sala rectangular
para obtener una distribución uniforme de sus frecuencias propias
donde:
fmax = 1849
√ RTmid
V
RTmid es el valor del tiempo de reverberación obtenido como promedio de los valores
correspondientes a las bandas de octava centradas en 500 Hz y 1 kHz, expresado en
segundos (apartado 1.15.8)
V es el volumen de la sala, expresado en m3
De la anterior expresión se desprende que el efecto de los modos propios tiene una
mayor incidencia cuanto más pequeña es la sala en consideración, como es el caso de los locu-
torios y las salas de control pertenecientes a estudios de grabación.
La manera práctica de minimizar dicho efecto es mediante la utilización de sistemas
electrónicos de ecualización, o bien a través de la instalación de elementos resonadores (apar-
tado 2.2.5). En general, las frecuencias propias cuyo efecto se pretende atenuar suelen estar
situadas por debajo de los 200 Hz.
En el caso de recintos grandes, como teatros y salas de conciertos, la coloración del
sonido a causa de los modos propios es prácticamente nula y, por tanto, no se tiene en cuenta
en la fase de diseño.
Dc = 0,14
√ QR
donde:
Q = factor de directividad de la fuente sonora en la dirección considerada
–
St α
R = constante de la sala = – (en m )
2
1–α
En la figura 1.46 se muestra la evolución del nivel relativo total de presión sonora en
función de la distancia a la fuente, normalizada con respecto a la distancia crítica Dc.
LD : Nivel de campo
0 directo
Nivel relativo total (dB)
-4 LR : Nivel de campo
reverberante
-8
-12
-16
3 dB
-20
LR
-24
LD
-28
Fig. 1.46 Evolución del nivel relativo total de presión sonora en función de la distancia
a la fuente sonora normalizada con respecto a la distancia crítica Dc
62
r
Se puede comprobar que, para puntos próximos a la fuente sonora ( << 1):
Dc
Lp ≈ LD
r
mientras que para puntos alejados ( >> 1):
Dc
Lp ≈ LR
Por otra parte, se puede demostrar que cuanto mayor sea el grado de absorción de un
recinto a una determinada frecuencia, mayor será el valor de la constante de la sala R (aumen-
to de la distancia crítica Dc) y menor el nivel de presión sonora de campo reverberante LR.
A título de ejemplo, en la figura 1.47 se representan tres gráficas de niveles relativos
totales de presión sonora correspondientes a una sala “viva” (poco absorbente), a una sala
intermedia y a una sala “apagada” (muy absorbente), en función de la distancia a la fuente
sonora.
Se puede observar que, efectivamente:
1 2 4 8 16 32 64 128
Distancia a la fuente (m)
salas de conciertos son recomendables unos valores apreciablemente más elevados a fin de
que la audición musical resulte óptima.
En la tabla 1.5 se dan los márgenes de valores recomendados de RTmid para diferentes
tipos de salas en el supuesto de que estén ocupadas.
Tabla 1.5 Márgenes de valores recomendados de RTmid en función del tipo de sala (recintos ocupados)
Si bien existe un gran número de fórmulas para el cálculo teórico del RT (ver algunas de ellas
en el apéndice 2), la fórmula clásica por excelencia, y aceptada como de referencia a nivel
internacional por su sencillez de cálculo, es la denominada fórmula de Sabine. La correspon-
diente expresión matemática, obtenida aplicando la teoría acústica estadística y despreciando
el efecto de la absorción producida por el aire, es la siguiente:
V
RT = 0,161 (en segundos)
Atot
donde:
V = volumen del recinto (en m3)
Atot = absorción total del recinto (definida seguidamente)
Energía absorbida
α=
Energía incidente
– Atot
α =
St
donde:
0,161 V
RT = –S
α t
Aparte del perjuicio que representa para la inteligibilidad de la palabra la existencia de eco o
de eco flotante en una sala (apartados 1.15.3 y 1.15.4), la comprensión de un mensaje oral
depende fundamentalmente de la correcta percepción de sus consonantes (apartado 1.13.1).
A principios de la década de los años 70, el investigador holandés V.M.A. Peutz llevó a
cabo un exhaustivo trabajo a partir del cual estableció una fórmula para el cálculo de la inte-
ligibilidad.
El trabajo se dividió en dos partes perfectamente diferenciadas: la primera consistió en
realizar una serie de pruebas de audiencia en diferentes recintos basadas en la emisión de un
conjunto preestablecido de “logatomos” (palabras sin significado formadas por: consonante-
vocal-consonante). Cada individuo receptor tomaba nota de lo que escuchaba y, posterior-
mente, se procesaba toda la información recogida y se establecía una estadística de los resul-
tados obtenidos. Si, por ejemplo, el porcentaje medio de logatomos detectados correctamente
en uno de los recintos era de un 85%, entonces se consideraba que la pérdida de información
era de un 15%. Como dicha pérdida se asociaba a una percepción incorrecta de las conso-
nantes, Peutz la denominó: % de Pérdida de Articulación de Consonantes, o lo que es lo
mismo, %ALCons (“Articulation Loss of Consonants”). En el ejemplo anterior, se tendría un
%ALCons de un 15%. Huelga decir que, al tratarse de un parámetro indicativo de una pérdi-
da, cuanto mayor sea, peor será el grado de inteligibilidad existente.
La segunda parte del trabajo consistió en encontrar una ley matemática que, a partir del
conocimiento de una serie de parámetros acústicos del recinto en estudio, permitiese hallar el 67
valor de %ALCons en cada punto del mismo, sin necesidad de tener que realizar las laborio-
sas pruebas de audiencia. Lógicamente,
una vez establecida dicha ley, sería posible 1
predecir la inteligibilidad de la palabra en
% AlCons
RT (s)
cualquier punto de un recinto todavía por
2
construir.
Haciendo uso de la teoría acústica 3
4 0,10
estadística, Peutz dedujo que el valor de
5
%ALCons en un punto dado se podía 0,63
determinar, simplemente, a partir del
1,00
conocimiento del tiempo de reverberación 10
LD – LR = 10 log
( ) QR
r2
– 17 (en dB)
donde:
log = logaritmo decimal
Q = factor de directividad de la fuente sonora en la dirección considerada (Q = 2 en el
caso de la voz humana, considerando la dirección frontal del orador)
R = constante de la sala (en m2)
r = distancia del punto considerado a la fuente sonora (en m)
➤ Cuanto más cerca esté situado el receptor de la fuente sonora (LD-LR mayor), menor
será el valor de %ALCons, es decir, mayor inteligibilidad.
➤ Cuanto menor sea el RT, igualmente menor será el %ALCons, es decir, mayor inteligi-
68 bilidad.
➤ El valor de %ALCons va aumentando a medida que el receptor se aleja de la fuente,
hasta una distancia: r = 3,16 Dc . Para distancias r > 3,16 Dc , equivalentes a (LD - LR) <
-10 dB, el valor de %ALCons tiende a ser constante. Ello significa que, a partir de dicha
distancia, la inteligibilidad de la palabra ya no empeora.
Alternativamente, en lugar de usar las gráficas anteriores, se pueden utilizar las fórmu-
las del apéndice 2.
Otro factor no mencionado hasta el momento, pero que contribuye sustancialmente a la
pérdida de inteligibilidad, es el ruido de fondo presente en la sala. Desde un punto de vista
práctico, y sin entrar en aspectos cuantitativos, se considera que su efecto es despreciable
cuando el correspondiente nivel de ruido de fondo está, como mínimo, 12 dB por debajo del
nivel de la señal.
Finalmente, es preciso indicar que existe otro parámetro alternativo que permite cuantifi-
car el grado de inteligibilidad de la palabra. Dicho parámetro, conceptualmente más complejo,
se denomina STI (“Speech Transmission Index”) y su valor oscila entre 0 (inteligibilidad nula)
y 1 (inteligibilidad total). La definición del mismo se halla en el apéndice 2. Asimismo, existe
una versión simplificada del STI denominada RASTI (“Rapid Speech Transmission Index”).
Habitualmente, el RASTI es el parámetro medido en recintos, debido a su rapidez de cálculo en
relación con el STI. Su definición se encuentra igualmente en el apéndice 2.
Se ha podido demostrar que existe una muy buena correlación entre los valores de
%ALCons y de STI / RASTI. Dicha correpondencia se muestra en la figura 1.50 y en la tabla
1.6. En esta última aparece también la valoración subjetiva del grado de inteligibilidad.
100
90
80
70
% ALCons
60
50
40
30
20
10
0
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
STI/RASTI
Tabla 1.6 Relación entre %ALCons, STI / RASTI y la valoración subjetiva del grado de inteligibilidad
Seguidamente se da la explicación de por qué en un recinto muy “vivo” la palabra resulta inin-
teligible.
Según se ha expuesto en el apartado 1.13.1, al emitir un mensaje oral, la duración de
las vocales y su correspondiente nivel de presión sonora es mayor que el de las consonantes.
Además, el contenido frecuencial de las vocales es más rico en bajas frecuencias, en tanto que
las consonantes presentan un mayor contenido de altas frecuencias.
En una sala con un tiempo de reverberación alto, el decaimiento energético de una vocal
emitida en la misma es apreciablemente más lento que su decaimiento propio (aquél que se
observaría si la vocal se emitiese en el espacio libre). Tal hecho, junto con la mayor duración
y nivel comentados anteriormente, provoca un solapamiento temporal de la vocal con la con-
sonante emitida inmediatamente después, según se observa en la figura 1.51.
La simultaneidad temporal de la vocal y de la consonante con sus correspondientes
niveles, así como las características espectrales de ambos sonidos, son las causantes del
enmascaramiento parcial o total de la consonante, producido por la vocal (según se ha visto
en el apartado 1.10.2, un tono de baja frecuencia y nivel elevado enmascara otro tono de fre-
cuencia más elevada y nivel inferior).
Vocal
Energía sonora
Consonante
Tiempo (s)
70
G r a d o en I n g . S i s t . de T e l e c o m . , S o n i d o e
Imagen
Autor/a:
Yetsibel Gonçalves Molina
Tutor/a:
Miguel Ferrer Contreras
GANDIA, 2020
Resumen
En este TFG se propone crear una base de datos de modelos de instrumentos musicales
con el fin de sintetizar sus sonidos de forma sencilla. Tanto el trabajo de modelado como
el de síntesis se realizará con la ayuda de MATLAB.
Habitualmente, la síntesis de instrumentos musicales, parte de un modelo armónico de
los mismos, o en un caso más genérico, de un modelo de componentes tonales
arbitrarias que se denominan parciales. Mediante técnicas de análisis espectral, se
pretende caracterizar los armónicos de diferentes instrumentos, y así poder sinterizarlos
mediante un modelo de síntesis aditiva. Estos modelos, no son siempre realistas, ya
que pierden la información de la envolvente temporal de los sonidos emitidos por cada
instrumento. Por lo tanto, para mejorar el modelado de los instrumentos, también se
realizará un análisis temporal de los sonidos que emiten los instrumentos musicales con
el objetivo de caracterizar la envolvente temporal de los mismos.
Finalmente, se propondrá la implementación de un sintetizador de instrumentos
musicales desarrollado, también, en MATLAB, con el fin de generar sonidos sintetizados
con un tono, amplitud, duración y modelo de instrumento elegidos por el usuario, que
podría transcribir partituras para sinterizar cualquier composición musical.
Palabras Clave
Síntesis Aditiva, Modelado de Sonido, Sonido Digital, Matlab, Música.
Abstract
In this TFG it is proposed to create a data base of musical instrument models with the
purpose of being able to synthesize their sounds in a simple way. Both the modeling and
synthesizing work Will be done with the help of Matlab.
Usually, the synthesis of musical instruments starts from a harmonic model, or in a more
generic case, from a model of arbitrary tonal componets that are called partials. Through
spectral análisis techniques, the aim is to characterize the harmonics or the partials of
different instruments, in order to be able to synthetsize them the using an additive
synthesis model. These kind of models are not always realistic, since they lose the
information of the temporal evelope of the sounds emitted by each instrument. Therefore,
to improve the modeling of the instruments, a temporal analysis of the sounds emitted
by the musical instruments will also be done in order to characterize the temporal
envelope of the instruments.
Finally, the implementation of a musical instrument synthesizer will be proposed, also
developed in MATLAB, in order to generate synthesized sounds with a tone, amplitude,
duration and instrument model chosen by the user, which could transcribe scores to
synthesize any musical composition.
Keywords
Additive Synthesis, Sound Modelling, Digital Sound, Matlab, Music.
Índice
Resumen...................................................................................................................................... 2
Palabras Clave............................................................................................................................ 2
Abstract ........................................................................................................................................ 3
Keywords ..................................................................................................................................... 3
1. Introducción y objetivos ..................................................................................................... 7
1.1 Presentación ............................................................................................................... 7
1.2 Objetivos ...................................................................................................................... 7
1.3 Metodología ................................................................................................................. 7
1.4 Organización de la memoria ..................................................................................... 8
2. El sonido y la música ......................................................................................................... 9
2.1 Las ondas sonoras ..................................................................................................... 9
2.1.1 La frecuencia fundamental y los armónicos ................................................... 9
2.1.2 La fase ................................................................................................................ 10
2.2 Cualidades del sonido en la música ...................................................................... 11
2.2.1 La intensidad y sonoridad ............................................................................... 11
2.2.2 El tono ................................................................................................................ 12
2.2.3 El timbre ............................................................................................................. 13
2.2.4 La duración ........................................................................................................ 14
2.3 Las escalas musicales ............................................................................................. 14
3. Análisis del sonido ............................................................................................................ 16
3.1 El espectro de frecuencias ...................................................................................... 16
3.1.1 La transformada de Fourier [7] ....................................................................... 18
3.2 La envolvente ADSR ................................................................................................ 20
4. Síntesis musical ................................................................................................................ 21
4.1 Tipos de síntesis ....................................................................................................... 22
4.1.1 Síntesis aditiva .................................................................................................. 22
4.1.2 Síntesis sustractiva .......................................................................................... 23
4.1.3 Síntesis por modulación de frecuencia (FM) ................................................ 23
4.1.4 Síntesis Granular .............................................................................................. 24
4.1.5 Síntesis por Tabla de ondas (Wavetable)..................................................... 24
4.2 Sistema MIDI [9] ....................................................................................................... 25
5. Modelado de instrumentos mediante MATLAB ........................................................... 27
5.1 Instrumentos de cuerda ........................................................................................... 30
5.2 Instrumentos de viento-madera.............................................................................. 34
5.3 Instrumentos de viento-metal ................................................................................. 36
6. Síntesis aditiva mediante MATLAB ............................................................................... 40
7. Conclusiones ..................................................................................................................... 45
8. Bibliografía ......................................................................................................................... 46
Índice de Ilustraciones
Figura 1: Composición de una onda mediante senos simples .......................................... 10
Figura 2: Composición de una onda con desfase ............................................................... 10
Figura 3: Curvas isofónicas calculadas por Robinson y Dadson (I.S.O 226) ................. 12
Figura 4: Escala Mels propuesta por Stevens, Volkman y Newwman ............................. 13
Figura 5: Figuras musicales .................................................................................................... 14
Figura 6: Relación de frecuencias en intervalos musicales ............................................... 15
Figura 7: Escala del temperamento igual ............................................................................. 16
Figura 8: División del espectro de frecuencias .................................................................... 17
Figura 9: Relación entre armónicos y octavas ..................................................................... 17
Figura 10: Descomposición de una onda compleja mediante la Transformada de
Fourier ........................................................................................................................................ 19
Figura 11: Relación de magnitudes en dominios tiempo-frecuencia mediante la
Transformada de Fourier......................................................................................................... 19
Figura 12: Envolvente ADSR .................................................................................................. 20
Figura 13: Envolvente ADSR del piano y el violín ............................................................... 20
Figura 14: Sintetizador Modular Moog .................................................................................. 21
Figura 15: Diagrama de un sintetizador aditivo ................................................................... 22
Figura 16: Diagrama de síntesis sustractiva ........................................................................ 23
Figura 17: Diagrama de síntesis FM ..................................................................................... 23
Figura 18: Proceso de síntesis granular asíncrona............................................................. 24
Figura 19: Representación gráfica de una tabla de ondas ................................................ 25
Figura 20: Estructura binaria de un mensaje MIDI.............................................................. 25
Figura 21: Mensajes MIDI ....................................................................................................... 26
Figura 22: Notación MIDI ........................................................................................................ 27
Figura 23: Espectro frecuencial de la guitarra ..................................................................... 30
Figura 24: Envolvente de la guitarra ...................................................................................... 30
Figura 25: Espectro frecuencial del Banjo ............................................................................ 31
Figura 26: Envolvente del Banjo ............................................................................................ 31
Figura 27: Espectro frecuencial del violín ............................................................................. 32
Figura 28: Envolvente del violín ............................................................................................. 32
Figura 29: Espectro frecuencial del piano ............................................................................ 33
Figura 30: Envolvente del piano ............................................................................................. 33
Figura 31: Espectro frecuencial del oboe ............................................................................. 34
Figura 32: Envolvente del oboe.............................................................................................. 34
Figura 33: Espectro frecuencial de la flauta ......................................................................... 35
Figura 34: Envolvente de la flauta ......................................................................................... 35
Figura 35: Espectro frecuencial del clarinete ....................................................................... 35
Figura 36: Envolvente del clarinete ....................................................................................... 36
Figura 37: Espectro frecuencial de la trompeta ................................................................... 37
Figura 38: Envolvente de la trompeta ................................................................................... 37
Figura 39: Espectro frecuencial de la tuba ........................................................................... 38
Figura 40: Envolvente de la tuba ........................................................................................... 38
Figura 41: Espectro frecuencial del trombón ....................................................................... 39
Figura 42: Envolvente del trombón ........................................................................................ 39
1. Introducción y objetivos
1.1 Presentación
Mediante los avances electrónicos y tecnológicos, se han desarrollado métodos de
síntesis con el fin de imitar instrumentos musicales reales y crear sonidos innovadores.
Los sintetizadores son una herramienta muy útil y utilizada para la producción de la
música en la actualidad.
Los primeros sintetizadores fueron analógicos, contaban con elementos electrónicos
como osciladores y generadores. Más adelante, con la aparición de las técnicas
digitales, aumentó la flexibilidad y facilidad para la síntesis musical, mediante su uso en
los ordenadores.
Existen distintos tipos de síntesis musical, como lo son la síntesis aditiva, síntesis
sustractiva, síntesis por modelado de frecuencia, entre otras, cada una con el mismo fin
de sintetizar sonidos, sin embargo, cada una cuenta con una técnica distinta de la cual
depende el resultado final.
El fin del presente proyecto es el estudio de las características sonoras necesarias para
recrear el timbre de distintos instrumentos musicales y el desarrollo de la síntesis aditiva
mediante MATLAB. Se trabajará con la síntesis aditiva ya que es conveniente para el
objetivo de imitar el sonido de instrumentos musicales existentes debido a la técnica que
emplea, en la cual es necesaria el modelado previo de los mismos.
La herramienta de programación usada en este proyecto es MATLAB, debido a su
amplio uso dentro de la ingeniería, y la capacidad y flexibilidad que contiene a la hora
del estudio del sonido, mediante las cuales posible realizar el modelado de los
instrumentos y la síntesis aditiva.
1.2 Objetivos
Los objetivos pretendidos en este proyecto se muestran a continuación:
1.3 Metodología
El proyecto se ha organizado de forma en la que se diferencian tres partes.
Primero, el estudio de los distintos conceptos teóricos necesarios para el desarrollo de
los objetivos técnicos planteados.
Luego se realizará el modelado de los instrumentos, el análisis espectral y temporal de
los sonidos con el fin de obtener los valores objetivos que posteriormente serán
necesarios para la imitación de los instrumentos en la síntesis.
Por último, se implementará una función en MATLAB de síntesis aditiva capaz de
generar melodías con el modelo de instrumento elegido por el usuario con un formato
sencillo similar al estándar MIDI.
2.1.2 La fase
La definición de fase consiste en el estado de vibración de un punto de la onda. Dos
puntos están en fase cuando coinciden en velocidad y elongación. La fase de cada
componente de la onda debe iniciar en cero para que no ocurra un desfase. En el caso
que cada onda empiece por fases distintas, la forma de la onda compleja se deformaría
de manera notable. Sin embargo, el oído humano es relativamente insensible a estas
modificaciones y al escucharlo no implicaría una diferencia significativa a una onda en
fase. En el caso de que distintos componentes consten de la misma frecuencia, si tienen
desfase de 90º o 180º sería distinto para la percepción auditiva, ya que con la diferencia
de 90º varía la amplitud de las ondas y con 180º se cancelarían entre ellas [5].
En la figura 2 se nota la deformación de la onda final causada por el desfase, se logra
ver una diferencia considerable respecto a la figura 1.
Sin embargo, la sensación del nivel del sonido no solo depende de la intensidad objetiva,
también afecta la sensibilidad del oído de cada persona. El oído humano puede
𝑊 𝑊
−12
escuchar sonidos en el rango de intensidad desde 10 𝑚2 hasta 1 𝑚2 , siendo éstas el
𝑊
−12
Donde 𝐼𝑟𝑒𝑓 es el umbral de audición (10 𝑚2 ).
2.2.2 El tono
El tono es una cualidad que viene determinada por la frecuencia, permite distinguir si un
sonido es agudo o grave. Mientras mayor sea la frecuencia de la onda, más agudo será
el sonido y al ser menor la frecuencia, más grave sonará el mismo.
La función de un tono puro corresponde a la de una onda senoidal, donde f es la
frecuencia, t es el tiempo y A es la amplitud:
𝑓(𝑡) = 𝐴 𝑠𝑒𝑛(2𝜋𝑓𝑡) (4)
Las ondas periódicas se expresan como la suma de varios tonos puros de distintas
frecuencias, la frecuencia fundamental y los múltiplos de ésta, llamados armónicos. [2]
La forma en la que se percibe el tono según la psicoacústica se conoce como la altura
del sonido, mediante la cual se determina bajo y alto como grave y agudo,
respectivamente. Es normal que “tono” y “altura” sean sinónimos en lo que respecta a
la música. [3]
La relación entre el tono y la frecuencia se puede observar a través de experimentos
realizados por Stevens, Volkman y Newmann en 1937. Para ello invitaron a grupos de
personas a juzgar tonos percibidos para así crear una escala llamada la Escala Mel, en
la cual se aprecia la relación entre las frecuencias y el tono con unidad de medida
subjetiva llamada “mels” (Figura 4). [5]
FIGURA 4: ESCALA MELS PROPUESTA POR STEVENS, VOLKMAN Y NEWWMAN
2.2.3 El timbre
El timbre es la cualidad que permite el reconocimiento de la fuente sonora, aún cuando
tienen el mismo tono, frecuencia fundamental e intensidad. El oído puede identificar si
un instrumento es de viento, cuerda o percusión, así como las diferentes voces de cada
persona debido al timbre de los mismos.
Así como lo demuestra el Teorema de Fourier, cualquier onda periódica se descompone
en una serie de ondas con distintas frecuencias múltiplo de la frecuencia fundamental,
las cuales son conocidas como armónicos. Esto ocurre en las ondas de sonido y el
timbre dependerá principalmente del número de armónicos y la intensidad de cada uno,
estos parámetros se pueden obtener a través del espectro mediante un analizador de
ondas. Los armónicos son distintos según la fuente, el tipo de instrumento y la forma en
la que se toca el mismo instrumento.
Aunque el espectro de las frecuencias muestra los parámetros de forma objetiva, el
timbre es una cualidad subjetiva ya que para describirlo interviene la interpretación del
oído humano. [5]
El timbre también depende de la envolvente que contiene la amplitud del sonido, la
variación de la amplitud en el tiempo. En general las distintas fuentes presentan una
forma específica de envolvente que se caracteriza por cuatro momentos en el tiempo:
el ataque, la caída, el sostenimiento y la relajación, lo cual se conoce como la envolvente
ADSR. [4]
2.2.4 La duración
El tiempo en el que se mantienen las ondas de un sonido se denomina duración. Los
sonidos se pueden distinguir según la duración de los mismos.
Por ejemplo, al tocar una nota en una trompeta las ondas tienen una duración larga
mientras que al tocar la cuerda de una guitarra ésta se disminuye y al tocar algún
instrumento de percusión, como un tambor, es bastante corta.
En la teoría musical, la duración se representa mediante las figuras musicales, las
cuales son: La cuadrada, redonda, blanca, negra, corchea, semicorchea, fusa,
semifusa, garrapatea y semigarrapatea. La redonda se toma como punto de referencia
para asignar el valor a las demás notas: 16 semicorcheas, 8 corcheas, 4 negras y 2
blancas tienen la misma duración que una redonda, así como es posible observarlo en
la figura 5. En los compases musicales, la figura que representa la unidad es la negra,
por lo tanto, un pulso equivale a una negra.
Y los coeficientes:
• Note On: Le indica al dispositivo que debe iniciar una nota, en el primer byte de
datos indica la altura de la nota, siendo 0 la nota más grave y 127 la nota más
aguda, como se logra ver en la figura 18. En el segundo byte indica la velocidad
del ataque, parámetro asociado con la intensidad sonora, algunos dispositivos
no detectan este parámetro y envían una velocidad constante de 64.
• Note Off: Le indica al dispositivo que debe parar una nota. El primer byte consta
de la altura de la nota y el segundo de la velocidad. La mayoría de equipos no
responden a la velocidad de liberación, por ello es común que en su lugar se
utilice el mensaje Note On con velocidad 0.
• Polyphonic Aftertouch: Consiste en la detección de los cambios de presión
ejercidos al tocar una tecla, los teclados de alta gama son los que cuentan con
esta opción. El primer byte indica la altura de la nota y el segundo byte la presión
que se ejerce sobre ésta.
• Control Change: Se utiliza para seleccionar los controles de efectos del sonido,
como la modulación, la reverberación, entre otros. El primer byte indica el tipo
de control y el segundo indica el valor del control seleccionado.
• Channel Aftertouch: Es similar al Polyphonic Aftertouch, utiliza un único byte
que envía un mensaje de presión por cada nota.
• Pitch Bend: Genera una variación de altura, usualmente se utiliza en teclados
que contienen un control giratorio el cual se utiliza para crear un efecto de
trémolo en el sonido. Utiliza los dos bytes de datos.
• Program Change: Se utiliza para seleccionar los distintos sonidos que contenga
el sintetizador. Consta de un byte.
• System Mesagge: Contienen información del sistema en general como la señal
de tiempo para sincronización, información sobre secuencias de MIDI grabados
anteriormente y detalles sobre la información de configuración del dispositivo en
el que se trabaja.
Aunque un dispositivo contenga la interfaz MIDI, no es necesario que trabaje con
todos los mensajes, esto depende de la capacidad de los dispositivos. La estructura
genérica de cada mensaje se puede observar en la figura 21.
plot(f,senalEnFreq1)
xlabel('Frecuencia [Hz]');
ylabel('Amplitud normalizada [V]');
title('Señal en el dominio de la frecuencia');
end
plot(y)
xlabel('Tiempo [s]');
ylabel('Amplitud normalizada [V]');
title('Señal en el dominio del tiempo');
end
Como siguiente paso, se ha creado la función “envADSR”, la cual genera una envolvente
ADSR mediante una expresión analítica. Los datos de entrada son la duración y la
frecuencia de muestreo, para adaptarlo posteriormente a la síntesis aditiva, y lo que la
define: el porcentaje de amplitud de sostenimiento y los tiempos de duración del ataque,
decaimiento, sostenimiento y relajación. Dichos valores han sido elegidos de forma que
la envolvente resulte similar a la envolvente de la señal original, visualizada mediante la
gráfica en el dominio del tiempo.
La función “envADSR” se ha implementado de la siguiente forma:
function [envolvente] =
envADSR(duracion,Fs,pSostenimiento,dAtaqueS,dDecaimientoS,dSostenimi
entoS,dRelajacionS)
%envolventeADSR devuelve un vector "envolvente", la entrada
%será la frecuencia de muestreo, el porcentaje de amplitud del
sostenimiento y la duracion del ataque, decaimiento,
%sostenimiento y relajación (en segundos).
if dTotal~=Fs*duracion
dRelajacionM=abs(dRelajacionM-(dTotalM-(Fs*duracion)));
else
dRelajacionM=dRelajacionM;
end
% Se genera la envolvente aplicando la expresion analitica
% Primero se generan los componentes X e Y de cada etapa
tAtaque = [0:dAtaqueM]; %Componente X del ataque
ataque = ((1/dAtaqueM)*(tAtaque-dAtaqueM))+1; %Componente Y del
ataque
tDecaimiento = [0:dDecaimientoM-1]; %Componente X del decaimiento
decaimiento = (((aSostenimiento-1)/dDecaimientoM)*(tDecaimiento-
dDecaimientoM))+aSostenimiento; %Componente Y del decaimiento
tSostenimiento = ones(1,dSostenimientoM); %Componente X del
sostenimiento
sostenimiento = tSostenimiento*aSostenimiento; %Componente Y del
sostenimiento
tRelajacion = [0:dRelajacionM-1]; %Componente X de la relajación
relajacion = (-aSostenimiento/dRelajacionM)*(tRelajacion-
dRelajacionM); %Componente Y de la relajación
% Por último se concatena cada etapa para formar la envolvente
ADSR
envolvente=[ataque decaimiento sostenimiento relajacion];
end
A partir de las funciones descritas en este apartado se han modelado los instrumentos,
los resultados y detalles de cada instrumento se presentan a continuación.
• Guitarra:
El espectro frecuencial resultante es el siguiente:
• Oboe:
La altura de cada nota corresponde a su notación MIDI (Figura 22), en donde 60, 62,
64, 65, 67, 69, 71 y 72 corresponden a 𝐷𝑂5 , 𝑅𝐸5 , 𝑀𝐼5 , 𝐹𝐴5 , 𝑆𝑂𝐿5 , 𝐿𝐴5 , 𝑆𝐼5 , 𝐷𝑂6 ,
respectivamente, existen tantos eventos como cantidad de notas, por lo tanto serían 8
eventos. El tiempo de cada nota es el mismo para cada una: 0.5, y la deltaT tiene un
valor de 0.5, por lo tanto, cada nota tendría una duración de 0.25 segundos. La amplitud
es la misma para todas las notas, por lo tanto, tiene el valor de 1. El modelo de
instrumento variará según el número a ingresar, posteriormente se explicará el
funcionamiento.
Como se ha explicado en el apartado 4.1.1, la síntesis aditiva parte del teorema de
Fourier, en el cual una forma compleja de ondas se puede generar a partir de la suma
de ondas sinusoidales simples y la expresión de una onda sinusoidal simple es la
siguiente:
𝑦 = 𝐴 sin(2𝜋𝑓𝑡) (13)
Luego de modelar los instrumentos, conocemos lo fundamental: el valor de las
amplitudes de cada armónico. Por lo tanto, la función contiene vectores con las
amplitudes de cada instrumento y la cantidad de armónicos que poseen, como se
observa a continuación:
% Modelo Oboe
modeloOboe.f=1:10;
modeloOboe.a=[0.06559 0.06568 0.1797 0.04523 0.02655 0.008484
0.004929 0.002103 0.0009053 0.0008656];
% Modelo Guitarra
modeloGuitarra.f=1:10;
modeloGuitarra.a=[0.03207 0.02928 0.01504 0.001873 0.001647
0.001336 0.0008313 0.0004061 0.0002245 0.0005213];
% Modelo Flauta
modeloFlauta.f=1:10;
modeloFlauta.a=[0.01335 0.07209 0.06227 0.01622 0.00469 0.0137
0.001239 0.001435 0.0006678 0.0006253];
% Modelo Piano
modeloPiano.f=1:10;
modeloPiano.a=[0.1416 0.09987 0.01254 0.01584 0.001425 0.01532
0.002571 0.005974 0.005192 0.002478];
% Modelo Violin
modeloViolin.f=1:10;
modeloViolin.a=[0.1273 0.07009 0.06772 0.03075 0.03411 0.0182
0.01086 0.01081 0.003783 0.002956];
% Modelo Trompeta
modeloTrompeta.f=1:10;
modeloTrompeta.a=[0.1002 0.09563 0.0370 0.02601 0.02786
0.01131 0.005406 0.008833 0.01085 0.004181];
% Modelo Banjo
modeloBanjo.f=1:10;
modeloBanjo.a=[0.01122 0.00392 0.002727 0.002759 0.002496
0.003355 0.002343 0.001233 0.0003229 0.00116];
% Modelo Clarinete
modeloClarinete.f=1:10;
modeloClarinete.a=[0.4564 0.1121 0.1777 0.08187 0.04608
0.02748 0.009626 0.004976 0.008025 0.003953];
% Modelo Tuba
modeloTuba.f=1:6;
modeloTuba.a=[0.3378 0.07217 0.07231 0.009529 0.0087
0.003814];11111111111
% Modelo Trombón
modeloTrombon.f=1:10;
modeloTrombon.a=[0.07031 0.148 0.02347 0.06058 0.02869 0.0336
0.01083 0.0148 0.01086 0.007741];
Se inicia un bucle que recorre la cantidad de eventos de entrada y extrae los datos de
ésta, el número de modelo de entrada varía según se observa en el switch del código:
se presentan dos modelos para cada instrumento, uno con envolvente ADSR (con los
valores obtenidos en el análisis (Apartado 5)) y otro sin ésta:
for evento=1:NumEventos
% Leemos la nota
NotaMidi=secuencia(evento,1);
% Leemos el volumen
Vol=secuencia(evento,2);
t=0:Ts:dur*deltaT;
NumNotas=length(motor_sintesis.f);
for nota=1:NumNotas
f=motor_sintesis.f(nota)*27.5*2^((NotaMidi-21)/12);
amplitud=motor_sintesis.a(nota).*envolvente;
sonidoTrama=sonidoTrama+amplitud.*cos(2*pi*f*t+fi1(nota));
TamTrama=length(sonidoTrama);
end
fi0(1:NumNotas)=fi1(1:NumNotas);
sonido(n:(TamTrama+n-1))=sonidoTrama;
n=n+TamTrama;
sonidoTrama=0;
end
end
7. Conclusiones
Como se ha observado tras la elaboración del presente proyecto, se han modelado
distintos instrumentos y con los parámetros obtenidos se ha desarrollado una función
en MATLAB capaz de reproducir melodías musicales con la técnica de síntesis aditiva,
tal como se marcaba en los objetivos principales.
Los valores objetivos obtenidos del análisis de los instrumentos y la aplicación de estos
en el desarrollo de la función de síntesis aditiva han dado los resultados esperados,
marcados por los objetivos. Cabe destacar que en los modelos en los que se ha aplicado
el uso de la envolvente ADSR, adquirida en el análisis temporal del audio, el sonido
resultante es mucho más natural que en los modelos en los cuales solo se han aplicado
los parámetros obtenidos a través del estudio del espectro frecuencial.
La función del sintetizador se ha hecho de forma en la que resulte de uso sencillo para
el usuario, ya que tiene similitud con los valores que se utilizan en el interfaz MIDI. Sin
embargo, el sintetizador podría ser más práctico si se propone un formato totalmente
compatible al MIDI, lo cual sería posible de lograr en el futuro, ya que los valores de
entrada de la función son los estandarizados.
Finalmente, se puede decir que el proyecto ha sido productivo, ya que los resultados
han sido los esperados y la realización del mismo me ha permitido aplicar y ampliar los
conocimientos adquiridos al cursar la carrera, en especial lo referente al tratamiento de
las señales de audio, y la programación en la herramienta MATLAB. También ha sido
útil a la hora de comprender la relación entre los parámetros físicos y matemáticos con
la música, y lo fundamental que es la compresión de ello a la hora de la creación de
herramientas para producir sonidos a través de medios digitales.
8. Bibliografía
[1] Luz López, A; (2013). Representación del sonido mediante Series de Fourier
Funciones de Variable Compleja. Disponible en:<
http://lcr.uns.edu.ar/fvc/NotasDeAplicacion/FVC-Ana%20Luz%20Lopez.pdf> [Último
acceso: 05 de agosto de 2020]
Sin importar el tipo, el digitalizador es vital para que el sistema reconstruya con
precisión una forma de onda. Para asegurarse de seleccionar el osciloscopio correcto
para su aplicación, considere el ancho de banda, la frecuencia de muestreo y la
resolución del osciloscopio.
Ancho de Banda
El frente de un osciloscopio consiste en dos componentes: una ruta de entrada
analógica y un convertidor analógico-digital (ADC). La ruta de entrada analógica atenúa,
amplifica, filtra y/o acopla la señal para optimizarla como preparación para la
digitalización por el ADC. El ADC muestrea la forma de onda condicionada y convierte la
señal de entrada analógica en valores digitales que representan la forma de onda de
entrada analógica. La respuesta de frecuencia de la ruta de entrada provoca una pérdida
inherente de información de amplitud y fase.
Figura 1. El ancho de banda describe el rango de frecuencia en el cual la señal de
entrada puede atravesar el frente del osciloscopio, que consta de dos componentes: una
ruta de entrada analógica y un ADC.
El ancho de banda describe la habilidad del panel frontal analógico para llevar una señal
del mundo exterior al ADC con pérdida de amplitud mínima, desde la punta de prueba o
equipo de pruebas a la entrada del ADC. En otras palabras, el ancho de banda describe
la diversidad de frecuencias que un osciloscopio puede medir con precisión.
El ancho de banda se mide entre los puntos de frecuencia inferior y superior, donde la
amplitud de la señal cae a -3 dB por debajo de la frecuencia de pasobanda. Esto parece
complicado, pero cuando usted lo desglosa en realidad es relativamente fácil.
Debido a que la señal de entrada es una onda sinusoidal, hay dos frecuencias en las que
la señal de salida impacta este voltaje; estas se llaman frecuencias de corte f1 y f2.
Estas dos frecuencias tienen diferentes nombres, como la frecuencia de corte,
frecuencia de cruce, frecuencia de media potencia, frecuencia 3 dB y frecuencia de
ruptura. Sin embargo, todos estos términos se refieren a los mismos valores. La
frecuencia central, f0, de la señal es la media geométrica de f1 y f2.
Usted puede calcular el ancho de banda (BW) restando las dos frecuencias de corte.
Un osciloscopio debe tener el ancho de banda apropiado para medir con precisión
la señal, pero también debe tener suficiente tiempo de incremento para capturar
con precisión los detalles de las transiciones rápidas. Esto es más aplicable si se
miden señales digitales, como pulsos y pasos. El tiempo de incremento de una
señal de entrada es el tiempo de una señal para hacer la transición de un 10% al
90% de la amplitud máxima de la señal. Algunos osciloscopios pueden usar del
20% al 80%, así que asegúrese de revisar su manual de usuario.
Velocidad de Muestreo
La velocidad de muestreo, también conocida como razón de muestreo, no está
directamente relacionada con la especificación de ancho de banda. La velocidad de
muestreo es la frecuencia a la que el ADC convierte la forma de onda de entrada
analógica a datos digitales. El osciloscopio muestrea la señal después de que cualquier
atenuación, ganancia y/o filtrado ha sido aplicado a la ruta de entrada analógica y
convierte la forma de onda resultante en una representación digital. Lo hace en las
imágenes instantáneas, similar a los fotogramas de una película. Cuanto más rápido el
osciloscopio realice el muestreo, mayor será la resolución y el detalle que se puede ver
en la forma de onda.
Teorema de Muestreo de Nyquist
Para entender por qué, eche un vistazo a una onda sinusoidal medida a diferentes
velocidades. En el caso A, la onda sinusoidal de frecuencia f es muestreada a la
misma frecuencia. Esos muestreos están marcados en la señal original a la
izquierda y a la derecha cuando se construyen, la señal aparece incorrectamente
como un voltaje de DC constante. En el caso B, la velocidad de muestreo es el
doble de la frecuencia de la señal. Ahora aparece como una forma de onda
triangular. En este caso, f es igual a la frecuencia de Nyquist, que es el
componente de frecuencia más alto permitido para evitar aliasing para una
frecuencia de muestreo determinada. En el caso C, la velocidad de muestreo es de
4f/3. La frecuencia Nyquist en este caso es:
Por ejemplo, considere una señal con una frecuencia de muestreo de 100 Hz y la
señal de entrada contiene las siguientes frecuencias: 25 Hz, 70 Hz, 160 Hz y 510
Hz. Las frecuencias por debajo de la frecuencia Nyquist de 50 Hz son
muestreadas correctamente; aquellas superiores a 50 Hz aparecen como alias.
Figura 8. Diferentes valores de frecuencia son medidos, algunos de los cuales son
frecuencias alias y algunos de los cuales son frecuencias reales de la forma de
onda.
Resolución
Otro factor a considerar al seleccionar un osciloscopio para una aplicación es la
resolución. Los bits de resolución se refieren al número de niveles verticales únicos que
un osciloscopio puede utilizar para representar una señal. Una manera de comprender el
concepto de la resolución es comparándolo con una regla. Divida un metro en
milímetros; ¿cuál es la resolución? La marca más pequeña en la regla es la resolución —
o 1 de entre 1,000.
Por ejemplo, un osciloscopio de 3 bits tiene 23 u ocho niveles. Por otra parte, un
osciloscopio de 16 bits tiene 216 o 65,536 niveles. El ancho de código o cambio de
voltaje mínimo detectable pueden calcularse como sigue:
El ancho de código también se conoce como el bit menos significativo (LSB). Si el rango
de entrada del dispositivo es 0 a 10 V, entonces un osciloscopio de 3 bits tiene un ancho
de código de 10/8 = 1.25 V mientras que un osciloscopio de 16 bits tiene un ancho de
código de 10/65,536 = 305 μV. Esto puede significar una gran diferencia en cómo se
muestra la señal.
Figura 9. Diferencia de una Forma de Onda entre 16 Bits y 3 Bits de Resolución
Algunos osciloscopios utilizan un método llamado tramado para ayudar a suavizar las
señales para obtener la apariencia de una resolución más alta. El tramado implica la
adición deliberada de ruido a la señal de entrada. Ayuda a difuminar las pequeñas
diferencias en la resolución de amplitud. La clave es añadir ruido aleatorio de tal manera
que haga que la señal rebote de un lugar a otro entre los niveles sucesivos. Por
supuesto, esto de por sí hace a la señal más ruidosa. Pero, la señal se suaviza
promediando este ruido digitalmente una vez que la señal es adquirida.
Figura 10. El tramado puede ayudar a suavizar una señal.
Resumen
■ El ancho de banda describe el rango de frecuencias que un osciloscopio puede
medir de manera precisa. Se define como la frecuencia a la que una señal de
entrada sinusoidal se atenúa al 70.7% de su amplitud original, que también se
conoce como el punto de -3 dB.
■ El ancho de banda es la diferencia entre las frecuencias de corte.
■ El error de amplitud es un porcentaje que es la relación del ancho de banda
con las frecuencias de la señal de entrada que ayuda a determinar el ruido en
un sistema.
■ Se recomienda que el ancho de banda de su osciloscopio sea de tres a cinco
veces el componente de interés de frecuencia más alta en la señal medida
para captar la señal con el mínimo error de amplitud.
■ El tiempo de incremento de una señal de entrada es el tiempo de una señal
para hacer la transición de un 10% al 90% de la amplitud máxima de la señal.
■ Se recomienda que el tiempo de incremento del osciloscopio sea de un tercio
a un quinto del tiempo de incremento de la señal medida para captar la señal
con error mínimo en el tiempo de incremento.
■ La velocidad de muestreo es la frecuencia a la que el ADC convierte la forma
de onda de entrada analógica a datos digitales.
■ La velocidad de muestreo debe ser por lo menos el doble de la frecuencia de
interés más alta en la señal, pero la mayoría de las veces debe ser alrededor de
cinco veces mayor.
■ Aliasing es cuando los componentes de frecuencia falsa aparecen en los datos
muestreados.
■ Los bits de resolución se refieren al número de niveles verticales únicos que un
osciloscopio puede utilizar para representar una señal.
■ Cuanto más alta la resolución de un instrumento, mayor la precisión.