0% encontró este documento útil (0 votos)
22 vistas144 páginas

Procesos Digitales

El libro se centra en el diseño acústico de espacios arquitectónicos, proporcionando criterios para lograr condiciones acústicas adecuadas en diferentes tipos de recintos. Se distingue entre acondicionamiento acústico e aislamiento acústico, y busca sensibilizar a arquitectos y diseñadores sobre la importancia de la acústica en sus proyectos. La obra está basada en la experiencia del autor y se estructura en varios capítulos que abordan principios básicos, materiales, y ejemplos prácticos de diseño acústico.

Cargado por

drmaryvel
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
22 vistas144 páginas

Procesos Digitales

El libro se centra en el diseño acústico de espacios arquitectónicos, proporcionando criterios para lograr condiciones acústicas adecuadas en diferentes tipos de recintos. Se distingue entre acondicionamiento acústico e aislamiento acústico, y busca sensibilizar a arquitectos y diseñadores sobre la importancia de la acústica en sus proyectos. La obra está basada en la experiencia del autor y se estructura en varios capítulos que abordan principios básicos, materiales, y ejemplos prácticos de diseño acústico.

Cargado por

drmaryvel
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

BIBLIOGRAFÍA

1.-Acústica y psicoacústica de la música - Cap. 1 “Los


sistemas físicos intervinientes”.
Juan Roederer
2.-Diseño acústico de espacios arquitectónicos - Cap. 1
"Principios básicos del sonido".
Antoni Carrión
3.-Introducción al sonido y a la grabación - Cap. 1 "¿Qué es el
sonido?”.
Francis Rumsey y Tim Mc Cormick
4.- “Empleo de técnicas de análisis tiempo-frecuencia para el
modelado de instrumentos musicales y su aplicación a la síntesis
musical aditiva.” Cap 2 (pags 9 - 14) y Cap 3 (pags 16 - 18)
Yetsibel Gonçalves Molina
5.- Adquirir una Señal Analógica: Ancho de Banda, Teorema
de Muestreo de Nyquist y Aliasing
Grupo Emerson
Antoni Carrión Isbert

Diseño acústico
de espacios
arquitectónicos
00-Primeras páginas ok 7/6/99 11:11 Página 19

Prólogo

El campo de la acústica, como muchos otros campos de la ciencia, es extremadamente amplio.


No en vano engloba disciplinas tan diversas como la acústica ambiental, la acústica musical,
la psicoacústica y la acústica arquitectónica, entre otras.
Este libro se centra exclusivamente en la acústica arquitectónica y, más concretamente,
en el diseño o acondicionamiento acústico de recintos. Dicho de una manera simple, el acon-
dicionamiento acústico consiste en la definición de las formas y revestimientos de las super-
ficies interiores de un recinto con objeto de conseguir las condiciones acústicas más adecua-
das para el tipo de actividad a la que se haya previsto destinarlo. 19
A menudo, el acondicionamiento acústico se confunde con el aislamiento acústico. Esta
temática, si bien complementaria a la anterior, es conceptualmente distinta, ya que se refiere
al conjunto de acciones encaminadas a la obtención de una correcta atenuación en la transmi-
sión de ruido y vibraciones entre los diferentes espacios que integran un recinto.
El libro está destinado a arquitectos, a estudiantes de arquitectura, a los diferentes
colectivos que intervienen directa o indirectamente en el diseño o remodelación de cualquier
tipo de recinto y, en general, a todas aquellas personas interesadas en el campo de la acústica
arquitectónica.
El objetivo básico del libro consiste en proporcionar unos criterios para el diseño acús-
tico de un amplio conjunto de espacios tipo, a fin de cubrir la inmensa mayoría de casos prác-
ticos que se puedan presentar.
El libro está exento de formulación matemática compleja, ya que, desde mi punto de
vista, no se trata de convertir a los lectores en expertos en la materia, sino más bien de pro-
porcionarles unos conocimientos que les permitan dialogar con los especialistas usando una
terminología común. En el caso de los arquitectos, es mi deseo que, a partir de dichos cono-
cimientos, sean capaces de calibrar en cada momento y en su justa medida las repercusiones
a nivel acústico que se puedan derivar de sus planteamientos en la fase de diseño.
El libro es fruto de la experiencia que he ido acumulando a lo largo de mis más de vein-
te años de ejercicio de la profesión, tanto en mi faceta de profesor e investigador universita-
rio, como en la de ingeniero del área de proyectos de sonido del Comité Organizador Olímpi-
co Barcelona 92 y, más recientemente y en paralelo con la primera, como director de la
empresa de consultoría Audioscan, ingeniería del sonido.

© Los autores, 1998; © Edicions UPC, 1998.


00-Primeras páginas ok 7/6/99 11:11 Página 20

DISEÑO ACÚSTICO DE ESPACIOS ARQUITECTÓNICOS π

Para su elaboración me ha sido de gran utilidad el extenso material preparado con moti-
vo de la impartición, en 1.996, del curso de especialización titulado “Acondicionamiento
Acústico de Espacios Arquitectónicos”, dentro de los programas de formación continuada
organizados por la Fundación Politécnica de Cataluña.
En cuanto al contenido del libro, ha sido mi intención respetar al máximo los criterios
de aquellos expertos avalados por una dilatada trayectoria profesional y considerados interna-
cionalmente como autoridades en la materia, y tan sólo me he decidido a exponer aquellos sis-
temas originales propios que han sido merecedores de un reconocimiento público en cuanto a
su valor científico.
El libro está estructurado en siete capítulos y tres apéndices. De todos ellos, solamente
el capítulo 7 y el apéndice 2 están reservados a especialistas.
En el capítulo 1 se exponen los principios básicos relativos a la generación y propaga-
ción del sonido y se describe de forma simplificada el comportamiento del mismo tanto en
espacios abiertos como cerrados.
El capítulo 2 está dedicado a describir los materiales y elementos más comúnmente uti-
lizados en el acondicionamiento acústico de recintos, como son los absorbentes, los reflecto-
res y los difusores del sonido. En el apartado de absorbentes no se han incluido tablas exhaus-
tivas de coeficientes de absorción de materiales, pues se trata de una información que se halla
en la práctica totalidad de libros dedicados a acústica.
En los capítulos 3 a 6 se estudian los diferentes espacios tipo incluidos en el libro. En
cada uno de ellos se exponen los objetivos acústicos que se deben cumplir, se presenta un
20 conjunto de criterios genéricos de diseño y se dan ejemplos prácticos de diseño. El hecho de
que existan conceptos comunes a diferentes espacios tipo ha obligado a un cierto grado de
repetición a fin de que cada capítulo tenga la máxima independencia posible respecto al
resto.
El capítulo 3 está destinado a los espacios de uso comunitario, de uso deportivo y a las
salas de conferencias/aulas. Éste es el único capítulo donde se trata la temática de los siste-
mas de megafonía, aunque de forma muy resumida. Los capítulos 4 y 5 están dedicados, res-
pectivamente, al estudio de teatros y salas de conciertos, por tratarse de espacios de mayor
complejidad y por ser representativos de espacios destinados a la palabra y a la música. En el
capítulo 6 se trata de la acústica variable aplicada a espacios multifuncionales.
Finalmente, en el capítulo 7 se expone la metodología necesaria para establecer la diag-
nosis acústica de un recinto, se presenta un programa de simulación acústica y se describen
algunos de los sistemas actuales de creación de sonido virtual. Asimismo, se presentan dos
ejemplos prácticos de diagnosis acústica de recintos.
Por lo que a los apéndices se refiere, el apéndice 1 está destinado al diseño de difuso-
res unidimensionales de residuo cuadrático, como ampliación de lo expuesto en el capítulo 2
sobre difusores del sonido. En el apéndice 2 se incluye toda la formulación matemática de los
parámetros definidos en los diferentes capítulos. En el apéndice 3 se presenta una tabla con
información relativa a 66 salas de conciertos de prestigio internacional, extraída del libro de
L. Beranek titulado Concert & Opera Halls: How They Sound, publicado en 1.996.
En cuanto a la bibliografía, he optado por dar exclusivamente una bibliografía básica, y
por tanto muy limitada, partiendo de la base de que el lector puede hallar una bibliografía
mucho más extensa simplemente consultando los libros referidos.

© Los autores, 1998; © Edicions UPC, 1998.


00-Primeras páginas ok 7/6/99 11:11 Página 21

π PRÓLOGO

Espero que este libro sirva para aumentar el grado de sensibilización hacia la acústica,
a la vez que sea útil para concienciar a los diferentes colectivos sobre la importancia y tras-
cendencia que el diseño acústico tiene en la calidad final de una sala. Sólo así será posible que
la acústica adquiera el protagonismo que se merece en el contexto de un proyecto de obra civil
ya desde sus primeras etapas de gestación.

Antoni Carrión
Junio de 1998

21

© Los autores, 1998; © Edicions UPC, 1998.


00-Primeras páginas ok 7/6/99 11:11 Página 23

Introducción

Imaginemos por un momento la siguiente escena: entre bastidores, en un nuevo auditorio,


momentos antes del concierto inaugural. Personajes: el director de la orquesta, el arquitecto y
el gerente de la sala. Lógicamente, cada uno estará con la mirada puesta en un aspecto distin-
to: el gerente, pendiente de si todas las localidades van siendo ocupadas; el arquitecto, preo-
cupado de si la obra por él realizada contará con el beneplácito del público; el director, sumi-
do en un grado de máxima concentración con objeto de lograr el acoplamiento perfecto entre
todos los músicos integrantes de la orquesta. 23
Pero entre todos estos deseos subyace una pregunta todavía sin respuesta: ¿cómo sona-
rá el nuevo recinto?
De la respuesta a dicha pregunta dependerá en buen grado la calidad de la interpreta-
ción musical, el éxito del arquitecto y, por ende, el de la sala en cuestión.
¿Cómo sonará el auditorio?, ¿de qué depende la respuesta a dicha pregunta?
Cualquier amante de la música conoce la respuesta: depende de la acústica.
La acústica es una de las ciencias clásicas más jóvenes. La primera referencia escrita
donde se conjugan criterios acústicos y arquitectónicos corresponde al romano Vitruvio en el
siglo I antes de Jesucristo. En su opinión, la geometría de los teatros griegos (en forma de aba-
nico) y de los romanos (la clásica “arena”) estaba basada en una definición previa de la acús-
tica más adecuada en cada caso.
Sin embargo, hasta finales del siglo XIX, la acústica era considerada una ciencia ine-
xacta y, en consecuencia, no resulta extraño que continuamente aparecieran explicaciones eso-
téricas a través de las cuales se pretendían aclarar los “misterios” de esta materia.
Sirva como ejemplo la vieja creencia, totalmente errónea, de que la acústica de una sala
de conciertos mejora con el tiempo, como si se tratase de un buen vino.
En todas las épocas se han construido salas con mejor o peor acústica, y lo cierto es que,
en la mayoría de casos, sólo aquéllas consideradas como excelentes han resistido el transcurso
de los años. Tal vez se podría afirmar que es la reputación de la sala la que puede ir en aumen-
to con el tiempo, en función del prestigio y calidad de los artistas que en ella intervienen.
En cualquier caso, conviene tener presente que los éxitos en el diseño, desde un punto
de vista acústico, eran fruto de una combinación de intuición y experiencia, si bien el princi-

© Los autores, 1998; © Edicions UPC, 1998.


00-Primeras páginas ok 7/6/99 11:11 Página 24

DISEÑO ACÚSTICO DE ESPACIOS ARQUITECTÓNICOS π

pal ingrediente era la suerte: suerte en la definición de las formas y suerte en la elección de
los materiales constructivos.
A pesar del desconocimiento reinante, es bien cierto que ya los primeros compositores
escribían su música pensando en el recinto donde había de ser interpretada, e incluso la ade-
cuaban para que el resultado final fuese óptimo. Es el caso, por ejemplo, de la Pasión según
San Mateo, de J.S. Bach, escrita especialmente para la Thomaskirche, de Leipzig, donde él
había sido cantor. Así las cosas, cabría preguntarse hasta qué punto también los arquitectos
diseñaban conscientemente sus edificios de acuerdo con las necesidades específicas acústico-
musicales, con objeto de lograr una perfecta conjunción entre forma y función. La evolución
de la arquitectura de las iglesias protestantes constituye un buen ejemplo del efecto de las exi-
gencias acústicas sobre el volumen de la sala. Cuando el sermón se convirtió en un elemento
primordial del servicio, el volumen de las iglesias de nueva construcción fue reducido, obte-
niéndose así una mejor comprensión de la palabra como consecuencia de la disminución de
la reverberación.
A finales del siglo XIX, y concretamente en 1.877, el físico inglés lord Rayleigh publi-
có un tratado con el título de Theory of Sound, que contenía los fundamentos teóricos de esta
ciencia y que aún hoy en día sirve de referencia. Con todo, las explicaciones allí vertidas sobre
acústica de salas se limitaban a generalidades del siguiente tipo:
“En relación con la acústica de edificios públicos, hay varios puntos que permanecen
oscuros. ... A fin de evitar la reverberación, a menudo se hace necesario colocar moquetas o
cortinas para absorber el sonido. En algunos casos, la presencia de la audiencia es ya sufi-
24 ciente para conseguir el efecto deseado.”
No es, pues, de extrañar que los arquitectos de la época se mostrasen abiertamente que-
josos por la falta de criterios claros a los que recurrir a la hora de definir las formas de una
sala para obtener una acústica óptima. Éste es el caso de Charles Garnier, arquitecto de la
Ópera de París, que en 1.880 hacía las siguientes manifestaciones:
“Es lamentable que la acústica y yo nunca hayamos llegado a entendernos. Me produ-
ce gran dolor no dominar esta extraña ciencia, pero después de una labor de quince años, ape-
nas he progresado en relación al primer día. ... He leído libros y he hablado con expertos; en
ninguna parte he encontrado una luz que me guíe; al contrario, únicamente afirmaciones con-
trapuestas.”
No deja de ser curioso que en una época caracterizada por descubrimientos revolucio-
narios en campos como el de la física atómica, el progreso de la acústica, que pretende expli-
car un fenómeno tan cotidiano como es el comportamiento del sonido en un recinto, fuese tan
lento. Con toda seguridad, el motivo principal de tal paradójica situación no era otro que la
falta de equipamiento electrónico con el que poder hacer mediciones objetivas. En efecto, el
único sistema del que se disponía era el oído humano, pero su rápida adaptación a cualquier
tipo de recinto con independencia de su comportamiento acústico imposibilitaba su empleo
como instrumento de medida.
Los ruegos de Garnier y otros prestigiosos arquitectos fueron atendidos al otro lado del
Atlántico cuando, en 1.895, Wallace Clement Sabine empezó su trabajo pionero encaminado
a la aplicación de la acústica en la arquitectura.
W.C. Sabine, profesor asociado del departamento de Física de la Universidad de Har-
vard, se había dedicado inicialmente a los campos de la óptica y la electricidad. Su cambio de

© Los autores, 1998; © Edicions UPC, 1998.


00-Primeras páginas ok 7/6/99 11:11 Página 25

π INTRODUCCIÓN

rumbo científico se produjo cuando el rector de la Universidad le solicitó que se ocupase de


buscar una solución para la pésima acústica del recién construido Fogg Art Museum. A pesar
de la precariedad de medios de que disponía, fue capaz de encontrarla con extrema diligencia;
la consecuencia fue inmediata: recibió el encargo de realizar el estudio acústico del nuevo
Boston Music Hall. En un principio Sabine dudó, pero acabó aceptando. Ante todo se dedicó
a revisar los datos experimentales que había recopilado en su anterior experiencia. La noche
del 29 de octubre de 1.898, y de forma repentina, encontró una justificación analítica a los
resultados recopilados, gritando a su madre, la única persona que se encontraba en su casa:
“¡Mamá, es una hipérbola!”. Acababa de descubrir que la reverberación de un recinto era
inversamente proporcional a la cantidad de absorción del mismo. Había nacido la célebre
ecuación de reverberación de Sabine, utilizada universalmente hasta nuestros días como pará-
metro primordial para la caracterización acústica de una sala.
La acústica se consolidó como una nueva ciencia a partir de los años 30, con posterio-
ridad a la prematura muerte de Sabine, en 1.919, fundamentalmente por el desarrollo de la tec-
nología de micrófonos, amplificadores a válvulas y altavoces, y su utilización como herra-
mienta habitual en trabajos de campo. Posteriormente, con la evolución de los equipos
electrónicos de medición, ha sido posible relacionar una serie de parámetros subjetivos tales
como: inteligibilidad de la palabra, claridad musical, reverberación, envolvente espacial del
sonido o intimidad acústica con otros parámetros objetivos obtenidos directamente a partir de
mediciones efectuadas “in situ”.
En las últimas décadas, y en el campo de la simulación acústica, se han venido utili-
zando mayoritariamente dos sistemas completamente diferentes, aunque complementarios: las 25
maquetas y los programas informáticos.
Las maquetas son modelos del recinto construidos a escala que permiten estudiar el
comportamiento de las ondas sonoras en su interior. A partir de una serie de medidas efec-
tuadas sobre las mismas, y siguiendo un proceso de extrapolación, es posible obtener unos
resultados orientativos en cuanto al comportamiento acústico del local. Con objeto de optimi-
zar la simulación, los factores de escala más comúnmente utilizados han sido 1:8 y 1:10. Sin
embargo, el espacio requerido para su ubicación, el coste y el tiempo de construcción, y en
especial la aparición de paquetes de software específicamente diseñados para aplicaciones en
los campos de la acústica y la sonorización, han hecho que su utilización actual quede prácti-
camente circunscrita a proyectos de gran prestigio y envergadura.
El advenimiento de los programas de simulación acústica, al inicio de la década de los
80, supuso un salto cualitativo importante en la mejora de las previsiones efectuadas en rela-
ción con los resultados finales, con el recinto construido. Dichas previsiones consistían en un
cálculo estimativo de los parámetros acústicos más representativos del recinto, y supusieron
un notable avance en cuanto a tiempo y dinero respecto al empleo exclusivo de maquetas.
Como complemento a ambos sistemas aparecen, ya en la década de los 90, los deno-
minados sistemas de creación de sonido virtual, que permiten llevar a cabo lo que se ha con-
venido en llamar “auralización”. La “auralización” es el proceso a través del cual es posible
realizar una escucha, en cualquier punto de un recinto, de un mensaje oral o un pasaje musi-
cal, con la particularidad de que ello se lleva a cabo de forma virtual (antes de que dicho recin-
to se haya construido o remodelado). La mencionada escucha se puede efectuar mediante alta-
voces o, preferentemente, por medio de auriculares.

© Los autores, 1998; © Edicions UPC, 1998.


00-Primeras páginas ok 7/6/99 11:11 Página 26

DISEÑO ACÚSTICO DE ESPACIOS ARQUITECTÓNICOS π

En la actualidad, la existencia de programas de simulación más potentes y perfecciona-


dos y de sistemas de creación de sonido virtual más evolucionados ha representado un avan-
ce significativo en la modelización acústica de recintos, tanto en la fase de diseño como en la
fase de análisis.
En la fase de diseño, constituyen una herramienta extremadamente útil, al facilitar la
toma de decisiones en cuanto a formas y revestimientos interiores óptimos del recinto.
En la fase de análisis, permiten predecir con un elevado grado de fiabilidad cuál será el
comportamiento acústico de una sala, a partir del conocimiento de las formas y de los mate-
riales propuestos como acabados interiores de la misma.
Del diseño acústico de un conjunto representativo de espacios tipo, así como del esta-
do actual de los programas de simulación acústica y de los sistemas de creación de sonido vir-
tual, se tratará a lo largo de los siete capítulos de que consta este libro.

26

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 27

1
Principios básicos del sonido

1.1 Definición del sonido

El sonido se puede definir de formas muy diversas. De todas ellas, las más habituales son las
siguientes:

➤ Vibración mecánica que se propaga a través de un medio material elástico y denso


(habitualmente el aire), y que es capaz de producir una sensación auditiva. De dicha 27
definición se desprende que, a diferencia de la luz, el sonido no se propaga a través del
vacío y, además, se asocia con el concepto de estímulo físico.
➤ Sensación auditiva producida por una vibración de carácter mecánico que se propaga a
través de un medio elástico y denso.

1.2 Generación y propagación del sonido

El elemento generador del sonido se denomina fuente sonora (tambor, cuerda de un violín,
cuerdas vocales, etc.). La generación del sonido tiene lugar cuando dicha fuente entra en
vibración. Dicha vibración es transmitida a las partículas de aire adyacentes a la misma que,
a su vez, la transmiten a nuevas partículas contiguas.
Las partículas no se desplazan con la perturbación, sino que simplemente oscilan alre-
dedor de su posición de equilibrio. La manera en que la perturbación se traslada de un lugar
a otro se denomina propagación de la onda sonora.
Si se considera como fuente sonora, por ejemplo, un tambor, un golpe sobre su mem-
brana provoca una oscilación. Cuando la membrana se desplaza hacia fuera, las partículas de
aire próximas a su superficie se acumulan creándose una zona de compresión, mientras que
en el caso contrario, dichas partículas se separan, lo cual da lugar a una zona de enrareci-
miento o dilatación (figura 1.1).
La oscilación de las partículas tiene lugar en la misma dirección que la de propagación
de la onda. En este caso se habla de ondas sonoras longitudinales, en contraposición a las

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 28

DISEÑO ACÚSTICO DE ESPACIOS ARQUITECTÓNICOS π

Fig. 1.1 Zonas de compresión y dilatación de las partículas de aire en la propagación de una onda sonora

ondas electromagnéticas que son transversales (oscilación de la señal generadora perpendicu-


lar a la dirección de propagación de la onda).
La manera más habitual de expresar cuantitativamente la magnitud de un campo sono-
ro es mediante la presión sonora, o fuerza que ejercen las partículas de aire por unidad de
superficie.
En la figura 1.2 se observa la evolución de la presión PT, en función del tiempo, en un
28 punto situado a una distancia cualquiera de la fuente sonora. Dicha presión se obtiene como
suma de la presión atmosférica estática P0
y la presión asociada a la onda sonora p.
Se observan incrementos y dismi- Presión sonora total PT
nuciones periódicas de presión sonora
P 0+ P
alrededor de su valor de equilibrio, corres-
pondiente a la presión atmosférica estática
P0. Dichas variaciones van asociadas a los P0
procesos de compresión y dilatación Tiempo (s)
comentados anteriormente. El valor máxi-
mo de la oscilación respecto a P0 recibe el P 0- P

nombre de amplitud de la presión asocia-


da a la onda sonora, y se representa por la Fig. 1.2 Evolución de la presión sonora total PT en
letra P. función del tiempo en un punto cualquiera del espacio

1.3 Frecuencia del sonido (f)

El número de oscilaciones por segundo de la presión sonora p se denomina frecuencia (f) del
sonido y se mide en hertzios (Hz) o ciclos por segundo (c/s).
Lógicamente, la frecuencia del sonido coincide con la frecuencia de la vibración mecá-
nica que lo ha generado (en el ejemplo anterior, la frecuencia de oscilación de la membrana
del tambor).

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 29

π PRINCIPIOS BÁSICOS DEL SONIDO

En la figura 1.3 se observan dos ejemplos de presión sonora p asociada a oscilaciones


de diferente frecuencia.

Presión sonora p Presión sonora p


1 Hz 10 Hz
P P

0 0
Tiempo (s) Tiempo (s)

-P -P

1s 1s

Fig. 1.3 Ejemplos de oscilaciones de frecuencias 1 y 10 Hz

1.4 Espectro frecuencial

La gran mayoría de los sonidos que percibimos no constan únicamente de una sola frecuen-
cia, sino que están constituidos por múltiples frecuencias superpuestas. Incluso cada uno de
los sonidos generados por un instrumento musical están formados por más de una frecuencia. 29
Se puede conocer qué frecuencias componen un sonido observando el denominado espec-
tro frecuencial (o simplemente espectro) del mismo, entendiendo por tal la representación grá-
fica de las frecuencias que lo integran junto con su correspondiente nivel de presión sonora.

1.5 Clasificación de los sonidos

Los sonidos se dividen en deterministas y aleatorios. Los primeros se pueden representar


siempre mediante una expresión matemática que indica la forma en que varía la correspon-
diente presión sonora en función del tiempo. Los segundos, en cambio, van asociados a vibra-
ciones irregulares que nunca se repiten exactamente y que, por tanto, solamente se pueden
describir mediante parámetros estadísticos.
A continuación se definen los sonidos más representativos pertenecientes a cada grupo.

1.5.1 Sonidos deterministas

1.5.1.1 Sonido periódico simple (tono puro)

Es el tipo más simple de sonido existente en la naturaleza. Se compone de una única frecuen-
cia (f0) constante, por lo que su espectro está constituido por una sola raya (figura 1.4). El
sonido producido por un diapasón es de este tipo.

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 30

DISEÑO ACÚSTICO DE ESPACIOS ARQUITECTÓNICOS π

Presión sonora p Espectro frecuencial

Tiempo (s)

f0 Frecuencia (Hz)

Fig. 1.4 Tono puro y su espectro frecuencial

1.5.1.2 Sonido periódico complejo

Sonido caracterizado por una frecuencia origen, denominada fundamental o primer armónico,
y un conjunto finito (y a veces infinito) de frecuencias múltiplos de ésta, denominados armó-
nicos. Por regla general, la frecuencia fundamental es la que lleva asociada más potencia sono-
ra. La mayoría de instrumentos musicales producen este tipo de sonidos.
En la figura 1.5 se representa un sonido de este tipo formado por una frecuencia fun-
30 damental o primer armónico (f0) y su tercer armónico (3f0).

Presión sonora p

1er armónico Sonido periódico complejo Espectro frecuencial


3er armónico (1er + 3er armónicos)

Tiempo (s)

f0 3f0 Frecuencia (Hz)

Fig. 1.5 Sonido periódico complejo y su espectro frecuencial

1.5.1.3 Sonido transitorio

Sonido resultante de la brusca liberación de energía bajo la forma, por ejemplo, de explosio-
nes o impactos. Es de aparición repentina y tiene una duración breve. A diferencia de los soni-
dos periódicos comentados anteriormente, contiene un gran número de componentes frecuen-

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 31

π PRINCIPIOS BÁSICOS DEL SONIDO

ciales que no guardan una relación armónica entre sí, sino que forman un espectro continuo.
Una palmada constituye un ejemplo de este tipo de sonidos.
En la figura 1.6 se representa un sonido transitorio denominado pulso rectangular, así
como su espectro frecuencial.

Presión sonora p Espectro frecuencial

Tiempo (s) Frecuencia (Hz)

Fig. 1.6 Pulso rectangular y su espectro frecuencial

1.5.2 Sonidos aleatorios


31
Los sonidos aleatorios están formados por muchas frecuencias de valor impredecible. Habi-
tualmente reciben el nombre de ruidos (ruido = sonido no deseado).
En este caso, en lugar de utilizar el espectro frecuencial, se hace uso de la llamada den-
sidad espectral de potencia, es decir, de la potencia sonora por unidad de frecuencia.
Un sonido aleatorio característico es el ruido blanco. Se define como aquel ruido que
presenta una densidad espectral de potencia constante. Un ejemplo de este tipo de ruido es el
generado por una cascada de agua.
En la figura 1.7 se aprecia la evolución temporal de un sonido aleatorio y su corres-
pondiente densidad espectral de potencia.

Presión sonora p Densidad espectral de potencia

Tiempo (s)

Frecuencia (Hz)

Fig. 1.7 Sonido aleatorio y correspondiente densidad espectral de potencia

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 32

DISEÑO ACÚSTICO DE ESPACIOS ARQUITECTÓNICOS π

1.6 Banda de frecuencias

Las notas inferior y superior de un piano de 88 teclas tienen unas frecuencias fundamentales
de 27,5 Hz y 4.400 Hz, respectivamente. La primera corresponde a un sonido muy grave,
mientras que la segunda va asociada a uno muy agudo. Por consiguiente, un sonido grave está
caracterizado por una frecuencia baja, en tanto que uno agudo lo está por una frecuencia alta.
El conjunto de frecuencias situado entre ambos extremos se denomina banda o margen de fre-
cuencias del piano. Dicha definición es válida para cualquier fuente sonora.
En la figura 1.8 se muestran las bandas de frecuencias asociadas a diversos instrumen-
tos musicales y a la voz humana.

16 31,5 63 125 250 500 1.000 2.000 4.000 8.000 16.000


VOZ
Soprano
Contralto
Tenor
Bajo

VIENTO-MADERA
Pícolo
Flauta
Oboe
Clarinete

VIENTO-METAL
Trompeta
Trompa
Trombón
32 Tuba

CUERDA
Violín
Viola
Violoncelo
Contrabajo
Guitarra
TECLADO
Piano
Órgano

PERCUSIÓN
Celeste
Xilófono

16 31,5 63 125 250 500 1.000 2.000 4.000 8.000 16.000 Frecuencia (Hz)

Fig. 1.8 Bandas de frecuencias de instrumentos musicales y de la voz

En el caso de la audición humana, la banda de frecuencias audibles para una persona


joven y sana se extiende, aproximadamente, de 20 Hz a 20.000 Hz (o bien 20 kHz). Las fre-
cuencias inferiores a 20 Hz se llaman subsónicas y las superiores a 20 kHz ultrasónicas, dando
lugar a los infrasonidos y ultrasonidos, respectivamente.

1.7 Velocidad de propagación del sonido (c)

La velocidad de propagación del sonido (c) es función de la elasticidad y densidad del medio
de propagación. Debido a que, en el aire, ambas magnitudes dependen de la presión atmosfé-

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 33

π PRINCIPIOS BÁSICOS DEL SONIDO

rica estática P0 y de la temperatura, resulta que, considerando las condiciones normales de


1 atmósfera de presión y 22 °C de temperatura, la velocidad de propagación del sonido es de,
aproximadamente, 345 m/s.
Si bien el aire constituye el medio habitual de propagación de las ondas sonoras, con-
viene tener presente que el sonido puede propagarse a través de cualquier otro medio elástico
y denso. Cuanto más denso y menos elástico sea el medio, mayor será la velocidad del soni-
do a su través. Por ejemplo, la velocidad de propagación del sonido generado por un tren a tra-
vés de los raíles es mucho mayor que a través del aire, por lo que la vibración del raíl se per-
cibirá mucho antes que el sonido aéreo debido a dicho tren.

1.8 Longitud de onda del sonido (λ)

Una vez definidos los conceptos fundamentales de frecuencia y velocidad de propagación del
sonido, es preciso definir otro concepto básico que guarda una estrecha relación con ambos:
la longitud de onda del sonido (λ).
Se define como la distancia entre dos puntos consecutivos del campo sonoro que se
hallan en el mismo estado de vibración en cualquier instante de tiempo. Por ejemplo, si en un
instante dado se seleccionan dos puntos consecutivos del espacio donde los valores de presión
son máximos, la longitud de onda es precisamente la distancia entre ambos puntos (figura 1.9).

33
Presión sonora total PT

P 0+ P

P0
Distancia (m)

P 0- P

Fig. 1.9 Longitud de onda (λ) del sonido

La relación entre las tres magnitudes: frecuencia (f), velocidad de propagación (c) y
longitud de onda (λ), viene dada por la siguiente expresión:

λ = c/f

Según se observa, para cada frecuencia, la longitud de onda depende del medio de pro-
pagación, ya que es proporcional a la velocidad, y ésta varía para cada medio.
Por otro lado, se puede ver que la longitud de onda y la frecuencia son inversamente
proporcionales, es decir, cuanto mayor es f menor es λ, y viceversa.
Por ejemplo, en el aire, las longitudes de onda correspondientes a la banda de frecuen-
cias audibles se hallan situadas entre 17,25 m (f = 20 Hz) y 1,72 cm (f = 20 kHz).

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 34

DISEÑO ACÚSTICO DE ESPACIOS ARQUITECTÓNICOS π

En la figura 1.10 se presenta un nomograma que relaciona λ con f, suponiendo que el


medio de propagación es el aire.

Longitud de onda (m)


20 10 5 2 1 0,5 0,2 0,1 0,05

10 20 50 100 200 500 1.000 2.000 5.000 10.000

Frecuencia f (Hz)

Fig. 1.10 Relación entre longitud de onda (λ) y frecuencia (f) en el aire

1.9 Nivel de presión sonora (SPL)

34 Según se ha mencionado en el apartado 1.2, la presión sonora constituye la manera más habi-
tual de expresar la magnitud de un campo sonoro. La unidad de medida es el Newton/metro2
(N/m2) o Pascal (Pa).
En principio, el valor a considerar es la diferencia entre el valor fluctuante de la presión
sonora total PT y su valor de equilibrio P0. Debido a la variación de dicha magnitud con el
tiempo, se utiliza como valor representativo su promedio temporal, que recibe el nombre de
valor eficaz o r.m.s. (“root-mean-square”).
Ahora bien, la utilización de dicho valor eficaz da lugar a una serie de problemas cuyo
origen se halla en el comportamiento del oído humano y que a continuación se exponen:

➤ La gama de presiones a las que responde el oído, desde el valor umbral de audición
hasta el que causa dolor, es extraordinariamente amplia. En concreto, la presión eficaz
sonora más débil que puede ser detectada por una persona, a la frecuencia de 1 kHz, es
de 2 x 10-5 Pa, mientras que el umbral de dolor tiene lugar para una presión eficaz del
orden de 100 Pa (milésima parte de la presión atmosférica estática P0 ≈ 105 Pa, equiva-
lente a 1 atmósfera). En consecuencia, la escala de presiones audibles cubre una gama
dinámica de, aproximadamente, 1 a 5.000.000. Es obvio, pues, que la aplicación direc-
ta de una escala lineal conduciría al uso de números inmanejables.
➤ Nuestro sistema auditivo no responde linealmente a los estímulos que recibe, sino que
más bien lo hace de forma logarítmica. Por ejemplo, si la presión de un tono puro de 1
kHz se dobla, la sonoridad, o sensación subjetiva producida por el mismo, no llegará a
ser el doble. De hecho, para obtener una sonoridad doble, es necesario multiplicar la
presión sonora por un factor de 3,16.

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 35

π PRINCIPIOS BÁSICOS DEL SONIDO

Por los dos motivos expuestos, resulta razonable y conveniente hacer uso de una esca-
la logarítmica para representar la presión sonora. Dicha escala se expresa en valores relativos
a un valor de referencia. Se trata de la presión eficaz correspondiente al umbral de audición,
a 1 kHz (2 x 10-5 Pa). En tal caso, se habla de nivel de presión sonora SPL o Lp. La unidad uti-
lizada es el decibelio (dB). En el apéndice 2 se da la correspondiente expresión matemática.
La utilización del umbral de audición como referencia tiene como objetivo que todos
los sonidos audibles sean representados por valores SPL positivos.
El uso de dB reduce la dinámica de presiones sonoras de 1:5 x 106 a niveles de presión
sonora de 0 a 135 dB, donde 0 dB representa una presión igual al umbral de audición (no sig-
nifica, por tanto, ausencia de sonido) y 135 dB el umbral aproximado de dolor. De esta mane-
ra, las cifras manejadas son mucho más simples y, además, se dan las siguientes relaciones
entre cambios de nivel sonoro y su efecto subjetivo:

➤ 1 dB: mínimo cambio de nivel sonoro perceptible


➤ 5 dB: cambio de nivel claramente percibido
➤ 10 dB: incremento asociado a una sonoridad doble

En la tabla 1.1 se muestran los niveles de presión sonora correspondientes a una serie
de sonidos y ruidos típicos, junto con la valoración subjetiva asociada.

35
FUENTE SONORA NIVEL DE PRESIÓN SONORA SPL (dB) VALORACIÓN SUBJETIVA DEL NIVEL

Despegue avión (a 60 m) 120 Muy elevado


Edificio en construcción 110
Martillo neumático 100
Camión pesado (a 15 m) 90 Elevado
Calle (ciudad) 80
Interior automóvil 70
Conversación normal (a 1 m) 60 Moderado
Oficina, aula 50
Sala de estar 40
Dormitorio (noche) 30 Bajo
Estudio de radiodifusión 20

Tabla 1.1 Niveles de presión sonora correspondientes a sonidos y ruidos típicos, y valoración subjetiva asociada

En la figura 1.11 se representan los niveles medios de presión sonora a 1 m de distan-


cia producidos por una persona hablando con diferentes intensidades de voz.

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 36

DISEÑO ACÚSTICO DE ESPACIOS ARQUITECTÓNICOS π

90

Nivel del habla a 1 metro (dB)


80

70

60

50
Baja Normal Alta Muy alta Grito
Intensidad de la voz

Fig. 1.11 Niveles medios de presión sonora SPL, a 1 m de distancia, producidos


por una persona hablando con diferentes intensidades de voz

1.10 Percepción del sonido en función de la frecuencia

1.10.1 Relación entre niveles de presión sonora (SPL) y frecuencia (f)

Como se ha comentado en el apartado 1.6, la banda de frecuencias audibles para una persona
joven con una audición normal, va desde 20 Hz (sonidos más graves) hasta 20.000 Hz ó 20
36 kHz (sonidos más agudos).
Ahora bien, el oído humano no tiene la misma sensibilidad para todo este margen de
frecuencias. En la figura 1.12 se observa la variación de los umbrales de audición y de dolor
en función de la frecuencia.

140

Umbral de dolor
Nivel de presión sonora SPL (dB)

120

100

80

60

40

20

Umbral de audición
0

20 31,5 63 125 250 500 1.000 2.000 4.000 8.000 16.000

Frecuencia (Hz)

Fig. 1.12 Niveles audibles en función de la frecuencia

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 37

π PRINCIPIOS BÁSICOS DEL SONIDO

A partir de la observación de la figura 1.12, se extraen las siguientes conclusiones:


➤ Para niveles bajos de presión sonora, el oído es muy insensible a bajas frecuencias, es decir,
el nivel de presión sonora de un sonido grave tiene que ser mucho más elevado que el
correspondiente a un sonido de frecuencias medias para que ambos produzcan la misma
sonoridad. Por ejemplo, un nivel SPL = 70 dB, a 20 Hz, produce la misma sonoridad que
un nivel SPL = 5 dB, a 1 kHz (sonoridad = sensación subjetiva de nivel sonoro).
➤ Para dichos niveles bajos, el oído también presenta una cierta atenuación a altas fre-
cuencias.
➤ A medida que los niveles aumentan, el oído tiende a responder de forma más homogé-
nea en toda la banda de frecuencias audibles, hasta el punto de que cuando son muy ele-
vados, la sonoridad asociada a tonos puros de diferente frecuencia es muy parecida.
Este cambio de comportamiento del oído en función del nivel de señal explica el hecho
de que al subir el volumen del amplificador de un equipo de música, se percibe un mayor con-
tenido de graves y agudos del pasaje musical reproducido. Igualmente pone de manifiesto la
confusión que puede surgir al seleccionar unas cajas acústicas de parecida calidad: las de
mayor rendimiento, y que por tanto radian más potencia sonora para la misma potencia eléc-
trica aplicada, pueden producir la sensación de que suenan mejor, exclusivamente debido a
que la percepción de graves y agudos es mayor.
Una vez descrito el comportamiento del oído humano desde el punto de vista de la per-
cepción de niveles en función de la frecuencia, es conveniente establecer una comparación
entre los mismos y las zonas representativas de generación sonora asociada a la voz humana 37
y a los instrumentos musicales convencionales (figura 1.13).

140

Umbral de dolor
120
Nivel de presión sonora SPL (dB)

100

Música
80

60
Palabra

40

20

Umbral de audición
0

20 31,5 63 125 250 500 1.000 2.000 4.000 8.000 16.000

Frecuencia (Hz)
Fig. 1.13 Niveles audibles en función de la frecuencia junto
con las zonas correspondientes a la música y a la palabra

Según se puede apreciar, la capacidad de la persona como receptora del sonido es


mucho mayor que como emisora.

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 38

DISEÑO ACÚSTICO DE ESPACIOS ARQUITECTÓNICOS π

1.10.2 Enmascaramiento del sonido

Cuando el oído está expuesto a dos o más tonos puros de frecuencias diferentes, existe la posi-
bilidad de que uno de ellos enmascare los demás y, por tanto, evite su percepción de forma
parcial o total. Del mismo modo, es evidente la dificultad que entraña entender una conver-
sación en presencia de ruido.
El fenómeno del enmascaramiento se explica de una manera simplificada consideran-
do la forma en que la denominada membrana basilar es excitada por tonos puros de diferente
frecuencia. La membrana basilar se extiende a lo largo de la cóclea (conducto en forma de
caracol de sección prácticamente circular alojado en el interior del oído interno), desde la lla-
mada ventana oval (zona de separación entre el oído medio y el oído interno) hasta el extre-
mo superior de aquélla.
En la figura 1.14 se muestra la amplitud relativa del desplazamiento de la membrama
basilar en función de la distancia a la ventana oval, para cuatro tonos de frecuencia diferente.

1600
1.600 Hz 400
400 Hz 200
200 Hz 50HzHz
50
Amplitud relativa

38
0
0 10 20
20 30
30 40
40
Distancia a la ventana oval (mm)

Fig. 1.14 Amplitud relativa del desplazamiento de la membrana basilar para diferentes tonos puros

Se observa que los tonos de alta frecuencia producen un desplazamiento máximo en la


zona próxima a la ventana oval y que, a medida que la frecuencia disminuye, dicho máximo
se va desplazando hacia puntos más alejados de la misma.
Por otra parte, la excitación es asimétrica puesto que presenta una cola que se extiende
hacia la ventana oval (zona de frecuencias altas), mientras que por el lado contrario (frecuen-
cias bajas) sufre una brusca atenuación.
La consecuencia de tal asimetría es que un tono de baja frecuencia puede enmascarar
otro de frecuencia más elevada, tanto más, cuanto mayor sea su nivel de presión sonora. Ello
es debido a que la zona de frecuencias cubierta por su cola será más extensa. En cambio, al
considerar la situación inversa, el grado de enmascaramiento es claramente inferior.
La figura 1.15 muestra el efecto de enmascaramiento entre dos tonos puros A y B en
cuatro situaciones distintas, por lo que a frecuencias y niveles asociados se refiere.
a) La frecuencia del tono A es mayor que la del tono B y los niveles son semejantes →
enmascaramiento inapreciable
b) La frecuencia del tono A es ligeramente mayor que la del tono B y los niveles son seme-
jantes → el tono B enmascara parcialmente el A
c) La frecuencia del tono A es mayor que la del tono B, mientras que su nivel es bastante
inferior → se produce un enmascaramiento prácticamente total

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 39

π PRINCIPIOS BÁSICOS DEL SONIDO

d) La frecuencia y el nivel del tono A son superiores a las del tono B → el enmascara-
miento producido es mínimo
Alta frecuencia Baja frecuencia
A B

(a)

Ventana Oval
A B
(b)
B

A
(c)

A
B

(d)

Fig. 1.15 Respuesta de la membrana basilar a diferentes combinaciones de tonos puros

1.11 Medición del sonido: el sonómetro

Debido a la complejidad del funcionamiento del oído humano, hasta el momento actual no 39
ha sido posible diseñar un aparato de medida objetiva del sonido que sea capaz de dar unos
resultados del todo equivalentes, para cualquier tipo de sonido, a las valoraciones subjetivas
asociadas al mismo. Sin embargo, resulta evidente la necesidad de disponer de un instru-
mento electrónico que permita medir sonidos bajo unas condiciones rigurosamente prefija-
das, de manera que los resultados obtenidos sean siempre objetivos y repetitivos, dentro de
unos márgenes de tolerancia conocidos. Dicho aparato recibe el nombre de sonómetro (f igu-
ra 1.16).

Fig. 1.16 Diferentes modelos de sonómetros convencionales (Dicesva, S.L.)

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 40

DISEÑO ACÚSTICO DE ESPACIOS ARQUITECTÓNICOS π

El sonómetro mide exclusivamente niveles de presión sonora. Su unidad de procesado


permite realizar medidas globales, o bien por bandas de frecuencias, con diferentes respues-
tas temporales (respuestas “Fast”, “Slow”, “Impulse” o “Peak”).
Por otro lado, con el fin de reducir al máximo las posibles diferencias entre las medi-
ciones efectuadas con sonómetros de distintas marcas y modelos, existen unas normas inter-
nacionales a las que deben ceñirse los fabricantes de tales instrumentos.
En Europa, las más representativas son las normas CEI (Comisión Electrotécnica Inter-
nacional) y, en concreto, las CEI 60651 y CEI 60804. Las normas equivalentes en España son,
respectivamente, la UNE-EN 60651 y la UNE-EN 60804.

1.11.1 Medidas globales. Escala lineal y red de ponderación A

1.11.1.1 Escala lineal

La medida del nivel de presión sonora SPL o Lp utilizando dicha escala significa que no se
aplica ningún tipo de acentuación ni atenuación a ninguna de las frecuencias integrantes del
sonido objeto de análisis.

1.11.1.2 Red de ponderación A


40
Debido a la diferente sensibilidad del oído a las distintas frecuencias, los valores obtenidos
haciendo uso de la escala lineal no guardan una relación directa con la sonoridad del sonido
en cuestión. Con objeto de que la medida realizada sea más representativa de la sonoridad aso-
ciada a un sonido cualquiera, los sonómetros incorporan la llamada red de ponderación A. En
la figura 1.17 se representa la curva de respuesta correspondiente a dicha red de ponderación.
Obsérvese que la frecuencia de 1 kHz queda inalterada y, por tanto, se puede conside-
rar de referencia, y que para frecuencias inferiores existe una importante atenuación de nivel.
Nivel relativo de presión sonora (dB)

10

-10

-20

-30

-40

-50

-60

-70
10 100 1.000 10.000

Frecuencia (Hz)

Fig. 1.17 Red de ponderación A

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 41

π PRINCIPIOS BÁSICOS DEL SONIDO

Los niveles de presión sonora medidos con la red de ponderación A se representan con
las letras LA y se expresan en dBA o dB(A).

1.11.2 Filtros para análisis frecuencial

En la mayoría de casos no es suficiente conocer el nivel de presión sonora total Lp y el nivel


ponderado LA , sino que es necesario disponer de una información más detallada de su espec-
tro, es decir, de su contenido energético a distintas frecuencias. Es lo que se ha convenido en
llamar análisis frecuencial de la señal.
Con este fin, existen sonómetros que incorporan un conjunto de filtros eléctricos, cada
uno de los cuales sólo deja pasar aquellas frecuencias que están dentro de una banda de fre-
cuencias determinada (habitualmente se trabaja con bandas de 1 octava). La banda de 1 octa-
va incluye todas las frecuencias comprendidas entre una frecuencia dada y la frecuencia doble.
Dicha denominación tiene su origen en el lenguaje musical. En la tabla 1.2 se indican las fre-
cuencias centrales de tales bandas, según prescribe la norma ISO 266.

FRECUENCIAS CENTRALES DE LAS BANDAS DE OCTAVA ESTANDARIZADAS (ISO 266)


16 31,5 63 125 250 500 1.000 2.000 4.000 8.000 16.000

Tabla 1.2 Frecuencias centrales de las bandas de octava estandarizadas según la norma ISO 266, en Hz
41

Por otra parte, las 6 bandas de octava cuyas frecuencias centrales están comprendidas
entre 125 Hz y 4.000 Hz son las que generalmente se consideran tanto en la fase de diseño
acústico como en la de diagnosis acústica de recintos, según se verá a lo largo de los próxi-
mos capítulos.

1.11.3 El sonómetro integrador

El sonómetro integrador realiza medidas del nivel de presión sonora obtenido como resultado
de promediar linealmente la presión sonora cuadrática instantánea a lo largo del tiempo de
medida. Dicha medida se denomina nivel continuo equivalente de presión sonora y se desig-
na por Leq.
Este tipo de sonómetro representa la alternativa actual al sonómetro convencional, ya
que permite disponer de tiempos de promediado más largos, pudiendo llegar a muchos minu-
tos o, incluso, horas.
Habitualmente, las medidas se realizan utilizando la red de ponderación A, en cuyo caso
la designación correcta sería LAeq. Ahora bien, como la ponderación A está totalmente gene-
ralizada, la representación mediante las letras Leq supone implícitamente el uso de la ponde-
ración A, a menos que se indique expresamente lo contrario.
El nivel Leq se utiliza como criterio de valoración del ruido ocupacional, de acuerdo con
la norma ISO 1999.

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 42

DISEÑO ACÚSTICO DE ESPACIOS ARQUITECTÓNICOS π

1.12 Criterios de evaluación del ruido de fondo en un recinto. Curvas NC

La evaluación objetiva del grado de molestia que un determinado ruido ambiental provoca en
un oyente se realiza por comparación de los niveles de ruido existentes en un recinto, en cada
banda de octava comprendida entre 63 Hz y 8 kHz, con un conjunto de curvas de referencia
denominadas NC (“Noise Criteria”).
Las curvas NC son, además, utilizadas de forma generalizada para establecer los nive-
les de ruido máximos recomendables para diferentes tipos de recintos en función de su apli-
cación (oficinas, salas de conferencias, teatros, salas de conciertos, etc.).
Se dice que un recinto cumple una determinada especificación NC (por ejemplo: NC-
20) cuando los niveles de ruido de fondo, medidos en cada una de dichas bandas de octava,
están por debajo de la curva NC correspondiente (figura 1.18).
Nivel de presión sonora SPL (dB)

100
90
80
NC 70
70
60 NC 60
50 NC 50

40 NC 40
30 NC 30

20 NC 20
42 10 NC 15
0
63 125 250 500 1.000 2.000 4.000 8.000
Frecuencia (Hz)

Fig. 1.18 Curvas NC (“Noise Criteria”)

Según se puede observar, las curvas NC siguen de forma aproximada la evolución de la


sensibilidad del oído en función de la frecuencia. Ello significa que, para una determinada
curva NC, los niveles SPL máximos permitidos a bajas frecuencias (sonidos graves) son siem-
pre más elevados que los correspondientes a frecuencias altas (sonidos agudos), ya que el oído
es menos sensible a medida que la frecuencia considerada es menor.
Lógicamente, para verificar el cumplimiento de una determinada especificación NC, es
necesario analizar el ruido de fondo presente en el recinto por bandas de octava.
Ahora bien, el nivel de ruido de fondo en un recinto se puede representar, alternativa-
mente, por el nivel global de presión sonora LA o Leq (medidos en dBA). Se puede comprobar
que, a partir de la curva NC-35, dicho nivel está aproximadamente 10 dB por encima del
correspondiente valor NC. Por ejemplo, si el nivel de ruido de fondo existente en un recinto
es de 50 dBA, ello significa que dicho recinto cumple la especificación NC-40.
En consecuencia, la medida del nivel global LA o Leq constituye una forma indirecta y
aproximada de determinar la curva NC de una sala cuando no se dispone de un sonómetro con
filtros para el análisis frecuencial.
En la tabla 1.3 se muestran las curvas NC recomendadas para diferentes tipos de recin-
tos, junto con su equivalencia en dBA.

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 43

π PRINCIPIOS BÁSICOS DEL SONIDO

TIPOS DE RECINTOS CURVA NC EQUIVALENCIA EN dBA


RECOMENDADA

Estudios de grabación 15 28
Salas de conciertos y teatros 15-25 28-38
Hoteles (habitaciones individuales) 20-30 33-42
Salas de conferencias / Aulas 20-30 33-42
Despachos de oficinas / Bibliotecas 30-35 42-46
Hoteles (vestíbulos y pasillos) 35-40 46-50
Restaurantes 35-40 46-50
Salas de ordenadores 35-45 46-55
Cafeterías 40-45 50-55
Polideportivos 40-50 50-60
Talleres (maquinaria ligera) 45-55 55-65
Talleres (maquinaria pesada) 50-65 60-75
Tabla 1.3 Curvas NC recomendadas y niveles de ruido de fondo equivalentes (en dBA)

Finalmente, cabe mencionar que existen otros criterios de evaluación del ruido de
fondo, como las curvas PNC (“Preferred Noise Criteria”) y las NR (“Noise Rating”), de fun-
cionamiento operativo análogo a las curvas NC.

43
1.13 El sistema de fonación humana

Los órganos que forman parte del sistema de fonación humana y que constituyen el denomi-
nado tracto vocal son: los pulmones, la laringe, la faringe, la cavidad nasal y la cavidad bucal
(figura 1.19).

Cavidad Cavidad
nasal nasal
Salida
Faringe nasal
Faringe Cavidad
bucal Laringe Salida
bucal
Cuerdas
Cuerdas Cavidad
vocales
Laringe vocales bucal
Tráquea

Tráquea
Volumen
pulmonar

Contracción muscular

Fig. 1.19 Tracto vocal y representación esquemática del mismo

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 44

DISEÑO ACÚSTICO DE ESPACIOS ARQUITECTÓNICOS π

El flujo de aire impulsado por los pulmones pasa por la laringe. En ella se encuentran
situadas las cuerdas vocales. Dicho aire provoca un movimiento rápido de abertura y cierre de
las mismas (vibración), produciéndose una modulación del mencionado flujo (figura 1.20).

Fig. 1.20 Fases sucesivas de un ciclo de vibración de las cuerdas vocales

La duración de un ciclo completo de aber-


Velocidad volumétrica (cm 3 /s)

tura y cierre es de aproximadamente 8 ms (mili-


segundos). Es el denominado pulso glotal (figura
1.21). En dicho intervalo la velocidad volumétri- 8 ms
44 ca del aire pasa de un valor máximo (máxima
elongación de las cuerdas vocales) a un valor nulo
(cuerdas vocales en su posición de equilibrio).
El número de ciclos completos por
segundo es, en consecuencia, de 125. De esta
forma, el espectro frecuencial de la señal gene- Tiempo (ms)
rada presenta una máxima contribución a la fre-
cuencia de 125 Hz (frecuencia fundamental) y Fig. 1.21 Flujo de aire en un pulso glotal
un conjunto de armónicos situados a frecuencias
múltiplos de la anterior (figura 1.22).
Dicho espectro resulta alterado como con- 0
secuencia de la existencia de las tres cavidades
Amplitud relativa (dB)

que atraviesa el flujo de aire: faringe, cavidad -10

nasal y cavidad bucal, que actúan a modo de cavi- -20


dades resonantes. El resultado final no es otro
que la voz característica de cada persona. -30

Los sonidos generados de la forma anterior- -40


mente expuesta se denominan sonidos sonoros. A
-50
este grupo de sonidos pertenecen todas las vocales,
así como aquellas consonantes generadas a partir de 0 125 500 1.000 2.000 4.000
Frecuencia (Hz)
la vibración de las cuerdas vocales (/b/, /d/, /g/, etc.).
Existen, además, otro tipo de sonidos Fig. 1.22 Espectro frecuencial de la señal
denominados sonidos sordos. Dichos sonidos se generada por la vibración de las cuerdas vocales

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 45

π PRINCIPIOS BÁSICOS DEL SONIDO

generan sin vibración alguna de las cuerdas vocales, simplemente mediante una constricción
del flujo de aire que atraviesa la cavidad bucal. A este grupo pertenecen la mayoría de conso-
nantes (/s/, /f/, /p/, /t/, /k/, etc.).

1.13.1 Características del mensaje oral

Cuando una persona emite un mensaje, emplea un tiempo mayor en la emisión de las vocales
que en la de las consonantes. Es por ello que las vocales constituyen el llamado régimen per-
manente del habla, mientras que las consonantes se asocian al régimen transitorio.
La duración en promedio de una vocal es del orden de 90 ms, reduciéndose a 20 ms en
el caso de una consonante.
El hecho de que la duración de las vocales sea más elevada hace que el nivel de presión
sonora asociado a las mismas sea, en promedio, del orden de 12 dB mayor que el correspon-
diente a las consonantes. Por otra parte, su contenido frecuencial es más rico en bajas fre-
cuencias, mientras que las consonantes presentan una mayor contribución de altas frecuencias.
Por otro lado, el grado de inteligibilidad de la palabra está estrechamente relacionado
con la correcta percepción de las altas frecuencias. En consecuencia, son las consonantes las
que determinan la comprensión del mensaje oral. En cambio, la información contenida en las
vocales es redundante. En la tabla 1.4 se resumen las características mencionadas.
DURACIÓN CONTENIDO NIVEL CONTRIBUCIÓN
(PROMEDIO) FRECUENCIAL (PROMEDIO) A LA INTELIGIBILIDAD
DOMINANTE DE LA PALABRA 45
VOCALES ≈ 90 ms bajas frecuencias nivel vocales ≈ baja
nivel consonantes +
CONSONANTES ≈ 20 ms altas frecuencias 12 dB alta

Tabla 1.4 Características más relevantes del mensaje oral

En la figura 1.23 se muestra la contribución de cada banda de frecuencias de octava al


nivel de la voz y a la inteligibilidad de la palabra.
Según se puede observar, la máxima contribución al nivel de la voz se sitúa en la zona
de frecuencias medias, destacando la banda de 500 Hz con un 46%. En cambio, la máxima
contribución a la inteligibilidad de la palabra está situada a frecuencias más elevadas (57%
sumando la contribución de las bandas de 2 y 4 kHz).

1.13.2 Directividad de la voz humana

En general, cualquier fuente sonora radia más potencia en unas direcciones que en otras y, por
tanto, presenta una cierta directividad. Dicha directividad depende de la frecuencia y aumen-
ta con la misma.
La manera de expresar la directividad de una fuente sonora en un punto cualquiera del
espacio es mediante el denominado factor de directividad Q. El factor Q depende de la rela-
ción entre el nivel de presión sonora producido por dicha fuente en la dirección considerada
y el nivel que se obtendría si la fuente no fuese directiva. Cuanto mayor sea el nivel de pre-
sión sonora en una dirección determinada, mayor será el valor de Q en dicha dirección.

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 46

DISEÑO ACÚSTICO DE ESPACIOS ARQUITECTÓNICOS π

80

Nivel de presión sonora SPL (dB) Grito

70
Voz muy alta

60
Voz alta

50
Voz normal

40
Voz baja

30
125 250 500 1.000 2.000 4.000 8.000

Frecuencia (Hz)

CONTRIBUCIÓN AL NIVEL DE LA VOZ


7% 22% 46% 20% 3% 2%
5% 13% 20% 31% 26% 5%
CONTRIBUCIÓN A LA INTELIGIBILIDAD DE LA PALABRA

Fig. 1.23 Contribución frecuencial al nivel de la voz y a la inteligibilidad de la palabra

La voz humana presenta unas características de directividad que vienen determinadas


46 por el sistema de fonación y la forma de la cabeza, siendo la dirección frontal la de mayor
directividad. Si bien la directividad aumenta con la frecuencia (figura 1.24), a efectos prácti-
cos, se considera que el factor de directividad de la voz humana en la dirección frontal es Q=2.

0 dB

-5 dB

-10 dB

-15 dB

4 kHz

2 kHz

1 kHz

500 Hz

Fig. 1.24 Directividad de la voz humana en las bandas de octava


comprendidas entre 500 Hz y 4 kHz (según Moreno y Pfretzschner)

A título de ejemplo de todo lo expuesto anteriormente, en la figura 1.25 se muestra la


evolución de una frase filtrada en las bandas de 500 Hz y 4 kHz, suponiendo que la escucha
se realiza delante y detrás del locutor.

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 47

π PRINCIPIOS BÁSICOS DEL SONIDO

Delante del locutor

500 Hz
Detrás del locutor

E l S o l De C ad aA u ro ra
Delante del locutor
4 kHz

Detrás del locutor

Fig. 1.25 Evolución del nivel de señal correspondiente a una frase


filtrada en las bandas de frecuencias centradas en 500 Hz y 4 kHz 47

De su observación se desprende lo siguiente:

➤ El nivel de presión sonora es más alto en la banda de 500 Hz que en la de 4 kHz.


➤ El nivel sonoro asociado a las vocales es más elevado que el correspondiente a las
consonantes.
➤ La directividad de la voz humana provoca una percepción menor detrás del locutor, a la
vez que la diferencia delante-detrás es efectivamente más notable en la banda de 4 kHz,
por ser la voz más directiva a medida que la frecuencia considerada es mayor.

1.14 Propagación del sonido en el espacio libre

Cuando una fuente sonora situada en un recinto cerrado es activada, genera una onda sonora
que se propaga en todas las direcciones. Un oyente ubicado en un punto cualquiera del mismo
recibe dos tipos de sonido: el denominado sonido directo, es decir, aquél que le llega directa-
mente desde la fuente sin ningún tipo de interferencia, y el sonido indirecto o reflejado origi-
nado como consecuencia de las diferentes reflexiones que sufre la onda sonora al incidir sobre
las superficies límite del recinto.
Mientras que las características del sonido reflejado serán objeto de estudio en el apar-
tado 1.15, a continuación se exponen una serie de conceptos asociados al sonido directo, que
es el único que llegaría a dicho oyente si estuviese situado en el espacio libre.

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 48

DISEÑO ACÚSTICO DE ESPACIOS ARQUITECTÓNICOS π

En primer lugar, se considera una fuente sonora omnidireccional, es decir, una fuente
que radia energía de manera uniforme en todas las direcciones (factor de directividad Q=1).
El hecho de que la radiación sea uniforme implica que, a una distancia cualquiera de la
fuente, el nivel de presión sonora SPL será siempre el mismo, con independencia de la direc-
ción de propagación considerada. Es la llamada propagación esférica.
A medida que uno se aleja de la fuente, la energía sonora se reparte sobre una esfera
cada vez mayor, por lo que el nivel SPL en cada punto va disminuyendo progresivamente. En
concreto, la disminución del mismo es de 6 dB cada vez que se dobla la distancia a la fuente.
Es la denominada ley cuadrática inversa y significa que el valor de la presión sonora se redu-
ce a la mitad. En la figura 1.26 se muestra la mencionada disminución del nivel SPL con la
distancia en el caso de que la fuente sonora sea un avión.

25 m
50 m
120 dB
100 m
114 dB

108 dB 200 m

48
102 dB

Fig. 1.26 Ejemplo de propagación esférica en el espacio libre

Para que una fuente sonora radie de forma omnidireccional es necesario que sus dimen-
siones sean pequeñas respecto a la longitud de onda del sonido emitido y que el receptor esté
alejado de la misma.
Si bien existe toda una variedad de fuentes sonoras omnidireccionales, también es cier-
to que el cumplimiento simultáneo de ambos requisitos es difícil, sobre todo si la banda de
frecuencias considerada es amplia. Es el caso de la voz humana que, como se ha visto en el
apartado anterior, constituye un claro ejemplo de fuente directiva.
En la figura 1.27 se representa el mapa de niveles SPL producidos por un orador situa-
do en el espacio libre, en la banda de 2 kHz, en función de la distancia y del ángulo referido
a su eje frontal. Se puede observar la disminución del nivel con la distancia, así como el efec-
to de directividad de la voz humana, evidenciado por la reducción del nivel a medida que
aumenta dicho ángulo.
A través de la realización de una serie de experimentos, se ha podido averiguar que un
mensaje oral emitido en una zona silenciosa (en ausencia de fenómenos atmosféricos ruido-
sos) puede ser oído de forma satisfactoria a una distancia máxima de 42 m en la dirección
frontal del orador, de 30 m lateralmente y de 17 m en la dirección posterior. A distancias supe-
riores, el mensaje deja de ser inteligible debido a que queda inmerso en el ruido de fondo exis-
tente, independientemente del lugar elegido para llevar a cabo la experiencia.

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 49

π PRINCIPIOS BÁSICOS DEL SONIDO

Fig. 1.27 Niveles de presión sonora producidos por un orador en el espacio libre, banda de 2 kHz

1.15 Propagación del sonido en un recinto cerrado

Según se acaba de comentar, la energía radiada por una fuente sonora en un recinto cerrado
llega a un oyente ubicado en un punto cualquiera del mismo de dos formas diferentes: una
parte de la energía llega de forma directa (sonido directo), es decir, como si fuente y receptor
estuviesen en el espacio libre, mientras que la otra parte lo hace de forma indirecta (sonido
reflejado), al ir asociada a las sucesivas reflexiones que sufre la onda sonora cuando incide 49
sobre las diferentes superficies del recinto.
En un punto cualquiera del recinto, la energía correspondiente al sonido directo depen-
de exclusivamente de la distancia a la fuente sonora, mientras que la energía asociada a cada
reflexión depende del camino recorrido por el rayo sonoro, así como del grado de absorción
acústica de los materiales utilizados como revestimientos de las superficies implicadas. Lógi-
camente, cuanto mayor sea la distancia recorrida y más absorbentes sean los materiales emple-
ados, menor será la energía asociada tanto al sonido directo como a las sucesivas reflexiones.

1.15.1 Sonido reflejado

Al analizar la evolución temporal del sonido reflejado en un punto cualquiera del recinto obje-
to de estudio, se observan básicamente dos zonas de características notablemente diferencia-
das: una primera zona que engloba todas aquellas reflexiones que llegan inmediatamente des-
pués del sonido directo, y que reciben el nombre de primeras reflexiones o reflexiones
tempranas (“early reflections”), y una segunda formada por reflexiones tardías que constitu-
yen la denominada cola reverberante.
Si bien la llegada de reflexiones al punto en cuestión se produce de forma continua, y
por tanto sin cambios bruscos, también es cierto que las primeras reflexiones llegan de forma
más discretizada que las tardías, debido a que se trata de reflexiones de orden bajo (habitual-
mente, orden ≤ 3). Se dice que una reflexión es de orden “n” cuando el rayo sonoro asociado
ha incidido “n” veces sobre las diferentes superficies del recinto antes de llegar al receptor.

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 50

DISEÑO ACÚSTICO DE ESPACIOS ARQUITECTÓNICOS π

Desde un punto de vista práctico, se suele establecer un límite temporal para la zona de
primeras reflexiones de aproximadamente 100 ms desde la llegada del sonido directo, aunque
dicho valor varía en cada caso concreto en función de la forma y del volumen del recinto.
La representación gráfica temporal de la llegada de las diversas reflexiones, acompa-
ñadas de su nivel energético correspondiente, se denomina ecograma o reflectograma. En la
figura 1.28 se representa de forma esquemática la llegada de los diferentes rayos sonoros a un
receptor junto con el ecograma asociado, con indicación del sonido directo, la zona de pri-
meras reflexiones y la zona de reflexiones tardías (cola reverberante).

SONIDO PRIMERAS REFLEXIONES TARDIAS


DIRECTO REFLEXIONES ( COLA REVERBERANTE )

Fuente
sonora

Receptor
Nivel de presión sonora (dB)

50

Tiempo (ms)
100 ms

Fig. 1.28 Ecograma asociado a un receptor con indicación del sonido


directo, las primeras reflexiones y la cola reverberante

En un recinto real, la manera más elemental de obtener dicha representación gráfica es


emitiendo un sonido intenso y breve como, por ejemplo, un disparo. Sin embargo, en la actua-
lidad existen sofisticados equipos de medida basados en técnicas TDS (“Time Delay Spectro-
metry”) o MLS (“Maximum Length Sequence”) que permiten obtener en cada punto de inte-
rés la curva de decaimiento energético, denominada curva energía-tiempo ETC
(“Energy-Time Curve”), de forma rápida, precisa y automatizada. A partir de la obtención de
dicha curva en distintos puntos del recinto considerado es posible extraer una gran cantidad
de información sobre las características acústicas del mismo.
En la figura 1.29 se muestra una curva ETC medida en un punto de un recinto. En abs-
cisas se indica el tiempo, expresado en ms (milisegundos), mientras que en ordenadas se indi-
ca el nivel, expresado en dB.

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 51

π PRINCIPIOS BÁSICOS DEL SONIDO

60

50

40
Amplitud (dB)
30

20

10

-10

-20
0 125 250 375 500 625 750 875 1.000
Tiempo (ms)

Fig. 1.29 Curva energía-tiempo ETC medida en un punto de un recinto

1.15.2 Estudio de las primeras reflexiones. Acústica geométrica

En general, las primeras reflexiones presentan un nivel energético mayor que las correspon-
dientes a la cola reverberante, ya que son de orden más bajo (según se ha comentado en el
apartado anterior, se suelen considerar primeras reflexiones hasta un orden 3).
Además, por el hecho de depender directamente de las formas geométricas de la sala, 51
son específicas de cada punto y, por tanto, determinan las características acústicas propias del
mismo, juntamente con el sonido directo (figura 1.30).
o )
ch
(te
ión
lex
f
Re

Reflexió d)
n ( esc are
enario)
ió n (p
flex
Re

Sonido directo Punto de


Fuente recepción
sonora
)
red
pa
ió n(
flex
Re

Fig. 1.30 Ejemplo de llegada del sonido directo y de las primeras reflexiones a un receptor

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 52

DISEÑO ACÚSTICO DE ESPACIOS ARQUITECTÓNICOS π

La hipótesis elemental de partida para calcular el ecograma asociado a un punto cual-


quiera consiste en tratar los rayos sonoros como si se tratase de rayos de luz, es decir, consi-
derando que las reflexiones de los mismos sobre las distintas superficies son totalmente espe-
culares y que, por tanto, verifican la ley de la reflexión. En la figura 1.31 se representa
gráficamente dicha ley.
El análisis acústico basado en la hipótesis de refle-
xiones especulares constituye la base de la denominada i r
acústica geométrica.
Evidentemente, dicho análisis no es más que una
aproximación a la realidad, ya que sólo en determinadas
circunstancias la hipótesis de reflexión especular es total- i = r

i
= ángulo de incidencia
mente veraz. r
= ángulo de reflexión
Para que en la práctica se produzca una reflexión
marcadamente especular es necesario que se cumplan los Fig. 1.31 Reflexión especular del
siguientes requisitos, por lo que a la superficie de refle- sonido sobre una superficie
xión se refiere:

➤ Dimensiones grandes en comparación con la longitud de onda del sonido en conside-


ración
➤ Superficie lisa y muy reflectante (poco absorbente)

52 En el caso de que las dimensiones sean menores o similares a la longitud de onda del
sonido, la onda sonora rodea la superficie y sigue propagándose como si el obstáculo que
representa la misma no existiese. Dicho fenómeno se conoce con el nombre de difracción
(apartado 2.3.1).
Por otra parte, si la superficie presenta irregularidades de dimensiones comparables con
la longitud de onda, se produce una reflexión de la onda incidente en múltiples direcciones.
Dicho fenómeno se conoce con el nombre de difusión del sonido (apartado 2.4).
En este punto conviene destacar el hecho de que existen programas informáticos avan-
zados de simulación acústica que permiten el análisis teniendo en cuenta tanto el fenómeno
de la difracción como el de la difusión del sonido. Obviamente, los resultados obtenidos con
dichos programas se aproximan más a los obtenidos mediante mediciones reales efectuadas
“in situ” que en el caso de utilizar programas de simulación más simples.
Por otro lado, como se ha comentado anteriormente, la cola reverberante está formada
por las reflexiones tardías (por regla general, se consideran las reflexiones de orden superior
a 3). Debido a que la densidad temporal de reflexiones en un punto cualquiera de un recinto
cerrado aumenta de forma cuadrática con el tiempo, existe una gran concentración de dichas
reflexiones en cualquier punto de recepción y, además, sus características son prácticamente
iguales con independencia del punto considerado. Es por ello que el estudio de la cola rever-
berante se efectúa siempre mediante criterios basados en la denominada acústica estadística,
en lugar de la acústica geométrica, según se verá en el apartado 1.15.7.
A título de ejemplo, en un auditorio de tamaño medio un oyente recibe alrededor de
8.000 reflexiones en el primer segundo después de la llegada del sonido directo. De todas for-
mas, debido a que el oído humano es incapaz de discriminar la llegada discreta de todas y cada

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 53

π PRINCIPIOS BÁSICOS DEL SONIDO

una de las reflexiones, lo que generalmente se percibe es un sonido continuo. Sólo en deter-
minados casos es posible percibir individualmente una o varias reflexiones. Para ello es nece-
sario que su nivel y retardo respecto al sonido directo sean significativos, como se verá a con-
tinuación.

1.15.3 Percepción subjetiva de primeras reflexiones. Ecos

Todas aquellas reflexiones que llegan a un oyente dentro de los primeros 50 ms desde la lle-
gada del sonido directo son integradas por el oído humano y, en consecuencia, su percepción
no es diferenciada respecto al sonido directo.
Cuando el sonido emitido es un mensaje oral, tales reflexiones contribuyen a mejorar
la inteligibilidad o comprensión del mensaje y, al mismo tiempo, producen un aumento de
sonoridad (o sensación de amplitud del sonido).
Por el contrario, la aparición en un punto de escucha de una reflexión de nivel elevado
con un retardo superior a los 50 ms es totalmente contraproducente para la obtención de una
buena inteligibilidad de la palabra, ya que es percibida como una repetición del sonido direc-
to (suceso discreto). En tal caso, dicha reflexión se denomina eco. El retardo de 50 ms equi-
vale a una diferencia de caminos entre el sonido directo y la reflexión de, aproximadamente,
17 m.
En la figura 1.32 se representa gráficamente dicho efecto.
53

Efecto físico Impresión subjetiva

Retardo hasta 50 ms:


se oye un único sonido
con un nivel más elevado

0 30 Tiempo (ms) Tiempo (ms)

Retardo superior a 50 ms:


se percibe claramente un eco

0 60 Tiempo (ms) Tiempo (ms)

Fig. 1.32 Superposición de sonidos con diferentes retardos e impresión subjetiva asociada

De forma más precisa, en la figura 1.33 se muestran las cuatro zonas características por
lo que a relación entre sonido retardado e inteligibilidad de la palabra se refiere. En el eje de
abscisas se indica el retardo temporal entre la reflexión (sonido retardado) y el sonido direc-
to, mientras que en el eje de ordenadas aparece la diferencia de niveles entre ambos sonidos.
La curva de separación entre las cuatro zonas es sólo aproximada.

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 54

DISEÑO ACÚSTICO DE ESPACIOS ARQUITECTÓNICOS π

Diferencia de niveles entre la reflexión


+12
B
+8

y el sonido directo (dB)


+4
D
0

-4

-8
A
-12

-16
C
-20

10 30 50 70 90

Retardo de la reflexión relativo al sonido directo (ms)

Fig. 1.33 Relación entre sonido retardado e inteligibilidad de la palabra (zonas características)

a) Zona A

La reflexión llega antes de los 50 ms: el oído integra la reflexión y se produce un aumento de
inteligibilidad y de sonoridad.
En la figura 1.34 se representa una curva de decaimiento energético ETC donde se
observa la existencia de una reflexión perteneciente a dicha zona A.
54

70

60

50
Amplitud (dB)

40

30

20

10

0
50 60 70 80 90 100 110 120
Tiempo (ms)

Sonido directo
Reflexión (retardo relativo de 17 ms)

Fig. 1.34 Curva energía-tiempo ETC mostrando la llegada del sonido directo
y de una reflexión significativa beneficiosa para la inteligibilidad

b) Zona B

La reflexión llega antes de los 50 ms, si bien con un nivel relativo más elevado: el oído integra
la reflexión, pero se produce un desplazamiento de la localización de la fuente sonora, genera-
dora del sonido directo, hacia la superficie generadora de la reflexión (“image shift”).

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 55

π PRINCIPIOS BÁSICOS DEL SONIDO

En la figura 1.35 se representa una curva de decaimiento energético ETC donde se


aprecia la existencia de una reflexión perteneciente a la mencionada zona B.
70

60

50
Amplitud (dB)

40

30

20

10

0
60 70 80 90 100 110 120 130
Tiempo (ms)

Sonido directo
Reflexión (retardo relativo de 18 ms)

Fig. 1.35 Curva energía-tiempo ETC mostrando la llegada del sonido directo y de una reflexión
significativa causante de una falsa localización de la fuente sonora

c) Zona C

La reflexión llega después de los 50 ms: la reflexión no es perjudicial para la inteligibilidad


debido a que su nivel relativo es suficientemente bajo. 55

d) Zona D

La reflexión llega después de los 50 ms, si bien con un nivel relativo más elevado: la reflexión
es percibida como un eco y se produce una pérdida de inteligibilidad.
En la figura 1.36 se representa una curva de decaimiento energético ETC donde apare-
ce una reflexión perteneciente a dicha zona D.
70

60

50
Amplitud (dB)

40

30

20

10

0
40 50 60 70 80 90 100 110 120 130
Tiempo (ms)

Sonido directo Reflexión (retardo relativo de 74 ms)

Fig. 1.36 Curva energía-tiempo ETC mostrando la llegada del sonido


directo y de una reflexión significativa causante de eco

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 56

DISEÑO ACÚSTICO DE ESPACIOS ARQUITECTÓNICOS π

1.15.4 Eco flotante

El eco flotante (“flutter echo”) consiste en una repetición múltiple, en un breve intervalo de
tiempo, de un sonido generado por una fuente sonora, y aparece cuando ésta se sitúa entre dos
superficies paralelas, lisas y muy reflectantes (figuras 1.37 y 1.38).

80

70

60

Amplitud (dB)
Fuente sonora 50

40

30

20

10

0
0 10 20 30 40 50 60 70 80 90 100
Tiempo (ms)

Fig. 1.37 Eco flotante aparecido al Fig. 1.38 Curva energía-tiempo ETC ilustrativa
colocar la fuente sonora entre dos paredes de la existencia de eco flotante
paralelas, lisas y muy reflectantes

56
1.15.5 Modos propios de una sala. Acústica ondulatoria

La combinación de ondas incidentes y reflejadas en una sala da lugar a interferencias cons-


tructivas y destructivas o, lo que es lo mismo, a la aparición de las denominadas ondas esta-
cionarias o modos propios de la sala. Cada modo propio va asociado a una frecuencia, igual-
mente denominada propia, y está caracterizado por un nivel de presión sonora SPL que varía
en función del punto considerado (figura 1.39).
El estudio analítico de los modos propios se realiza mediante la denominada acústica ondu-
latoria que, conjuntamente con la acústica geo-
métrica y la estadística anteriormente comenta-
das, constituyen las tres teorías clásicas que
hacen posible conocer con rigor el comporta-
1,0 1,0 1,0
miento del sonido en un recinto cualquiera.
El número de modos propios es ilimitado, 0,8 0,8 0,8 0,8
si bien su distribución a lo largo del eje frecuen-
0,6 0,6 0,6 0,6
cial es discreta, aumentando su densidad con la
0,4 0,4 0,4 0,4
frecuencia. La presencia de todos ellos provoca en
cada punto una concentración de energía alrede- 0,2 0,2 0,2 0,2

dor de las diversas frecuencias propias, lo cual 0 0

confiere un sonido característico a cada sala.


Dicho sonido recibe el nombre de “coloración” y Fig. 1.39 Distribución de niveles SPL normalizados
normalmente se pone de manifiesto en espacios asociados a un modo propio de una sala

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 57

π PRINCIPIOS BÁSICOS DEL SONIDO

de dimensiones relativamente reducidas, como por

Nivel de presión sonora SPL (dB)


70
ejemplo los estudios de grabación (figura 1.40).
Los valores de las frecuencias propias asocia-
60
das a los diferentes modos propios dependen de la
geometría y de las dimensiones del recinto y, en
general, su determinación resulta muy compleja. 50

Únicamente cuando se trata de recintos de forma


paralelepipédica con superficies totalmente reflec- 40
tantes es posible calcularlos de una forma muy senci- 20 40 60 80 100
Frecuencia (Hz)
lla, mediante la denominada fórmula de Rayleigh:
Fig. 1.40 Representación de las frecuencias
propias en un punto determinado de una

√( k
) ( ) ( )
2 m 2 n 2
sala de reducidas dimensiones
fk,m,n = 172,5 + +
Lx Ly Lz

donde:
Lx, Ly y Lz representan las dimensiones de la sala (en metros)
k, m, n pueden tomar cualquier valor entero (0, 1, 2, 3, ..).

Cada combinación de valores k, m, n da lugar a una frecuencia y modo propio asociado, que
recibe el nombre de modo propio k, m, n. Por ejemplo, la combinación: 57

k = 2, m = 1, n=1
da lugar al modo propio 2, 1, 1.
Partiendo de que la existencia de modos propios es inevitable, conviene elegir una rela-
ción entre las dimensiones de la sala tal que la distribución de los mismos en el eje frecuen-
cial sea lo más uniforme posible. De esta manera se consigue evitar concentraciones de
energía en bandas estrechas de frecuencias o, lo que es lo mismo, coloraciones intensas del
sonido.
A título de ejemplo, en la figura 1.41 se representa la distribución de los modos pro-
pios más significativos de dos salas: la primera, con una relación óptima entre sus dimensio-
nes (6,25 x 3,75 x 2,5 m), y la segunda, de forma cúbica (4 x 4 x 4 m).
a) Sala de : Lx= 6,25 m, Ly= 3,75 m, Lz= 2,5 m

Hz
27,6

46,0

53,6

69,0

82,8

92,0

115,0
107,3

127,6

138,0

b) Sala de : Lx= 4 m, Ly= 4 m, Lz= 4 m


43,1

61,0

74,7

86,3

96,4

Hz
105,6

122,0

129,4

136,4

143,0

Fig. 1.41 Distribución de las frecuencias propias en el eje frecuencial para:


a) una sala rectangular de proporciones óptimas; b) una sala cúbica

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 58

DISEÑO ACÚSTICO DE ESPACIOS ARQUITECTÓNICOS π

Se observa claramente que, en el primer caso, la distribución es uniforme, mientras que


en el segundo existe una concentración de modos propios que provocará, sin lugar a dudas, la
aparición de coloraciones.
En la figura 1.42 se representa una zona sombreada indicativa del conjunto de relacio-
nes recomendadas entre la longitud y la anchura de una sala rectangular (suponiendo una altu-
ra normalizada de valor 1), con objeto de obtener una distribución lo más uniforme posible de
sus frecuencias propias.

2,6

2,4

2,2
Longitud

2,0

1,8

Altura = 1
1,6

1,4
58 1,0 1,2 1,4 1,6 1,8 2,0
Anchura

Fig. 1.42 Relaciones recomendadas entre las dimensiones de una sala rectangular
para obtener una distribución uniforme de sus frecuencias propias

Por otra parte, y como se ha mencionado anteriormente, la densidad de modos propios


aumenta con la frecuencia. Ello significa que, a partir de una cierta frecuencia, el concepto de
coloración del sonido deja de tener sentido, ya que una gran densidad de modos propios es
equivalente a la ausencia de éstos, por el hecho de que dejan de existir concentraciones dis-
cretas de energía.
La fórmula empírica que permite calcular, para cada sala, la frecuencia límite superior a
partir de la cual los modos propios tienen una influencia prácticamente nula, es la siguiente:

donde:
fmax = 1849
√ RTmid
V

RTmid es el valor del tiempo de reverberación obtenido como promedio de los valores
correspondientes a las bandas de octava centradas en 500 Hz y 1 kHz, expresado en
segundos (apartado 1.15.8)
V es el volumen de la sala, expresado en m3

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 59

π PRINCIPIOS BÁSICOS DEL SONIDO

De la anterior expresión se desprende que el efecto de los modos propios tiene una
mayor incidencia cuanto más pequeña es la sala en consideración, como es el caso de los locu-
torios y las salas de control pertenecientes a estudios de grabación.
La manera práctica de minimizar dicho efecto es mediante la utilización de sistemas
electrónicos de ecualización, o bien a través de la instalación de elementos resonadores (apar-
tado 2.2.5). En general, las frecuencias propias cuyo efecto se pretende atenuar suelen estar
situadas por debajo de los 200 Hz.
En el caso de recintos grandes, como teatros y salas de conciertos, la coloración del
sonido a causa de los modos propios es prácticamente nula y, por tanto, no se tiene en cuenta
en la fase de diseño.

1.15.6 Balance energético sonoro

En el apartado 1.15 se ha descrito la propagación de una onda sonora en un recinto cerrado


partiendo de la hipótesis de que la fuente sonora emite un sonido intenso y breve.
A continuación se analiza dicho comportamiento, si bien ahora suponiendo que la fuen-
te radia energía de forma continua. En tal caso resulta evidente que, una vez transcurrido un
periodo de tiempo transitorio, se alcanza un estado de equilibrio caracterizado por el hecho de
que la absorción acústica producida por las superficies del recinto se iguala con el aporte ener-
gético de la fuente. Existe, en consecuencia, un balance energético sonoro.
El punto de partida consiste en poner en marcha una fuente sonora omnidireccional y 59
en dejarla emitir de forma continua. A partir del instante inicial, la onda sonora generada se
propaga en todas las direcciones y cada rayo sonoro recorre un camino distinto, reflejándose
una y otra vez sobre las diferentes superficies de la sala. En cada reflexión, parte de la ener-
gía es absorbida y parte es devuelta al recinto en mayor o menor cuantía, en función del grado
de absorción acústica del revestimiento correspondiente a la superficie implicada.
El aporte constante de energía por parte de la fuente sonora hace que la energía total
recibida en cualquier punto de la sala, obtenida como suma de la directa y la indirecta o refle-
jada, vaya aumentando progresivamente hasta alcanzar el mencionado punto de equilibrio.
En la figura 1.43 se observa el incre-
Nivel de presión sonora SPL (dB)

mento del nivel de presión sonora en un


80 punto receptor genérico hasta llegar a un
70 valor máximo correspondiente al régimen
60
permanente. Cabe señalar que los incre-
50
mentos discretos de nivel producidos en una
40
30
serie de instantes concretos pretenden úni-
20
camente destacar la contribución tanto del
10 sonido directo como de cada una de las
0 reflexiones sucesivas que llegan al receptor.
0 50 100 150
Tiempo (ms)
En la práctica, dichas discontinuidades no
Fig. 1.43 Aumento del nivel de presión sonora SPL suelen observarse de manera tan evidente,
en un punto receptor por la acumulación del sonido ya que el número de reflexiones y la proxi-
directo y de las sucesivas reflexiones midad entre las mismas es mucho mayor.

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 60

DISEÑO ACÚSTICO DE ESPACIOS ARQUITECTÓNICOS π

El proceso anteriormente descrito es totalmente reversible, de forma que cuando la


fuente sonora se detiene bruscamente, el nivel de presión sonora empieza a disminuir progre-
sivamente hasta desaparecer (estrictamente hablando, dicho nivel disminuye hasta confundir-
se con el nivel de ruido de fondo de la sala).
Siguiendo con el ejemplo simplificado
anterior, en la figura 1.44 se observan los

Nivel de presión sonora SPL (dB)


decrementos discretos de nivel, asociados en 80
primer lugar a la desaparición del sonido 70
directo y, posteriormente, a la desaparición 60

de las sucesivas reflexiones. 50


40
La rapidez en la atenuación del sonido
30
depende del grado de absorción de las super- 20
ficies del recinto: a mayor absorción, atenua- 10
ción más rápida. El grado de permanencia del 0
0 50 100 150
sonido una vez que la fuente sonora se ha
Tiempo (ms)
desconectado se denomina reverberación. Por
lo tanto, la reverberación de una sala es Fig. 1.44 Disminución del nivel de presión sonora
mayor cuanto más tarda el sonido en atenuar- SPL en un punto receptor después de que la fuente
se, es decir, cuanto menos absorbente es el sonora se haya detenido
recinto.
La evolución teórica de la presión
60 sonora asociada a las fases descritas anterior-
mente (conexión de la fuente sonora, alcance Escala lineal Régimen
del régimen permanente y desconexión de la a ) Permanente
Crecimiento
fuente) se representa en la figura 1.45 tanto 1,0
Presión sonora

en escala lineal como en escala semilogarít- 0,8


relativa

mica. Dichas gráficas surgen de la aplicación 0,6


Decaimiento
exclusiva de la acústica estadística y, por con- 0,4
siguiente, son válidas para cualquier punto de 0,2
la sala objeto de estudio, con independencia 0
de su ubicación dentro de la misma. Tiempo (ms)
Régimen
Según se observa, el decaimiento en Escala semilogarítmica
Permanente
escala lineal sigue una evolución exponen- b ) 0
Nivel relativo (dB)

cial, lo cual se traduce en una línea recta en


-10
escala semilogarítmica. Ello resulta de gran Decaimiento
utilidad para la determinación teórica del -20

tiempo de reverberación, definido en el apar- -30


tado 1.15.8.
-40
En la práctica nunca se obtiene una Tiempo (ms)
curva tan regular y, además, a cada punto de
medida le corresponde una curva diferente
Fig. 1.45 Evolución teórica de la presión sonora en
del resto. Ello es especialmente evidente un punto de un recinto al conectar y, posteriormente,
durante, aproximadamente, los primeros 100 desconectar una fuente sonora : a) escala lineal;
ms desde la llegada del sonido directo debido b) escala semilogarítmica

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 61

π PRINCIPIOS BÁSICOS DEL SONIDO

a la existencia de primeras reflexiones específicas asociadas al punto considerado (como ya


se dicho con anterioridad, el estudio de las primeras reflexiones se realiza por medio de la
acústica geométrica).

1.15.7 Campo directo y campo reverberante. Nivel total de presión sonora

Siguiendo con la hipótesis de régimen permanente y aplicando exclusivamente la teoría de la


acústica estadística, resulta que la energía sonora total presente en cualquier punto de una sala
se obtiene como suma de una energía de valor variable, que depende de la ubicación del punto,
y otra de valor constante. Se supone que se parte de una fuente sonora de directividad cono-
cida que radia una potencia constante.
La energía de valor variable corresponde al sonido directo, y disminuye a medida que
el receptor se aleja de la fuente, mientras que la energía de valor constante va asociada al soni-
do indirecto o reflejado. El hecho de que dicha energía no dependa del punto en considera-
ción proviene de aplicar la teoría estadística a todo el sonido reflejado y, en consecuencia, de
tratar por igual todas las reflexiones, sean primeras o tardías (cola reverberante). Esta hipóte-
sis teórica conduce a resultados evidentemente aproximados, si bien presenta la ventaja de la
simplicidad de cálculo de la energía total.
Habitualmente no se trabaja en términos de energía, sino de nivel de presión sonora
SPL, lo cual es totalmente equivalente. Ello se debe a que, en la práctica, el nivel SPL es fácil-
mente medible (ver descripción del sonómetro en el apartado 1.11). 61
Por lo tanto, según lo que se acaba de exponer, la presión sonora total en un punto cual-
quiera de un recinto se obtiene a partir de la contribución de las presiones del sonido directo
(disminuye con la distancia a la fuente) y del sonido reflejado (se mantiene constante).
La zona donde predomina el sonido directo se denomina zona de campo directo. A
dicha zona pertenecen los puntos más próximos a la fuente sonora y en ella el nivel de pre-
sión sonora, llamado nivel de campo directo LD , disminuye 6 dB cada vez que se dobla la dis-
tancia a la fuente. Es como si el receptor estuviese situado en el espacio libre.
La zona donde predomina el sonido reflejado recibe el nombre de zona de campo rever-
berante (es por ello que a dicho sonido también se le denomina sonido reverberante). A ella
pertenecen los puntos más alejados de la fuente sonora. En esta zona, el nivel de presión sono-
ra, denominado nivel de campo reverberante LR , se mantiene constante.
La distancia para la cual LD = LR se denomina distancia crítica Dc. Se puede demostrar
que:

Dc = 0,14
√ QR
donde:
Q = factor de directividad de la fuente sonora en la dirección considerada

St α
R = constante de la sala = – (en m )
2
1–α

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 62

DISEÑO ACÚSTICO DE ESPACIOS ARQUITECTÓNICOS π

St = superficie total de la sala (en m2)


– = coeficiente medio de absorción de la sala (apartado 1.15.8.2)
α

En la figura 1.46 se muestra la evolución del nivel relativo total de presión sonora en
función de la distancia a la fuente, normalizada con respecto a la distancia crítica Dc.

LD : Nivel de campo
0 directo
Nivel relativo total (dB)

-4 LR : Nivel de campo
reverberante
-8

-12

-16
3 dB
-20
LR
-24
LD
-28

0,125 0,25 0,5 1,0 2,0 4,0 8,0


r / Dc

Fig. 1.46 Evolución del nivel relativo total de presión sonora en función de la distancia
a la fuente sonora normalizada con respecto a la distancia crítica Dc

62
r
Se puede comprobar que, para puntos próximos a la fuente sonora ( << 1):
Dc

Lp ≈ LD

r
mientras que para puntos alejados ( >> 1):
Dc

Lp ≈ LR

Por otra parte, se puede demostrar que cuanto mayor sea el grado de absorción de un
recinto a una determinada frecuencia, mayor será el valor de la constante de la sala R (aumen-
to de la distancia crítica Dc) y menor el nivel de presión sonora de campo reverberante LR.
A título de ejemplo, en la figura 1.47 se representan tres gráficas de niveles relativos
totales de presión sonora correspondientes a una sala “viva” (poco absorbente), a una sala
intermedia y a una sala “apagada” (muy absorbente), en función de la distancia a la fuente
sonora.
Se puede observar que, efectivamente:

LR1 > LR2 > LR3

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 63

π PRINCIPIOS BÁSICOS DEL SONIDO

Nivel relativo total (dB )


-6
Sala “viva”
-12 LR1
-18
Sala intermedia
-24 LR2
-30
Sala “apagada”
-36 LR3
-42
LD

1 2 4 8 16 32 64 128
Distancia a la fuente (m)

Fig. 1.47 Gráficas de niveles relativos totales de presión sonora correspondientes


a una sala “viva”, a una sala intermedia y a una sala “apagada”

1.15.8 Tiempo de reverberación RT

Con el fin de poder cuantificar la reverberación de un recinto, se define el tiempo de rever-


beración (de forma abreviada RT) a una frecuencia determinada como el tiempo (en segun- 63
dos) que transcurre desde que el foco emisor se detiene hasta el momento en que el nivel de
presión sonora SPL cae 60 dB con respecto a su valor inicial.
Un recinto con un RT grande se denomina “vivo” (nave industrial, iglesia, etc.), mien-
tras que si el RT es pequeño recibe el nombre de recinto “apagado” o “sordo” (locutorio, estu-
dio de grabación, etc.). Ambas denominaciones coinciden con las del apartado anterior, lo cual
es lógico habida cuenta de que el nivel de campo reverberante aumenta con el tiempo de rever-
beración.
Por lo general, el RT varía con la frecuencia, tendiendo a disminuir a medida que ésta
aumenta. Ello es debido, en parte, a las características de mayor absorción con la frecuencia
de los materiales comúnmente empleados como revestimientos, así como a la absorción del
aire, especialmente manifiesta en recintos grandes y a altas frecuencias.

1.15.8.1 Valores recomendados del tiempo de reverberación

Habitualmente, cuando se establece un único valor recomendado de RT para un recinto dado,


se suele hacer referencia al obtenido como media aritmética de los valores correspondientes a
las bandas de 500 Hz y 1kHz. Se representa por RTmid .
En general, el valor más adecuado de RTmid depende tanto del volumen del recinto como
de la actividad a la que se haya previsto destinarlo. Por ejemplo, como se verá en capítulos
sucesivos, cuando se trata de salas destinadas a la palabra, es conveniente que los valores de
RT sean bajos, con objeto de conseguir una buena inteligibilidad, mientras que en el caso de

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 64

DISEÑO ACÚSTICO DE ESPACIOS ARQUITECTÓNICOS π

salas de conciertos son recomendables unos valores apreciablemente más elevados a fin de
que la audición musical resulte óptima.
En la tabla 1.5 se dan los márgenes de valores recomendados de RTmid para diferentes
tipos de salas en el supuesto de que estén ocupadas.

TIPO DE SALA RTmid , SALA OCUPADA (EN s)


Sala de conferencias 0,7 – 1,0
Cine 1,0 – 1,2
Sala polivalente 1,2 – 1,5
Teatro de ópera 1,2 – 1,5
Sala de conciertos (música de cámara) 1,3 – 1,7
Sala de conciertos (música sinfónica) 1,8 – 2,0
Iglesia/catedral (órgano y canto coral) 2,0 – 3,0
Locutorio de radio 0,2 – 0,4

Tabla 1.5 Márgenes de valores recomendados de RTmid en función del tipo de sala (recintos ocupados)

64 1.15.8.2 Cálculo del tiempo de reverberación

Si bien existe un gran número de fórmulas para el cálculo teórico del RT (ver algunas de ellas
en el apéndice 2), la fórmula clásica por excelencia, y aceptada como de referencia a nivel
internacional por su sencillez de cálculo, es la denominada fórmula de Sabine. La correspon-
diente expresión matemática, obtenida aplicando la teoría acústica estadística y despreciando
el efecto de la absorción producida por el aire, es la siguiente:

V
RT = 0,161 (en segundos)
Atot

donde:
V = volumen del recinto (en m3)
Atot = absorción total del recinto (definida seguidamente)

El grado de absorción del sonido de un material cualquiera se representa mediante el


llamado coeficiente de absorción α. Se define como la relación entre la energía absorbida por
dicho material y la energía incidente sobre el mismo:

Energía absorbida
α=
Energía incidente

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 65

π PRINCIPIOS BÁSICOS DEL SONIDO

Sus valores están comprendidos entre 0 (correspondiente a un material totalmente


reflectante) y 1 (caso de absorción total). El valor de α está directamente relacionado con las
propiedades físicas del material y varía con la frecuencia.
En cuanto a la denominada absorción A de un material cualquiera, ésta se obtiene como
resultado de multiplicar su coeficiente de absorción α por su superficie S. La unidad de absor-
ción es el sabin (1 sabin corresponde a la absorción de 1m2 de ventana abierta).
Finalmente, y debido a que un recinto está constituido por distintas superficies recu-
biertas de materiales diversos, se define la absorción total Atot como la suma de todas y cada
una de las absorciones individuales, es decir:

Atot = α1S1 + α2S2 + ...... + αnSn


– dividiendo la
A partir de Atot es posible calcular el coeficiente medio de absorción α
absorción total Atot por la superficie total del recinto St:

– Atot
α =
St
donde:

St = S1 + S2+ ..... + Sn = superficie total del recinto (paredes + techo + suelo)


65
Con todo lo anterior, el tiempo de reverberación se puede expresar como sigue:

0,161 V
RT = –S
α t

Según se observa, el RT calculado a cada frecuencia de interés mediante dicha fórmula


no tiene en cuenta la ubicación del receptor, es decir, es único para cada recinto. Ello es con-
secuencia de que la misma surge exclusivamente de la aplicación de la acústica estadística.
Por otra parte es preciso comentar que, a pesar de la utilización universal de esta fór-
mula, su validez se circunscribe al caso de recintos con las siguientes características:

➤ Decaimiento energético exponencial asociado a un campo sonoro perfectamente difuso


(la energía se propaga con la misma probabilidad en todas las direcciones)
➤ Geometría regular de la sala
➤ Coeficiente medio de absorción α – inferior a, aproximadamente, 0,4

El RT resulta ser un parámetro fundamental en el diseño acústico de recintos. Ahora


bien, en la práctica se utilizan una serie de parámetros complementarios que, por estar funda-
mentados en la acústica geométrica, dependen de la situación del receptor (ver capítulos 4 y
5). La optimización de todos ellos en la fase de diseño permite garantizar con un elevado
grado de fiabilidad la obtención de una acústica adecuada, una vez construido el recinto.

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 66

DISEÑO ACÚSTICO DE ESPACIOS ARQUITECTÓNICOS π

1.15.8.3 Medida del tiempo de reverberación

El RT se calcula a partir de la curva de decaimiento energético, medida en un punto cualquiera


de una sala.
Según lo comentado en el apartado 1.15.1, dicha curva se puede obtener como res-
puesta a la emisión de un sonido intenso y breve, o bien más modernamente, mediante técni-
cas TDS o MLS, en cuyo caso se denomina ETC.
La obtención del RT a cada frecuencia de interés, a partir de la correspondiente curva
ETC, no se lleva a cabo directamente por simple observación del tiempo que transcurre hasta
que el nivel disminuye 60 dB. Ello es debido a que dicha curva presenta irregularidades, a
pesar de que su decaimiento asintótico es efectivamente en forma de línea recta. El motivo de
la aparición de dichas irregularidades es que en ningún recinto real existe un campo sonoro
perfectamente difuso. Teóricamente, sería necesario repetir la medida de la curva ETC un
número infinito de veces para, posteriormente, obtener una curva promedio exenta ya de irre-
gularidades.
En la práctica, la determinación del RT se realiza aplicando el método de Schroeder.
Dicho investigador demostró matemáticamente que la curva promedio anterior se puede obte-
ner de forma totalmente equivalente a base de integrar (sumar) todas las contribuciones ener-
géticas asociadas a una única curva ETC, desde un instante de tiempo infinito (en la práctica,
habitualmente entre 1 y 3 segun-
dos) hasta el instante inicial. 60
66 A título de ejemplo, en la RT = 1,38 s
figura 1.48 se muestra una curva 50
ETC, la curva obtenida a partir
40
de la integración temporal de la
Amplitud (dB)

ETC y el valor del RT calculado 30


Curva
a partir de esta última (margen ETC
20
superior derecho).
En la práctica, nunca es 10
posible observar una caída de 60
0
dB, por falta de margen dinámi-
co. En consecuencia, es el usua- -10
rio quien fija los instantes inicial
-20
y final, a partir de los cuales el 0 125 250 375 500 625 750 875 1.000
sistema de medida calcula auto- Tiempo (ms)
máticamente el RT.
Fig. 1.48 Curva ETC y curva utilizada para el cálculo del RT, obteni-
En el ejemplo anterior, se da como resultado de la integración de la ETC
han fijado unos márgenes tales
que la disminución de nivel es
de 20 dB, ya que corresponde al tramo más recto de la curva. En este caso, el RT se obtiene
multiplicando por 3 el tiempo asociado a dicha disminución.
Finalmente, conviene señalar que la manera práctica de obtener el valor del RT repre-
sentativo de una sala, a cada de frecuencia de trabajo, consiste en promediar los valores medi-
dos en diferentes puntos de la misma (habitualmente entre 10 y 15 puntos, según su volumen).

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 67

π PRINCIPIOS BÁSICOS DEL SONIDO

1.15.9 Cálculo de la inteligibilidad de la palabra: %ALCons y STI/RASTI

Aparte del perjuicio que representa para la inteligibilidad de la palabra la existencia de eco o
de eco flotante en una sala (apartados 1.15.3 y 1.15.4), la comprensión de un mensaje oral
depende fundamentalmente de la correcta percepción de sus consonantes (apartado 1.13.1).
A principios de la década de los años 70, el investigador holandés V.M.A. Peutz llevó a
cabo un exhaustivo trabajo a partir del cual estableció una fórmula para el cálculo de la inte-
ligibilidad.
El trabajo se dividió en dos partes perfectamente diferenciadas: la primera consistió en
realizar una serie de pruebas de audiencia en diferentes recintos basadas en la emisión de un
conjunto preestablecido de “logatomos” (palabras sin significado formadas por: consonante-
vocal-consonante). Cada individuo receptor tomaba nota de lo que escuchaba y, posterior-
mente, se procesaba toda la información recogida y se establecía una estadística de los resul-
tados obtenidos. Si, por ejemplo, el porcentaje medio de logatomos detectados correctamente
en uno de los recintos era de un 85%, entonces se consideraba que la pérdida de información
era de un 15%. Como dicha pérdida se asociaba a una percepción incorrecta de las conso-
nantes, Peutz la denominó: % de Pérdida de Articulación de Consonantes, o lo que es lo
mismo, %ALCons (“Articulation Loss of Consonants”). En el ejemplo anterior, se tendría un
%ALCons de un 15%. Huelga decir que, al tratarse de un parámetro indicativo de una pérdi-
da, cuanto mayor sea, peor será el grado de inteligibilidad existente.
La segunda parte del trabajo consistió en encontrar una ley matemática que, a partir del
conocimiento de una serie de parámetros acústicos del recinto en estudio, permitiese hallar el 67
valor de %ALCons en cada punto del mismo, sin necesidad de tener que realizar las laborio-
sas pruebas de audiencia. Lógicamente,
una vez establecida dicha ley, sería posible 1
predecir la inteligibilidad de la palabra en
% AlCons

RT (s)
cualquier punto de un recinto todavía por
2
construir.
Haciendo uso de la teoría acústica 3
4 0,10
estadística, Peutz dedujo que el valor de
5
%ALCons en un punto dado se podía 0,63
determinar, simplemente, a partir del
1,00
conocimiento del tiempo de reverberación 10

RT y de la diferencia entre los niveles de


presión sonora de campo directo LD y de 15
1,60

campo reverberante LR en dicho punto.


20
La ley en cuestión, expresada de 2,30
30
forma gráfica, se presenta en la figura 1.49. 40 4,00
El valor de %ALCons (eje de ordenadas 50
6,30
izquierdo) se determina a partir de los valo-
10,0
res de RT (eje de ordenadas derecho) y de 6 4 2 0 -2 -4 -6 -8 -10 -12
la diferencia LD-LR (eje de abscisas). LD - LR (dB)
Para el cálculo de LD-LR , la fórmu-
la a emplear es la siguiente: Fig. 1.49 Obtención del %ALCons a partir de RT y de LD - LR

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 68

DISEÑO ACÚSTICO DE ESPACIOS ARQUITECTÓNICOS π

LD – LR = 10 log
( ) QR
r2
– 17 (en dB)

donde:
log = logaritmo decimal
Q = factor de directividad de la fuente sonora en la dirección considerada (Q = 2 en el
caso de la voz humana, considerando la dirección frontal del orador)
R = constante de la sala (en m2)
r = distancia del punto considerado a la fuente sonora (en m)

Como tanto RT como R dependen del coeficiente medio de absorción α –, su conoci-


miento, junto con el del volumen V y el de la superficie total St permiten calcular los valores
de RT y de LD-LR.
– correspondiente a la banda
A nivel práctico, se suele elegir para el cálculo el valor de α
de 2 kHz, por ser la de máxima contribución a la inteligibilidad de la palabra.
De la observación de la figura anterior se desprende lo siguiente:

➤ Cuanto más cerca esté situado el receptor de la fuente sonora (LD-LR mayor), menor
será el valor de %ALCons, es decir, mayor inteligibilidad.
➤ Cuanto menor sea el RT, igualmente menor será el %ALCons, es decir, mayor inteligi-
68 bilidad.
➤ El valor de %ALCons va aumentando a medida que el receptor se aleja de la fuente,
hasta una distancia: r = 3,16 Dc . Para distancias r > 3,16 Dc , equivalentes a (LD - LR) <
-10 dB, el valor de %ALCons tiende a ser constante. Ello significa que, a partir de dicha
distancia, la inteligibilidad de la palabra ya no empeora.

Alternativamente, en lugar de usar las gráficas anteriores, se pueden utilizar las fórmu-
las del apéndice 2.
Otro factor no mencionado hasta el momento, pero que contribuye sustancialmente a la
pérdida de inteligibilidad, es el ruido de fondo presente en la sala. Desde un punto de vista
práctico, y sin entrar en aspectos cuantitativos, se considera que su efecto es despreciable
cuando el correspondiente nivel de ruido de fondo está, como mínimo, 12 dB por debajo del
nivel de la señal.
Finalmente, es preciso indicar que existe otro parámetro alternativo que permite cuantifi-
car el grado de inteligibilidad de la palabra. Dicho parámetro, conceptualmente más complejo,
se denomina STI (“Speech Transmission Index”) y su valor oscila entre 0 (inteligibilidad nula)
y 1 (inteligibilidad total). La definición del mismo se halla en el apéndice 2. Asimismo, existe
una versión simplificada del STI denominada RASTI (“Rapid Speech Transmission Index”).
Habitualmente, el RASTI es el parámetro medido en recintos, debido a su rapidez de cálculo en
relación con el STI. Su definición se encuentra igualmente en el apéndice 2.
Se ha podido demostrar que existe una muy buena correlación entre los valores de
%ALCons y de STI / RASTI. Dicha correpondencia se muestra en la figura 1.50 y en la tabla
1.6. En esta última aparece también la valoración subjetiva del grado de inteligibilidad.

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 69

π PRINCIPIOS BÁSICOS DEL SONIDO

100
90
80
70

% ALCons
60
50
40
30
20
10
0
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
STI/RASTI

Fig. 1.50 Correspondencia entre STI / RASTI y %ALCons

%ALCONS STI / RASTI VALORACIÓN SUBJETIVA

1,4% - 0% 0,88 - 1 Excelente


4,8% - 1,6% 0,66 – 0,86 Buena
11,4% - 5,3% 0,50 – 0,64 Aceptable
24,2% - 12% 0,36 – 0,49 Pobre
69
46,5% - 27% 0,24 – 0,34 Mala

Tabla 1.6 Relación entre %ALCons, STI / RASTI y la valoración subjetiva del grado de inteligibilidad

1.15.10 Relación entre el tiempo de reverberación y la inteligibilidad de la palabra

Seguidamente se da la explicación de por qué en un recinto muy “vivo” la palabra resulta inin-
teligible.
Según se ha expuesto en el apartado 1.13.1, al emitir un mensaje oral, la duración de
las vocales y su correspondiente nivel de presión sonora es mayor que el de las consonantes.
Además, el contenido frecuencial de las vocales es más rico en bajas frecuencias, en tanto que
las consonantes presentan un mayor contenido de altas frecuencias.
En una sala con un tiempo de reverberación alto, el decaimiento energético de una vocal
emitida en la misma es apreciablemente más lento que su decaimiento propio (aquél que se
observaría si la vocal se emitiese en el espacio libre). Tal hecho, junto con la mayor duración
y nivel comentados anteriormente, provoca un solapamiento temporal de la vocal con la con-
sonante emitida inmediatamente después, según se observa en la figura 1.51.
La simultaneidad temporal de la vocal y de la consonante con sus correspondientes
niveles, así como las características espectrales de ambos sonidos, son las causantes del
enmascaramiento parcial o total de la consonante, producido por la vocal (según se ha visto
en el apartado 1.10.2, un tono de baja frecuencia y nivel elevado enmascara otro tono de fre-
cuencia más elevada y nivel inferior).

© Los autores, 1998; © Edicions UPC, 1998.


01-Principios básicos 10/6/99 09:27 Página 70

DISEÑO ACÚSTICO DE ESPACIOS ARQUITECTÓNICOS π

Vocal

Energía sonora
Consonante

Tiempo (s)

Fig. 1.51 Evolución temporal de la energía sonora correspondiente a la emisión de


una vocal seguida de una consonante en un recinto cerrado (según Kurtovic)

Finalmente, como quiera que el grado de inteligibilidad está estrechamente ligado a la


correcta percepción de las consonantes por su importante contenido de altas frecuencias, el
enmascaramiento de las mismas debido a un exceso de reverberación provoca indefectible-
mente una pérdida de inteligibilidad en la sala.

70

© Los autores, 1998; © Edicions UPC, 1998.


UNIVERSITAT POLITÈCNICA DE
VALÈNCIA
E S C O L A P O L I T E C N I C A S U P E R I O R DE
GANDIA

G r a d o en I n g . S i s t . de T e l e c o m . , S o n i d o e
Imagen

“Empleo de técnicas de análisis


tiempo-frecuencia para el modelado de
instrumentos musicales y su aplicación
a la síntesis musical aditiva.”

TRABAJO FINAL DE GRADO

Autor/a:
Yetsibel Gonçalves Molina

Tutor/a:
Miguel Ferrer Contreras

GANDIA, 2020
Resumen
En este TFG se propone crear una base de datos de modelos de instrumentos musicales
con el fin de sintetizar sus sonidos de forma sencilla. Tanto el trabajo de modelado como
el de síntesis se realizará con la ayuda de MATLAB.
Habitualmente, la síntesis de instrumentos musicales, parte de un modelo armónico de
los mismos, o en un caso más genérico, de un modelo de componentes tonales
arbitrarias que se denominan parciales. Mediante técnicas de análisis espectral, se
pretende caracterizar los armónicos de diferentes instrumentos, y así poder sinterizarlos
mediante un modelo de síntesis aditiva. Estos modelos, no son siempre realistas, ya
que pierden la información de la envolvente temporal de los sonidos emitidos por cada
instrumento. Por lo tanto, para mejorar el modelado de los instrumentos, también se
realizará un análisis temporal de los sonidos que emiten los instrumentos musicales con
el objetivo de caracterizar la envolvente temporal de los mismos.
Finalmente, se propondrá la implementación de un sintetizador de instrumentos
musicales desarrollado, también, en MATLAB, con el fin de generar sonidos sintetizados
con un tono, amplitud, duración y modelo de instrumento elegidos por el usuario, que
podría transcribir partituras para sinterizar cualquier composición musical.

Palabras Clave
Síntesis Aditiva, Modelado de Sonido, Sonido Digital, Matlab, Música.
Abstract
In this TFG it is proposed to create a data base of musical instrument models with the
purpose of being able to synthesize their sounds in a simple way. Both the modeling and
synthesizing work Will be done with the help of Matlab.
Usually, the synthesis of musical instruments starts from a harmonic model, or in a more
generic case, from a model of arbitrary tonal componets that are called partials. Through
spectral análisis techniques, the aim is to characterize the harmonics or the partials of
different instruments, in order to be able to synthetsize them the using an additive
synthesis model. These kind of models are not always realistic, since they lose the
information of the temporal evelope of the sounds emitted by each instrument. Therefore,
to improve the modeling of the instruments, a temporal analysis of the sounds emitted
by the musical instruments will also be done in order to characterize the temporal
envelope of the instruments.
Finally, the implementation of a musical instrument synthesizer will be proposed, also
developed in MATLAB, in order to generate synthesized sounds with a tone, amplitude,
duration and instrument model chosen by the user, which could transcribe scores to
synthesize any musical composition.

Keywords
Additive Synthesis, Sound Modelling, Digital Sound, Matlab, Music.
Índice
Resumen...................................................................................................................................... 2
Palabras Clave............................................................................................................................ 2
Abstract ........................................................................................................................................ 3
Keywords ..................................................................................................................................... 3
1. Introducción y objetivos ..................................................................................................... 7
1.1 Presentación ............................................................................................................... 7
1.2 Objetivos ...................................................................................................................... 7
1.3 Metodología ................................................................................................................. 7
1.4 Organización de la memoria ..................................................................................... 8
2. El sonido y la música ......................................................................................................... 9
2.1 Las ondas sonoras ..................................................................................................... 9
2.1.1 La frecuencia fundamental y los armónicos ................................................... 9
2.1.2 La fase ................................................................................................................ 10
2.2 Cualidades del sonido en la música ...................................................................... 11
2.2.1 La intensidad y sonoridad ............................................................................... 11
2.2.2 El tono ................................................................................................................ 12
2.2.3 El timbre ............................................................................................................. 13
2.2.4 La duración ........................................................................................................ 14
2.3 Las escalas musicales ............................................................................................. 14
3. Análisis del sonido ............................................................................................................ 16
3.1 El espectro de frecuencias ...................................................................................... 16
3.1.1 La transformada de Fourier [7] ....................................................................... 18
3.2 La envolvente ADSR ................................................................................................ 20
4. Síntesis musical ................................................................................................................ 21
4.1 Tipos de síntesis ....................................................................................................... 22
4.1.1 Síntesis aditiva .................................................................................................. 22
4.1.2 Síntesis sustractiva .......................................................................................... 23
4.1.3 Síntesis por modulación de frecuencia (FM) ................................................ 23
4.1.4 Síntesis Granular .............................................................................................. 24
4.1.5 Síntesis por Tabla de ondas (Wavetable)..................................................... 24
4.2 Sistema MIDI [9] ....................................................................................................... 25
5. Modelado de instrumentos mediante MATLAB ........................................................... 27
5.1 Instrumentos de cuerda ........................................................................................... 30
5.2 Instrumentos de viento-madera.............................................................................. 34
5.3 Instrumentos de viento-metal ................................................................................. 36
6. Síntesis aditiva mediante MATLAB ............................................................................... 40
7. Conclusiones ..................................................................................................................... 45
8. Bibliografía ......................................................................................................................... 46
Índice de Ilustraciones
Figura 1: Composición de una onda mediante senos simples .......................................... 10
Figura 2: Composición de una onda con desfase ............................................................... 10
Figura 3: Curvas isofónicas calculadas por Robinson y Dadson (I.S.O 226) ................. 12
Figura 4: Escala Mels propuesta por Stevens, Volkman y Newwman ............................. 13
Figura 5: Figuras musicales .................................................................................................... 14
Figura 6: Relación de frecuencias en intervalos musicales ............................................... 15
Figura 7: Escala del temperamento igual ............................................................................. 16
Figura 8: División del espectro de frecuencias .................................................................... 17
Figura 9: Relación entre armónicos y octavas ..................................................................... 17
Figura 10: Descomposición de una onda compleja mediante la Transformada de
Fourier ........................................................................................................................................ 19
Figura 11: Relación de magnitudes en dominios tiempo-frecuencia mediante la
Transformada de Fourier......................................................................................................... 19
Figura 12: Envolvente ADSR .................................................................................................. 20
Figura 13: Envolvente ADSR del piano y el violín ............................................................... 20
Figura 14: Sintetizador Modular Moog .................................................................................. 21
Figura 15: Diagrama de un sintetizador aditivo ................................................................... 22
Figura 16: Diagrama de síntesis sustractiva ........................................................................ 23
Figura 17: Diagrama de síntesis FM ..................................................................................... 23
Figura 18: Proceso de síntesis granular asíncrona............................................................. 24
Figura 19: Representación gráfica de una tabla de ondas ................................................ 25
Figura 20: Estructura binaria de un mensaje MIDI.............................................................. 25
Figura 21: Mensajes MIDI ....................................................................................................... 26
Figura 22: Notación MIDI ........................................................................................................ 27
Figura 23: Espectro frecuencial de la guitarra ..................................................................... 30
Figura 24: Envolvente de la guitarra ...................................................................................... 30
Figura 25: Espectro frecuencial del Banjo ............................................................................ 31
Figura 26: Envolvente del Banjo ............................................................................................ 31
Figura 27: Espectro frecuencial del violín ............................................................................. 32
Figura 28: Envolvente del violín ............................................................................................. 32
Figura 29: Espectro frecuencial del piano ............................................................................ 33
Figura 30: Envolvente del piano ............................................................................................. 33
Figura 31: Espectro frecuencial del oboe ............................................................................. 34
Figura 32: Envolvente del oboe.............................................................................................. 34
Figura 33: Espectro frecuencial de la flauta ......................................................................... 35
Figura 34: Envolvente de la flauta ......................................................................................... 35
Figura 35: Espectro frecuencial del clarinete ....................................................................... 35
Figura 36: Envolvente del clarinete ....................................................................................... 36
Figura 37: Espectro frecuencial de la trompeta ................................................................... 37
Figura 38: Envolvente de la trompeta ................................................................................... 37
Figura 39: Espectro frecuencial de la tuba ........................................................................... 38
Figura 40: Envolvente de la tuba ........................................................................................... 38
Figura 41: Espectro frecuencial del trombón ....................................................................... 39
Figura 42: Envolvente del trombón ........................................................................................ 39
1. Introducción y objetivos
1.1 Presentación
Mediante los avances electrónicos y tecnológicos, se han desarrollado métodos de
síntesis con el fin de imitar instrumentos musicales reales y crear sonidos innovadores.
Los sintetizadores son una herramienta muy útil y utilizada para la producción de la
música en la actualidad.
Los primeros sintetizadores fueron analógicos, contaban con elementos electrónicos
como osciladores y generadores. Más adelante, con la aparición de las técnicas
digitales, aumentó la flexibilidad y facilidad para la síntesis musical, mediante su uso en
los ordenadores.
Existen distintos tipos de síntesis musical, como lo son la síntesis aditiva, síntesis
sustractiva, síntesis por modelado de frecuencia, entre otras, cada una con el mismo fin
de sintetizar sonidos, sin embargo, cada una cuenta con una técnica distinta de la cual
depende el resultado final.
El fin del presente proyecto es el estudio de las características sonoras necesarias para
recrear el timbre de distintos instrumentos musicales y el desarrollo de la síntesis aditiva
mediante MATLAB. Se trabajará con la síntesis aditiva ya que es conveniente para el
objetivo de imitar el sonido de instrumentos musicales existentes debido a la técnica que
emplea, en la cual es necesaria el modelado previo de los mismos.
La herramienta de programación usada en este proyecto es MATLAB, debido a su
amplio uso dentro de la ingeniería, y la capacidad y flexibilidad que contiene a la hora
del estudio del sonido, mediante las cuales posible realizar el modelado de los
instrumentos y la síntesis aditiva.

1.2 Objetivos
Los objetivos pretendidos en este proyecto se muestran a continuación:

• Modelado y análisis de instrumentos musicales, en concreto instrumentos de


cuerda, viento-madera y viento-metal.
• Síntesis de los instrumentos modelados, mediante el método de síntesis aditiva.
• Proposición de dos modelos para cada instrumento en la síntesis: uno mediante
los datos obtenidos a partir del análisis espectral y otro agregando los datos
obtenidos a partir del análisis de la señal del sonido de los instrumentos en el
dominio del tiempo.
• Capacidad del sintetizador de generar composiciones musicales con los tonos,
amplitudes, duración y modelo de instrumento elegidos por el usuario. Con un
formato sencillo similar al estándar MIDI.

1.3 Metodología
El proyecto se ha organizado de forma en la que se diferencian tres partes.
Primero, el estudio de los distintos conceptos teóricos necesarios para el desarrollo de
los objetivos técnicos planteados.
Luego se realizará el modelado de los instrumentos, el análisis espectral y temporal de
los sonidos con el fin de obtener los valores objetivos que posteriormente serán
necesarios para la imitación de los instrumentos en la síntesis.
Por último, se implementará una función en MATLAB de síntesis aditiva capaz de
generar melodías con el modelo de instrumento elegido por el usuario con un formato
sencillo similar al estándar MIDI.

1.4 Organización de la memoria


La memoria cuenta con las siguientes fases:

• Introducción y objetivos. En este capítulo se realiza la presentación del


proyecto, así como los objetivos planteados y los métodos necesarios para
llevarlo a cabo.
• Conceptos teóricos del sonido en la música. Se muestran conceptos
necesarios para entender la relación de los parámetros físicos y matemáticos
con la teoría musical.
• Conceptos teóricos aplicados en el análisis del sonido. En esta fase se
presentarán las técnicas necesarias, tanto el estudio del espectro frecuencial del
sonido como el estudio de éste en el dominio del tiempo, necesarios para el
modelado de instrumentos.
• Definición de la síntesis musical. Se presentará una breve historia de los
sintetizadores, la definición del mismo y los distintos tipos de técnicas de síntesis
existentes.
• Modelado de instrumentos mediante MATLAB. En esta fase se aplicarán los
métodos de análisis de sonido, previamente estudiados, con el fin de obtener los
parámetros objetivos de los distintos instrumentos mediante MATLAB.
• Síntesis aditiva de instrumentos mediante MATLAB. Se creará una función
en MATLAB capaz de sintetizar piezas musicales con los instrumentos
modelados anteriormente.
• Conclusiones. Se presentan las conclusiones alcanzadas a la hora de finalizar
el proyecto, junto con un breve repaso del mismo.
• Bibliografía. Se detallan las distintas fuentes de información utilizadas para la
realización del proyecto.
2. El sonido y la música
El sonido se puede definir como el conjunto de ondas mecánicas que se propagan a
través de medios elásticos. Para que se produzca el sonido se requiere la existencia de
un cuerpo vibrante y la de un medio elástico que transmita esas vibraciones, que se
propagan por él constituyendo la onda sonora.
Físicamente el ruido presenta el mismo concepto del sonido, sin embargo, se pueden
distinguir ya que el ruido produce sensaciones desagradables en el oído. Cuando se
tiene en cuenta las gráficas de las vibraciones se observa que mayormente los sonidos
musicales poseen ondas sinusoidales con variaciones debido a sus armónicos y cada
armónico presenta una periodicidad en el tiempo, el ruido en cambio carece de
periodicidad y por ello causa una sensación desagradable en el oyente. [1]

2.1 Las ondas sonoras


Una onda sonora consiste en la alteración de la presión del aire producida por una
vibración proveniente de instrumentos musicales, cuerdas vocales, altavoces o
cualquier objeto que presente una vibración en el rango de frecuencias audibles para
los humanos, desde 20Hz hasta 20kHz.
Mediante el Teorema de Fourier se demuestra que las ondas complejas, mientras sea
periódica, se pueden separar en los distintos componentes que la conforman, formando
así varias sumas de senos simples. Por lo tanto, las ondas sonoras de la voz y la música
parten de una función simple de seno, la cual se expresa con la siguiente ecuación:
𝑦 = 𝐴 𝑠𝑒𝑛 (2𝜋𝑓𝑡 + 𝜑) (1)
En donde 𝐴 es la amplitud, 𝑓 es la frecuencia, 𝑡 es el tiempo y 𝜑 es la fase en el instante
inicial de la oscilación. Es interesante estudiar cada parámetro de la función para
entender la síntesis aditiva.

2.1.1 La frecuencia fundamental y los armónicos


La frecuencia se trata de la cantidad de ciclos que se completan por segundo, la unidad
de medida es el Hertz (Hz). Las ondas periódicas complejas contienen una frecuencia
fundamental y los armónicos de ésta.
La frecuencia fundamental es la más baja presente en la onda sonora, mientras que los
armónicos son frecuencias múltiplo de la fundamental. Cada armónico presenta su
propia amplitud y en las frecuencias más altas decrece hasta llegar a cero.
En la figura 1 se logra ver el resultado final de una onda compleja al sumar frecuencias
con sus múltiplos.
FIGURA 1: COMPOSICIÓN DE UNA ONDA MEDIANTE SENOS SIMPLES

2.1.2 La fase
La definición de fase consiste en el estado de vibración de un punto de la onda. Dos
puntos están en fase cuando coinciden en velocidad y elongación. La fase de cada
componente de la onda debe iniciar en cero para que no ocurra un desfase. En el caso
que cada onda empiece por fases distintas, la forma de la onda compleja se deformaría
de manera notable. Sin embargo, el oído humano es relativamente insensible a estas
modificaciones y al escucharlo no implicaría una diferencia significativa a una onda en
fase. En el caso de que distintos componentes consten de la misma frecuencia, si tienen
desfase de 90º o 180º sería distinto para la percepción auditiva, ya que con la diferencia
de 90º varía la amplitud de las ondas y con 180º se cancelarían entre ellas [5].
En la figura 2 se nota la deformación de la onda final causada por el desfase, se logra
ver una diferencia considerable respecto a la figura 1.

FIGURA 2: COMPOSICIÓN DE UNA ONDA CON DESFASE


2.2 Cualidades del sonido en la música
Los distintos sonidos en la música están caracterizados principalmente por cuatro
cualidades: la intensidad, el tono, el timbre y la duración. Cada una depende de
parámetros físicos como lo son la frecuencia, la presión sonora, los armónicos, la
envolvente, entre otros.

2.2.1 La intensidad y sonoridad


La intensidad de sonido consiste en la cantidad de energía acústica que contiene un
sonido. La intensidad percibida subjetivamente por los humanos se denomina sonoridad
y es la cualidad con la cual se logra distinguir si un sonido es suave o fuerte.
La intensidad depende de la amplitud de las vibraciones y viene definida por la potencia
acústica (A) que transfiere una onda sonora por unidad de área normal a la dirección en
que la que ocurre la propagación (N).
𝐴
𝐼= (2)
𝑁

La unidad de la intensidad, estandarizada por el Sistema Internacional de Unidades, es


𝑊
el vatio por metro cuadrado (𝑚2).

Sin embargo, la sensación del nivel del sonido no solo depende de la intensidad objetiva,
también afecta la sensibilidad del oído de cada persona. El oído humano puede
𝑊 𝑊
−12
escuchar sonidos en el rango de intensidad desde 10 𝑚2 hasta 1 𝑚2 , siendo éstas el

umbral de audición y el umbral de dolor respectivamente.


Para expresar la sonoridad es habitual usar el decibelio (dB), viene dada por la siguiente
expresión:
𝐼
𝐿𝐼 = 10log (𝐼 ) (3)
𝑟𝑒𝑓

𝑊
−12
Donde 𝐼𝑟𝑒𝑓 es el umbral de audición (10 𝑚2 ).

Está demostrado que la sonoridad percibida varía según la frecuencia y el nivel de


intensidad sonora. Los primeros en trabajar en ello fueron Fletcher y Munson en los
Laboratorios Bell en 1933, las investigaciones siguieron hasta que se adoptó como
standard internacional (I.S.O 226) las curvas isofónicas estudiadas por Robinson y
Dadson. [5]
FIGURA 3: CURVAS ISOFÓNICAS CALCULADAS POR ROBINSON Y DADSON (I.S.O 226)
En la figura 3 se logra ver que las curvas isofónicas se vuelven más planas mientras
aumenta la intensidad, es decir, la dependencia de la frecuencia es más relevante
cuando hay niveles bajos de intensidad. El oído humano tiene menos sensibilidad para
las notas de bajas frecuencias que para las medias y altas. [5]

2.2.2 El tono
El tono es una cualidad que viene determinada por la frecuencia, permite distinguir si un
sonido es agudo o grave. Mientras mayor sea la frecuencia de la onda, más agudo será
el sonido y al ser menor la frecuencia, más grave sonará el mismo.
La función de un tono puro corresponde a la de una onda senoidal, donde f es la
frecuencia, t es el tiempo y A es la amplitud:
𝑓(𝑡) = 𝐴 𝑠𝑒𝑛(2𝜋𝑓𝑡) (4)
Las ondas periódicas se expresan como la suma de varios tonos puros de distintas
frecuencias, la frecuencia fundamental y los múltiplos de ésta, llamados armónicos. [2]
La forma en la que se percibe el tono según la psicoacústica se conoce como la altura
del sonido, mediante la cual se determina bajo y alto como grave y agudo,
respectivamente. Es normal que “tono” y “altura” sean sinónimos en lo que respecta a
la música. [3]
La relación entre el tono y la frecuencia se puede observar a través de experimentos
realizados por Stevens, Volkman y Newmann en 1937. Para ello invitaron a grupos de
personas a juzgar tonos percibidos para así crear una escala llamada la Escala Mel, en
la cual se aprecia la relación entre las frecuencias y el tono con unidad de medida
subjetiva llamada “mels” (Figura 4). [5]
FIGURA 4: ESCALA MELS PROPUESTA POR STEVENS, VOLKMAN Y NEWWMAN

2.2.3 El timbre
El timbre es la cualidad que permite el reconocimiento de la fuente sonora, aún cuando
tienen el mismo tono, frecuencia fundamental e intensidad. El oído puede identificar si
un instrumento es de viento, cuerda o percusión, así como las diferentes voces de cada
persona debido al timbre de los mismos.
Así como lo demuestra el Teorema de Fourier, cualquier onda periódica se descompone
en una serie de ondas con distintas frecuencias múltiplo de la frecuencia fundamental,
las cuales son conocidas como armónicos. Esto ocurre en las ondas de sonido y el
timbre dependerá principalmente del número de armónicos y la intensidad de cada uno,
estos parámetros se pueden obtener a través del espectro mediante un analizador de
ondas. Los armónicos son distintos según la fuente, el tipo de instrumento y la forma en
la que se toca el mismo instrumento.
Aunque el espectro de las frecuencias muestra los parámetros de forma objetiva, el
timbre es una cualidad subjetiva ya que para describirlo interviene la interpretación del
oído humano. [5]
El timbre también depende de la envolvente que contiene la amplitud del sonido, la
variación de la amplitud en el tiempo. En general las distintas fuentes presentan una
forma específica de envolvente que se caracteriza por cuatro momentos en el tiempo:
el ataque, la caída, el sostenimiento y la relajación, lo cual se conoce como la envolvente
ADSR. [4]
2.2.4 La duración
El tiempo en el que se mantienen las ondas de un sonido se denomina duración. Los
sonidos se pueden distinguir según la duración de los mismos.
Por ejemplo, al tocar una nota en una trompeta las ondas tienen una duración larga
mientras que al tocar la cuerda de una guitarra ésta se disminuye y al tocar algún
instrumento de percusión, como un tambor, es bastante corta.
En la teoría musical, la duración se representa mediante las figuras musicales, las
cuales son: La cuadrada, redonda, blanca, negra, corchea, semicorchea, fusa,
semifusa, garrapatea y semigarrapatea. La redonda se toma como punto de referencia
para asignar el valor a las demás notas: 16 semicorcheas, 8 corcheas, 4 negras y 2
blancas tienen la misma duración que una redonda, así como es posible observarlo en
la figura 5. En los compases musicales, la figura que representa la unidad es la negra,
por lo tanto, un pulso equivale a una negra.

FIGURA 5: FIGURAS MUSICALES


Aunque las figuras musicales siempre tienen la misma equivalencia entre ellas, la
duración en unidad de tiempo lo define el tempo musical. El tempo se mide en BPM
(pulsos por minuto) y su valor depende de la elección del compositor de la música. El
tempo indica la cantidad de pulsos de figuras negras por minuto. Por lo tanto, si es igual
a 100 BPM el valor de la negra será el de 100 pulsaciones de negra cada minuto, lo que
resultaría alrededor de 1.6 segundos y sabiendo la equivalencia entre las figuras se
podría determinar la duración de cada una en unidad de tiempo.

2.3 Las escalas musicales


La música podría definirse como un arte basado en sonidos y silencios, los cuales tienen
un orden creativo y técnico a su vez. Este orden varía según culturas, gustos subjetivos
personales y géneros musicales, sin embargo, existen reglas básicas que están
presentes en cualquier variación de la música y por ello surgen las escalas musicales,
creadas a partir de la matemática.
Las escalas musicales son un conjunto discreto de alturas puestas de tal forma en que
se obtenga un máximo número posible de combinaciones cuando varias notas del
conjunto son tocadas al mismo tiempo. Cualquier música basada en tonos demuestra
que el ser humano escucha con preferencia ciertos intervalos de frecuencia, como lo
son la octava y la quinta, esta preferencia no solo es solo subjetiva, mientras más
número de armónicos coincidentes y menor número de armónicos no coincidentes
tengan dos notas mejor sonarán, a lo que se llama consonancia y en el caso contrario
se le conoce como disonancia y es posible demostrarlo matemáticamente de la siguiente
forma:
𝑓1 𝑛
𝑓1′
=𝑚 (5)

En donde 𝑓1 y 𝑓1′ son las frecuencias fundamentales de ambas notas, 𝑛 y 𝑚 números


enteros. En la figura 6 se puede observar la relación de frecuencias en los intervalos
más usados en la música, todos cumpliendo la consonancia [7].

FIGURA 6: RELACIÓN DE FRECUENCIAS EN INTERVALOS MUSICALES


La voz humana y algunos instrumentos como los de cuerda frotada (violín, violonchelo,
entre otros) tienen la capacidad de producir tonos indefinidos dentro del rango auditivo
humano, sin embargo, no ocurre lo mismo para los instrumentos musicales de afinación
limitada ya que éstos se afinan con notas de altura fija, con doce sonidos por octava con
una frecuencia estandarizada.
En la música occidental el sistema más utilizado es el sistema de temperamento igual,
el cual se refiere a una afinación construida de tal forma en la que los semitonos de la
octava están divididos en partes iguales, la relación entre una nota y el siguiente
12
semitono es de √2 (Figura 7). Los valores de las frecuencias de cada nota en el
temperamento igual se conocen mediante la expresión número 6.
12 𝑛−𝑛0
𝑓(𝑛) = ( √2) 𝑓0 (6)

En la expresión, 𝑓(𝑛) es el valor de la frecuencia a calcular, 𝑛 el número de la nota


musical a calcular, 𝑛0 el número de tecla base y 𝑓0 el valor de la frecuencia base. La
Organización Internacional de Normalización ha estandarizado como nota base de
afinación la nota 𝐿𝐴4 con el valor fijo de frecuencia de 440 Hz (norma ISO 16).
FIGURA 7: ESCALA DEL TEMPERAMENTO IGUAL

3. Análisis del sonido


Como se ha mencionado antes, existen parámetros físicos que forman parte en la
definición de las cualidades subjetivas del sonido, en análisis de éstos es una acción
importante para el fin de realizar un modelado de instrumentos musicales.
Las formas principales de analizar el sonido son mediante la visualización del espectro
de frecuencias y el desarrollo temporal de la señal que se quiere estudiar, que en el
caso de los instrumentos musicales es natural la aparición de una envolvente conocida
como “envolvente ADSR”.

3.1 El espectro de frecuencias


El espectro de frecuencias se caracteriza por mostrar la forma en que la energía de la
señal se distribuye en las frecuencias. El conocimiento del espectro permite el acceso a
las magnitudes de las frecuencias de una señal. La representación espectral no permite
observar la evolución temporal de la señal, si no que permite evaluar instantáneamente
las características de un segmento de ésta.
Las señales de audio usualmente son complejas en el desarrollo temporal y para
analizarlas es muy útil el uso del espectro de frecuencias, ya que aporta información de
sencilla lectura. La equivalencia de la representación temporal y espectral de las señales
se dan por transformaciones definidas por la Transformada de Fourier.
Al realizar un análisis espectral se descompone las frecuencias dentro del intervalo
audible humano (de 20 a 20 kHz) en bandas de octava, y se determina el nivel de presión
sonora correspondiente a cada banda. En las bandas de octava se cumple que la
frecuencia superior de la banda es el doble de su frecuencia inferior, como se puede
observar en la figura 8.
FIGURA 8: DIVISIÓN DEL ESPECTRO DE FRECUENCIAS
En la música es frecuente usar las octavas, el cual es un concepto logarítmico que
determina las terminologías y escalas musicales debido a la relación que tiene con la
naturaleza del oído humano. Por ello es común el uso de escalas logarítmicas para las
medidas del sonido. [5]
Los armónicos, definidos en el apartado 2.1.1, y las octavas están relacionados de tal
forma en la que se observa en la figura 9. Los armónicos son lineales mientras que las
octavas son logarítmicas.

FIGURA 9: RELACIÓN ENTRE ARMÓNICOS Y OCTAVAS


El análisis espectral es muy útil en la práctica ya que permite realizar una gran cantidad
de arreglos como la cancelación de ruido, la ecualización y la manipulación de las
señales en el procesamiento digital del sonido.
3.1.1 La transformada de Fourier [7]
El Teorema de Fourier demuestra que toda señal periódica compleja puede ser dividida
en infinitas sinusoides, las cuales tienen una relación armónica en la cual la frecuencia
fundamental contiene el período de la señal compleja que se analiza. Es una
herramienta fundamental a la hora de estudiar los parámetros de los sonidos. Fue Jean-
Baptiste Joseph Fourier quién descubrió el teorema mientras estudiaba las funciones
complejas, al ser capaz de descomponer una función compleja en muchas funciones
simples se convirtió mucho más sencillo analizar dichas señales.
Al estudiar una señal periódica y saber su período se conoce instantáneamente que el
espectro es armónico y el valor de la frecuencia de cada armónico, sin embargo, antes
de aplicar el Análisis de Fourier la amplitud de cada armónico es desconocida.
Todos los sonidos periódicos en el dominio del tiempo pueden sintetizarse a través de
los coeficientes del desarrollo en series de Fourier. Para demostrarlo se observa que al
ser 𝑠(𝑡) la amplitud de dicha señal, se espera que ésta se pueda escribir como la suma
de un número de tantas funciones armónicas simples como armónicos tenga la señal.
El período del primer armónico es el mismo de la señal compleja y por lo tanto éste se
podría expresar de la siguiente forma:
𝑠1 (𝑡) = 𝐴1 cos(2𝜋𝑓1 𝑡 + 𝜑1 ) (7)
Con el fin de no tratar con amplitudes y fases al mismo tiempo se usa una identidad
trigonométrica y se produce una suma de senos y cosenos, la cual permite reconstruir
la función original 𝑠(𝑡):

𝑠(𝑡) = 𝑎0 + ∑𝑛=1(𝑎𝑛 cos( 𝑛2𝜋𝑓1 𝑡) + 𝑏𝑛 sin(𝑛2𝜋𝑓1 𝑡)) (8)

Para reconstruir la señal habría que determinar los coeficientes 𝑎𝑛 y 𝑏𝑛 , 𝑎0 es el valor


medio de la función, el cual casi siempre es cero en las señales acústicas. Los
coeficientes se calculan a través de las relaciones de Euler, como se demuestra a
continuación:
2 𝜌
𝑎𝑛 = 𝑃 ∫0 𝑓(𝑡) cos(𝑛2𝜋𝑓1 𝑡) ⅆ𝑡
{ 2 𝜌 (9)
𝑏𝑛 = 𝑃 ∫0 𝑓(𝑡) sin(𝑛2𝜋𝑓1 𝑡) ⅆ𝑡

En donde 𝜌 es el periodo fundamental de la señal. Sin embargo, teniendo como fin la


manipulación de las señales en medios electrónicos, se debe tener en cuenta que al
tratarse de señales infinitas requieren de muchos cálculos, lo cual no es lo más óptimo
para al tratarse de cálculo por ordenador. La solución para esto es la Transformada
Rápida de Fourier (Fast Fourier Transform), que es una versión eficiente de la
transformada discreta de Fourier y permite reconstruir la señal periódica compleja
utilizando una frecuencia de muestreo Fs de la siguiente forma:
𝑘𝑚𝑎𝑥
1 2𝜋𝑓0
𝑠(𝑛) = 2 𝑎0 (𝑛) + ∑ 𝑟𝑘 (𝑛) cos ( 𝐹𝑠
+ 𝜑𝑘 (𝑛)) (10)
𝑘=1

Y los coeficientes:

𝑎𝑘 (𝑛) = 𝑟𝑘 (𝑛) cos(𝜑𝑘 (𝑛))


{ (11)
𝑏𝑛 (𝑛) = 𝑟𝑘 (𝑛) sin(𝜑𝑘 (𝑛))
En la FFT se tiene en cuenta el teorema de muestreo de Nyquist-Shannon para
garantizar la construcción de la señal original, por lo tanto, se utiliza un valor 𝑘𝑚𝑎𝑥 el
𝐹𝑠
cual consiste en el armónico más alto luego de la frecuencia fundamental (𝑘𝑚𝑎𝑥 < 2𝑓 ).
0
También se introduce un coeficiente variable 𝑟𝑘 el cual habilita el uso de envolventes
que modulen los osciladores, de esta forma se generan las ondas periódicas.
Como resumen práctico del teorema, se puede resaltar que éste permite realizar dos
funciones fundamentales durante en análisis del audio: descomponer una onda
periódica compleja en los componentes simples que la conformen, como se muestra en
la figura 10, y obtener las amplitudes y frecuencias de cada armónico a partir de la señal
en el dominio del tiempo, lo cual se observa en la figura 11.

FIGURA 10: DESCOMPOSICIÓN DE UNA ONDA COMPLEJA MEDIANTE LA TRANSFORMADA DE


FOURIER

FIGURA 11: RELACIÓN DE MAGNITUDES EN DOMINIOS TIEMPO-FRECUENCIA MEDIANTE LA


TRANSFORMADA DE FOURIER
3.2 La envolvente ADSR
Como se ha indicado anteriormente, la forma de la onda sonora en el tiempo influye de
manera importante en el timbre. Cada instrumento musical tiene una forma de onda
característica y por la naturaleza de éstos se puede describir mediante un modelo
llamado ADSR.
La ADSR consiste en una envolvente de cuatro etapas: ataque (A), decaimiento (D),
sostenimiento (S) y relajación (R), tal como se observa en la figura 12.

FIGURA 12: ENVOLVENTE ADSR


• El ataque se trata del tiempo desde que la onda empieza en cero hasta que
alcanza el punto máximo de amplitud.
• El decaimiento es el tiempo que tarda la onda en pasar del punto máximo de
amplitud hasta un estado de energía estacionario.
• El sostenimiento es la duración en la que la onda se mantiene en un estado de
energía estacionario, el cual tiene un nivel de amplitud específico.
• La relajación consiste en el tiempo en el que la onda finaliza el estado
estacionario hasta que su amplitud se convierte en cero.
En la figura 13 se visualiza la diferencia de la forma temporal de las ondas de dos
instrumentos, el piano y el violín, y la forma en la que se aplica la envolvente ADSR a
éstos.

FIGURA 13: ENVOLVENTE ADSR DEL PIANO Y EL VIOLÍN


4. Síntesis musical
La síntesis del sonido consiste en la generación o replicación de sonidos mediante la
aplicación de técnicas electrónicas o digitales de tratamiento de señal, en lugar de los
medios acústicos tradicionales. El descubrimiento de la síntesis del sonido ha sido de
gran importancia en el campo musical de los últimos años, entre otras cosas debido a
la oportunidad que ofrece de generar sonidos nuevos, que han aportado innovación en
distintos géneros musicales. La síntesis puede ser analógica o digital. Los dispositivos
analógicos contienen circuitos electrónicos complejos que tratan señales continuas
mientras que los digitales se basan en algoritmos y señales discretas.
Uno de los primeros en desarrollar equipos sintetizadores fue el ingeniero eléctrico y
físico Robert Moog, su primera creación que salió en el mercado fue el “sintetizador
Modular Moog”, el cual contaba con resistencias, transistores, condensadores y
válvulas, el control de éstos los tenía el usuario mediante potenciómetros ubicados en
el panel del sintetizador, como se puede ver en la figura 14. [5]

FIGURA 14: SINTETIZADOR MODULAR MOOG


En general, los primeros sintetizadores analógicos contaban con osciladores, distintos
tipos de formas de onda, filtros, generadores de envolventes y efectos sobre los sonidos
que el usuario podría manipular.
Por otro lado, las técnicas de síntesis digital heredaron los conocimientos desarrollados
con los dispositivos analógicos. El primer sistema, llamado Music V, fue desarrollado
por Max Mathews en 1969 [8]. Mathews versionó los módulos pertenecientes a los
sintetizadores analógicos, reemplazándolos con un generador unitario el cual acepta
entradas numéricas de control y genera una señal digital, la cual puede pasar a otro
control unitario o ser el sonido de salida. Los generadores unitarios generalmente son
los osciladores, los filtros, generadores de envolvente, sumadores, entre otros… A partir
de la combinación de estos elementos se generan sonidos similares al resultado por los
módulos analógicos, pero con un control mucho más sencillo y preciso. La mayoría de
sistemas de síntesis digital en la actualidad parten de estos conceptos [8].
Los algoritmos de síntesis son implementados tanto a nivel de software como de
hardware. Mediante software, los algoritmos tienen mayor flexibilidad y complejidad ya
que dependen de un lenguaje de programación y la capacidad del ordenador, sin
embargo, es difícil su aplicación a tiempo real, por esta razón la mayoría de
sintetizadores comerciales utilizan implementaciones en hardware [8].

4.1 Tipos de síntesis


Existen diferentes técnicas de síntesis aplicadas a los sintetizadores analógicos y
digitales, cada una cuenta con procesos diferentes y con el mismo fin de sintetizar
sonidos, sin embargo, es importante estudiar la diferencia entre estas ya que algunas
son más convenientes que otras según el propósito para el que se quiera sintetizar.
Algunas de las más comunes son la síntesis aditiva, la sustractiva, la granular, por
modulación, por tabla de ondas y por modelado físico.

4.1.1 Síntesis aditiva


La síntesis aditiva parte de la generación de tonos puros (ondas sinusoidales) y la
combinación de éstos para así crear un sonido complejo. Se basa en el Teorema de
Fourier, el cual demuestra que cualquier forma de onda periódica tiene la capacidad de
ser modelada como suma de sinusoides con distintas frecuencias y amplitudes. En el
caso de la síntesis aditiva se aplica una ingeniería inversa del Teorema de Fourier, ya
que se suman diversas ondas simples, moduladas con distintas amplitudes y
frecuencias, hasta formar una señal compleja. La señal de salida generalmente se
expresa de la siguiente forma:
𝑦(𝑡) = ∑𝑛𝑘=1 Ak (t) sin(𝑘2𝜋𝑓0 𝑡 + 𝜑k ) (12)

En donde 𝑛 es el número de armónicos, A la amplitud del armónico k-ésimo, 𝑓0 es la


frecuencia fundamental, 𝑡 es la duración y 𝜑k la fase inicial de cada armónico.
Como se logra ver a través de la expresión 12, para aplicar la síntesis aditiva se necesita
el conocimiento de tres elementos característicos del sonido que se quiere imitar o crear:
la amplitud, la frecuencia fundamental y la fase inicial de cada armónico presente en la
señal.
Para la imitación óptima de un instrumento musical, la amplitud de los armónicos debe
estar modulada según la envolvente ADSR (explicado en el apartado 3.2) del mismo.
En caso de que no se añada la envolvente ADSR y solo se ingrese la amplitud de cada
armónico, el resultado será un sonido electrónico, lejos de la naturalidad del instrumento.

FIGURA 15: DIAGRAMA DE UN SINTETIZADOR ADITIVO


4.1.2 Síntesis sustractiva
La síntesis sustractiva consiste en la emulación de un sonido a partir de una señal inicial
compleja, a la cual se procede a sustraer características para así generar el sonido
deseado.
El proceso empieza mediante la generación de ondas, las cuales pueden ser
sinusoidales, cuadradas, de diente de sierra, triangulares, o ruido, a través de un
oscilador. La señal generada consta de distintas frecuencias las cuales pasan por un
filtro para así dejar solo las frecuencias de la señal que se quiere emular. Finalmente, la
señal pasa por un amplificador el cual controla el nivel de la señal filtrada.
El proceso completo consigue imitar el espectro frecuencial del sonido a emular, tiene
limitaciones a la hora de recrear sonidos naturales. Sin embargo, este tipo de síntesis
es llamativa ya que ofrece el uso de timbres particulares característicos de sonidos
electrónicos clásicos, el uso de este sistema es muy frecuente en los sintetizadores
analógicos.

FIGURA 16: DIAGRAMA DE SÍNTESIS SUSTRACTIVA

4.1.3 Síntesis por modulación de frecuencia (FM)


La síntesis por modulación de frecuencia se basa en el uso de al menos dos osciladores,
uno con la señal portadora y otro con la señal moduladora. El timbre y la frecuencia
fundamental generalmente lo origina la señal portadora, la cual es usualmente
controlada mediante un teclado o cualquier medio MIDI. Por otro lado, la señal
moduladora tiene el fin de modificar la portadora con un índice de modulación específico,
el cual determina la amplitud y cantidad de cada uno de los componentes (armónicos)
en el espectro de la señal de salida.

FIGURA 17: DIAGRAMA DE SÍNTESIS FM


La síntesis por modulación de frecuencia generalmente produce formas de ondas que
no son habituales en la naturaleza, por esta razón no es ideal para la imitación de
sonidos encontrados en instrumentos musicales.

4.1.4 Síntesis Granular


Consiste en la síntesis de sonidos a partir de elementos muy pequeños de señal en el
dominio del tiempo, los cuales se conocen como sonidos atómicos o granos. Los granos
pueden tener una duración aproximada desde uno a cien milisegundos. Cada grano se
genera a partir de una forma de onda obtenida mediante otro método de síntesis y
cuenta con tres parámetros: frecuencia, duración y forma de onda.
La síntesis granular de mayor uso es la asíncrona (AGS), los granos se obtienen
mediante una dispersión de éstos en una zona característica denominada “nube” en el
dominio de frecuencia. Es un proceso repetitivo y aleatorio en el que ocurre la creación
de granos con distintas frecuencias y duraciones hasta tener una gran densidad de
éstos. Finalmente, cada grano obtenido es multiplicado por una envolvente con el fin de
eliminar sonidos bruscos de clicking, que ocurriría debido a la transición de distintos
granos.
En la figura 19 es posible observar las nubes y que cada punto en éstas representa un
grano con una frecuencia y duración particular.

FIGURA 18: PROCESO DE SÍNTESIS GRANULAR ASÍNCRONA


Con esta técnica es posible crear sonidos no periódicos, como los de objetos no
musicales o efectos nuevos, y por lo tanto no es conveniente a la hora de sintetizar
sonidos con el fin de imitar instrumentos musicales acústicos.

4.1.5 Síntesis por Tabla de ondas (Wavetable)


Este método de síntesis es utilizado generalmente para producir música de forma digital.
Contiene una tabla con una gran cantidad de formas de onda almacenadas a partir de
muestras procedentes de sonidos, las cuales son modificadas por el usuario mediante
un interfaz. Al tocar una nota en el dispositivo, empieza una secuencia de ondas
predeterminadas con el mismo ciclo que están almacenadas en la tabla, generalmente
con aplicación de modulaciones a la señal, lo que genera cambios en su forma con
transiciones sutiles en el tiempo.
La síntesis por tabla de ondas es bastante relevante ya que la mayoría de tarjetas de
sonido y sintetizadores en el mercado actual constan con alguna variante de ésta. Se
debe tener en cuenta la capacidad de los dispositivos para aplicar esta técnica, ya que,
para reconstruir los distintos sonidos, los sintetizadores deben contener espacio de
almacenamiento capaz de almacenar la cantidad de fragmentos de audio de excelente
calidad que contiene las tablas y la velocidad de procesamiento requerida para la lectura
de éstas.

FIGURA 19: REPRESENTACIÓN GRÁFICA DE UNA TABLA DE ONDAS

4.2 Sistema MIDI [9]


El sistema MIDI (Musical Instrument Digital Interface) consiste en un conjunto de
instrucciones simples y estandarizadas que comunican a un instrumento electrónico las
notas que debe reproducir, y las características que deben tener. Surgió a partir de la
aparición de los sintetizadores digitales, ya que no existía una forma de interconexión
entre ellos, la solución ocurrió en 1983, cuando fue estandarizado por un grupo llamado
MIDI Manufactures, representantes en la industria de fabricantes de instrumentos
musicales y desde entonces se hizo posible la comunicación entre instrumentos digitales
de distintas marcas.
Los mensajes MIDI están compuestos por tres bytes, uno de estado y los dos restantes
de datos. En el byte de estado se determina el tipo de mensaje y el canal que lo recibe,
los bytes restantes dependen de éste, como se observa en la figura 20.

FIGURA 20: ESTRUCTURA BINARIA DE UN MENSAJE MIDI


Por lo tanto, existen 23 tipos de mensajes MIDI, ellos son:

• Note On: Le indica al dispositivo que debe iniciar una nota, en el primer byte de
datos indica la altura de la nota, siendo 0 la nota más grave y 127 la nota más
aguda, como se logra ver en la figura 18. En el segundo byte indica la velocidad
del ataque, parámetro asociado con la intensidad sonora, algunos dispositivos
no detectan este parámetro y envían una velocidad constante de 64.
• Note Off: Le indica al dispositivo que debe parar una nota. El primer byte consta
de la altura de la nota y el segundo de la velocidad. La mayoría de equipos no
responden a la velocidad de liberación, por ello es común que en su lugar se
utilice el mensaje Note On con velocidad 0.
• Polyphonic Aftertouch: Consiste en la detección de los cambios de presión
ejercidos al tocar una tecla, los teclados de alta gama son los que cuentan con
esta opción. El primer byte indica la altura de la nota y el segundo byte la presión
que se ejerce sobre ésta.
• Control Change: Se utiliza para seleccionar los controles de efectos del sonido,
como la modulación, la reverberación, entre otros. El primer byte indica el tipo
de control y el segundo indica el valor del control seleccionado.
• Channel Aftertouch: Es similar al Polyphonic Aftertouch, utiliza un único byte
que envía un mensaje de presión por cada nota.
• Pitch Bend: Genera una variación de altura, usualmente se utiliza en teclados
que contienen un control giratorio el cual se utiliza para crear un efecto de
trémolo en el sonido. Utiliza los dos bytes de datos.
• Program Change: Se utiliza para seleccionar los distintos sonidos que contenga
el sintetizador. Consta de un byte.
• System Mesagge: Contienen información del sistema en general como la señal
de tiempo para sincronización, información sobre secuencias de MIDI grabados
anteriormente y detalles sobre la información de configuración del dispositivo en
el que se trabaja.
Aunque un dispositivo contenga la interfaz MIDI, no es necesario que trabaje con
todos los mensajes, esto depende de la capacidad de los dispositivos. La estructura
genérica de cada mensaje se puede observar en la figura 21.

FIGURA 21: MENSAJES MIDI


Cada nota musical y su frecuencia fundamental estandarizada tiene asignada un número
específico en la notación MIDI (Figura 22).
FIGURA 22: NOTACIÓN MIDI

5. Modelado de instrumentos mediante


MATLAB
Con el fin de sintetizar instrumentos mediante la síntesis aditiva, es necesario realizar
previamente el modelado de éstos. Tal como se ha explicado en el apartado 3, las
características sonoras de los instrumentos se pueden obtener mediante el análisis de
la señal en el espectro de frecuencias y en el dominio del tiempo.
Cada instrumento presenta unos componentes espectrales específicos, los cuales son
posibles de obtener mediante el cálculo de la transformada de Fourier rápido (FFT) de
datos extraídos a partir de un archivo de audio proveniente de grabaciones al tocar una
sola nota del instrumento.
MATLAB es una herramienta fundamental para la realización de este proyecto ya que
contiene funciones que permiten el análisis y la manipulación de señales de audio. Para
obtener las componentes espectrales de cada instrumento se ha implementado una
función llamada “espectroFrecuencial”, la cual realiza la FFT del audio y genera una
gráfica del espectro de frecuencias, mediante esta gráfica es posible observar el valor
de las amplitudes de cada armónico.
La función se ha implementado de la siguiente forma:
function espectroFrecuencial(audio)
%La función genera la gráfica del espectro frecuencial del audio de
entrada

[y,Fs] = audioread(audio); %Lee los datos muestreados y la


frecuencia de muestreo el audio
y=y/max(y); %Normaliza los datos
nMuestras=length(y); %Cantidad de muestras de los datos

%Transformada rapida de Fourier


senalEnFreq=abs(fft(y/(nMuestras/2))); %Genera la FFT de la señal,
normalizada según el muestreo
senalEnFreq1=senalEnFreq(1:nMuestras/2); %Reduce la señal a las
frecuencias audibles (elimina imagen espejo)
f=linspace(0,Fs/2,nMuestras/2); %Se crea el vector con los valores
de las frecuencias

plot(f,senalEnFreq1)
xlabel('Frecuencia [Hz]');
ylabel('Amplitud normalizada [V]');
title('Señal en el dominio de la frecuencia');

end

Al aplicar la función anterior y obtener los valores de la gráfica resultante se obtiene lo


fundamental para recrear el sonido de un instrumento mediante el método de Fourier: la
amplitud de cada armónico. Sin embargo, para obtener un sonido menos “digital” y más
cerca a la naturalidad del instrumento, es conveniente estudiar la señal en el dominio
del tiempo y así ajustar su envolvente a una envolvente ADSR (apartado 3.2).
Se debe tener en cuenta que cada instrumento tiene una envolvente característica, la
cual no es exactamente la misma en todos los casos, ya que cuenta con algunas
variaciones que dependen, por ejemplo, de la forma en la que éstos se toquen, por lo
tanto, su generación también puede constar de valores subjetivos.
Para la obtención de la envolvente ADSR en el presente proyecto, primero se ha
estudiado la señal de la nota de cada instrumento en el dominio del tiempo mediante la
función “senalDominioTiempo”, la cual genera una gráfica con la señal en el dominio del
tiempo. El código es el siguiente:
function senalDominioTiempo(audio)
%La función genera la gráfica en el dominio del tiempo del audio de
entrada

[y,Fs] = audioread(audio); %Lee los datos muestreados y la


frecuencia de muestreo el audio
y=y/max(y); %Normaliza los datos

plot(y)
xlabel('Tiempo [s]');
ylabel('Amplitud normalizada [V]');
title('Señal en el dominio del tiempo');
end

Como siguiente paso, se ha creado la función “envADSR”, la cual genera una envolvente
ADSR mediante una expresión analítica. Los datos de entrada son la duración y la
frecuencia de muestreo, para adaptarlo posteriormente a la síntesis aditiva, y lo que la
define: el porcentaje de amplitud de sostenimiento y los tiempos de duración del ataque,
decaimiento, sostenimiento y relajación. Dichos valores han sido elegidos de forma que
la envolvente resulte similar a la envolvente de la señal original, visualizada mediante la
gráfica en el dominio del tiempo.
La función “envADSR” se ha implementado de la siguiente forma:
function [envolvente] =
envADSR(duracion,Fs,pSostenimiento,dAtaqueS,dDecaimientoS,dSostenimi
entoS,dRelajacionS)
%envolventeADSR devuelve un vector "envolvente", la entrada
%será la frecuencia de muestreo, el porcentaje de amplitud del
sostenimiento y la duracion del ataque, decaimiento,
%sostenimiento y relajación (en segundos).

% Se normaliza la amplitud de sostenimiento


aSostenimiento = pSostenimiento/100;
% Se normalizan los segundos de duracion de cada etapa
dTotal = dAtaqueS+dDecaimientoS+dSostenimientoS+dRelajacionS;
dAtaqueS = (duracion*dAtaqueS)/dTotal;
dDecaimientoS = (duracion*dDecaimientoS)/dTotal;
dSostenimientoS = (duracion*dSostenimientoS)/dTotal;
dRelajacionS = (duracion*dRelajacionS)/dTotal;
% Se pasa cada duracion de Segundos a Muestras
dAtaqueM = round(dAtaqueS*Fs);
dDecaimientoM = round(dDecaimientoS*Fs);
dSostenimientoM = round(dSostenimientoS*Fs);
dRelajacionM = round(dRelajacionS*Fs);
dTotalM=dAtaqueM+dDecaimientoM+dSostenimientoM+dRelajacionM;

if dTotal~=Fs*duracion
dRelajacionM=abs(dRelajacionM-(dTotalM-(Fs*duracion)));
else
dRelajacionM=dRelajacionM;
end
% Se genera la envolvente aplicando la expresion analitica
% Primero se generan los componentes X e Y de cada etapa
tAtaque = [0:dAtaqueM]; %Componente X del ataque
ataque = ((1/dAtaqueM)*(tAtaque-dAtaqueM))+1; %Componente Y del
ataque
tDecaimiento = [0:dDecaimientoM-1]; %Componente X del decaimiento
decaimiento = (((aSostenimiento-1)/dDecaimientoM)*(tDecaimiento-
dDecaimientoM))+aSostenimiento; %Componente Y del decaimiento
tSostenimiento = ones(1,dSostenimientoM); %Componente X del
sostenimiento
sostenimiento = tSostenimiento*aSostenimiento; %Componente Y del
sostenimiento
tRelajacion = [0:dRelajacionM-1]; %Componente X de la relajación
relajacion = (-aSostenimiento/dRelajacionM)*(tRelajacion-
dRelajacionM); %Componente Y de la relajación
% Por último se concatena cada etapa para formar la envolvente
ADSR
envolvente=[ataque decaimiento sostenimiento relajacion];
end

A partir de las funciones descritas en este apartado se han modelado los instrumentos,
los resultados y detalles de cada instrumento se presentan a continuación.

5.1 Instrumentos de cuerda


Los instrumentos de cuerda son los que producen sonidos mediante vibraciones de una
o múltiples cuerdas, normalmente amplificadas a través de una caja de resonancia.
Dichas cuerdas están tensadas entre dos extremos. A su vez, se dividen en tres tipos:
de cuerda frotada, de cuerda pulsada y de cuerdas percutidas.
En el presente proyecto se estudiará la guitarra acústica y el banjo (cuerda pulsada), el
violín (cuerda frotada) y el piano (cuerda percutida).

• Guitarra:
El espectro frecuencial resultante es el siguiente:

FIGURA 23: ESPECTRO FRECUENCIAL DE LA GUITARRA


Se ha estudiado el sonido de la guitarra acústica al tocar una cuerda con una púa, el
envolvente ADSR que logra su imitación consiste en un ataque muy rápido, un
decaimiento corto con una amplitud baja, y un sostenimiento y liberación con más
duración que los anteriores, pero sin llegar a ser muy largos.

FIGURA 24: ENVOLVENTE DE LA GUITARRA


• Banjo:
El espectro frecuencial resultante del banjo es:

FIGURA 25: ESPECTRO FRECUENCIAL DEL BANJO


Respecto a la envolvente, aunque ambos instrumentos son de cuerda pulsada, el ataque
del banjo es incluso más rápido que el de la guitarra, el decaimiento es más corto y con
menos amplitud, el sostenimiento es corto y la liberación es más larga.

FIGURA 26: ENVOLVENTE DEL BANJO


• Violín:
El espectro frecuencial es el siguiente:

FIGURA 27: ESPECTRO FRECUENCIAL DEL VIOLÍN


La envolvente del violín se caracteriza por un ataque de duración normal y decaimiento
nulo, un sostenimiento con amplitud máxima, y una liberación bastante larga.

FIGURA 28: ENVOLVENTE DEL VIOLÍN


• Piano:
El espectro frecuencial resultante del piano se ve de la siguiente forma:

FIGURA 29: ESPECTRO FRECUENCIAL DEL PIANO


La envolvente del piano tiene una forma exponencial, en el proyecto se ha optado por
modificar la envolvente ADSR de forma que genere un sonido más similar al piano
electrónico, por ello se ha escogido un ataque y liberación rápida y un sostenimiento
largo con amplitud máxima.

FIGURA 30: ENVOLVENTE DEL PIANO


Los valores obtenidos a partir de los espectros y los utilizados para la generación de la
envolvente ADSR son los siguientes:

Armónicos Guitarra Banjo Violín Piano


f 0.03207 0.01122 0.1273 0.1416
2f 0.02928 0.00392 0.07009 0.09987
3f 0.01504 0.002727 0.06772 0.01254
4f 0.001873 0.002759 0.03075 0.01584
5f 0.001647 0.002496 0.03411 0.001425
6f 0.001336 0.003355 0.0182 0.01532
7f 0.0008313 0.002343 0.01086 0.002571
8f 0.0004061 0.001233 0.01081 0.005974
9f 0.0002245 0.0003229 0.003783 0.005192
10f 0.0002245 0.00116 0.002956 0.002478
Tiempo Tiempo de Tiempo de Tiempo Porcentaje de
de decaimiento sostenimiento de amplitud de
ataque liberación sostenimiento
Guitarra 0.014 0.09 0.5 0.39 30
Banjo 0.01 0.062 0.087 0.84 20
Violín 0.09 0.22 0.063 0.625 100
Piano 0.025 0.025 0.8 0.05 100

5.2 Instrumentos de viento-madera


Los instrumentos de viento manera son aquellos que generan sonido mediante el uso
del aire, el cual se genera en dentro del instrumento al soplarlo, y generalmente están
fabricados con madera. La longitud del tubo es la que determina las notas que suenan.
El sonido que producen se caracteriza por sonar de forma melodiosa y dulce.
En el proyecto se modelarán el oboe, la flauta y el clarinete. La envolvente ADSR
característica de instrumentos de viento tienen forma de trapezoide, con pequeñas
variaciones según el instrumento. Las gráficas de las componentes frecuenciales y las
envolventes ADSR generadas son las siguientes:

• Oboe:

FIGURA 31: ESPECTRO FRECUENCIAL DEL OBOE

FIGURA 32: ENVOLVENTE DEL OBOE


• Flauta:

FIGURA 33: ESPECTRO FRECUENCIAL DE LA FLAUTA

FIGURA 34: ENVOLVENTE DE LA FLAUTA


• Clarinete:

FIGURA 35: ESPECTRO FRECUENCIAL DEL CLARINETE


FIGURA 36: ENVOLVENTE DEL CLARINETE
Los valores obtenidos a partir de los espectros y los utilizados para la generación de la
envolvente ADSR son los siguientes:

Armónicos Oboe Flauta Clarinete


f 0.06559 0.01335 0.4564
2f 0.06568 0.07209 0.1121
3f 0.1797 0.06227 0.1777
4f 0.04523 0.01622 0.08187
5f 0.02655 0.00469 0.04608
6f 0.008484 0.0137 0.02748
7f 0.004929 0.001239 0.009626
8f 0.002103 0.001435 0.004976
9f 0.0009053 0.0006678 0.008025
10f 0.0008656 0.0006253 0.003953

Tiempo Tiempo de Tiempo de Tiempo Porcentaje de


de decaimiento sostenimiento de amplitud de
ataque liberación sostenimiento
Oboe 0.29 0.04 0.5 0.16 90
Flauta 0.3 0.25 0.25 0.3 80
Clarinete 80 0.021 0.82 0.13 80

5.3 Instrumentos de viento-metal


Los instrumentos de viento-metal son instrumentos fabricados con un tubo de metal,
una boquilla y una campana. Producen sonido mediante la vibración de los labios de la
persona que lo toque a través de la boquilla, a través del aire. Al contrario que los
instrumentos de viento-madera, éstos tienen un timbre brillante y potente.
La envolvente ADSR característica de cada instrumento tiene forma de trapezoide, de
la misma forma que pasa con los instrumentos de viento-madera. En el proyecto se
modelarán la trompeta, la tuba y el trombón. Las gráficas y los envolventes ADSR
generados son los siguientes:
• Trompeta

FIGURA 37: ESPECTRO FRECUENCIAL DE LA TROMPETA

FIGURA 38: ENVOLVENTE DE LA TROMPETA


• Tuba:

FIGURA 39: ESPECTRO FRECUENCIAL DE LA TUBA

FIGURA 40: ENVOLVENTE DE LA TUBA


• Trombón:

FIGURA 41: ESPECTRO FRECUENCIAL DEL TROMBÓN

FIGURA 42: ENVOLVENTE DEL TROMBÓN


Los valores obtenidos a partir de los espectros y los utilizados para la generación de la
envolvente ADSR son los siguientes:

Armónicos Trompeta Tuba Trombón


f 0.1002 0.3378 0.07031
2f 0.09563 0.07217 0.148
3f 0.0370 0.07231 0.02347
4f 0.02601 0.009529 0.06058
5f 0.02786 0.0087 0.02869
6f 0.01131 0.003814 0.0336
7f 0.005406 - 0.01083
8f 0.008833 - 0.0148
9f 0.01085 - 0.01086
10f 0.004181 - 0.007741

Tiempo Tiempo de Tiempo de Tiempo de Porcentaje de


de decaimiento sostenimiento liberación amplitud de
ataque sostenimiento
Trompeta 0.14 0.27 0.17 0.4 80
Tuba 0.047 0.12 0.4 0.43 70
Trombón 0.1 0.073 0.487 0.33 90
6. Síntesis aditiva mediante MATLAB
La construcción de la síntesis aditiva en el proyecto se ha realizado mediante la función
sintetizador en MATLAB. La función produce como salida una variable “sonido” la cual
contiene la señal sintetizada resultante, como entrada contiene tres elementos:
secuencia, “deltaT” y “Fs”.
La secuencia consiste en una matriz de cuatro columnas y tantas filas como eventos se
consideren en la síntesis, cada columna contiene el código MIDI correspondiente a las
notas, la amplitud de las notas, la duración y el modelo de instrumento que se quiera
sintetizar. deltaT consiste en el valor del desplazamiento temporal entre ventanas de
síntesis y Fs es la frecuencia de muestreo.
La función por lo tanto tiene la siguiente forma:
function [sonido]=sintetizador(secuencia,deltaT,Fs)

Como ejemplo intuitivo, si se pretende escuchar la escala de DO mayor, se tendría que


llamar a la función de la siguiente manera:
Fs=44100;
Nota_inicial=60;
Melodia=Nota_inicial+[0;2;4;5;7;9;11;12];
TiempoNota=0.5*ones(size(Melodia));
Amplitudes=ones(size(Melodia));
instrumento=0*ones(size(Melodia));
secuencia = [Melodia Amplitudes TiempoNota instrumento];
sonido=sintetizador(secuencia,0.5,Fs);

La altura de cada nota corresponde a su notación MIDI (Figura 22), en donde 60, 62,
64, 65, 67, 69, 71 y 72 corresponden a 𝐷𝑂5 , 𝑅𝐸5 , 𝑀𝐼5 , 𝐹𝐴5 , 𝑆𝑂𝐿5 , 𝐿𝐴5 , 𝑆𝐼5 , 𝐷𝑂6 ,
respectivamente, existen tantos eventos como cantidad de notas, por lo tanto serían 8
eventos. El tiempo de cada nota es el mismo para cada una: 0.5, y la deltaT tiene un
valor de 0.5, por lo tanto, cada nota tendría una duración de 0.25 segundos. La amplitud
es la misma para todas las notas, por lo tanto, tiene el valor de 1. El modelo de
instrumento variará según el número a ingresar, posteriormente se explicará el
funcionamiento.
Como se ha explicado en el apartado 4.1.1, la síntesis aditiva parte del teorema de
Fourier, en el cual una forma compleja de ondas se puede generar a partir de la suma
de ondas sinusoidales simples y la expresión de una onda sinusoidal simple es la
siguiente:
𝑦 = 𝐴 sin(2𝜋𝑓𝑡) (13)
Luego de modelar los instrumentos, conocemos lo fundamental: el valor de las
amplitudes de cada armónico. Por lo tanto, la función contiene vectores con las
amplitudes de cada instrumento y la cantidad de armónicos que poseen, como se
observa a continuación:
% Modelo Oboe
modeloOboe.f=1:10;
modeloOboe.a=[0.06559 0.06568 0.1797 0.04523 0.02655 0.008484
0.004929 0.002103 0.0009053 0.0008656];

% Modelo Guitarra
modeloGuitarra.f=1:10;
modeloGuitarra.a=[0.03207 0.02928 0.01504 0.001873 0.001647
0.001336 0.0008313 0.0004061 0.0002245 0.0005213];

% Modelo Flauta
modeloFlauta.f=1:10;
modeloFlauta.a=[0.01335 0.07209 0.06227 0.01622 0.00469 0.0137
0.001239 0.001435 0.0006678 0.0006253];

% Modelo Piano
modeloPiano.f=1:10;
modeloPiano.a=[0.1416 0.09987 0.01254 0.01584 0.001425 0.01532
0.002571 0.005974 0.005192 0.002478];

% Modelo Violin
modeloViolin.f=1:10;
modeloViolin.a=[0.1273 0.07009 0.06772 0.03075 0.03411 0.0182
0.01086 0.01081 0.003783 0.002956];

% Modelo Trompeta
modeloTrompeta.f=1:10;
modeloTrompeta.a=[0.1002 0.09563 0.0370 0.02601 0.02786
0.01131 0.005406 0.008833 0.01085 0.004181];

% Modelo Banjo
modeloBanjo.f=1:10;
modeloBanjo.a=[0.01122 0.00392 0.002727 0.002759 0.002496
0.003355 0.002343 0.001233 0.0003229 0.00116];

% Modelo Clarinete
modeloClarinete.f=1:10;
modeloClarinete.a=[0.4564 0.1121 0.1777 0.08187 0.04608
0.02748 0.009626 0.004976 0.008025 0.003953];

% Modelo Tuba
modeloTuba.f=1:6;
modeloTuba.a=[0.3378 0.07217 0.07231 0.009529 0.0087
0.003814];11111111111

% Modelo Trombón
modeloTrombon.f=1:10;
modeloTrombon.a=[0.07031 0.148 0.02347 0.06058 0.02869 0.0336
0.01083 0.0148 0.01086 0.007741];

El sintetizador se inicializa definiendo el número de eventos según la cantidad de notas


en la secuencia y se definen variables que se usarán posteriormente en el código:
%Inicializamos el sintetizador:
[NumEventos,~]=size(secuencia);
Ts=1/Fs;
sonido=0;
n=1;
fi0=zeros(100,1); % Vector con las fases iniciales de los parciales
(hasta un máximo de 100)
fi1=fi0;
f_nota_anterior=zeros(100,1); % Vector con las frecuencias (hasta
un máximo de 100) de la nota en el evento anterior

Se inicia un bucle que recorre la cantidad de eventos de entrada y extrae los datos de
ésta, el número de modelo de entrada varía según se observa en el switch del código:
se presentan dos modelos para cada instrumento, uno con envolvente ADSR (con los
valores obtenidos en el análisis (Apartado 5)) y otro sin ésta:
for evento=1:NumEventos
% Leemos la nota
NotaMidi=secuencia(evento,1);

% Leemos el volumen
Vol=secuencia(evento,2);

% Leemos la duración y definimos el vector temporal


dur=secuencia(evento,3);

t=0:Ts:dur*deltaT;

% Determinamos el modelo de síntesis


modelo=secuencia(evento,4);
switch modelo
case 0 % Oboe sin envolvente ADSR
motor_sintesis=modeloOboe;
envolvente=Vol.*ones(1,round(deltaT*dur*Fs)+1);

case 1 % Oboe con envolvente ADSR


motor_sintesis=modeloOboe;
envolventeADSR=envADSR(dur*deltaT,Fs,90,0.29,0.04,0.5,0.16);
envolvente=envolventeADSR*Vol;

case 2 % Guitarra sin envolvente ADSR


motor_sintesis=modeloGuitarra;
envolvente=Vol*ones(1,round(deltaT*dur*Fs)+1);

case 3 % Guitarra con envolvente ADSR


motor_sintesis=modeloGuitarra;
envolventeADSR=envADSR(dur*deltaT,Fs,30,0.014,0.09,0.5,0.39);
envolvente=envolventeADSR*Vol;

case 4 % Flauta sin envolvente ADSR


motor_sintesis=modeloFlauta;
envolventeADSR=Vol*ones(1,round(deltaT*dur*Fs)+1);
envolvente=envolventeADSR*Vol;

case 5 % Flauta con envolvente ADSR


motor_sintesis=modeloFlauta;
envolventeADSR=envADSR(dur*deltaT,Fs,80,0.3,0.25,0.25,0.3);
envolvente=envolventeADSR*Vol;
case 6 % Piano sin envolvente ADSR
motor_sintesis=modeloPiano;
envolventeADSR=Vol*ones(1,round(deltaT*dur*Fs)+1);
envolvente=envolventeADSR*Vol;

case 7 % Piano con envolvente ADSR


motor_sintesis=modeloPiano;
envolventeADSR=envADSR(dur*deltaT,Fs,100,0.025
,0.025,0.8,0.05);
envolvente=envolventeADSR*Vol;

case 8 % Violin sin envolvente ADSR


motor_sintesis=modeloViolin;
envolventeADSR=Vol*ones(1,round(deltaT*dur*Fs)+1);
envolvente=envolventeADSR*Vol;

case 9 % Violin con envolvente ADSR


motor_sintesis=modeloViolin;
envolventeADSR=envADSR(dur*deltaT,Fs,100,1.5,3.5,1,10);
envolvente=envolventeADSR*Vol;

case 10 % Trompeta sin envolvente ADSR


motor_sintesis=modeloTrompeta;
envolventeADSR=Vol*ones(1,round(deltaT*dur*Fs)+1);
envolvente=envolventeADSR*Vol;

case 11 % Trompeta con envolvente ADSR


motor_sintesis=modeloTrompeta;
envolventeADSR=envADSR(dur*deltaT,Fs,80,0.14,0.27,0.17,0.4);
envolvente=envolventeADSR*Vol;

case 12 % Banjo sin envolvente ADSR


motor_sintesis=modeloBanjo;
envolventeADSR=Vol*ones(1,round(deltaT*dur*Fs)+1);
envolvente=envolventeADSR*Vol;

case 13 % Banjo con envolvente ADSR


motor_sintesis=modeloBanjo;
envolventeADSR=envADSR(dur*deltaT,Fs,20,0.01
,0.062,0.087,0.84);
envolvente=envolventeADSR*Vol;

case 14 % Clarinete sin envolvente ADSR


motor_sintesis=modeloClarinete;
envolventeADSR=Vol*ones(1,round(deltaT*dur*Fs)+1);
envolvente=envolventeADSR*Vol;

case 15 % Clarinete con envolvente ADSR


motor_sintesis=modeloClarinete;
envolventeADSR=envADSR(dur*deltaT,Fs,80,0.03,0.021,0.82,0.13);
envolvente=envolventeADSR*Vol;

case 16 % Tuba sin envolvente ADSR


motor_sintesis=modeloTuba;
envolventeADSR=Vol*ones(1,round(deltaT*dur*Fs)+1);
envolvente=envolventeADSR*Vol;

case 17 % Tuba con envolvente ADSR


motor_sintesis=modeloTuba;
envolventeADSR=envADSR(dur*deltaT,Fs,70,0.047,0.12,0.4,0.43);
envolvente=envolventeADSR*Vol;
case 18 % Trombon sin envolvente ADSR
motor_sintesis=modeloTrombon;
envolventeADSR=Vol*ones(1,round(deltaT*dur*Fs)+1);
envolvente=envolventeADSR*Vol;

case 19 % Trombon con envolvente ADSR


motor_sintesis=modeloTrombon;
envolventeADSR=envADSR(dur*deltaT,Fs,90,0.1,0.073,0.487,0.33);
envolvente=envolventeADSR*Vol;
end

Por último, se aplica la expresión más importante en la síntesis aditiva: el sumatorio de


ondas simples. El bucle recorre cada nota, según el valor de la altura de esta se aplica
la fórmula del temperamento igual (Apartado 2.3) y así se denomina el valor que le
faltaba a la expresión de la onda sinusoidal simple (Expresión 13): la frecuencia
fundamental correspondiente y sus armónicos en el sumatorio. En el sumatorio, también
se debe hacer el ajuste a la fase de forma que no se genere desfase.
Una vez se genera el sumatorio de cada nota, los datos se guardan en el vector
sonidoTrama, que fuera del bucle se guarda a su vez en una posición ordenada del
vector final sonido, el cual contiene la síntesis de todas las notas y se puede reproducir
como cualquier archivo de audio en MATLAB, por ejemplo, mediante la función sound.

% Extraemos el número de armónicos

NumNotas=length(motor_sintesis.f);

for nota=1:NumNotas

f=motor_sintesis.f(nota)*27.5*2^((NotaMidi-21)/12);

% Ajustamos la continuidad de fase


fi1(nota)=2*pi*t(1)-1*((f_nota_anterior(nota)-
f)/Fs)+fi0(nota);
f_nota_anterior(nota)=f;

amplitud=motor_sintesis.a(nota).*envolvente;
sonidoTrama=sonidoTrama+amplitud.*cos(2*pi*f*t+fi1(nota));
TamTrama=length(sonidoTrama);

end

fi0(1:NumNotas)=fi1(1:NumNotas);

sonido(n:(TamTrama+n-1))=sonidoTrama;

n=n+TamTrama;

sonidoTrama=0;

end

end
7. Conclusiones
Como se ha observado tras la elaboración del presente proyecto, se han modelado
distintos instrumentos y con los parámetros obtenidos se ha desarrollado una función
en MATLAB capaz de reproducir melodías musicales con la técnica de síntesis aditiva,
tal como se marcaba en los objetivos principales.
Los valores objetivos obtenidos del análisis de los instrumentos y la aplicación de estos
en el desarrollo de la función de síntesis aditiva han dado los resultados esperados,
marcados por los objetivos. Cabe destacar que en los modelos en los que se ha aplicado
el uso de la envolvente ADSR, adquirida en el análisis temporal del audio, el sonido
resultante es mucho más natural que en los modelos en los cuales solo se han aplicado
los parámetros obtenidos a través del estudio del espectro frecuencial.
La función del sintetizador se ha hecho de forma en la que resulte de uso sencillo para
el usuario, ya que tiene similitud con los valores que se utilizan en el interfaz MIDI. Sin
embargo, el sintetizador podría ser más práctico si se propone un formato totalmente
compatible al MIDI, lo cual sería posible de lograr en el futuro, ya que los valores de
entrada de la función son los estandarizados.
Finalmente, se puede decir que el proyecto ha sido productivo, ya que los resultados
han sido los esperados y la realización del mismo me ha permitido aplicar y ampliar los
conocimientos adquiridos al cursar la carrera, en especial lo referente al tratamiento de
las señales de audio, y la programación en la herramienta MATLAB. También ha sido
útil a la hora de comprender la relación entre los parámetros físicos y matemáticos con
la música, y lo fundamental que es la compresión de ello a la hora de la creación de
herramientas para producir sonidos a través de medios digitales.
8. Bibliografía
[1] Luz López, A; (2013). Representación del sonido mediante Series de Fourier
Funciones de Variable Compleja. Disponible en:<
http://lcr.uns.edu.ar/fvc/NotasDeAplicacion/FVC-Ana%20Luz%20Lopez.pdf> [Último
acceso: 05 de agosto de 2020]

[2] De Candé, R; (2012): Nuevo Diccionario de la Música, Madrid, Ediciones


Robinbook, s.l.
[3] Musicaysonido.es; (2019). Altura Musical. Disponible
en:<https://musicaysonido.es/2019/04/25/altura-musical/> [Último acceso: 10 de agosto
de 2020]

[4] Musicaysonido.es; (2019). Timbre. Disponible


en:<https://musicaysonido.es/2019/03/12/timbre/> [Último acceso: 10 de agosto de 2020]
[5] Alton Everest, F; (2001): The Master Handbook of Acoustics, Estados Unidos,
Ediciones McGraw-Hill, Inc.
[6] Ricardo, D & Bruno, M; (2010). ¿Por qué usamos 12 notas? De Pitágoras a Bach.
Universidad de Buenos Aires, Argentina.
[7] Basso, G; (2001). Análisis espectral. La transformada de Fourier en la música,
Argentina, Ediciones Al Margen.
[8] Xavier, S; (2012). Perspectivas actuales en la síntesis digital de sonidos musicales.
Universitat Pompeu Fabra, España.
[9] Jordà Puig, S; (1997). Audio digital y MIDI, Madrid, Ediciones Anaya Multimedia.
¿Qué es un Digitalizador?
Científicos e ingenieros a menudo utilizan un digitalizador para capturar datos
analógicos en el mundo real y convertirlos en señales digitales para su análisis. Un
digitalizador es cualquier dispositivo que se utiliza para convertir las señales analógicas
en señales digitales. Uno de los digitalizadores más comunes es un teléfono celular, que
convierte una voz, una señal analógica, en una señal digital para enviar a otro teléfono.
Sin embargo, en las aplicaciones de pruebas y medidas, un digitalizador casi siempre se
refiere a un osciloscopio o un multímetro digital (DMM). Este artículo se enfoca en
osciloscopios, pero la mayoría de los temas también son aplicables a otros
digitalizadores.

Sin importar el tipo, el digitalizador es vital para que el sistema reconstruya con
precisión una forma de onda. Para asegurarse de seleccionar el osciloscopio correcto
para su aplicación, considere el ancho de banda, la frecuencia de muestreo y la
resolución del osciloscopio.

Ancho de Banda
El frente de un osciloscopio consiste en dos componentes: una ruta de entrada
analógica y un convertidor analógico-digital (ADC). La ruta de entrada analógica atenúa,
amplifica, filtra y/o acopla la señal para optimizarla como preparación para la
digitalización por el ADC. El ADC muestrea la forma de onda condicionada y convierte la
señal de entrada analógica en valores digitales que representan la forma de onda de
entrada analógica. La respuesta de frecuencia de la ruta de entrada provoca una pérdida
inherente de información de amplitud y fase.
Figura 1. El ancho de banda describe el rango de frecuencia en el cual la señal de
entrada puede atravesar el frente del osciloscopio, que consta de dos componentes: una
ruta de entrada analógica y un ADC.

El ancho de banda describe la habilidad del panel frontal analógico para llevar una señal
del mundo exterior al ADC con pérdida de amplitud mínima, desde la punta de prueba o
equipo de pruebas a la entrada del ADC. En otras palabras, el ancho de banda describe
la diversidad de frecuencias que un osciloscopio puede medir con precisión.

Se define como la frecuencia a la que una señal de entrada sinusoidal se atenúa al


70.7% de su amplitud original, que también se conoce como el punto de -3 dB. Las
figuras 2 y 3 muestran la respuesta de entrada típica para un osciloscopio de 100 MHz.

Figura 2. El ancho de banda es cuando la señal de entrada se atenúa al 70.7% de su


amplitud original.
Figura 3. Esta gráfica indica que a 100 MHz, la señal de entrada alcanza el punto de -3
dB.

El ancho de banda se mide entre los puntos de frecuencia inferior y superior, donde la
amplitud de la señal cae a -3 dB por debajo de la frecuencia de pasobanda. Esto parece
complicado, pero cuando usted lo desglosa en realidad es relativamente fácil.

Primero, usted debe calcular su valor -3 dB.

Ecuación 1. Calcular el Punto -3 dB.


Vin,pp es el voltaje de pico a pico de la señal de entrada y Vout,pp es el voltaje de pico a
pico de la señal de salida. Por ejemplo, si introduce una onda sinusoidal de 1 V, el voltaje

de salida se puede calcular como entonces .

Debido a que la señal de entrada es una onda sinusoidal, hay dos frecuencias en las que
la señal de salida impacta este voltaje; estas se llaman frecuencias de corte f1 y f2.
Estas dos frecuencias tienen diferentes nombres, como la frecuencia de corte,
frecuencia de cruce, frecuencia de media potencia, frecuencia 3 dB y frecuencia de
ruptura. Sin embargo, todos estos términos se refieren a los mismos valores. La
frecuencia central, f0, de la señal es la media geométrica de f1 y f2.

Ecuación 2. Calcular la Frecuencia Central

Usted puede calcular el ancho de banda (BW) restando las dos frecuencias de corte.

Ecuación 3. Calcular el Ancho de Banda


Figura 4. El ancho de banda, la frecuencia de corte, la frecuencia central y el punto 3 dB,
están todos conectados.

Calcular Error de Amplitud

Otra ecuación que por lo general es útil es para error de amplitud.

Ecuación 4. Calcular el Error de Amplitud

El error de amplitud se expresa como un porcentaje y R es la relación del ancho de


banda del osciloscopio a la frecuencia de la señal de entrada (fin).
Usando el ejemplo anterior, usted tiene un osciloscopio de 100 MHz con una señal
de entrada de onda sinusoidal de 100 MHz a 1 V y BW = 100 MHz y fin = 100 MHz.
Esto significa que R = 1. Entonces solamente tiene que resolver la ecuación:

El error de amplitud es 29.3%. Usted puede determinar el voltaje de salida para la


señal de 1 V:

Se recomienda que el ancho de banda de su osciloscopio sea de tres a cinco


veces el componente de interés de frecuencia más alta en la señal medida para
captar la señal con el mínimo error de amplitud. Por ejemplo, para la onda
sinusoidal de 1 V a 100 MHz, usted debe usar un osciloscopio con 300 MHz a 500
MHz de ancho de banda. El error de amplitud de una señal de 100 MHz a estos
anchos de banda es:
Calcular el Tiempo de Incremento

Un osciloscopio debe tener el ancho de banda apropiado para medir con precisión
la señal, pero también debe tener suficiente tiempo de incremento para capturar
con precisión los detalles de las transiciones rápidas. Esto es más aplicable si se
miden señales digitales, como pulsos y pasos. El tiempo de incremento de una
señal de entrada es el tiempo de una señal para hacer la transición de un 10% al
90% de la amplitud máxima de la señal. Algunos osciloscopios pueden usar del
20% al 80%, así que asegúrese de revisar su manual de usuario.

Figura 5. El tiempo de incremento de una señal de entrada es el tiempo de una


señal para hacer la transición de un 10% al 90% de la amplitud máxima de la señal.

El tiempo de incremento (Tr) se puede calcular de la siguiente manera:

Ecuación 5. Calcular el Tiempo de Incremento


La constante k es dependiente del osciloscopio. La mayoría de osciloscopios con
un ancho de banda menor a 1 GHz típicamente tienen k = 0.35, mientras que los
osciloscopios con un ancho de banda mayor a 1 GHz, por lo general tienen un
valor de k entre 0.4 y 0.45.

El tiempo de incremento teórico medido puede ser calculado a partir del


tiempo de incremento del osciloscopio y el tiempo de incremento real de la
señal de entrada .

Ecuación 6. Calcular el Tiempo de Incremento Teórico Medido

Se recomienda que el tiempo de incremento del osciloscopio sea de un tercio a


un quinto del tiempo de incremento de la señal medida para captar la señal con
error mínimo en el tiempo de incremento.

Velocidad de Muestreo
La velocidad de muestreo, también conocida como razón de muestreo, no está
directamente relacionada con la especificación de ancho de banda. La velocidad de
muestreo es la frecuencia a la que el ADC convierte la forma de onda de entrada
analógica a datos digitales. El osciloscopio muestrea la señal después de que cualquier
atenuación, ganancia y/o filtrado ha sido aplicado a la ruta de entrada analógica y
convierte la forma de onda resultante en una representación digital. Lo hace en las
imágenes instantáneas, similar a los fotogramas de una película. Cuanto más rápido el
osciloscopio realice el muestreo, mayor será la resolución y el detalle que se puede ver
en la forma de onda.
Teorema de Muestreo de Nyquist

El Teorema de Muestreo de Nyquist explica la relación entre la velocidad de


muestreo y la frecuencia de la señal medida. Afirma que la velocidad de muestreo
fs debe ser mayor que el doble del componente de interés de frecuencia más alto
en la señal medida. Esta frecuencia por lo general se conoce como la frecuencia
Nyquist, fN.

Ecuación 7. La velocidad de muestreo debe ser mayor al doble de la frecuencia


Nyquist.

Para entender por qué, eche un vistazo a una onda sinusoidal medida a diferentes
velocidades. En el caso A, la onda sinusoidal de frecuencia f es muestreada a la
misma frecuencia. Esos muestreos están marcados en la señal original a la
izquierda y a la derecha cuando se construyen, la señal aparece incorrectamente
como un voltaje de DC constante. En el caso B, la velocidad de muestreo es el
doble de la frecuencia de la señal. Ahora aparece como una forma de onda
triangular. En este caso, f es igual a la frecuencia de Nyquist, que es el
componente de frecuencia más alto permitido para evitar aliasing para una
frecuencia de muestreo determinada. En el caso C, la velocidad de muestreo es de
4f/3. La frecuencia Nyquist en este caso es:

Debido a que f es mayor que la frecuencia de Nyquist ( ), esta velocidad


de muestreo reproduce una forma de onda alias de la frecuencia y la forma
incorrectas.
Figura 6. Una velocidad de muestreo demasiado baja puede causar reconstrucción
inexacta de la forma de onda.

Por lo tanto, para reconstruir con precisión la forma de onda, la velocidad de


muestreo fs debe ser mayor que dos veces el componente de interés de
frecuencia más alto en la señal medida. Por lo general, usted desea muestrear
cinco veces más alto que la frecuencia de la señal.
Aliasing

Si necesita muestrear a una determinada velocidad para evitar aliasing, entonces


¿qué es aliasing?. Si una señal es muestreada a una velocidad de muestreo menor
que el doble de la frecuencia Nyquist, los componentes de frecuencias falsas más
bajas aparecen en los datos muestreados. Este fenómeno se conoce como
aliasing. La siguiente figura muestra una onda sinusoidal de 800 kHz muestreada
a 1 MS/s. La línea punteada indica la señal de alias registrada en esa velocidad de
muestreo. La frecuencia de 800 kHz usa un alias de vuelta en el pasobanda,
apareciendo falsamente como una onda sinusoidal de 200 kHz.

Figura 7. Aliasing se produce cuando una velocidad de muestreo es demasiado


baja y reproduce una representación incorrecta de forma de onda.
La frecuencia alias fa se puede calcular para determinar cómo aparece una señal
de entrada a una frecuencia sobre la frecuencia de Nyquist. Es el valor absoluto
del múltiplo entero más cercano de la frecuencia de muestreo menos la frecuencia
de la señal de entrada.

Ecuación 8. Calcular la Frecuencia Alias

Por ejemplo, considere una señal con una frecuencia de muestreo de 100 Hz y la
señal de entrada contiene las siguientes frecuencias: 25 Hz, 70 Hz, 160 Hz y 510
Hz. Las frecuencias por debajo de la frecuencia Nyquist de 50 Hz son
muestreadas correctamente; aquellas superiores a 50 Hz aparecen como alias.
Figura 8. Diferentes valores de frecuencia son medidos, algunos de los cuales son
frecuencias alias y algunos de los cuales son frecuencias reales de la forma de
onda.

Estos son los cálculos para las frecuencias alias:

Además de incrementar la velocidad de muestreo, aliasing también se puede


prevenir usando filtro antialiasing. Este es un filtro paso bajo que atenúa cualquier
frecuencia en la señal de entrada que sea mayor a la frecuencia Nyquist y debe ser
introducido antes del ADC para restringir el ancho de banda de la señal de entrada
y cumplir con los criterios de muestreo. Los canales de entrada analógica pueden
tener filtros analógicos y digitales implementados en hardware para ayudar en la
prevención de aliasing.

Resolución
Otro factor a considerar al seleccionar un osciloscopio para una aplicación es la
resolución. Los bits de resolución se refieren al número de niveles verticales únicos que
un osciloscopio puede utilizar para representar una señal. Una manera de comprender el
concepto de la resolución es comparándolo con una regla. Divida un metro en
milímetros; ¿cuál es la resolución? La marca más pequeña en la regla es la resolución —
o 1 de entre 1,000.

La resolución de un ADC es una función de la cantidad de piezas en las que la señal


máxima se puede dividir. La resolución de amplitud está limitada por el número de
niveles de salida discretos que tiene un ADC. Un código binario representa cada división;
como tal, el número de niveles puede ser calculado como sigue:
Ecuación 9. Calcular los Niveles de Salida Discretos de un ADC

Por ejemplo, un osciloscopio de 3 bits tiene 23 u ocho niveles. Por otra parte, un
osciloscopio de 16 bits tiene 216 o 65,536 niveles. El ancho de código o cambio de
voltaje mínimo detectable pueden calcularse como sigue:

Ecuación 10. Calcular el Ancho del Código

El ancho de código también se conoce como el bit menos significativo (LSB). Si el rango
de entrada del dispositivo es 0 a 10 V, entonces un osciloscopio de 3 bits tiene un ancho
de código de 10/8 = 1.25 V mientras que un osciloscopio de 16 bits tiene un ancho de
código de 10/65,536 = 305 μV. Esto puede significar una gran diferencia en cómo se
muestra la señal.
Figura 9. Diferencia de una Forma de Onda entre 16 Bits y 3 Bits de Resolución

La resolución que usted necesita depende de su aplicación; cuanto mayor es la


resolución, el osciloscopio cuesta más. Tenga en mente que un osciloscopio con alta
resolución no necesariamente significa que tiene una alta precisión. Sin embargo, la
precisión alcanzable de un instrumento está limitada por la resolución. La resolución
limita la precisión de una medida; cuanto mayor es la resolución (número de bits) la
medida es más precisa.

Algunos osciloscopios utilizan un método llamado tramado para ayudar a suavizar las
señales para obtener la apariencia de una resolución más alta. El tramado implica la
adición deliberada de ruido a la señal de entrada. Ayuda a difuminar las pequeñas
diferencias en la resolución de amplitud. La clave es añadir ruido aleatorio de tal manera
que haga que la señal rebote de un lugar a otro entre los niveles sucesivos. Por
supuesto, esto de por sí hace a la señal más ruidosa. Pero, la señal se suaviza
promediando este ruido digitalmente una vez que la señal es adquirida.
Figura 10. El tramado puede ayudar a suavizar una señal.
Resumen
■ El ancho de banda describe el rango de frecuencias que un osciloscopio puede
medir de manera precisa. Se define como la frecuencia a la que una señal de
entrada sinusoidal se atenúa al 70.7% de su amplitud original, que también se
conoce como el punto de -3 dB.
■ El ancho de banda es la diferencia entre las frecuencias de corte.
■ El error de amplitud es un porcentaje que es la relación del ancho de banda
con las frecuencias de la señal de entrada que ayuda a determinar el ruido en
un sistema.
■ Se recomienda que el ancho de banda de su osciloscopio sea de tres a cinco
veces el componente de interés de frecuencia más alta en la señal medida
para captar la señal con el mínimo error de amplitud.
■ El tiempo de incremento de una señal de entrada es el tiempo de una señal
para hacer la transición de un 10% al 90% de la amplitud máxima de la señal.
■ Se recomienda que el tiempo de incremento del osciloscopio sea de un tercio
a un quinto del tiempo de incremento de la señal medida para captar la señal
con error mínimo en el tiempo de incremento.
■ La velocidad de muestreo es la frecuencia a la que el ADC convierte la forma
de onda de entrada analógica a datos digitales.
■ La velocidad de muestreo debe ser por lo menos el doble de la frecuencia de
interés más alta en la señal, pero la mayoría de las veces debe ser alrededor de
cinco veces mayor.
■ Aliasing es cuando los componentes de frecuencia falsa aparecen en los datos
muestreados.
■ Los bits de resolución se refieren al número de niveles verticales únicos que un
osciloscopio puede utilizar para representar una señal.
■ Cuanto más alta la resolución de un instrumento, mayor la precisión.

También podría gustarte