0% encontró este documento útil (0 votos)
180 vistas184 páginas

Programas Eco y Reverberacion

Cargado por

LuisOrdoñez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
180 vistas184 páginas

Programas Eco y Reverberacion

Cargado por

LuisOrdoñez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

ESCUELA POLITÉCNICA NACIONAL

ESCUELA DE INGENIERÍA

SIMULACIÓN DE EFECTOS DE VOZ


EN ARCHIVOS DE FORMATO WAV

PROYECTO PREVIO A LA OBTENCIÓN DEL TITULO DE INGENIERO EN


ELECTRÓNICA Y TELECOMUNICACIONES

GUILLERMO ALEJANDRO YASELGA PRADO

DIRECTOR: DR. GUALBERTO HIDALGO

Quito, Junio 2001


DECLARACIÓN

Yo Guillermo Alejandro Yaselga Prado, declaro que el trabajo aquí descrito es de


mí autoría; que no ha sido previamente presentada para ningún grado o
calificación profesional; y, que he consultado las referencias bibliográficas que se
incluyen en este documento.

La Escuela Politécnica Nacional, puede hacer uso de los derechos


correspondientes a este trabajo, según lo establecido por la Ley, Reglamento de
Propiedad Intelectual y por la normalidad institucional vigente.

Guillermo Alejandro Yaselga Prado


CERTIFICACIÓN

Certifico que el presente trabajo fue desarrollado por Guillermo Alejandro Yaselga
Prado, bajo mi supervisión.

V Dr. Gualberto Hidalgo


DIRECTOR DE PROYECTO
Al Dr. Gualbérto Hidalgo por su acertada dirección para
la culminación' dé éste trabajo.

Y a todos quienes de una u otra manera colaboraron


con su granito de arena.
DEDICATORIA

A mis abuelitos Piedad y Alfredo por el apoyo


incondicional que siempre me han brindado .
A mis padres Aída y Julio quienes me dieron su
ejemplo y confianza.
A mis hermanos Manuela y José por los bonitos
momentos que compartimos.
Y a mis amigos por todas las aventuras que pasamos.

Guillermo
ÍNDICE

Prólogo

CAPITULO 1
FORMATOS DE SONIDO

1.1 Introducción 3
1.2 Definiciones 3
1.2.1 Formatos de archivos sonido 3
1.2.2 Archivo de audio digital 3
1.2.3 Frecuencia de muestreo 4
1.2.4 Resolución 6
.,3 Formatos de archivos de sonido 7
1.3.1 Formato Au 7
1.3.2 Formato Midi 8
1.3.2.1 Bloque de cabecera 9
1.3.2.2 Bloque de pista 11
1.3.3 Formato Raw 14
1.3.4 Formato Aiff 15
1.3.4.1 Aiff-c 15
1.3.5 Formato Mp3 16
1.3.5.1 Mpeg-1 17
1.3.5.2 Mpeg-2 17
1.3.5.3 Contenido de parámetros 18
1.3.6 Formato Voc 25
1.3.7 Formato Wav 27
1.3.7.1 Forma canónica del formato 27
1.3.7.2 Interpretación de datos hexadecimales 29
1.4 Bibliografía 31
CAPITULO 2
CARACTERÍSTICAS DE LOS EFECTOS DE SONIDO A SIMULAR
2.1 Introducción 33
2.2 Efecto eco 33
2.2.1 Modelo 34
2.2.2 Ecuación de diferencias 34
2.2.3 Función de transferencia 34
2.2.4 Características del efecto 37
2.2.5 Variaciones del modelo 37
2.3 Efecto Coro 40
2.3.1 Modelo 40
2.3.2 Ecuación de diferencias 40
2.3.3 Características 41
2.3.3.1 LFO 41
2.3.3.2 Retardo 42
2.3.3.3 Sweep depth width 42
2.3.3.4 Speed rate 42
2.3.4 Otros modelos 43
2.4 Efecto robot 44
2.4.1 Modelo 44
2.4.2 Ecuación de diferencias 44
2.4.3 Función de transferencia 44
2.5 Reverberación . 46
2.5.1 Tiempo de reverberación 46
2.5.2 Volumen 51
2.5.3 Coeficientes de absorción 53
2.5.4 Características de la reverberación 54
2.5.5 Modelo 55
2.5.6 Reverberador de Schroeder 56
2.5.6.1 Filtros combo , 57
2.5.6.2 Filtros pasa todo 59
2.5.7 Reverberador de Moorer 61
2.6 Bibliografía 63
CAPITULO 3
SIMULACIÓN DE LOS EFECTOS DE SONIDO

3.1 Introducción 65
3.2 Características de Matlab 65
3.2.1 Inicio del programa Matlab 67
3.2.2 Funciones utilizadas de Matlab 73
3.3 Estructura del programa de simulación 75
3.4 Impiementación del efecto eco 76
3.5 Implementación del efecto coro 79
3.6 Implementación del efecto robot 80
3.7 Implementación del efecto reverberación 81
3.7.1 Implementación del tiempo de reverberación de locales 82
3.7.1.1 Teatro • 82
3.7.1.2 Iglesia 85
3.7.1.3 Sala 85
3.8 Simulación de los efectos 86
3.9 Bibliografía 115

CAPITULO 4
RESULTADOS

4.1 Introducción 116


4.2 Presentación de resultados 116
4.3 Tiempo de proceso 119

CAPITULO 5

CONCLUSIONES Y RECOMENDACIONES
5.1 Conclusiones 121
5.2 Recomendaciones 123

ANEXO A
CREACIÓN DE INTERFACES GRÁFICAS 125
ANEXO B
MANUAL DE USUARIO DE LA INTERFAZ GRÁFICA 139
ANEXO C
PROGRAMAS COMERCIALES DE EFECTOS 152

ANEXO D
GLOSARIO DE TÉRMINOS 160

ÍNDICE DE FIGURAS

Capítulo 1

Figura 1.1 Muestreo de señal 4


Figura 1.2 Espectro de potencia 5
Figura 1.3 Aliasing 6
Figura 1.4 Resolución 7
Figura 1.5 Contenido de un bloque 8
Figura 1.6 Bloque de cabecera 9
Figura 1.7 Contenido del parámetro división 10
Figura 1.8 Parámetros de un bloque de pista 11
Figura 1.9 Estructura de formato AIFF 15
Figura 1.10 Estructura de formato AIFF-C 16
Figura 1.11 Interpretación de formato Wav 30

Capítulo 2

Figura 2.1 Eco de una señal senosoidal 33


Figura 2.2 Modelo de implementación de eco 34
Figura 2.3 Modelo de efecto eco 34
Figura 2.4 Respuesta de frecuencia en amplitud de la
ecuación 2.2 35
Figura 2.5 Variación de la respuesta de frecuencia en fase
de la ecuación. 2.2 36
Figura 2.6 Respuesta impulsiva de la ecuación 2.2 36
Figura 2.7 Modelo de implementación de n retardos 37
Figura 2.8 Respuesta de frecuencia en amplitud de ia ecuación 2.5 38
Figura 2.9 Respuesta de frecuencia en fase de la ecuación. 2.5 39
Figura 2.10 Respuesta impulsiva de la ec. 2.5 39
Figura 2.11 Modelo de implementación del efecto coro 40
Figura 2.12 Modelo del efecto coro 40
Figura 2.13 Ondas generadas por el LFO 41
Figura 2.14 Parámetros del efecto coro 43
Figura 2.15 Modelo para simular tres voces 43
Figura 2.16 Modelo para el efecto robot 44
Figura 2.17 Respuesta de frecuencia en amplitud 45
Figura 2.18 Respuesta de frecuencia en fase 45
Figura 2.19 Tiempo de reverberación 46
Figura 2.20 Elementos característicos de la reverberación 54
Figura 2.21 Respuesta impulsiva de un sonido dentro de un recinto 55
Figura 2.22 Modelo utilizado para simular el efecto de reverberación 56
Figura 2.23 Reverberador de Schroeder 57
Figura 2.24 Filtro Combo 58
Figura 2.25 Respuesta de frecuencia del filtro combo 58
Figura 2.26 Respuesta impulsiva del filtro combo 59
Figura 2.27 Estructura de un filtro pasa todo 60
Figura 2.28 Respuesta de frecuencia en amplitud del filtro pasa todo 60
Figura 2.29 Respuesta de frecuencia en fase del filtro pasa todo 61
Figura 2.30 Reverberador de Moorer 62

Capítulo 3

Figura 3.1 Pantalla de inicio del programa Matlab 68


Figura 3.2 Pantalla para abrir un archivo m 69
Figura 3.3 Pantalla para ingreso del comando edit 70
Figura 3.4 Pantalla del editor de archivos m 70
Figura 3.5 Pantalla de edición del archivo ejemplo .m 72
Figura 3.6 Pantalla de comandos con los resultados 72
Figura 3.7 Estructuración del programa de simulación 75
Figura 3.8 Resultados efecto eco simple 86
Figura 3.9 Intervalo del efecto eco 87
Figura 3.10 Transformada de Fourier 88
Figura 3.11 Espectrograma de los archivos 88
Figura 3.12 Efecto eco largo 89
Figura 3.13 Efecto eco débil 90
Figura 3.14 Efecto eco fuerte 90
Figura 3.15 Gráficas de la transformada de Fourier de los efectos eco 91
Figura 3.16 Gráficas del efecto coro de dos voces 92
Figura 3.17 Rango de observación del efecto coro de dos voces 93
Figura 3.18 Espectro de potencia 94
Figura 3.19 Transformada de Fourier 94
Figura 3.20 Espectrograma del efecto coro de dos voces 95
Figura 3.21 Efecto coro tres voces 96
Figura 3.22 Gráficas de la transformada de Fourier entre el efecto
coro de dos y tres voces 96
Figura 3.23 Espectrograma del efecto coro de tres voces 97
Figura 3.24 Efecto robotl 98
Figura 3.25 Espectrograma del efecto robotl 99
Figura 3.26 Transformada de Fourier del efecto robotl 99
Figura 3.27 Efecto robot2 100
Figura 3.28 Espectrograma del efecto robot2 101
Figura 3.29 Transformada de Fourier del efecto robot2 101
Figura 3.30 Efecto robots 102
Figura 3.31 Espectrograma del efecto robots 103
Figura 3.32 Transformada de Fourier del efecto robots 103
Figura .3.33 Efecto reverberación clara 104
Figura 3.34 Espectrograma del efecto reverberación clara 105
Figura 3.35 Transformada del efecto reverberación clara 105
Figura 3.36 Efecto reverberación difusa 106
Figura 3,37 Espectrograma del efecto reverberación difusa 107
Figura 3.38 Transformada de Fourier del efecto reverberación difusa 108
Figura 3.39 Efecto teatro 109
Figura 3.40 Espectrograma del efecto teatro 109
Figura 3.41 Transformada de Fourier del efecto teatro 110
Figura 3.42 Efecto iglesia 111
Figura 3.43 Espectrograma del efecto iglesia 112
Figura 3.44 Transformada de Fourier del efecto iglesia 112
Figura 3.45 Efecto sala 113
Figura 3.46 Espectrograma del efecto sala 114
Figura 3.47 Transformada de Fourier del efecto sala 114

Capítulo 4

Figura 4.1 Resultados del efecto eco 117


Figura 4.2 Resultados de los efectos coro y robot 117
Figura 4.3 Resultados de los efectos de reverberación 118
Figura 4.4 Datos de los tiempos de proceso de los efectos 120

Anexo A

Figura A. 1 Menú principal 125


Figura A.2 Panel para el diseño de interfaces 126
Figura A.3 Opciones para añadir objetos 126
Figura A.4 Pantalla de la nueva figura 128
Figura A.5 Pantalla para ingreso del contenido del texto 129
Figura A.6 Pantalla con las etiquetas de los textos 129
Figura A.7 Pantalla de resultado de la suma 137
Figura A.8 Pantalla de resultado de la resta 137
Anexo B

Figura B.1 Pantalla de presentación 140


Figura B.2 Pantalla de la ¡nterfaz gráfica 141
Figura B.3 Contenido de efectos 141
Figura B.4 Opciones del efecto eco 142
Figura B.5 Opciones del efecto coro 142
Figura B.6 Opciones del efecto reverberación 142
Figura B.7 Opciones del efecto Robot 143
Figura B.8 Espectrograma en dos y tres dimensiones 143
Figura B.9 Pantalla del manual en formato HTML 144
Figura B.10 Pantalla de selección del archivo de sonido 145
Figura B.11 Pantalla de la ¡nterfaz con un solo gráfico 145
Figura B.12 Pantalla de la ¡nterfaz con las dos gráficas 146
Figura B.13 Opciones de la pantalla principal 147
Figura B.14 Ingreso de datos del tiempo de análisis 147
Figura B.15 Pantalla con !as gráficas en el intervalo de
tiempo seleccionado 148
Figura B.16 Parámetros del efecto eco 148
Figura B.17 Espectrograma 149
Figura B.18 Visualización tridimensional del espectrograma 150
Figura B.19 Gráfica de la densidad espectral 150
Figura B.20 Gráfica de las diferencias entre los dos archivos 151

Anexo C

Figura C.1 Ventana principa! de Goldwave 153


Figura C.2 Ventana de control de Goldwave 153
Figura C.3 Ventana de sonido de Goldwave 154
Figura C.4 Ventana principal de mixvibespro 155
Figura C.5 Pantalla principal de Cool Edit 156
Figura C.6 Pantalla principal del Cooí Edit 2000 157
Figura C.7 Pantalla principal de Sampled NueroDancer 158
ÍNDICE DE TABLAS

Capítulo 1

Tabla 1.1 Parámetros del formato au 8


Tabla 1.2 Contenido de la cabecera de un archivo MPEG 18
Tabla 1.3 Combinaciones de bits para la razón de cambio 20
Tabla 1,4 Modos permitidos según la razón de bit 21
Tabla 1.5 Valores de frecuencia de muestreo para archivos MPEG 21
Tabla 1.6 Distribución de las bandas de frecuencia para archivos
MPEG 23
Tabla 1.7 Bandas de frecuencia para archivos MPEG 23
Tabla 1.8 Parámetros dei campo ID3 24
Tabla 1.9 Posibilidades del campo género 25
Tabla 1.10 Contenido de un formato de archivo wav 27

Capítulo 2

Tabla 2.1 Tiempos de reverberación 50


Tabla 2.2 Frecuencias centrales para cada octava 51
Tabla 2,3 Tiempos de reverberación para salas de conferencias 52
Tabla 2,4 Tiempos de reverberación para teatros 52
Tabla 2.5 Tiempos de reverberación para templos 52
Tabla 2.6 Coeficientes de absorción para diferentes frecuencias 54

Capítulo 3

Tabla 3.1 Valores de retardo 77


Tabia 3.2 Valores del efecto eco 78
Tabla 3.3 Valores del efecto coro 80
Tabla 3.4 Valores de! efecto robot 81
Tabla 3.5 Valores del efecto reverberación 82
Tabla 3.6 Valores de atenuaciones del efecto teatro 84
Tabla 3.7 Valores de retardos del efecto teatro 84
Tabla 3.8 Valores de atenuaciones del efecto iglesia 85
Tabla 3.9 Valores de atenuaciones del efecto iglesia 85
Tabla 3.10 Valores de atenuaciones del efecto sala 85
Tabla 3.11 Valores de retardos de! efecto sala 86

Capítulo 4

Tabla 4.1 Formato de la encuesta 116


Tabla 4.2 Datos de los tiempos de proceso de los efectos 119

Anexo A

Tabla A.1 Propiedad de los objetos uicontrol 131


PROLOGO

El desarrollo de técnicas computacionales para el procesamiento digital de


señales en los últimos años, ha tenido un variado campo de aplicación, desde la
adquisición de datos, análisis de señales de audio, hasta el desarrollo de
paquetes que facilitan la simulación de ciertos fenómenos con la utilización de
pocos recursos.

Es así como con el aparecimiento del internet, donde se combinan audio , video y
texto, permite al usuario indagar como se logra almacenar el audio en simples
archivos, como se realizan ios efectos de voz en programas radiales, como
obtenerlos y cuáles son sus principales parámetros de variación.

Por ello éste trabajo está estructurado de cinco capítulos ;

• El primer capítulo trata sobre los formatos de los archivos de sonido.


• El segundo trata sobre las características de los efectos a simular.
• El tercero trata sobre la implementación de los efectos de voz a simular.
• El cuarto trata sobre los resultados de las simulaciones.
• Y el quinto sobre las conclusiones y recomendaciones.

Con ello se trata de dar una visión más amplia de cómo se producen los efectos y
cuales son sus principales características en el dominio del tiempo y frecuencia.

También se incluyen 4 anexos en los cuales se detalla información sobre:

• Manual de usuario del programa de simulación.


• Elaboración de ¡nterfaces gráficas en MATLAB 5.3.
• Programas comerciales de efectos de voz.
• Y un glosario de términos.
Con esto se persigue que al final el lector tenga la idea clara de la manera como
se realizan los efectos de voz y cuáles son los conceptos utilizados para ello.
CAPITULO 1

FORMATOS DE ARCHIVOS DE SONIDO

1.1 INTRODUCCIÓN

Con ei desarrollo de la tecnología multimedia las computadoras se convirtieron en


verdaderos estudios de grabación, en donde gracias a las ventajas de la
digitalización de los sonidos analógicos, se crearon formatos, los cuales tratan
cada vez de ocupar menos espacio en el disco duro, usando técnicas de
compresión y conservando sus características de calidad.

1.2 DEFINICIONES

Con la introducción al capítulo es necesario definir ciertos términos, los cuales se


van a emplear con frecuencia, en el desarrollo de este trabajo.

1.2.1 FORMATO DE ARCHIVO DE SONIDO

Un formato de archivo de sonido es aquel que sirve para identificar las diferentes
características de las ondas sonoras. Por ejemplo: frecuencia de muestreo,
número de bits por muestra, tipo de codificación, número de canales, tamaño de
muestras de datos e identificación del tipo de archivo,

1.2.2 ARCHIVO DE AUDIO DIGITAL

Un archivo de audío digital es aquel que tiene almacenado información de sonido


que ha sido convertido a un formato numérico.
1.2.3 FRECUENCIA DE MUESTKEO

La frecuencia de muestreo es el número de muestras por segundo, que se toman


de una señal en particular.

Cuanto mayor sea este número, más fiel será la reproducción, respecto de la
señal original. En la figura 1.1 podemos observar la manera de cómo se realiza el
muestreo.

2.5

"-5. 1.5

G.5

Figura 1.1 Muestreo de señal

Según el teorema de Nyquist [2] el mínimo valor de la frecuencia de muestreo es


dos veces la máxima frecuencia de la señal a digitalizar.
Por ejemplo si tenemos una señal que es la suma de dos sinusoides:

Y=sin(2*pi*20*t)+sin(2*p¡*50*t),cuyas frecuencias son " 20Hz y 50Hz


respectivamente, entonces para muestrearla necesitamos una frecuencia mínima
de maestreo de 100 Hz, en la figura 1.2 tenemos el espectro de potencia de
dicha señal con una frecuencia de muestreo de 150Hz.

60r^=

50

40

•o 30

Q-

20

10

" . . :.- so : ;\• loa ' . ., - iso


Frecuencia en Hz

Figura 1.2 Espectro de potencia

Se observa las frecuencias de 20 y 50 Hz, que son las componentes originales, y


además se tiene las de 100 y 130Hz debidas a la repetición periódica del
espectro básico.

Caso contrario s¡ la frecuencia de muestreo es menor, por ejemplo de 60 Hz se


generará una frecuencia en 10 Hz, llamándose a este efecto aliasing [1] ver la
figura 1.3.
• 50

45

. 40
Aliasing
. -v -35

|T 30
co
"I 25
O)

:a 20

15

10

10 . 20 30 40 50 60
Frecuencia en Hz

Figura 1.3 Aliasing

Valores comunes de frecuencia de muestreo que se utilizan en las tarjetas de


sonido son de 8000 Hz, 11025 Hz, 22050 Hz, 44100 Hz , teniéndose que entre
más alto sea el valor de la frecuencia de muestreo, la calidad del sonido será
superior.

1.2.4 RESOLUCIÓN

Es el número de bits que se utiliza para representar las muestras de audio.

Por ejemplo si tengo 8 bits, tendré 28 combinaciones o niveles de cuantificación


teniendo que el rango de variación de la señal se divide en 256 subintervalos,
mientras que con una resolución de 16 bits lo hace en 65536 subintervaios,
concluyendo que si la resolución es mayor, mejor será la representación de la
señal. ( Ver figura 1.4 )
Niveles de
cuaníificación

255
254
253

1
O
Tiempo

1T 2T 3T 4T

Figura 1.4 Resolución

1.3 FORMATOS DE ARCHIVOS DE SONIDO

En la actualidad existen varios tipos de formatos de archivos de sonido,


desarrollados unos por casas fabricantes de tarjetas de sonido, otros por
fabricantes de computadoras, que de una u otra manera querían estandarizar el
manejo del mismo en sus productos particulares. Entre los más conocidos
tenemos: au, midi, raw, aiff, ra, voc, mid, wav, mp3,

1.3.1 FORMATO AU

Formato desarrollado por la empresa Sound, posee pocas características de


buena calidad pues su frecuencia de muestreo es de apenas 8000 Hz y 8 bits
por muestra. Es muy utilizado en las páginas web, por tener un tamaño pequeño,
lo que en términos de velocidad, facilita su descarga de la red.
Este formato tiene como contenido usual los siguientes parámetros que se
muestran a continuación en la tabla 1.1.
Longitud
Offset Contenido
(bytes)
0 4 Snd
4 4 Tamaño de cabecera (h)
8 4 Tamaño de muestras de datos (n)
12 4 Codificación del archivo de sonido
16 4 Frecuencia de muestreo
20 4 Número de canales
24 (h-24) Comentario
24+(h-24) N Muestras de datos

Tabla 1.1 Parámetros del formato au

Teniendo varias posibilidades de codificación como PCM [4] de 8 , 16, 24 bits, ley
u, ley a, Adpcm [7], etc, las cuales tienen un número en el formato del archivo,
que identifica la codificación utilizada.

1.3.2 FORMATO MIDI

MIDI ( Musical Instruments Digital Interface ) es el formato por el cual una


computadora puede comunicarse con instrumentos musicales. Está estructurado
por bloques, cada bloque contiene los siguientes parámetros como lo indica la
figura 1. 5.

Tipo Longitud Dato


4 4 n
bytes bytes bytes
Figura 1.5 Contenido de un bloque

Hay dos tipos de bloques:

Bloques de cabecera
Bloques de pista
Por tanto un archivo MIDI consiste de un bloque de cabecera, seguido de uno o
más bloques de pista.

1.3.2.1 Bloque de cabecera

Contiene tres campos de 16 bits. Estos campos especifican e! formato, número de


pistas y tiempo para el archivo MIDI, Resultando el tamaño de datos de 6 bytes de
longitud. La figura 1.6 muestra la distribución de los diferentes parámetros dentro
del bloque de cabecera.

Bloque
Longitud Dato
Tipo
4 bytes 4 bytes 6 bytes
ascii 32 bits
16 16 16
binarios
bits bits bits

MThd Longitud formato pistas división

Figura 1.6 Bloque de cabecera

MThd
Identificación de un bloque de cabecera.

Longitud
Este es un número binario de 32 bits MSB first, siendo de 6 bytes
exactamente para cualquier archivo MIDI bajo la especificación MIDI 1.0.
Donde MSB first (Most Significant Byte First ) significa primero el bit más
significativo.

Formato
Este es un número binario de 16 bits MSB first, siendo válidos los formatos
0,1y2.
10

Formato O
Consiste de un bloque de cabecera y un solo bloque de pista, el cual
contiene todas las notas e información de tiempo.

Formato 1
Consiste de un bloque de cabecera y uno o más bloques de pista, siendo
estos últimos ejecutados simultáneamente.
La primera pista de un formatol es especial, y es conocido como "Tempo
Map".
Formato 2
Este formato consiste de un bloque de cabecera y uno o más bloques de
pista, donde cada pista representa secuencias independientes.

Pistas
Da el número de pistas contenidas en el archivo.

División
Este parámetro define las unidades de incrementos de tiempo, es un
número binario de 16 bits que puede estar en dos formatos dependiendo del bit
más significativo. La figura 1.7 muestra el contenido de este parámetro.

Bit 15 14... 8 7 ...0

0 Ticks por cuarto de nota


división
1 Tramas/segundo Ticks/trama

Figura 1.7 Contenido del parámetro división

Por ejemplo si el bit 15 = O, se tiene:


bits 0-14
número de unidades de incrementos de tiempo en cada cuarto de nota
11

si ei bit 15 = 1:
bits 0-7
número de unidades de incrementos de tiempo por cada trama SMTPE [6].
bits 8-14
valor negativo, representa e! número de tramas SMTPE por segundo.
Valores válidos corresponden a estos en la trama QUARTER MTC [7],

-24 = 24 tramas por segundo


-25 = 25 tramas por segundo
-29 = 30 tramas por segundo
-30 = 30 tramas por segundo

1.3.2.2 Bloque de pista

La parte de datos del bloque de pista contiene uno o más pares de unidades de
incrementos de tiempo. La figura 1.8 muestra los parámetros de un bloque de
pista.

Tipo Longitud Dato

4 bytes 4 bytes n bytes


ascii 32 bits
datos binarios
binarios

(incrementos de tiempo )
MTrk Longitud
(eventos)

Figura 1.8 Parámetros de un bloque de pista

Unidad de incremento de tiempo

Es el número de marcas desde el evento previo, y está representado como


una variable de longitud contable.
12

Evento

Son mensajes generados según la acción que se desee ejecutar, por


ejemplo; parar, continuar, leer, repetir, pausa, etc.

Puede ser uno de los siguientes:

• Midi evento

• Sysex evento

• Meta evento

Midi evento

Es cualquier mensaje de canal MIDI, estos incluyen;

• Canal de mensaje de voz


• Canal de mensajes modo
• Estado actual

Svsex evento

Este proporciona mensajes exclusivos en un archivo de formato MIDI


Por ejemplo para generar el mensaje:

FO 7E 09 03 01 01 F7
(solicitud de descarga de muestra - Dispositivo 9, muestra número 257)

el sysex_evenfo debería ser:


F 0 0 6 7 E 0 9 0 3 0 1 01 F7

o también:

F707 F 0 7 E 0 9 0 3 0 1 01 F7
Meta eventos

Son parámetros usados para los nombres de las pistas, lyrics (letras) y
puntos de corte.

Los meta eventos tienen ía siguiente forma:

FF tipo longitud datos

Donde:

Tipo

Es un solo byte, especificando el tipo de meta evento.


Los posibles rangos están dentro de 00 - 7F. No todos los valores en este rango
están definidos.

Longitud

Es el número de bytes de datos siguientes,


cero es una longitud válida

Datos

cero o más bytes de datos.

Ejemplo:

Secuencia de número
FFOO
02ssss

Este es un evento ocasional, solamente ocurre en el comienzo de una pista


cuando la unidad de incremento de tiempo es diferente de cero.
14

Para formato 2 este es utilizado para identificar una pista, si es omitido las
secuencias son numeradas secuencialmente en el orden de aparición de las
pistas.
Para formato 1 este evento debería ocurrir solamente para la primera pista.

Texto evento
FF01
Longitud
texto
'Este evento es usado para anotaciones de la pista con texto arbitrario.
Longitud .- longitud del texto.
Texto.- longitud en bytes de texto asen, u 8 bits de datos binarios.
Copyright Notice
FF02
Longitud
texto

Este evento es para indicar la noticia del copyright, debe ir antes de la primera
pista y puede ser por ejemplo de la forma: "(C) 1850 J.Strauss"

1.3.3 FORMATO RAW

Es el más elemental de todos, ya que la información de la señal maestreada no


contiene bloques que identifiquen parámetros como la frecuencia de muestreo,
tamaño y número de bits por muestra.

Por lo general los archivos con este formato tienen su frecuencia de muestreo de
SOOOHz, número de bits por muestra igual a 8, y su reproducción monofónica [3].
1.3.4 FORMATO AIFF

AIFF (Audio ¡nterchange File Formal), este formato fue desarrollado por Apple
para almacenar muestras de sonido de alta calidad, soporta una variedad de bits
de resolución, frecuencias de muestreo, canales de audio, es muy utilizado en
programas de procesamiento de audio digital.

Un formato de archivo AIFF es una colección de diferentes tipos de bloques, uno


de ellos es el bloque común, el cual contiene importantes parámetros que
describen la forma de onda, tal como la longitud, frecuencia de muestreo.
El bloque de datos de sonido, contiene los datos de la forma de onda, otros
bloques son opcionales y definen marcas, parámetros de lista de instrumentos,
información específica, etc.

Todas las aplicaciones que usen el formato AIFF deberán ser capaces de leer los
2 bloques requeridos y poder elegir o ignorar los bloques opcionales. No hay
restricciones en el orden de los bloques en este formato.

La figura 1.9 muestra un archivo con sus dos bloques fundamentales, el común y
el bloque de datos de sonido.

BLOQUE DE FORMA AIFF


CKID = FORM
TIPO DE FORMA = AIFF

Bloque Común
CKID= COMM

Bloque de datos de sonido


CKID= SSND

Figura 1.9 Estructura de formato AIFF


1.3.4.1 Aiff-c

AIFF-C ( Compressed Audio Interchange File Formal ), este formato se diferencia


del primero ya que posee la opción de compresión.
16

En la figura 1.10 está la estructura de un archivo AIFF-C, y un ejemplo de los


valores que suelen tener los diferentes campos de la estructura del formato.

Bytes Ejemplo

Bloque de identificación 4 FORM


Bloque de forma
Bloque de tamaño 4 99690
Tipo de forma 4 AIFF-C

Bloque de Bloque de identificación 4 AIFF-C


versión de
formato . Bloque de tamaño 4 4
Tiempo de comienzo 4 27263184

Bloque de identificación 4 Comm


Bloque de tamaño 4 38
Número de canales 2 1
Tramas del numero de 4 99611
Bloque Común
muestras
Tamaño de muestra 2
Frecuencia de muesíreo 8 2225454
Tipo de compresión 4 Ninguno
Nombre de compresión 16 HOT COMPRESSED

Bloque de identificación 4 SSND


Bloque del data Bloque de tamaño 4 99619
sound Offset 4 O
Tamaño del bloque 4 O

Datos de sonido variable Trama 1 de trama n ( 99,611)


Datos de sonido
Pad byte 1 O

Figura 1.10 Estructura de formato AIFF-C

1.3.5 FORMATO MP3

Sus orígenes son en MPEG ( Moving Pictures Expert Group ) [5], es ei formato
que está en auge en estos días, gracias a ios algoritmos de compresión que
posee.
17

Existen dos versiones;


> MPEG-1
> MPEG-2
Cada uno de ellos con esquemas de codificación llamados capa 1,2 y 3

1.3.5.1 Mpeg-1

Describe tres capas de audio codificando con las siguientes propiedades:


uno o dos canales de audio, frecuencia de muestreo de 32kHz, 44.1kHz o 48kHz,
razón de bit desde 32kbps hasta los 448kbps, el estándar (ISO/IEC 11172-3),
hace referencia de esta versión.

1.3.5.2 Mpeg-2

Descrito por el estándar (ISO/IEC 13818-3), tiene dos extensiones usualmente


referidos como:

MPEG-2/LSF y MPEG-2/Multicanal.

MPEG-2/LSF.- tiene las siguientes propiedades:

Uno o dos canales de audio, frecuencia de muestreo de 16kHz, 22.05kHz o


24kHz, razón de bit desde 8kbps hasta los 256kbps.

MPEG-2/Multicanal." tiene las siguientes propiedades:

Hasta 5 canales de audio y un canal LFE (Low Frequency Enhancement


subwoofer ), frecuencia de muestreo de 32kHz, 44.1kHz o 48kHz, razón de bit
altos cerca de 1Mbps para 5.1

Un archivo MPEG está constituido por tramas que son independientes entre ellas,
cada trama tiene su propia cabecera e información de audio.
18

Para la explicación tenemos la representación gráfica del contenido de la


cabecera, con caracteres desde la A hasta la M para indicar los diferentes
campos.
AAAAAAAAAAABBCCDEEEEFFGHIIJJKLMM

En la tabla 1.2, se tiene la distribución de bits de la trama de cabecera.

Carácter Propósito Posición Longitud en bits


A Trama de sincronismo 31-21 11
B Versión de audio MPEG 20-19 2
C Capa MPEG 18-17 2
D Protección 16 1
E Razón de bit 15-12 4
F Frecuencia de muestreo 11-10 2
G Bit de relleno 9 1
H Bit privado 8 1 -
I Modo de canal 7-6 2
J Modo de extensión 5-4 2
K Copyright 3 1
L Original 2 1
M Énfasis 1-0 2

Tabla 1.2 Contenido de la cabecera de un archivo MPEG

1.3.5.3 Contenido de parámetros

Trama de sincronismo

Presente en todas las tramas, su longitud es de once o doce bits, dependiendo de


si tiene bit de relleno o no, siendo todos unos.
19

Versión de audio

Tiene las siguientes alternativas.

00 = MPEG Versión 2.5


01 = reservado
10 = MPEG Versión 2 (ISO/IEC 13818-3)
11 = MPEG Versión 1 (ISO/IEC 11172-3)

La versión MPEG 2.5 no es un estándar oficial, por tanto se deberá fijar el bit 20
en la cabecera, en aplicaciones que no soporten esta versión.

Capa MPEG

Se usan dos bits y sus combinaciones son:

00 = reservado
01 - capa tres
10 = capa dos
11 = capa uno

Protección

Sirve para indicar si el archivo tiene un copyright


Bit
0 = Protegido porCRC
1 = No protegido

Razón de bit

La siguiente tabla 1.3 muestra las posibles combinaciones;


20

Bits V1,L1 V1,L2 V1,L3 V2,L1 V2, L2 & L3


0000 Libre Libre Libre Libre Libre
0001 32 32 32 32 8
0010 64 48 40 48 16
0011 96 56 48 56 24
0100 128 64 56 64 32
0101 160 80 64 80 40
0110 192 96 80 96 48
0111 224 112 96 112 56
1000 256 128 112 128 64
1001 288 160 128 144 80
1010 320 192 160 160 96
1011 352 224 192 176 112
1100 384 256 224 192 128
1101 416 320 256 224 144
1110 448 384 320 256 160
1111 Bad Bad Bad Bad Bad

Tabla 1.3 Combinaciones de bits para la razón de cambio

Donde todos los valores están en Kbps

V1 = MPEG versión 1
V2 = MPEG versión 2
L1 = capa I
L2 = capa II
L3 = capa Itl
Libre = formato libre
Bad = valor no permitido

La tabla 1.4 muestra la razón de bit con sus modos permitidos:


21

Razón de bit ( kbps ) Modos permitidos


Libre Todos
32 Canal único
48 Canal único
56 Canal único
64 Todos
80 Canal único
96 Todos
112 Todos
128 Todos
160 Todos
192 Todos
224 Estéreo, intensity estéreo, canal dual
256 Estéreo, intensity estéreo, canal dual
320 Estéreo, intensity estéreo, canal dual
384 Estéreo, intensity estéreo, canal dual

Tabla 1.4 Modos permitidos según la razón de bit

Frecuencia de muestreo

Se la setea con dos bits y la tabla 1.5 muestra sus valores expresados en KHz.

bits MPEG1 MPEG2 MPEG2.5


00 44100 22050 11025
01 48000 24000 12000
10 32000 16000 8000
11 Reservado Reservado Reservado

Tabla 1.5 Valores de frecuencia de muestreo para archivos MPEG


22

Bit de relleno

Este bit es usado cuando las tramas no cumplen con el número de bits
necesarios.
0 = trama no es rellenada
1 - trama es rellenada.

El relleno es usado dependiendo del tipo de capa y de la frecuencia de muestreo.


Por ejemplo: 128KHz, 44.1KHz capa II usan 418 bytes y algunos 417 bytes. Para
capa I este slot es de 32 bits y 8 bits para capa II y III.

Bit privado

Un solo bit, usado libremente para necesidades específicas del autor, como por
ejemplo si es uno sería favorito. Poco utilizado en la práctica.

Modo de canal

Es de dos bits y sus combinaciones indican que tipo de configuración de canal es


utilizado.

00 = estéreo
01 - joint estéreo ( estéreo)
10 = canal dual (estéreo)
11 - canal único ( mono )

Modo de extensión

Es usado en información donde no cuenta con efectos estéreo. El rango completo


de frecuencia es dividido en 32 bandas, para capa I y II estos dos bits determinan
la banda donde el efecto estéreo es aplicado. Para la determinación de las sub-
bandas se parte de la característica que tiene el oído humano de no poder
23

distinguir entre dos frecuencias muy cercanas como por ejemplo: 1KHz y 1.01
KHz, Las tablas 1.6 y 1.7 muestran estas bandas de frecuencia.

Banda Frecuencia Banda Frecuencia Banda Frecuencia Banda Frecuencia


(Hz) (Hz) (Hz) (Hz)
0 50 7 660 14 1970 21 6375
1 95 8 800 15 2340 22 7690
2 140 9 940 16 2721 23 9375
3 235 10 1125 17 3280 24 11625
4 330 11 1265 18 3840 25 15375
5 420 12 1500 19 4690 26 20250
6 560 13 1735 20 5440

Tabla 1.6 Distribución de las bandas de frecuencia

Capa I y II Capa III


valores Capas I & II I ntensity estéreo MS estéreo
00 Bandas 4 hasta 31 off Off
01 Bandas 8 hasta31 on Off
10 Bandas 12 hasta 31 off On
11 Bandas 16 hasta 31 on on

Tabla 1.7 Bandas de frecuencia para archivos MPEG


Copyright

Es de un solo bit e indica et derecho de autor.


0 = Audio sin copyright
1 = Audio con copyright

Original

Es de un solo bit e indica si un archivo es original o no.


24

0 - Copia I
1 = Original

Énfasis

Son dos bits y sus combinaciones son:

00 = ninguno
01 =50/15 ms
10 = reservado
11 =CCITJ.17

La mayoría de los archivos MPEG tienen un bloque de 128 bytes ílamado ID3,el
cual tiene información del nombre del artista, nombre de la canción, álbum, año,
etc. La representación gráfica de este campo es el siguiente:

AAABBBBB BBBBBBBB BBBBBBBB BBBBBBBB


BCCCCCCC CCCCCCCC CCCCCCCC CCCCCCCD
DDDDDDDD DDDDDDDD DDDDDDDD DDDDDEEE
EFFFFFFF FFFFFFFF FFFFFFFF FFFFFFFG

La tabla 1.8 muestra estos parámetros:

Carácter Longitud Posición descripción


( bytes ) ( bytes )
A 3 (0-2) Identificación TAG' si tag existe y es correcto.
B 30 (3-32) Titulo
C 30 (33-62) Artista
D 30 (63-92) Álbum
E 4 (93-96) Año
F . 30 (97-126) Comentario
G 1 (127) Género

Tabla 1.8 Parámetros del campo ID3


25

La tabla 1.9 muestra las posibilidades del campo género.

0 Blues 20 Alternativo 30 Rock alternativo 31 Top40


1 Rock clásico 21 Ska 31 Bass 32 Cristian Rap
2 Country 22 Death Metal 32 Soul 33 Pop- Funk
3 Dance 23 Pranks 33 Punk 34 Jungle
4 Disco 24 Soundtrack 34 Space 35 Nativa Americana
5 Funk 25 Euro-Techno 35 Meditativa 36 Cabaret
6 Grunge 26 Ambient 36 Pop Instrumental 37 New Wave
Rock
7 Hip-Hop 27 Trip-Hop 37 38 Sicodélica
Instrumental
8 Jazz 28 Vocal 38 Étnica 39 Rave

9 Metal 29 Jazz+Funk 39 Gótica 40 Showtunes


10 New age 30 Fusión 40 Darkwave 41 Trailer

11 Oldies 31 Trance 41 Tecno industrial 42 LoFi

12 Otros 32 Classical 42 Electrónica 43 Tribal

13 Pop 33 Instrumental 43 Pop- folk 44 Acid Punk

14 R&B 34 Acid 44 Eurodance 45 Acid Jazz

15 Rap 35 House 45 Dream 46 Polka

16 Reggae 36 Game 46 Southern Rock 47 Retro

17 Rock 37 Sound Clip 47 Comedy 48 Musical


18 Tech no 38 Cospel 48 Cult 49 Rock and roll
19 Industrial 39 Noise 49 Gangsía 50 Rock Duro

Tabla 1.9 Posibilidades del campo género

1.3.6 FORMATO VOC

Formato desarrollado por la empresa Creative Labs para sus tarjetas de sonido
Sound Blaster.

Consta de dos bloques principales:

Encabezamiento
Datos
El primero contiene la información que caracteriza ai archivo de sonido, como son
versión del archivo de voz, identificadores del tipo de archivo, desplazamientos,
etc. La descripción de los bytes es la siguiente:
26

Del 0x00 hasta el 0x13h


Contiene la descripción del tipo de archivo, se lee
'Creative Voice File' seguido de un EOF (0x1 A)
0x14 hasta 0x15
El comienzo del bloque data.

0x16 hasta 0x17


Contiene la versión del archivo.

0x18 hasta 0x19


Contiene la identificación del código, éste puede verificar que está leyendo un
archivo .VOC real.

El segundo contiene la información del archivo de sonido, en este pueden existir


varios sub-bloques que contengan información de silencios, ciclos repetitivos,
texto ASCII, etc.

Cada bloque data comienza con los mismos 4 bytes.


Bloque tipo : 1 byte
Bloque longitud: 3 bytes
Contenido de los sub-bloques;
Cero.- final del bloque data
Uno.- nuevos datos muestreados, este bloque incluye la frecuencia de muestreo
y el campo de empaquetamiento de los datos.
Dos.- datos muestreados
Tres.- silencio.
Cuatro.- marcas.
Cinco, -textoASCII.
Seis.- comienzo de una repetición.
Siete,- final de una repetición.
Ocho.- información adicional.
Nueve,- nuevo tipo de bloque.
27

1.3.7 FORMATO WAV

Es un formato propio de las aplicaciones de Windows, su estructura está basada


de acuerdo a las normas RIFF[8] ( Resource interchange File Format), Formato
de Archivo de Intercambio de Recursos, muy utilizados en ambientes multimedia.

En este formato las muestras se almacenan una tras otra, sin ningún tipo de
compresión y con cuantificación uniforme. La manera de operación lo hace ideal
para el tratamiento digital del sonido.

1.3.7.1 Forma canónica del formato

La tabla 1.10 muestra el contenido de cada uno de los bytes en un formato de


archivo wav.

Bytes Contenido Usual Propósito


00-03 RIFF Bloque de identificación.

04-07 Entero largo. Tamaño del fichero en bytes, incluyendo cabecera.

08-11 WAVE Indica que el archivo contiene una señal de sonido.

12-15 Fmt Identifica al bloque como un fragmento de formato.

16-19 16,0,0,0 Tamaño de la cabecera hasta este punto.

20-21 1,0 Indica categoría de formato.

22-23 1,0 Número de canales ( 1= mono 2= estéreo )

24-27 Frecuencia de muestreo

28-31 Número medio de bytes/segundo

32-33 1,0 Alineamiento de bloque

34-35 8,0 Número de bits por muestra

36-39 Data Indica el comienzo de los datos de las muestras

40-43 Número de bytes muestreados

Resto Muestras ( cuantificación uniforme )

Tabla 1.10 Contenido de un formato de archivo WAVE


28

La forma canónica WAVE comienza con ia cabecera RIFF;

Bloque de Identificación.- contiene las letras "RIFF" en código ASCII desde (


0x52494646 en forma big-endian).

Bloque de Tamaño.- contiene el tamaño del archivo entero en bytes.

Formato.- contiene las letras "WAVE" ( 0x57415645 forma big-endian )

El formato "WAVE" consiste de dos sub-bloques:" fmt" y " data " :

El sub-bloque " fmt" describe el formato de los datos del sonido:

Sub-bloque1 de identificación.- contiene las letras " fmt" (Ox666d7420 forma big-
endian )
Sub-bloque 1 de tamaño.- contiene el tamaño del resto del sub-bloque, por
ejemplo: para PCM es 16.

Formato de audío.- contiene valores que representan el tipo de modulación


utilizado por ejemplo: PCM=1 ( cuantización lineal).

Número de canales.- contiene la información del archivo si es mono = 1 , 0


estéreo =2.

Frecuencia de muestreo.- en este campo se tiene el valor de la frecuencia a ia


cual e! archivo debería ser ejecutado por ejemplo 8000 Hz, 44100 Hz, etc.

Número medio de bytes por segundo.- es el valor al cual deberían ser


transferidos los datos del archivo de sonido. Se obtiene multiplicando la
frecuencia de muestreo por el número de canales y por el número de bits por
muestra dividido para ocho. Nbs= F*Nc*bpm/8
29

Bloque de alineación.- número expresado en bytes necesario cuando existen


múltiples procesos de alineación de bloques de datos en un determinado tiempo
este valor se lo obtiene multiplicando el número de canales por el número de bits
por muestra divido para ocho. Ba^ Nc*bpm/8

Bits por muestra.- contiene el número de bits que utiliza por cada muestra
ejemplo: 8,16,etc.

El sub-bloque "data" contiene ei tamaño de los datos del archivo de sonido:

Sub-bloque 2 de identificación.- contiene las letras " data " (0x64617461 forma
big-endian ).

Sub-blogue 2 de tamaño.- este es el número de bytes en el campo data. Se lo


obtiene multiplicando el número de muestras por el número de canales y por el
número de bits por muestra divido para ocho. Nm* Nc*bpm/8
Data.- contiene los datos del archivo de sonido.

1.3.7.2 Interpretación de datos hexadecimales

Para visualizar todo lo anteriormente expuesto tenemos un ejemplo de un archivo


wave de 72 bytes mostrado en números hexadecimales:

52 49 46 46 24 08 00 00 57 41 56 45 66 6d 74 20 10 00 00 00 01 00 02 00
22 56 00 00 88 58 01 00 04 00 10 00 64 61 74 61 00 08 00 00 00 00 00 00
24 17 1e f33c13 3c 14 16 f9 18 f9 34 e7 23 a6 3c f2 24 f2 11 c3 1b Od

Aquí la interpretación de estos bytes como un archivo de sonido WAVE:


Ver Figura 1.11
30

Sub-bloque de tamaño = 2084 Sub-bloque1 de tamaño = 16 Número de canales = 2

Bloque de descripción sub-bloque frnt


52 49 46 46(24080000) 57 41 56 45 66 6d 74 20 f 10 00 0000^ (0100) (02 Otí\ m t
R | F F^- -^W A V E

Formato de audio=1 (PCM)

Frecuencia de muestreo=22050

Bloque de alineación =4 Sub-bloque2 de tamaño = 2048

sub-bloque data
'225600 00 Y 88 580100^ /0400\/10 00* 64 61 74 61 fOQ 08 0000"^ (0000^ ( 0000^1
d a t a

Bits pormuestra=16 Muestra 1

Número medio de bytes por segundo = 88200

2417Vlef3H3c13V3c14V16f9V18f9V34e7V23aa 3cf2H24f2H11ce ObOd

Muestra 2 Muestra 3 Muestra 4 ^^ Muestra 5 Muestra 6 Muestra 7

Muestras de canal Muestras de canal


izquierdo derecho

Figura 1.11 Interpretación de formato Wav

Por lo general los archivos wav utilizan e! formato PCM ( Pulse Code Modulation) ,
existiendo otras alternativas como: la ley u, la ley a, ADPCM (Adaptive Differential
Pulse Code Modulation), etc.

Estos archivos de sonido, son los más utilizados en el área de edición, pues
contienen la información necesaria para la alteración de dichos parámetros, pero
una desventaja es su gran tamaño, por lo que una vez terminados de editar, se
procede a comprimirlos con el formato mp3, el de mayor auge en estos días, en
equipos que disponen de recursos multimedia .

1.4 BIBLIOGRAFÍA

[1] SAMIR S. SOLIMÁN ; MANDYAN D. SRINATH


SEÑALES Y SISTEMAS CONTINUOS Y DISCRETOS
PRENTICE HALL IBERIA, S.R.L
Segunda edición
Madrid 1999

[2] OPPENHEIM, ALAN V ; ALAN S. WILSKY y S. HAMID NEWAB


SEÑALES Y SISTEMAS
PRENTICE HALL
Segunda Edición
1997

[3] MOMPÍN POBLET JOSÉ


MANUAL DE ALTA FIDELIDAD Y SONIDO PROFESIONAL
MUNDO ELECTRÓNICO
MARCOMBO BARCELONA 1981

[4] WAYNETOMASI
SISTEMAS DE COMUNICACIONES ELECTRÓNICAS
PRENTICE HALL
Segunda Edición

Direcciones de internet

[5] http://mernbers.es.tripod.de/latorrepc/queesmp3.htm
[6] http://music.utsa.edu/electron/SMPTE.html
[7] http://www.fortunecity.com/tinpan/faithfuII/379/mtc.html
[8] http://www.waves.com/htmls/technologies/tec_improved_adpcm.htm
[9] http://www.ora.com/centers/gff/formats/micriff/index.htm
[10] http://premium.microsoft.com/msdn/iibrary/tools/dnmuit/dl/newwave.hmt
[11] http://www.lightlink.com/tjweber/StripWav/WAVE.html

[12] http://music.concordia.ca/Programs/Electroacoustics/SoundApp
7formats.html
[13] http://www.utp.ac.pa/seccion/topicos/muitimedia/formatos.html
[14] http://www.teleport.com/-desitrek/wavformat.html
[15] http://www.geocities.com/-vmushinskiy/fformats/fiies/voc.txt
[16] http://www.eng.tau.ac.il/-acmidi/format.htm
[17] http://home.sprynet.com/-cbagwell/AudioFormats-11.html
[18] http://www.opennc.org/public/pubs/externai/auformat.html
33

CAPITULO 2
CARACTERÍSTICAS DE LOS EFECTOS DE SONIDO A
SIMULAR

2.1 INTRODUCCIÓN

Gracias a las técnicas digitales, el desarrollo de algoritmos que simulan efectos


se han incrementado de manera considerable, de ahí la necesidad de entender el
cómo se producen y cuáles son sus principales parámetros de variación, io cual
conlleva a la utilización de conceptos de sistemas de control, para la obtención de
las funciones de transferencia [1], ecuaciones de diferencias [2], y así poder
obtener los mencionados efectos.

2.2 EFECTO ECO

El efecto eco es aquel en el cual se tiene repeticiones atenuadas de la señal


original a intervalos fijos. En la figura 2.1 se muestra a una onda sinusoidal con
dicho efecto.

0.8

0.6

0.4

0.2

-0.2

-0.4

-0.6

O 20 40 60 80 100 120

Figura 2.1 Eco de una señal sinusoidal


34

2.2.1 MODELO

Este efecto se lo consigue sumando, la señal original con una versión de la


misma, pero con un retardo de R muestras, el modelo para la implementación se
muestra en la figura 2.2.

entrada salida
V ¿

rvclcíl UU

Figura 2.2 Modelo de implementación de eco

2.2.2 ECUACIÓN DE DIFERENCIAS

x(n)
\
Á

Z
¿- R

Figura 2.3 Modelo de efecto eco

Analizando la figura 2.3 podemos nosotros obtener la ecuación de diferencia que


es:
y(n) = x(n) + a.x(n - R) ecuación 2.1

donde y(n) es la seña! de salida con efecto, x(n) es la señal original , x(n-R) es la
señal original retardada, a es el factor de atenuación y R es el valor del retardo
expresado en muestras.

2.2.3 FUNCIÓN DE TRANSFERENCIA

Realizando la transformación al dominio Z de la ecuación 2.1, se obtiene la


función de transferencia que es:
35

H(z) = 1 + a Z-R ecuación 2.2

Cuya respuesta impulsiva es:

h(n) = 5(n) + a 5(n-R) ecuación 2.3

Donde la respuesta de frecuencia de la ecuación 2.2 para un valor de R - 2,4,6,


y a = 0.5 se muestra en la figura 2.4.

D 0.1 0.2 0.3 0.4 Q.5 0.6 07 G.8 0.9 1


Frecuencia normalizada (radianes)

Figura 2.4 Respuesta de frecuencia en amplitud de ía ec. 2.2

Teniendo que a medida que se incrementa el retardo, mayor es el número de


ciclos que se producen, 9bservándose las mismas características en la variación
de la fase figura 2.5.
36

0.6r

0.4 R=6

0.2

-0:2

•-Q.4

. -0.6 -

-0.8
O 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Frecuencia normalizada (radianes)

Figura 2.5 Variación de la respuesta de frecuencia en fase de la ec. 2.2

Si se obtiene la respuesta impulsiva de la ecuación 2.2, para valores de retardos


R = 2, 4, 6 y atenuación a = 0.5, podemos distinguir que solamente existe señal
en aquellos valores iguales al retardo, salvo el valor del término independiente
que alcanza una amplitud igual a la unidad, como se muestra en la figura 2.6.

1 r f- )
0.9 •

0.8 -

07 •

0.6 R =2 R=4 R =6

0.5 • <> v <>

0.4 •

0.3

0.2 •

0.1

' -
0
0 2 4 6 10 15 20 25

Figura 2.6 Respuesta impulsiva de la ecuación 2.2


37

2.2.4 CARACTERÍSTICAS DEL EFECTO

Podemos identificar dos parámetros importantes en este efecto, el retardo y la


atenuación.

El valor de a es la atenuación para las muestras retardadas, el cual oscila entre


0.1 y 1, se debe tener en cuenta de no sobrepasar estos límites para evitar la
saturación del efecto.

R es el valor de retardo, generalmente se ío expresa en milisegundos, pero en


nuestro caso se lo debe tratar en términos de número de muestras, por lo que
debe ser entero y no negativo, y variará dependiendo de la frecuencia de
muestreo de la señal original.

Valores comunes de retardo son; 100, 120, 150 milisegundos.

2.2.5 VARIACIONES DEL MODELO

Otra alternativa es implementar una línea de retardos, como en la figura 2.7,


donde cada uno de los retardos va multiplicado por un valor de atenuación.

Figura 2.7 Modelo de implementación de n retardos


Dando la ecuación de diferencia;

y(n) = x(n)+a1x(n-R1)+a2x(n-R2)+a3x(n-R3)+......+anx(n-Rn) ecuación 2.4

Y su función de transferencia;

H(z) = 1+a1 Z'R1 + a2 Z"R2 + a3 Z"R3 + + an Z"Rn ecuación 2.5

Teniéndose en la figura 2.8, y 2.9 el valor absoluto y la fase respectivamente, de


la respuesta de frecuencia de la ecuación 2.5, para valores de a1 hasta a9 desde
0.1 hasta 0.9.

££
CL
3

V / \1 0.2 0.3 0.4

Frecuencia normalizada (radianes)

Figura 2.8 Respuesta de frecuencia en amplitud de la ecuación 2.5

Se tiene que para un valor de 0.3641 en el eje de la frecuencia, la amplitud es de


0.0526 y su valor máximo es 5.5, conforme la frecuencia aumenta, tiende a un
valor constante.
39

iu j
U.--1

-2

-3

-4
O 0.1 0.2 0.3 '0.4 0.5 0.6 0.7 0.8 0.9 1
Frecuencia normalizada (radianes)

Figura 2.9 Respuesta de frecuencia en fase de la ecuación 2.5

En el gráfico se observa que la fase varía, con un valor mínimo de - 3.1298


radianes y un valor máximo de 3.0774 radianes, conforme aumenta la frecuencia
la variación tiende a disminuir.

En cambio en la figura 2.10, se tiene la respuesta impulsiva de la ecuación 2.5


para los mismos valores de a.
1
0.9

0.8 o
0.7

0.6 O

0.5

0.4

0.3

0.2

0.1 o
O
O 5 10 15 20 25

Figura 2.10 Respuesta impulsiva de la ec. 2.5


40

2.3 EFECTO CORO

El efecto coro es aquel que simula a dos o más personas hablando al mismo
tiempo, pero con un pequeño retardo entre ellos.

2.3.1 MODELO

Este efecto se lo puede implementar sumando a la señal original, una señal con
un retardo variable, la cual puede ser implementada utilizando un LFO( Low
Frequency Osciiator) [3].

En la figura 2.11 podemos observar el modelo para el efecto coro.

entrada- salida

Retardo

Figura 2.1 1 Modelo de implementación del efecto coro

2.3.2 ECUACIÓN DE DIFERENCIAS

La ecuación de diferencias que se obtiene de la figura 2. 12 es:

Figura 2.12 Modelo del efecto coro

y(n)= x(n) + ax(n-d(n)) ecuación 2.6


41

donde y(n) es la señal de salida con efecto, x(n) es la señal original , x(n-d(n)) es
la señal original retardada, a es el factor de atenuación y d(n) es el valor del
retardo variable expresado en muestras.

2.3.3 CARACTERÍSTICAS

En este efecto conceptos como el retardo variable, sweep depth, speed/rate, LFO,
son de mucha importancia, razón por la cual serán detallados a continuación para
tener una mejor visualización de cómo eilos influyen en dicho efecto.

2.3.3.1 LFO

Un LFO (Low Frequency Oscilator), es un oscilador de baja frecuencia cuyas


señales patrón pueden ser funciones seno, coseno o triangulares, ver figura 2.13,
en las cuales pueden variarse dos parámetros como la amplitud y la frecuencia.

Onda senoidal

7\0

15 20 25 30 35

Onda cosenoidal

\\0

15 20 25 30 35

Onda triangular

-1
10 15 20 25 30 35

Fig. 2.13 Ondas generadas por el LFO.


42

Al utilizar la onda seno como señal del LFO produce una variación constante del
tono, en cambio la onda triangular genera dos tonos, siendo el cambio súbito de
uno a otro. La cantidad de modulación del tono introducido por el efecto coro es
relativo con la rapidez del cambio de la onda del LFO.

2.3.3.2 Retardo

Para la realización de este efecto es necesario generar un retardo variable d(n),


donde

d(n) = R( K+v(n)) ecuación 2.7

R es un valor entre 0.1 y 1, K es una constante menor o igual a uno, v(n)


representa una señal generada por el LFO, cuya frecuencia oscile en el orden de
las unidades de los Hertz, con el retardo variable entre los límites:

0<d(n)<R ecuación 2.8

Donde los valores típicos de retardo del efecto coro están entre 20 y 30 ms, los
cuales deben ser expresados en términos de muestras de señal para poder ser
aplicados.

2.3.3.3 Sweep Depth/ Width

Este parámetro nos indica el retardo total que se aplica a la señal, siendo
expresado usualmente en milisegundos.

2.3.3.4 Speed/Rate

Es la frecuencia de la señal del LFO y un factor de modulación del tono.


La figura 2.14 muestra todos los parámetros anteriormente tratados.

Depth
"o.
E

Figura 2.14 Parámetros del efecto coro

2.3.4 OTROS MODELOS

Un modelo que simula tres voces utiliza dos retardos variables y atenuaciones
diferentes, según muestra la figura 2.15

Figura 2.15 Modelo para simular tres voces

Siendo su ecuación la siguiente:

y(n) = x(n) + a1x(n-d1(n)) +a2 x(n-d2(n)) ecuación 2.9

Donde d1(n) y d2(n) son señales sinusoidales de frecuencias variables diferentes.


44

2.4 EFECTO ROBOT

Este efecto simula la voz robotizada, muy utilizado en propagandas de emisoras


radiales. La voz es metalizada puesto que la frecuencia de muestreo es
multiplicada por un factor pequeño, por io general en ei orden de 0.005 a 0.03,

2.4.1 MODELO

La figura 2.16, muestra el diagrama utilizado para la implementación de este


efecto.

Figura 2.16 Modelo para el efecto robot

2.4.2 ECUACIÓN DE DIFERENCIAS

De la figura 2.16 se obtiene la siguiente ecuación de diferencias:

y(n)= x(n)+ b y(n-R) ecuación 2.10

2.4.3 FUNCIÓN DE TRANSFERENCIA

Obteniendo la transformada Z de la ecuación 2.10 y dividiendo los términos de


Y(z) para X(z) se tiene la función de transferencia:

_n ecuación 2.11
1 — b¿

Las figuras 2:17 y 2.18 muestran la respuesta de frecuencia de la ecuación 2.11.


45

de ia amplitud y fase respectivamente. Esta respuesta de frecuencia


corresponde a la de un filtro combo, el cual se detallará más adelante, en el
numeral 2.5.6.1

0.1 - 0:2 .0.3 0.4. 0.5 . 0.6 0.7 O.i


. . " • " • Frecuencia normalizada

Figura 2.17 Respuesta de frecuencia en amplitud.

O Ü.í 0.2 . Q.3 0.4 0.5 • 0,6 0.7 Q.Q. 0.9 .1


.Frecuencia, normalizada

Figura 2.18 Respuesta de frecuencia en fase.


46

2.5 REVERBERACIÓN

La reverberación es la persistencia del sonido en un recinto, debido a las


continuas reflexiones de las ondas sonoras en las superficies del contorno,
cuando la fuente ha dejado de emitir.

Por tanto este efecto simula las reflexiones de un sonido, que ocurren en un
ambiente cerrado.

Para analizar este efecto debemos tener claro los parámetros que intervienen,
por ejemplo: el tiempo de reverberación, volumen, área del ambiente,
coeficientes de absorción de los materiales del recinto, etc que serán definidos a
continuación.

2.5.1 TIEMPO DE REVERBERACIÓN

Se define como tiempo de reverberación, al intervalo en ei que la intensidad de


un sonido se reduce a una millonésima de su valor inicial contado a partir del
instante en que la fuente deja de emitir. Esto es equivalente a considerar una
reducción de 60 dB en el nivel de presión sonora dentro del recinto.
En la figura 2.19, podemos ver un ejemplo.

J
Impulso
3000

=j
"o.
^
E
Tiempo de
reverberación

3 _ Illllilhl. *
1.2
Tiempo (seg)

Figura 2.19 Tiempo de reverberación


47

El tiempo de reverberación se mide en forma frecuencia!, esto es, un local no


tiene el mismo tiempo de reverberación en 200 Hz que en 4 KHz. Esto se debe a
que está determinado por el volumen de la sala y por los coeficientes de
absorción de sus superficies.

Para calcularlo se pueden usar expresiones que fueron planteadas por:

• Sabine
• Norris - Eyríng
• Millington
• Fitzroy
• Hopkins - Stryker

Sabine hallo la expresión:

0161*F
TR = - 1 ecuación 2.12
S*as

Donde 0.161 es una constante, V = volumen de la habitación en m3 y S = es la


superficie total interna del local m2, as = coeficiente de absorción promedio de
Sabine.

Expresión de Norris - Eyring:

016*7
TR = ecuación 2,13
-S*\TL(l-ane)

Donde 0.16 es una constante, V = volumen de la habitación en m3 y S = superficie


total interna del local en m2, ane - coeficiente de absorción promedio de Norris-
Eyring.
48

Expresión de Millington:

-0.16*K
TR = : ecuación 2.14

Donde - 0.16 es una constante, V = volumen de ia habitación en m3 y S =


superficies internas del local en m2, a= coeficiente de absorción de cada superficie
interna.

Expresión de Fitzroy:

_ . 2(xz) 2(yz) •- ~<c


TR = —^-¿— + —^-^^ + —^-^— ecuación 2.15
S2

Donde - 0.16 es una constante, V = volumen de la habitación en m3 y S -


superficie interna de! local en m2, x= altura del local en (m), y= ancho del local en
(m), z=longitud del local en (m), a= coeficiente de absorción promedio de las dos
superficies.

Expresión de Hopkins-Stryker:

016*7
TR = ecuación 2.16
R

A A
donde n = S*ar
R
l-ar

Donde 0.16 es una constante, V = volumen de la habitación en m3 y R =


constante del local, S=superficie interna dei local en m2, ar = coeficiente de
absorción promedio de Hopkins-Stryker.

Para saber cual de las ecuaciones utilizar se toma en cuenta ciertas


consideraciones por ejemplo:
49

Para tiempos de reverberación mayores que 1.6 segundos y cálculos exactos se


recomienda las ecuaciones de Norris - Eyring y Hopkins - Stryker.
Para cuando las superficies del local son lo suficientemente grande y los
coeficientes de absorción se conocen con exactitud, se usan la ecuaciones de
Millington y Fiztroy.
Para cuando se necesita hacer cálculos rápidos y sencillos la ecuación de Sabine.

Por ejemplo para calcular el tiempo de reverberación con la fórmula de Sabine se


procede de la siguiente manera:

Determinar de que material está recubiería cada superficie de la habitación y


obtener su coeficiente de absorción a , y multiplicarlo por el área S de dicha
superficie, lo que nos dará la absorción de la superficie.

Sea S1 la superficie del techo y su coeficiente de absorción cc1, S2 la del piso, S3


pared derecha, S4 pared izquierda, S5 pared frontal y S6 pared trasera,
entonces:

Ahora para calcular el coeficiente de absorción promedio se lo realiza de la


siguiente manera:

as = ~- ecuación 2. 1 7

donde

Si : son las superficies internas del local en m2


ai : son los coeficientes de absorción de ¡os materiales en cada una de las
frecuencias.

Para una habitación de 4 metros de ancho, 5 metros de largo y 3 metros de alto,


siendo medidos los coeficientes de absorción a una frecuencia de 128 Hz
tenemos un coeficiente de absorción a1 de 0.40 para la fibra de yeso, con S1= 20
50

m2 , <x2 de 0.30 para alfombra, con S2 =20m2 , a3 y a4 de 0.02 para enlucido


rugoso de cemento, con S3 15 m2 y S4= 15 m2 , a5 y a6 de 0.01 para enlucido
de yeso sobre la pared con S5- 12 m2 y S6 - 12 m2, se tiene :

Volumen = 4*5*3= 60 m3.


Área = ct1 S1 +a2S2 +a3S3 +a4S4 +a5S5 +a6S6
=0.40(20)+0.30(15)+0.02(15)*2+0.01(12)*2 = 13,34 m2.
TR= 0.161 (60/13.34)= 0.724 segundos

El tiempo de reverberación es un factor muy importante para el diseño de


construcciones donde la acústica juega un papel determinante, puesto que de
acuerdo al uso que se le vaya a dar al recinto, se tendrá un determinado valor, por

ejemplo si el tiempo de reverberación es muy prolongado, los sonidos anteriores
siguen oyéndose cuando aparecen los nuevos, provocando cacofonías que
perjudican la inteligibilidad1 de la palabra y la música. Además tiende a producirse
un aumento del nivel, de! ruido ambiente.

Si, en cambio, el tiempo de reverberación es muy corto, los sonidos suenan


débiles, sobre todo lejos de la fuente. Existiendo un tiempo óptimo para cada tipo
de aplicación, que aumenta con el volumen del ambiente.

La tabla 2.1 muestra aplicaciones de diferentes valores de tiempos de


reverberación.
Tiempo de reverberación (segundos) Aplicación
8.5 No para aplicaciones de voz.
5.5 Voz poco inteligible.
3.5 Bueno para la música.
1.5-2.5 Propósito general auditorios.
1 Bueno para aplicaciones de voz.
0.3 Sonido muerto
Tabla 2.1 Tiempos de reverberación

1 Inteligibilidad.- se define como el porcentaje de palabras comprendidas respecto a las emitidas.


51

Existen gráficas del tiempo de reverberación en función de la frecuencia llamadas


curvas tonales, siendo características únicas para cada local e indican la calidad
acústica del mismo.

Para poder construir una curva tonal es necesario medir el tiempo de


reverberación para cada octava o tercio de banda.

La tabla 2.2 muestra las frecuencias centrales de cada octava.

Frecuencia (central)
de cada octava (Hz)
32
64
128
256
512
1000
2000
4000
8000

Tabla 2.2 Frecuencias centrales para cada octava

2.5.2 VOLUMEN

Es el producto de las dimensiones de la habitación, siendo un factor determinante


a la hora de diseñar un recinto, ya que cuanto mayor sea el volumen del local,
mayores serán sus tiempos de reverberación, debido a que las ondas sonoras
deben recorrer caminos más largos y tardan más tiempo en llegar de un
paramento del local a otro y al reflejarse en estos tardarán mucho más en volver
al punto de partida
52

En la tabla 2.3 tenemos tiempos de reverberación en función del volumen de la


sala de conferencias.

Volumen m3 Tiempo de reverberación


(seg.)
100 0.65
200 0.7
500 0.77
1000 0.81
5000 0.94
10000 1.0
50000 1.13

Tabla 2.3 Tiempos de reverberación para salas.de conferencias.

En ia tabla 2.4 tenemos tiempos de reverberación en función del volumen del


teatro.
Volumen m3 Tiempo de reverberación
(seg.)
100 1.0
200 1.06
500 1.15
1000 1.21
5000 1.36
10000 1.41
50000 1.57

Tabla 2.4 Tiempos de reverberación para teatros.

En la tabla 2.5 tenemos tiempos de reverberación en función del volumen del


templo o iglesia.
Volumen m3 Tiempo de reverberación
(seg.)
100 1.12
200 1,14
500 1.18
1000 1.23
5000 1.32
10000 1.37
50000 1.45

Tabla 2.5 Tiempos de reverberación para templos.


53

Cabe indicar que ios valores de tiempos de reverberación de las tablas anteriores
son para una frecuencia de 512 (Hz).1

2.5.3 COEFICIENTES DE ABSORCIÓN

Cuando las ondas sonoras inciden sobre una superficie u objeto, su energía es
parcialmente reflejada y parcialmente absorbida. La cantidad de energía
absorbida depende del tipo de material, de su forma, del espesor y del método de
montaje, así como del ángulo de incidencia2 y de la frecuencia de la onda acústica
incidente. La eficiencia de la absorción del sonido de una superficie se define en
términos de un coeficiente de absorción a! que puede considerarse como el
cociente entre la energía absorbida y la energía incidente.

Esta definición puede parecer en principio muy simple y fácil de aplicar, sin
embargo, para un mismo material se pueden dar distintos tipos de coeficientes de
absorción, los cuales dependen de la frecuencia, de los medios a ambos iados de
la superficie (densidad y velocidad de propagación del medio) y del ángulo de
incidencia.

Los coeficientes de absorción acústica estadísticos varían desde


aproximadamente 0,01 para el mármol, hasta 0,99 para una superficie recubierta
con un material fuertemente absorbente. Nunca puede ser superior a 1, ya que de
lo contrario la superficie estaría absorbiendo más sonido del que recibe.

La tabla 2.6 muestra los coeficientes de absorción de distintos, materiales para


diferentes valores de frecuencia.

1 Tesis "Estudio, planificación y diseno de sonorización para locales cerrados" de Cobo Criollo Guillermo
páginas 111 a 113.

2 Ángulo de incidencia.- ángulo formado entre la superficie y la onda incidente.


54

Material coeficientes para Frecuencias ( Hz)


125 250 500 1000 2000 4000
Ladrillo rugoso 0.03 0.03 0.03 0.04 0.05 0.07
Alfombra sobre
0.02 0.06 0.14 0.37 0.60 0.65
hormigón
Bloque de hormigón 0.36 0.44 0.31 0.29 0.39 0.25
Hormigón o terrazo 0.01 0.01 0.01 0.02 0.02 0.02
Madera 0,15 0.11 0.10 0.07 0.06 0,07
Placa de cristal 0.18 0.06 0.04 0.03 0.02 0.02
Cristal de ventana 0.25 0.25 0.18 0.12 0.07 0.04
Placa de yeso 0.29 0.10 0,05 . 0.04 0.07 0.05
Aire ( sap/1 OOOp"3 ) 2.3 7.2
Yeso o cal pulidos 0.01 0.01 0.02 0.03 0.04 0.09

Tabla 2.6 Coeficientes de absorción para diferentes frecuencias

2.5.4 CARACTERÍSTICAS DE LA REVERBERACIÓN

En la reverberación se tiene tres características bien diferenciadas que son: un


sonido directo, reflexiones tempranas y reflexiones tardías.

La figura 2.20, muestra estos tres elementos característicos de la reverberación.

Figura 2.20 Elementos-característicos de la reverberación


55

Donde de la figura tenemos:


1 fuente de sonido
2 receptor
3 sonido directo (color lila)
4 reflexiones tempranas (color azul)
5 reflexiones tardías (color rojo)

El sonido directo es aquel que va de la fuente al destino sin ninguna reflexión.


El retorno rápido es aquel que va de la fuente al destino luego de una o varias
reflexiones.
Cola de reverberación es aquel que va de la fuente al destino luego de muchas
reflexiones, volviéndose muy difuso el sonido origina!.
Una representación de la respuesta impulsiva de cómo un sonido se propaga a
través de un recinto se muestra en la figura 2.21.

J
Impulso Sonido directo
^ /
o
JO * Primera reflexión
^
O
t/) ^ .4r.--
***

^^- Reflexiones tempranas



"O
c
-o Cola de reverberación
"(/>
0)
^^
£

lllllllliii.il fc
t
Figura 2,21 Respuesta impulsiva de un sonido dentro de un recinto

2.5.5 MODELO

La implementación de un modelo simple de reverberación, se la puede realizar


con la siguiente configuración, la cual se muestra en la figura 2.22.
56

Figura 2.22 Modelo utilizado para simular el efecto de reverberación.

Teniéndose la ecuación de diferencias igual a:

y(n)=x(n)+a1x(n-R1)+x(n-R2)-a2x(n-R3)-a1a2x(n-R1-R3)+a2y(n-R3)
ecuación 2.14

Y su función de transferencia;

w ,
H(z) = ecuación 2.15
1-02Z'

En el figura 2.22, se observa el primer bloque es el sonido directo, el segundo las


reflexiones tempranas y el tercero la cola de reverberación o sonido difuso.

2.5.6 REVERBERADOR DE SCHROEDER

Para simular la reverberación existen otros modelos como por ejemplo ei


Reverberador de Manfred Schroeder1, el cual está formado por cuatro filtros
combo en paralelo y dos filtros pasa todo en serie, como se indica en al figura
2.23.

1 Manfred Schroeder.- investigador de modelos digitales para la simulación de la reverberación.


57

x(n)
,- y(n)

a2

a3

a4

Figura 2.23 Reverberador de Schroeder

Por tanto debemos saber como trabajan dichos filtros, por lo que vamos a
describirlos a continuación

2.5.6.1 Filtros Combo

Un filtro combo, es aquel que tiene una respuesta de frecuencia en amplitud


semejante a un peine, ver figura 2.25, causando que algunas componentes de
frecuencia sean atenuadas y otras amplificadas.
Estos filtros esencialmente simulan múltiples reflexiones de ondas de sonido,
siendo su estructura I1R como se muestra en la figura 2.24.
58

A L
xl
x(n) y(n-R)
)—»•
*/ \lfn\^
7"

Figura 2.24 Filtro Combo

De donde obtenemos la ecuación de diferencias igual a:

y(n) = g\x(ri)+ g2y(n-R) ecuación 2.16

Y su función de transferencia:

H(¿) = l~g2Z~R ecuación 2.17

Figura 2.25 Respuesta de frecuencia del filtro combo.


59

donde la señal tiene su máximo valor igual a 1/ 1-g2 si g1=1 y su mínimo valor
igual a 1/1+g2 , alcanzando su primer máximo en 2n I R, segundo máximo en 4n /
R, el tercero en Bn I R, y así sucesivamente.

La figura 2.26 muestra la respuesta impulsiva de este filtro.

h(n)

1—

R 2R 3R 4R n

Figura 2.26 Respuesta impulsiva del filtro combo

Se observa que el primer impulso aparece en cero, con una amplitud igual a uno,
luego en R que es el valor del retardo, con amplitud igual al factor de ganancia g2
del lazo de realimentación de la figura 2.24, el segundo impulso se tiene en 2R
con una amplitud igual a g22, el tercero en 3R con amplitud g23- Es decir que es
dependiente del valor del retardo y la ganancia de lazo cerrado, con una
tendencia a una exponencial decreciente.

2.5.6.2 Filtros Pasa todo

Conocidos como filtros Al I Pass, es un filtro MR que presenta una respuesta de


frecuencia plana en amplitud, ver figura 2.28, es decir deja pasar todas las
frecuencias por igual, tiene una respuesta de fase variable, por lo que algunas
veces es llamado ecualizador de fase ver figura 2/29. La estructura de este filtro
se muestra en la figura 2.27.
60

Figura 2.27 Estructura de un filtro pasa todo

Teniendo una ecuación de diferencias igual a:

y(n) = x(n - R) - bx(n) + by(n - R) ecuación 2.18

Y su función de transferencia:

,~bZ -R ecuación 2.19

• i ~

1.8

1.6

1.4

1.2
T3

1 1
Q,
£
< 0.8

0.6

0.4

0.2

O
O 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Frecuencia Normalizada

Figura 2.28 Respuesta de frecuencia en amplitud del filtro pasa todo


61

O 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1


Frecuencia Normalizada

Figura 2.29 Respuesta de frecuencia en fase del filtro pasa todo

Los filtros combo, dan la sensación de profundidad y los pasa todos incrementan
la densidad de los ecos, reduciendo la coloración1 de la señal.

Las ecuaciones de diferencia de cada uno de los filtros, fueron tratadas


anteriormente, siendo únicamente necesario modificar los parámetros de
atenuación y retardo.

2.5.7 REVERBERADOR DE MOORER

Este modelo tiene como característica que añade una sección de filtros FIR2, para
simular las reflexiones tempranas, seguido de seis filtros combo y por último un
filtro pasa todo, ver la figura 2.30

1 Coloración.- es la modificación de las principales características de una señal


2 FIR.- Respuesta Impulsiva Finita
62

y(n)

a2
x(n)

a3

a4

a5

a6

Er

Figura 2.30 Reverberador de Moorer


63

El filtro FIR cumple la función de añadir un retardo, y sus varias salidas atenuadas
alimentan a los filtros combo donde se simulan las reflexiones y por último el filtro
pasa todo compensa en fase y añade cierta densidad de ecos.
Las ganancias y retardos se eligen de acuerdo ai ambiente a simular.

2.6 BIBLIOGRAFÍA

[1] KATSUHIKOOGATA
SISTEMAS DE CONTROL EN TIEMPO DISCRETO
Prentice Hall
Segunda Edición
1995

[2] OPPENHEIM, ALAN V ; ALAN S. WILSKY y S. HAMID NEWAB


SEÑALES Y SISTEMAS
Prentice Hall
Segunda edición
1997

[3] WAYNETOMASI
SISTEMAS DE COMUNICACIONES ELECTRÓNICAS
Prentice Hall
Primera Edición
1996

[4] JOHN G. PROAKIS, DIMITRIS G. MANOLAKIS


TRATAMIENTO DIGITAL DE SEÑALES
Prentíce Hall
Tercera edición
1998

[5] KLINGER, H.H


TÉCNICA DE LA ACÚSTICA
Marcombo
1978
64

[6] COBO CRIOLLO GUILLERMO


TESIS a ESTUDIO , PLANIFICACIÓN Y DISEÑO DE SONORIZACIÓN
PARA LOCALES CERRADOS"
E.P.N.
1999

[7] MALDONADO ALENCASTRO ROBERTO


7ES/S " DISEÑO DE ALGORITMOS DSP PARA EFECTOS DE
GUITARRA ELÉCTRICA UTILIZANDO ELADSP-2181"
E.P.N.
1998

Direcciones de internet

[8] http://www.harmony-central.com
[9] http:// www.acoustics-engineering.com
[10] http:// hyperphysics.phy-astr.gsu.edu/hbase/acoustic/revmod.html
[11] http://bkla.com/reverb.htm
[12] http://www.rbobadams.com
[13 ] http:// reverb.xfx.net/ whatsa.htm
[14] http://www.coxt.freeserve.co.uk/reverberation.html
[15 ] http:// www.orpheus-acoustics.com/reverb_calcs.htmi
[16 ] http://www.sbu.ac.uk/~acogrp/sabine.html
[17 ] http://www.sfu.ca/sca/Manuals/CLMs.htmi
65

CAPITULO 3
SIMULACIÓN DE LOS EFECTOS DE SONIDO

3.1 INTRODUCCIÓN

Para la simulación de los efectos de sonido, se utilizó el paquete computacional


Matlab, puesto que hoy en día, es la herramienta de aprendizaje y entrenamiento
de estudiantes de ingeniería en cualquier rama de especialización.

3.2 CARACTERÍSTICAS DE MATLAB

Matlab proviene de Matrix Laboratory, es un lenguaje de alto nivel, que integra


programación y visualización.

Entre las principales características que se destacan de este paquete son:

Lenguaje
Ambiente de trabajo
Sistema de gráficos
Librerías de funciones matemáticas
Librerías de comandos API

Lenguaje.- utiliza arreglos de matrices, con la facilidad de creación de funciones


específicas de acuerdo a la aplicación del programador, cuenta con instrucciones
para el control de flujo, estructuras de datos y programación orientada a objetos.

Ambiente de trabajo.- es el conjunto de herramientas y facilidades para trabajar


como usuario o programador de Matlab.
Incluye el manejo de variables para importar y exportar datos, facilidad para
desarrollo, manejo, y depuración de archivos M.
66

Librerías de funciones matemáticas.- es una basta colección de algoritmos


computacionales tales como suma, seno, coseno, transformadas de Fourier,
funciones de Bessel, etc, que están almacenados en carpetas, dependiendo de la
aplicación, por ejemplo: matrices, señales, control, funciones, demos, que son
ejecutados desde la pantalla de comandos

Librerías de comandos API .- Son librerías escritas en lenguaje C y Fortran que


interactúan con Matlab.

Además Matlab cuenta con una sección para simular sistemas dinámicos no
lineales llamado SIMULINK, donde se tienen bloques que son añadidos mediante
el mouse en un ambiente de trabajo, tales como fuentes, filtros, osciloscopios, etc.
También se tiene la opción de trabajar con sistemas en tiempo real, bajo rutinas
escritas en lenguaje C, haciendo a este paquete muy dinámico

Cuenta con una colección de toolbox los cuales son un conjunto de subrutinas
para aplicaciones específicas, como por ejemplo:

toolbox de comunicaciones
es una colección de funciones y bloques de simulación para investigar y
desarrollar modelos de sistemas para su respectivo análisis en el área de
comunicaciones, como modulación, canales, codificación, etc.

toolbox de procesamiento de señal


este incluye una basta colección de clásicos algoritmos de procesamiento digital,
incluyendo modelos de filtros, análisis espectral, modelos paramétricos, siendo
estas herramientas una parte esencial en aplicaciones como audio, video,
telecomunicaciones, medicina, geofísicos, etc.

toolbox de sistemas de control


es una colección de funciones para el análisis y diseño de sistemas de control,
provee clásicas herramientas como el diagrama de Bode, localización de raíces,
67

polos y ceros en sistemas dinámicos, gráficos de respuesta en el tiempo y


frecuencia, modelos discretos, etc.

Tiene ayudas tanto en formato HTML1 como en formato PDF2, para poder
solucionar cualquier problema durante ía realización de programas.
Matlab cuenta con instrucciones para crear Interfaces Gráficos3, los cuales se
implementan de acuerdo a la aplicación que se desee desarrollar.

Existen dos versiones del programa Matlab, la estudiantil y la profesional.


En ía versión estudiantil viene limitada, por ejemplo en la dimensión de las
matrices de trabajo, que no superen cierto número de filas o columnas, no
disponen de ciertos toolboxes, y funciones para determinados cálculos
matemáticos.

Por otro lado la versión profesional cuenta con un mayor número de subrutinas,
funciones, algoritmos siendo la más utilizada en los centros de estudio de
ingeniería o ciencias aplicadas.

3.2.1 INICIO DEL PROGRAMA MATLAB

AI iniciar Maílab, se abre una ventana de comandos (ver figura 3.1), en la cual se
despliega un mensaje de información y la dirección de internet del grupo
mathworks.com, que es la casa que distribuye dicho producto.

Una vez desplegada dicha pantalla podemos utilizar comandos como dir, cd que
cumplen las mismas funciones que en DOS es decir;

dir .- despliega en pantalla el contenido de un directorio o carpeta de trabajo.


cd .- sirve para cambiarse de directorio o carpeta.

1 HTML- HyperText Markup Language


2 PDF.- Portable Document Formal
3 Ver Anexo A
68

Cabe hacer una observación, que los comandos son ingresados con letras
minúsculas para su ejecución, caso contrario se despliega en pantalla un mensaje
de error.

-J MATLAB Command Window 1=05131


£ile |ídit View WJhdow Jd

D aM * s b a i - o I 0 tg bi ?

To get started, tjype one of tríese: helpwin, helpdesk, or tierno.


For product information, type tour or uisit w w w . m a t h w o r k s . c o m .

U
Readji <NUM

Figura 3.1 Pantalla de inicio del programa Matlab

El directorio de trabajo estándar es work, en caso de no ser así se debe ingresar


el comando pwd para obtener información del actual directorio de trabajo.

Dentro de Matlab existen varias extensiones de formatos de archivos como:

.m
.mat
.mdl

-fíg
-P

Donde los archivos de extensión .m almacenan los comandos para las diferentes
aplicaciones, los de extensión .mat contienen los resultados de todas tas
variables que intervienen en un archivo .m, los de extensión .mdl guardan los
modelos realizados en simulink, tos de extensión .fig aquellos que guardan la
69

información de gráficos y los de extensión .p aquellos archivos de seudocodigo un


paso antes de la transformación a lenguaje c.

Ahora hablaremos de como programar, para ello debemos crear los archivos .m o
también llamados M-Files, los cuales se escriben en un editor de texto que
incluye Matlab, pudiendo acceder a ellos de las siguientes maneras:

La primera del menú de inicio elegir el comando File, seleccionar New, y M-file,
la segunda es escribir el comando edit en la pantalla de comandos y la tercera es
seleccionar del menú principal el icono donde está una hoja en blanco como lo
indican las figura 3.2. y figura 3.3, respectivamente.

Al realizar los anteriores procedimientos se obtiene un editor de texto donde se


ingresarán los comandos para la programación, (ver figura 3.4.)

> MATLAB Command Windp EEUU


File. Edil; View Wíndow Help

Opea,. Figure
Model
RunScrípL.

Load Workspace...
Save Workspace As...
Show Workspace

Show Graphics Property Editor


Show GUI La.youtTool

Set Path...
Prefer enees...

Print Setup...
PrinL.
PiiníSeieotion...

ExitMATLAB Drh-Q

Figura 3.2 Pantalla para abrir un archivo m


70

File Edil view Window Help

» edit

Ready

Figura 3.3 Pantalla para ingreso del comando edit


MATLAB--;?.<*.&*Ht
Editor
[f\e .Edit View Debug Tools Window
Help J

D tí?

Untftledl

Ready ;Line1 x ->;

Figura 3.4 Pantalla del editor de archivos m

La programación depende de la aplicación que se desee implementar, con la


observación que en Matlab las variables de trabajo se almacenan como vectores.
En caso de necesitar ayuda de la estructura del comando se dígita la palabra help
y el nombre de la función, por ejemplo queremos saber cual es la estructura para
el comando filter, por tanto digitamos help filter y damos un enter, a continuación
se mostrará en pantalla la información del comando.
71

El siguiente ejemplo es la programación para obtener la matriz transpuesta de la


suma de dos matrices de dimensión 2x3.

Los pasos a seguir son los siguientes:

a) creamos las dos matrices

A=[1 2 3; 4 5 6]
B=[246; 8 10 12]

Las matrices se crean indicando la terminación de cada fila con un punto y


coma e ingresando ios números con un espacio entre ellos para las columnas.

b) creamos una variable donde se almacena la suma de las dos matrices


C=A+B

c) ahora almacenamos en otra variable el resultado de la transpuesta de la matriz


donde contiene la suma de las dos anteriores.
D=C'
d) guardamos el programa ingresando un nombre, ejemplo.m y nuestro
programa está terminado.
e) para ejecutarlo basta llamarlo desde la pantalla de comandos simplemente
ingresando ejemplo.

Las figuras 3.5 muestra la programación en el editor y la figura 3.6 la ejecución


del mismo y los resultados que se observa en la pantalla de comandos.
72

^^^^S^S^^sS3°E[
¡7] File £dit View Debug Tools Whdow. Help -jg^x]

D G£~H i .& ^^ i a 11 e*s"í ~~ \ Slack:

A=[l 2 3 ; 4 5 6 1
B-[2 4 6; 8 10 12 ]
C=A+B
D=C'

ejetnplojn - ...
Ready XineS ' 11:58 PM

Figura 3.5 Pantalla de edición del archivo ejemplo.m

J MATLAB Command Wmdow


File.-: :¿dit Víew Window híelp

ejemplo

fi =

B =

10 12

3 6 9
12 15 18

D =

12
15
18
_Ll
Ready

Figura 3.6 Pantalla de comandos con los resultados


73

Ahora para no desplegar los resultados de las operaciones en pantalla, se coloca


un punto y coma después de la sentencia, por ejemplo:

A=[1 2 3; 4 5 6];

3. 2.2 FUNCIONES UTILIZADAS DE MATLAB

Las funciones utilizadas de Matlab para la realización de este trabajo son las
siguientes;

Filter.- comando para filtrar una señal, su estructura es la siguiente;

Y= filter ( num, den, x)

Donde Y es la variable de almacenamiento de la señal filtrada, num es el


polinomio del numerador, den es el polinomio del denominador, x es la señal a
ser filtrada. Cabe indicarse que las variables de almacenamiento, así como el de
los polinomios pueden ser cualquier letra del alfabeto.

Sin.- Comando para generar una onda senoidal, su formato es el siguiente:

Y=sin(2*pi*f*t)

Donde Y es el vector de almacenamiento, p¡ es la constante de 3.1416, f es el


valor de la frecuencia y t es el vector de tiempo, para ello se debe definir eí vector
t, por ejemplo:
t = 0:2*p¡/100*: 2*p¡, el cual indica que t tendrá valores desde cero con
incrementos de (2*pi)/100 hasta 2*p¡.
74

Fft.- mediante este comando se'obtiene la transformada discreta de Fourier, su


estructura es:
y= fft(x)

este comando indica que se va almacenar en la variable y los valores de la


transformada discreta de Fourier (DFT) de un vector x, obteniéndose valores
complejos.

Wavread.- comando utilizado para abrir un archivo de sonido con formato wav
codificado con PCM, lo abre como un vector de N filas por una columna (Nx1) si
es monofónico, caso contrario si es estéreo será (Nx2),
Su formato es el siguiente;

[y fs nbits ] = wavread(fn)

Donde y es el vector donde se va a almacenar las muestras del archivo de


sonido, fs es la variable donde se almacenará el dato de la frecuencia de
muestreo del archivo seleccionado, nbits es la variable que almacenará el dato
del número de bits por muestra que utiliza el archivo de sonido, fn es el archivo de
sonido que se va a leer.

Specgram . comando que sirve para obtener el espectrograma1 de una señal. Su


formato es el siguiente:

Specgram(x,np)fm)

Donde x es el vector que contiene las muestras del archivo de sonido, np indica el
número de puntos para obtener el espectrograma siendo éste valor seteado en
256, fm indica la frecuencia de muestreo con la que se va obtener el
espectrograma.

1 Espectrograma.- es la gráfica de la frecuencia en función del tiempo.


75

3.3 ESTRUCTURA DEL PROGRAMA DE SIMULACIÓN

El programa de simulación está estructurado como se indica en la figura 3.7 .


Cada efecto esta desarrollado en subrutinas diferentes, así como los de las
gráficas del espectrograma y la densidad espectral de potencia.

Figura 3.7 Estructuración del programa de simulación


76

Como el programa principal se relaciona tanto con las subrutinas internas como
con las externas es necesario definir variables que serán globales, siendo las más
importantes las siguientes:

Definición de variables

x para almacenar las muestras del archivo de sonido original


fm para la frecuencia de muestreo
y para almacenar las muestras del archivo de sonido con efecto
fn para almacenar el nombre del archivo a ser tratado
Nm número de muestras del archivo
Mi muestra inicial del archivo
Mf muestra final del archivo

3.4 IMPLEMENTACIÓN DEL EFECTO ECO

Como se trató en el capítulo anterior el efecto eco se puede simular con la


ecuación 2.1, en la cual se distinguen cuatro variables;

y señal de salida.
x señal de entrada.
n muestra de la señal a ser tratada.
a factor de atenuación
R número de retardos expresado en muestras.

Primeramente debemos encontrar una relación entre milisegundos y número de


muestras, puesto que los retardos comúnmente se encuentran en estas unidades,
por ejemplo un archivo de 80400 muestras, con frecuencia de muestreo de 8000
Hz, y se quiere implementar un retardo de 20 ms ¿Cuántas muestras serán
equivalentes?
77

Sea:
Nm = Número de muestras
Fs = Frecuencia de muestreo
T = Tiempo
T= Nm/Fs
Entonces Nm = T* Fs
reemplazando tenemos Nm = 0.020*8000 = 16 muestras.

La subrutina empieza almacenando en la variable x, las muestras del archivo de


sonido original y en. fm el valor de la frecuencia de muestreo, mediante el
comando wavread.

[xfsl ]~ wavread(fn);

por tanto debemos definir y como una matriz de las mismas dimensiones que el
vector x para poder trabajar con operaciones matriciales.

y=zeros(size(x));

Ahora debemos definir el número de retardos que íe vayamos aplicar;


R-round(delay*fs1);

Por ejemplo sea delay=0.3, por tanto cabe indicar que este retardo tiene un rango
de valores posibles dependiendo de la frecuencia de muestreo del archivo original
por ejemplo la tabla 3.1 lo muestra:

R (muestras) Delay (Factor de retardo) Fs1 ( Hz)


2400 0.3 8000
3307.5 0.3 11025
6615 0.3 22050
13230 0.3 44100

Tabla 3.1 Valores de retardo posibles


78

Así mismo definimos el valor de la atenuación a con valores menores a uno y


mayores a cero los cuales afectarán a las amplitudes de las muestras,

Como e! número de muestras debe ser entero y positivo por tanto se le redondeó
al inmediato superior.

Mediante un lazo igual a la longitud del vector x, e iniciando en R+1 aplicamos el


retardo, para evitar tener un elemento nulo.

For¡= R+1:1:!ength(x);
y(i)=x(i)+a*x(i-R):
end

Teniendo en y los valores de las muestras con el efecto, se recomienda


incrementar silencios al archivo original, para evitar terminaciones bruscas de la
reproducción del sonido.

Si queremos implemeníar-el efecto en estéreo podemos hacerlo de la siguiente


manera:

y(¡,2)=x(i,1);

siendo esta instrucción insertada dentro del lazo.

La tabla 3.2 muestras los valores seleccionados para este efecto:

Eco Atenuación Retardo


Simple 0.3 0.3

Largo 0.3 0.9

Débil 0.1 0.3

Fuerte 0.7 0.3

Tabla 3.2 Valores del efecto eco


79

3.5 IMPLEMENTACION DEL EFECTO CORO

Mediante !a ecuación 2.6 empezamos la implementación de este efecto.


Primero definimos los retardos conociendo previamente el número de muestras
del archivo.

xlong=length(x);
luego definimos un vector y con la misma dimensión que el archivo a ser tratado
y-zeros(size(x));
de la misma manera para las dimensiones de los retardos variables
ret=zeros(size(x));
retí -zeros(size(x));
ahora vamos a tener los valores de los retardos que se van a aplicar:
D=round(delay1 *fm);
D1=round(delay2*fm);
D2=delay3*fm;
D3=round(delay4*fm);
D4=de!ay5*fm;

Se aplica el comando round para tener valores enteros pues estas variables van
dentro de arreglos matriciales.
Como debemos tener un. retardo variable lo haremos mediante la generación de
una señal senoidal o cosenoidal, por tanto debemos fijar los límites de inicio ,
incremento y fin , los mismos que son el retardo principal D y el número de
muestras xlong , por medio de un lazo for podemos hacer variar de muestra en
muestra y obtener el efecto coro.

for i-D:xlong
ret(i)=abs(i-D1-round(D2*cos(2*pi*3*(i/fm))));
y(i)= a1*x(')+a2Xret(¡)+1);
end
para obtener el efecto en estéreo debemos generar un segundo retardo variable y
aumentar una columna en el vector de salida y, por ejemplo:
80

ret1(i)=abs(i-D3-round(D4*cx)s(2*p¡*4*(¡/fm))));
y(¡,2)= arx(0+a2*x(ret1(¡)+1)i

La tabla 3.3 muestra los valores seleccionados para este efecto

Coro Atenuación Retardos


Número de Voces A1 A2 R1 R2 R3 R4 R5
Dos 1 0.6 0.03 0.025 0.004
Tres 1 0.6 0.03 0.025 0.004 0.045 0.004

Tabla 3.3 Valores del efecto coro

3.6 EMPLEMENTACION DEL EFECTO ROBOT

La ecuación 2.10 del capítulo anterior nos da un modelo de simulación de este


efecto, para io cual partimos definiendo un vector de la misma dimensión que el
vector x que es donde se almacena los datos del archivo de sonido original.

Y=zeros(size(x))

Luego definimos los valores del retardo R y atenuación a1 los cuales están
determinados por las constantes retrobot y atrobot respectivamente.
a1=atrobot;
delay^retrobot;

redondeamos ai inmediato superior el producto de la frecuencia de muestreo con


el retardo para evitar valores decimales.

R=round(delay*fm);
Rv= round(2.5xD)
81

Luego con un lazo implementamos los retardos a la señal original

for¡= Rv+1:1:xlong
y(¡)= x(i)+a1*y(round(i-R))¡
end

La razón del porqué empezamos definiendo el lazo siempre desde Rv+1 es


para evitar tener un elemento nulo.

La tabla 3.4 muestra los valpres seleccionados para este efecto :

Robot Atenuación Retardo


Robotl 0.75 0.02
Robot2 0.95 0.009
Robots 0.95 0.006

Tabla 3.4 Valores del efecto robot

3.7 EMPLEMENTACIÓN DEL EFECTO REVERBERACIÓN

Como se tiene se acostumbra en Matlab, primero definimos las dimensiones de


las matrices para trabajar, por tanto con la ecuación 2.14 empezamos la
implementación del mismo.
Definimos los retardos en este caso serían R1, R2 y R3 con los comandos
siguientes:

R1=delay*fm;
R2=2*R1;
R3=0.5*R1;

Las atenuaciones dependerán de los valores ingresados por teclado teniéndose


a1 y a2.
82

Mediante un lazo afectamos a cada una de las muestras del sonido original desde
R2+R3+1 hasta la longitud del archivo original así:
for¡= R2+R3+1:1:xlong
y(i-R2-R3)= a1*y(i-R)+ x(i)+x(i-R2)+a2*x(i-R2-R3);
end

Para la simulación de este efecto se tuvo algunas alternativas por ejemplo con
ecuaciones de diferencias y aplicando el comando filter.
La tabla 3.5 indica los valores que fueron definidos para este efecto.

Reverberación Atenuación Retardo


Tipo a1 a2 R R1 R2
Clara 0.2 0.2 0.04*fm 2*R 0.5*R
Difusa 0.5 0.5 0.2*fm 2*R 0.5*R

Tabla 3.5 Valores del efecto reverberación


3.7.1 IMPLEMENTACION DEL TIEMPO DE REVERBERACIÓN DE LOCALES
3.7.1.1 Teatro

Para la simulación de este efecto se procedió a utilizar las ecuaciones 2.17 y 2.19
que corresponden a las funciones de transferencia de los filtros combo y pasatodo
respectivamente, con la configuración del reverberador de Moorer el cual lo indica
la figura 2.30.

Se lo implemento mediante el comando filter debido a que su código fuente


optimiza el tiempo de ejecución con respecto a las ecuaciones de diferencias, por
tanto se procedió a encontrar los coeficientes de los polinomios de los
numeradores y denominadores de las funciones de transferencia para utilizarlas
en los filtros.

Como el reverberador de Moorer tiene seis filtros combo en paralelo y un filtro


pasatodo en cascada empezaremos por los primeros;
para el primer filtro combo
83

num'HO,zeros(1IR1-1),1];
den1=[1,zeros(1,R1-1),-a1];
d1=filter(num1,den1,x);

donde en la variable numl estamos formando un vector de una fila por N


columnas las cuales vienen determinadas por la longitud del retardo que es
llenado con ceros y el último término es multiplicado por uno, esto equivale a
colocar en ei numerador el número 1.

Ahora en el denominador empezamos definiendo el uno seguido de ceros, según


sea la longitud del retardo, y el último término multiplicado por la constante de
atenuación, pero con signo menos como se tiene en la función de transferencia
del filtro combo, (ver ecuación 2.17.)

para eí segundo filtro combo


num2=[0,zeros(1IR2-1),1];
den2=[1 ,zeros(1 , R2-1 ),-
d2=filter(num2,den21x);

para el tercer filtro combo


num3=[0,zeros(1,R3-1),1];
den3=[1lzeros(1,R3-1),-a3];

para el cuarto filtro combo


num4=[0Jzeros(1,R4~1),1];
den4=[1 ,zeros(1 , R4-1 ),~a4
d4=filter(num4Iden4,x);

para el quinto filtro combo

d5-filter(num5,den5,x);
84

para el sexto filtro combo


num6=[Olzeros(1,R6-1),1];
den6=[1 ,zeros(1 , R6-1 ),-
d6=fiiter(num6,den6,x);

luego sumamos las salidas de los seis filtros combo para que el resultado sea
filtrado por el primer filtro pasatodo y su salida sumada a las muestras originales
como a una línea de retardos.

Para la línea de retardos se procede a realizarla con un lazo .

for i=200:Iength(d)
yO(i)^0.5*d(i-100)+0.2*d(i-100)-f0.4*d(i-100)¡ % línea de retardos
end

dllR=d1+d2+d3+d4;
num5=[a5lzeros(1,R5-1),1];
den5=[1,zeros(1,R5-1)la5];
dALL1=filter(num5,den5,dllR);
dTOTAL=d+a7*dALL1 +a8*yO;

La tabla 3.6 y 3.7 muestran las atenuaciones y retardos utilizados para este
efecto respectivamente:

A1 A2 A3 A4 A5 A6 A7 A8 A9
0.5 0.3 0.2 0.1 0.4 0.7 0.2 0.7 0.8

Tabla 3.6 Valores de atenuaciones del efecto teatro

R1 R2 R3 R4 R5 R6 R7 R8
7 17 27 300 500 320 500 700

Tabla 3.7 Valores de retardos del efecto teatro


85

Con estos valores se obtiene un sonido semejante al que se tiene en un recinto


grande.

3.7.1.2 Iglesia

Este efecto parte del reverberador de Schroeder, et cual tiene 4 filtros combo en
paralelo y dos filtros pasatodo en cascada como lo indica la figura 2.23.

Por tanto una iglesia la cual es un local grande, tendrá cierto sonido si está vacía
y cuando esté llena se ia escuchará de diferente manera.

Las tablas 3.8 y 3.9 muestran las atenuaciones y retardos respectivamente,


utilizadas para este efecto :
A1 A2 A3 A4 A5 A6 A7
0.3 0.2 0.1 0.1 0.5 0.6 0.8

Tabla 3.8 Valores de atenuaciones de! efecto iglesia

R1 R2 R3 R4 R5 R6
20 40 10 500 2000 2000

Tabla 3.9 Valores de retardos del efecto iglesia


3.7.1.3 Sala

Se utilizó el mismo reverberador de Schroeder donde se varió los parámetros de


atenuación y retardo para la simulación de una sala pequeña.

Las tablas 3.10 y 3.11 muestran los valores de atenuaciones y retardos


respectivamente utilizados para este efecto:

A1 A2 A3 A4 A5 A6 A7
0.3 0.2 0.1 0.1 0.1 0.6 0.1

Tabla 3.10 Valores de atenuaciones del efecto sala


R1 R2 R3 R4 R5 R6
20 40 10 500 2000 2000

Tabla 3.11 Valores de retardos del efecto sala

3.8 SIMULACIÓN DE LOS EFECTOS

Ahora analizaremos los efectos antes descritos mediante la ¡nterfaz gráfica donde
podremos apreciar las características de cada uno de ellos.

Para nuestro análisis escogeremos un archivo de sonido llamado prueba1.wav.


Seleccionamos ei efecto eco simple, la figura 3.8 muestra el archivo original así
como el archivo con efecto respectivamente en función del tiempo.

Archivo original

0.5

-0.5

2 4
Archivo con efecto

2 4 6

Figura 3.8 Resultados efecto eco simple


87

Nótese las claras diferencias entre las dos gráficas, por ejemplo en la figura 3.9
observamos en el intervalo de tiempo de 4.5 seg a 6 seg, donde la señal con
efecto tiene más componentes de señal tanto en el inicio como en el final de la
misma, observándose el efecto eco, el cual tiene componentes de la señal original
retardada y atenuada como su definición básica lo dice.

Archivo original

-0.2

5.2 5.4 5.6 5,8 6 6.2


Archivo con efecto

5 5.2 5.4 5.6 5.8 6 6.2


Figura 3.9 Intervalo del efecto eco

Ahora aplicaremos la transformada de Fourier para el mismo efecto, la figura 3.10


lo detalla.

Observándose que existen un mayor número de componentes de frecuencia para


el rango de los 2000 a los 8000 Hz, donde su amplitud es mayor.
Sonido origino!
.<Ü 0-8
5
o
u_
-S 0.6
"35

f 0.4

2000 4000 6000 8000 10000 12000


Frecuencia (Hz)
Sonido con efecto
1.5

.2 0.5

-I-
2000 4000 6000 8000 10000 12000
Frecuencia (Hz)

Figura 3.10 Transformada de Fourier

Veamos ahora la figura 3.11 que corresponde al espectrograma


Sonido original

O
Tiempo
Sonido con efecto

Figura 3.11 Espectrograma de los archivos


89

Notamos que hay componentes de color rojo y amarillo en mayor cantidad que en
e! gráfico original, esto es debido a que se repiten ciertas componentes de la
señal después de cierto intervalo.

Ahora apliquemos el efecto eco largo, débil y fuerte y veamos sus gráficas en
función del tiempo en las figuras 3.12, 3.13 y 3,14 respectivamente .

Archivo original

5.4 5.6 5.8


Archivo con efecto

-0.4
5.2 5.4 5.6 5.8 6 6.2
Figura 3.12 Efecto eco largo

Aquí en estas dos gráficas observamos que al mantener la atenuación y variar el


retardo de 0.3 a 0.9 se tiene que aumentamos las amplitudes de las muestras a
partir del tiempo 5.4 hasta 6 segundos.

Ahora en la figura 3.13 vemos el efecto eco débil en el cual se disminuyó la


atenuación de 0.3 a 0.1 y el retardo de 0.9 a 0.3 teniéndose muestras a partir del
tiempo 5.4 con una amplitud que decrece hasta cero.
90

Archivo original

5.4 5.6 5.8


Archivo con efecto

-O
5 5.2 5.4 5.6 5.8 6 6.2

Figura 3.13 efecto eco débil

Y por último veamos la figura 3.14 en la cual se detalla el efecto eco fuerte, el cual
se lo obtiene aumentando la atenuación de 0.1 a 0.7 y manteniendo el retardo en
0.3.
Archivo original

5.4 5.6 5.8


Archivo con efecto

-0.5
5.2 5.4 5.6 5.8 ' - 6 6.2
Figura 3,14 Efecto eco fuerte
91

Se puede ver en las gráficas anteriores las diferencias entre los diferentes ecos
con tan solo modificar los valores de las atenuaciones y retardos.

Así mismo al aplicar la transformada de Fourier observaremos sus diferencias, ver


la figura 3.15.

Sonido con efecto


10

js 4

2000 4000 6000 8000 10000 12000


Frecuencia (Hz)

Sonido con efecto

0.6

0.4

0.2

2000 4000 6000 8000 10000 12000


Frecuencia (Hz)

Sonido con efecto


T

2000 4000 6000 8000 10000 12000


Frecuencia (Hz)

Figura 3.15 gráficas de la transformada de Fourier de los efecto eco

por tanto en las gráficas vemos que se tienen amplitudes mayores al aumentar las
atenuaciones y retardos.
92

Ahora apliquemos el efecto coro al archivo prueba1.wav y veamos los cambios


que se dan en este archivo.

Seleccionamos el efecto coro de dos voces. En la figura 3.16 vemos las gráficas
de los archivos original y con efecto,

Archivo original
1

0.5
T3

I- o
-0.5

-1
o 2 4 6

Archivo con efecto


1.5

0.5
_

I
-0.5

-1 t
O 2 4 . 6

Figura 3.16 Gráficas del efecto coro de dos voces

Podemos distinguir pequeños cambios, como el aumento de ios valores máximos,


por lo tanto para tener una mejor observación vamos a seleccionar un rango
pequeño de valores para la visualización de los cambios producidos.

El rango escogido está entre 2 y 3 segundos, por ser uno de los segmentos más
representativos, indicando sin embargo que cualquier otro rango puede ser apto
para el análisis.
93

La figura 3.17 muestra este rango de valores, donde en primera instancia vemos
que las muestras del archivo con efecto aparecen con amplitudes casi de la
misma amplitud que el archivo original, pero con un ligero retraso, notándose ello
en que aparecen unos instantes después.

Archivo original

2.4 2.6 2.8 3.2


Archivo con efecto

2 2.2 2.4 2.6 2.8 3 3.2

Figura 3.17 Rango de observación del efecto coro de dos voces

Ahora observaremos el respectivo gráfico del espectro de potencia y la


transformada de Fourler, como lo indican las figuras 3,18 y 3.19 respectivamente.
94

Sonido original

2000 4000 6000 8000 10000 12000


Frecuencia

Sonido con efecto

-10
-20
0_
-30
-40
,-50
-60
2000 4000 6000 8000 10000 12000
Frecuencia

Figura 3.18 Espectro de potencia

Sonido original

2000 4000 ., 6000 , 8000 10000 12000


Sonido con efecto

2000 4000 60ÜO 8000 10000 12000

Figura 3.19 Transformada de Fourier

Vemos que la magnitud sufre cambios de su valor mínimo aproximado a -100 dB


para pasar a un valor de -50 dB en el archivo con efecto,
95

En el gráfico de la transformada de Fourier (figura 3.19) aparecen picos de mayor


amplitud , continuos y en mayor número que en el original, pudiendo observarse
ello en el espectrograma de la figura 3.20, donde el color amarillo predomina
sobre los demás, existiendo una menor cantidad del color azul que representa a
las componentes de baja amplitud.

Sonido original
•vjl , ^* ' •; ' ¡f-* U

10000

8000

O
O 0.2 0.4 0.6 0.
Tiempo
Sonido con efecto
I__ , p ( ^__
í "L?
10000 ;•' ' r*

8000
.2 - ' ''
#•:
§ 6000
3
O
OJ -• *Q'' •^"'•- - •' •
4000 •
§""' Kí!.
Vf?.'
;' f
''V'1 'HiC^tWF^—
^ >
fctó£r-

2000 • :^|fes • .Í^K^ ]L


TTiir.-; • ¡ ^^MmUBP»^ - JHÍMJ
0.2 0.4 0.6 O.f
Tiempo

Figura 3.20 Espectrograma del efecto coro de dos voces

Ahora pasemos al efecto coro de tres voces y veamos los cambios que
experimenta el archivo original en función del tiempo. Las figuras 3.21 y 3.22, nos
muestran los cambios en la transformada de Fourier entre el efecto de dos y tres
voces.
96

Archivo original

2.4 2.6 2.8


Archivo con efecto

2 2.2 2.4 2.6 2.8 3 3.2


Figura 3.21 Efecto coro tres voces

Se observa e! aparecimiento de ciertas componentes con amplitudes, que varían


dependiendo de su posición en la ecuación de diferencia.
Dos voces

2000 4000 6000 8000 10000 12000

Tres voces

2000 4000 6000 8000 10000 12000

Figura 3.22 Gráficas de la transformada de Founer entre el efecto coro de dos y


tres voces
97

La amplitud pasa de 4 a 6 en el archivo con efecto, debido a que en la ecuación


de diferencias se aumenta un retardo variable, y en el espectrograma ( ver figura
3.23 ), se observa de la misma manera un predominio del color amarillo que
representa a las componentes de frecuencia con amplitudes entre O y -20 dB.

Comparándolo con el espectrograma del coro de dos voces se observa un


aumento del color azul en el rango de 0.6 a 0.8, la razón es la inclusión de un
segundo retardo variable.

Sonido original

0.4 0.6
Tiempo
Sonido con efecto

Figura 3.23 Espectrograma del efecto coro de tres voces


98

En la simulación del efecto robot tenemos tres opciones a partir de las cuales
veremos como se experimentan ios cambios al variar el retardo y la atenuación,
en primer lugar veamos el efecto robotl

Archivo original
1

0.5

-0.5

-1
2.2 2.4 2.6 2.8 3.2
Archivo con efecto

2 2.2 2.4 2.6 2.8 3 3.2

Figura 3.24 Efecto robotl

Se observa el aparecimiento de componentes en forma decreciente en los


tiempos en ios que en el archivo original no existen muestras. Esto es debido a
las características de! filtro combo.

En cambio en el espectrograma hay un predominio del color rojo que indica


componentes de frecuencia de mayor amplitud. La figura 3.25 nos muestra estas
variaciones.
99

Sonido original

-100

0.4 0.6
Tiempo
Sonido con efecto

-100

O 0.2 0.4 0.6 0.8


Tiempo

Figura 3.25 Espectrograma del efecto robotl

Ahora observando la transformada de Fourier se tiene un aumento de las


amplitudes en una relación considerable como lo muestra la figura 3.26.

Sonido original
1.5

,0.5
V
2000 4000 « ., 6000 8000 10000 12000
Sonido con efecto
15

10

^ 5

2000 4000 6000 8000 10000 12000

Figura 3.26 Transformada de Fourier del efecto robotl


100

Modificando la atenuación de 0.75 a 0.95 y el retardo de 0,02 a 0.009 observemos


los cambios.

Archivo original
1
0.5

'É. O
<
-0.5

-1
2.2 2.4 2.6 2.8 3.2
Archivo con efecto

2 2.2 2.4 2.6 2.8 3 3.2


Figura 3.27 Efecto robot2

Se nota claramente que cambiaron totalmente las amplitudes y su representación


en el dominio del tiempo. Ahora veamos el espectrograma ( ver figura 3.28 ), en el
cual se observa un predominio del color rojo ya que como la atenuación y el
retardo sufrieron cambios, hay una casi uniformidad de este color en todo el rango
de tiempo del archivo.

Veamos los cambios en la transformada de Fourier (figura 3.29), nótese un gran


aumento en las amplitudes de las muestras, que son más similares a las del
archivo original.
101

Sonido original

10000 - a í, v V "\,lK^r
< V/'.-M)
**"' 20
>s íaíító *- "-rV O
8000
-20
6000 -40
4000 -60

2000
-100
O
o 0.2 0.4 0.6 o.e
Tiempo
Sonido con efecto

10000 ¿

_CD
"u
c
CD
13
O
OJ

-100

0.2 0.4 0.6 O.f


Tiempo

Figura 3.28 Espectrograma del efecto robot2

Sonido original

2000 4000 „ .6000 , 8000 10000 12000


Sonido con efecto
40

20

2000 4000 6000 8000 10000 12000


Figura 3.29 Transformada de Fourier de! efecto robot2
102

Por último para el efecto robots, en el cual se modificó únicamente el retardo de


0.009 a 0.006, veamos la representación en función del tiempo.

Archivo original

2.2 2.4 2.6 2.8


Archivo con efecto

2.2 2.4 2.6 2.8 3 3.2

Figura 3.30 Efecto robots

Tenemos un decremento en las muestras desde 2.1 segundos aproximadamente


hasta 2,3 segundos, así como la presencia de nuevas muestras en los instantes
de tiempo siguientes.

En el espectrograma de la figura 3.31 se observa ya no la uniformidad del color


rojo sino por segmentos, así como los de color amarillo y en pequeñas
proporciones los de color azul.

En tanto que en la transformada de Fourier de la figura 3.32 tenemos un


aumento pequeño de la amplitud, como el aparecimiento de nuevas componentes
y la desaparición de otras.
103

Sonido original

O 0.2 0.4 0.6 O.Í


Tiempo
Sonido con efecto

10000
8000
6000
4000
2000
O
O 0.2 0.4 0.6 0.8
Tiempo

Figura 3.31 Espectrograma del efecto robots

Sonido original
1.5

=5 -1
n l

,0.5

wu 12000

2000 4000 6000 8000 10000 12QOQ

Figura 3.32 Transformada de Fourier del efecto robots


104

Así para la simulación del efecto reverberación se definió dos tipos, una
.reverberación clara y una difusa. Empecemos con la primera, la figura 3.33 nos
muestra este efecto para un rango entre 4 y 6 segundos del archivo prueba1.wav.

Archivo original

"c
£

4.5 5 5.5
Archivo con efecto

4 4.5 5 5.5 6

Figura 3.33 Efecto reverberación clara

Existe un mayor número de muestras cuya envolvente tiene la forma de una


exponencial decreciente, como lo observamos en el rango de 4.3 a 4.5 segundos
aproximadamente.

Ahora al ver el espectrograma, ver figura 3.34, constatamos que hay un aumento
del color rojo y amarillo que representan a componentes de frecuencia de
amplitudes entre 20 y -20 dB de acuerdo como lo indica la escala.
105

Sonido original [dB]

ioooo • v' ^^'T^^-ní^^


' • ** * /*« j-Hü
8000 • ti
03 • -20
g 6000 • * ' ! S
i
> •
• --40
• --60
1 4000 '
L
¿
H
* ¿vt #
; --80
2000 P 1

ni 1
tl^S A¿'
0 0.5 1 1.5
Tiempo
Sonido con efecto

10000 -
; ' , '• % '' 1 t t- * •T
8000 •
.2 •"--20
»
1 600D h - .--40
O jinf fe
* ^ (T*?"*! *í
i? 4000 fe :
fc
•'. --60

i, $^
2000 ¡r f
*iS|T^ ;;;^j
|. .Jw-|
-80

nlMÉ IteSu... ra&p^»^ÍHiíiii ., 1 ^


0 0.5 1 1.5
Tiempo

Figura 3.34 Espectrograma del efecto reverberación clara

Veamos por último la transformada de Fourieren la figura 3.35.


Sonido original
Al-l
4U ¡ i i i i

1
u
i 1
M
1

* 20-j -

1 H
-7-1 1 f 1

^ 0 ' ^\ a^^c j- _,-_ i i i


0 2000 4000 o .6000, 8000 10000 12C
Sonido con efecto
in
4U i i i i i
O)

t 20 -I -
i
í A/ VA i i^—t* ti. j ^
J^ AAv/'^>-\
2000 4000 6000 8000 10000 12000

Figura 3.35 Transformada del efecto reverberación clara


106

En la cual vemos que casi no hay cambios excepto unos picos alrededor de 2000
y 4000 Hz como lo indican las figuras.

Al aplicar el efecto de reverberación difusa veamos los cambios producidos en el


archivo original como lo indica la figura 3.36.

Archivo original

4.5 5 5.5
Archivo con efecto

4 4.5 5 5.5 6

Figura 3.36 Efecto reverberación difusa

Hay un cambio total en la forma de onda, debido a! aparecimiento de una mayor


cantidad de muestras, en casi todo el rango de análisis lo que ocasiona que se
escuche muchos ecos, como una señal bastante reaümentada.

Veamos lo que se tiene en el espectrograma al aplicar este efecto, la figura 3.37


nos muestra dichos cambios, como el aparecimiento de amplitudes alrededor de
mil con ei color amarilio uniformemente distribuido, así como de color rojo en la
amplitud correspondiente a valores de O a 2000 Hz.
107

Sonido original

0.5 1
Tiempo
Sonido con efecto

10000

Figura 3.37 Espectrograma del efecto reverberación difusa

En cambio en la transformada de Fourier ( ver figura 3.38) vemos que en la mayor


parte del rango en análisis hay un aumento en la amplitud y el aparecimiento de
picos, como ocurre en el segmento de O a 2000 Hz, así como una uniformidad
desde 6000 Hz hasta el final con amplitudes que tienden a cero.
108

Sonido original
40

20

_J *£

2000 4000 0 .,6000, 8000 10000 12000


Sonido con efecto
60

40

O
O 2000 4000 6000 8000 10000 12000

Figura 3.38 Transformada de Fourier del efecto reverberación difusa

Una vez que hemos visto esta sección de efectos , sabemos como afectan las
ecuaciones de diferencias, al variar parámetros como la amplitud y la atenuación,

Ahora vamos a observar los cambios que se producen en el archivo original al


aplicar los filtro combo y pasatodo que forman los reverberadores de Moorer y
Schroeder para la simulación del efecto teatro, iglesia y sala.

Empecemos con el efecto Teatro. La figura 3.39 nos muestra el cambio que sufre
el archivo en función del tiempo.

Vemos que las muestras aumentan en su mayoría la amplitud, y la tendencia de


la envolvente a una exponencial decreciente. Cabe recordar que estamos
analizando en el rango de 2 a 4 segundos del archivo original solo con el fin de
poder observar los cambios que éste experimenta, pudiendo ser cualquier el
rango de análisis.

Ahora en el espectrograma a partir de la figura 3.40 vemos que hay un


aparecimiento de componentes que tienen la misma amplitud, que se representa
con color rojo y componentes de color amarillo, con una reducción de
componentes de baja amplitud representado con el color azú!.
109

Archivo original

4.5 5 5.5
Archivo con efecto

<

4 4.5 5 5.5

Figura 3.39 Efecto teatro


Sonido original

0.5 1
Tiempo
Sonido con efecto [dB]

10000 20
O
3000
-20
6000 -40
4000 -60
-80
2000
-100
O
O 0.5 1 1.5
Tiempo

Figura 3.40 Espectrograma del efecto teatro


110

Al obtener la transformada de Fourier como lo muestra la figura 3.41, observamos


que hay un cambio de amplitud en un nivel considerable , así como la reducción
de ciertos picos como se aprecia en el segmento de O a 2000 Hz.

Sonido original
40

20

2000 4000 0 ., 6000 f 8000 10000 12000


Sonido con efecto
100

50

O
O 2000 4000 6000 8000 10000 12000

Figura 3.41 Transformada de Fourier del efecto teatro

Veamos los cambios al aplicar el efecto iglesia, la figura 3.42 nos muestra como
afectan la configuración de los filtros combo y pasatodo.

Podemos apreciar que hay una distorsión total de la onda original, con muestras
nuevas en donde no las había en el archivo original.

Ello se debe a que fueron implementadas con la configuración del reverberador


de Schroeder, el cual tiene 4 filtros combo en paralelo y dos filtros pasatodo en
cascada como lo indica la figura 2,23.

Por tanto tienen secciones que incrementan ecos como aquellas que regulan la
variación de fase.
111

Archivo original

4.5 5 5.5 6

Figura 3.42 Efecto iglesia

Veamos las gráficas para e! espectrograma y la transformada de Fourier las


cuales son mostradas por las figuras 3.43 y 3.44 respectivamente.

En el espectrograma del archivo con efecto, las componentes de color rojo tienen
un mayor predominio sobre las de color amarillo, en la parte que corresponde al
rango de frecuencias de O a 5000 Hz, con una ausencia casi total del color azul
que representa a las componentes de baja amplitud. Ello es debido a la presencia
de los filtros combo los cuales atenúan o incrementan ciertas componentes de la
señal. Notándose ei mismo efecto en la transformada de Fourier para las
componentes que están entre O y 6000 Hz.
112

Sonido original

10000

8000

6000

4000 1». *

«>^
2000

O
o 0.5 1 1.5
Tiempo
Sonido con efecto

10000 •

O)
3
u

-100

0.5 1
Tiempo

Figura 3.43 Espectrograma del efecto iglesia

Sonido original
40

20

*/-y\_._t J.^

2000 4000 6000 8GOO 10000 12000


Sonido con efecto
40

20

2000 4000 6000 \0 . 10000 12000

Figura 3.44 Transformada de Founer del efecto iglesia


113

Por último veamos lo que sucede al aplicar el efecto de simular una sala, la figura
3.45, 3.46 y 3.47 muestran la respuesta en función del tiempo, espectrograma y
transformada de Fourier respectivamente.

Archivo original

5 5.5
Archivo con efecto

4.5 5 5.5

Figura 3.45 Efecto sala

Vemos que los cambios son unas pocas muestras que son aumentadas en
amplitud, observándose que en el espectrograma el color amarillo es el que se ha
esparcido representando componentes de amplitud entre el rango de 20 a 30 dB
aproximadamente.

En tanto que en la transformada casi no hay diferencias, de no ser por unas pocas
componentes en ei rango entre 6000 y 8000 Hz.
114

Sonido original [dB]

10000 • ''! '* V'^^''*-?^1^)^, ff vV


•20
5 ' *
i
v • ' i • * l ir
,, i '
u(
Wo
8000 " *• t
ce t t t ^ --20
'a i
g 6000 j f ,.
• --40
=3 " á# ^ '
^ ft* >"' # fi
| 4000 U
* fr
•*
l í»,
i St JÉt
4* ' "- 60
*«l aff**" ^ 1 j en
2000 u
fó * ^1 ÍS-
; ri.
-ti tfi±ii
U'80
Pí 1 j . -:^m : w^
aL - EEgtjf IÍ& • -100

0 0.5 1 1.5 •
Tiempo
Sonido con efecto [dB]

10000
T,
1.
-a í-
I i1
í
' . , v^
f
^
"i r>!l í
!.r *J
-^
"* s
"*", - «.,
' *"tf
f ^ i * ,&-
•20-
' .
lio
8000 1
1
.2 t ' t [ -20
"o
g 6000 * * i • --40
13 '• fií »

i S*1 f -te ^ • --60


| 4000 f I * r *í

í^» "llé^ • --80


2000
^ i .-_ <fcí^B.
¿b*L WJ»-*-
a&»¿.k
Q iiiáiBii3B&>H«PSi^MffftSMiiiBfefetfh» . « H
0 0.5 1 1.5
Tiempo

Figura 3.46 Espectrograma del efecto sala


Sonido origina!
40

20 -

40
i .....
] 2000

i
4000

i
rt .,6000 f
Sonido con efecto
i
8000

i
10000

i
12C

20 -.

4 W—^-,. n. .i

2000
•—.<•—A- — - •^/'V ^ .

4000
-J. -—

6000
I

8000
I 1

10000 12000

Figura 3.47 Transformada de Founer del efecto sala


115

3.9 BIBLIOGRAFÍA

[I] MATLAB THE LENGUAJE OF TECHNICAL COMPUTING


MANUAL DE PROGRAMACIÓN DE MATLAB
THE MATH WORKS
1998

[2] ETTER DELORES M.


SOLUCIÓN DE PROBLEMAS DE INGENIERÍA CON MATLAB
Prentice Hall
Segunda edición
1998

[3] NAKAMURA SHOICHIRO.


ANÁLISIS NUMÉRICO Y VISUALIZACIÓN GRÁFICA CON MATLAB
Prentice Hall
1997

Direcciones de internet

[4] http://www.mathworks.com.
[5] http://www.chipcenter.com/dsp/DSP000202F1.html
[6] http://www.ceanet.com.au/training/matlab/introsp.asp
[7] http://www.dcs.shef.ac.uk/-martin/WebCourseNotes/COM325
/Iabciasses/lab2. htm
[8] http://www.engin.umich.edu/group/ctm/
[9] http://www.math.utah.edu/lab/ms/matlab/mattab.html
[10] http://spicerack.sr.unh.edu/~rnathadm/tutorial/software/matlab/
[II] http://eng.usna.navy.mil/-mecheng/DESIGN/CAD/MATLAB/usna.html
[12] http://www.math.ufl.edu/help/matlab-tutoriai/
[13] http://www.me.pdx.edu/-gerry/MATLAB/
[14] http://www-personal.eng¡n.umich.eduMilbury/tutorials/matlab_tutorial.html
116

CAPITULO 4
RESULTADOS

4.1 INTRODUCCIÓN

Una vez realizadas las simulaciones de todos ios efectos, se procedió a realizar
una encuesta a varias personas independientemente.
El objetivo de ello es saber que tanto se acercan los efectos y si son claros e
inteligibles sus reproducciones.
Se diseñó un patrón de preguntas en cuadros para que cada individuo llene con
sus apreciaciones los resultados de la simulación de cada efecto.

4.2 PRESENTACIÓN DE RESULTADOS

Se cuenta con un cuadro para realizar la evaluación de la simulación de los


efectos, éste tiene seis casilleros como lo indica la tabla 4.1.
Donde:
C = Claro NC = No tan claro I = Impreciso
IN = Inteligible MI = Medianamente inteligible NI = No inteligible

SIMULACIÓN PALABRAS
EFECTO
C NC I IN MI Ni
ECO SIMPLE
ECO LARGO
ECO DÉBIL
ECO FUERTE
COR01
CORO 2
ROBOT 1
ROBOT 2
ROBOTS
REVERBERACIÓN CLARA
REVERBERACIÓN DIFUSA
TEATRO
IGLESIA
SALA

Tabla 4,1 Formato de la encuesta


Los datos fueron recabados en el laboratorio de informática del sexto piso, con la
colaboración de varias personas a las que se les solicitó que evalúen el programa
de simulación.

De un total de diez personas encuestadas los resultados de la evaluación fueron


los siguientes como lo muestran las gráficas a continuación:

Efecto Eco

-1°

b
10 -
8 -
6 -
4 -
2 -
n. fll
f !
rVln
D ECO SIMPLE
• ECO LARGO
D ECO DÉBIL
C NC I IN MI NI D ECO FUERTE

Slf ^lULAC ION P ALABRAS

Figura 4.1 Resultados del efecto eco

Efectos Coro y Robot

•10

i
10- GCORO 1
8 -
6 - • CORO 2
4 -
2- D ROBOT 1
n ]*]_ 1 1 FU-TW
G ROBOT 2
/-i
NC I IN MI NI
• ROBOTS
SIN1UUC ON PALABR/\

Figura 4.2 Resultados de los efectos coro y robot


118

Efectos de Reverberación B REVERBERACIÓN


CLARA
4o
• REVERBERACIÓN
10 - DIFUSA
8 -
6 - í¥íl
1IdíTL
D TEATRO
4-
2 -
n- - II, D IGLESIA
C NC 1 IN MI NI

SIMULACIC)N PALABRA S • SALA

Figura 4.3 Resultados de los efectos de reverberación

De los resultados se puede observar que las variaciones del efecto eco son: eco
simple, largo , débil y fuerte tuvieron una muy buena reproducción , los mismos
resultados se obtuvieron con el efecto robot, en cambio en los efectos- de
reverberación y coro, los encuestados no tenían un conocimiento muy claro de los
conceptos que dichos efectos traían de simular. Por lo que se nota que en dichas
simulaciones los resultados no fueron muy claros para algunos de los
entrevistados.

Cabe indicar que ios archivos de sonido en los que fueron aplicados los efectos,
fueron obtenidos de internet, otros realizados con el grabador de Windows, por lo
que algunos tienen un bajo volumen en su reproducción, afectando de alguna
manera a los resultados.

También se notó como varía la percepción auditiva de una persona a otra, ya que
algunos podían distinguir mejor las características del sonido que otros.

Por lo que para poder obtener mejores resultados, lo recomendable sería


conectar a la salida de la tarjeta de sonido unos buenos parlantes, o un buen
equipo de sonido, ya que contando con un ecuaüzador, sería posible resaltar las
características específicas de los efectos deseados.
119

4.3 TIEMPO DE PROCESO

Con el fin de tener una referencia de los tiempos de proceso para cada efecto, se
procedió a realizar ias mediciones en dos tipos de procesadores (Intel Pentium III
, AMD ATHLON).

Las siguientes gráficas presentan el tiempo de ejecución de los diferentes efectos


de voz, ejecutados en dos máquinas con procesadores de 750MHz y 866MHz con
128 Mb en memoria RAM1 .

La tabla 4.2 muestra los tiempos de proceso de la simulación de cada efecto.

Procesador AMD ATHLON 750 MHz Intel 866 MHz


EFECTO TIEMPO (segundos) TIEMPO (segundos)
ECO SIMPLE 3 4
ECO LARGO 3 4
ECO DÉBIL 3 4
ECO FUERTE 3 4
CORO1 6 7
CORO 2 6 7
ROBOT1 5 6
ROBOT2 5 6
ROBOT3 5 6
REVERBERACIÓN H
7
TEATRO 12 12
IGLESIA 15 17
SALA 13 15

Tabla 4.2 Datos de los tiempos de proceso de los efectos

Estos tiempos fueron tomados al aplicar los efectos en un archivo de audio


monofónico de 148403 muestras, 16 bits por muestra y frecuencia de muestreo de
22050 . ( archivo llamado pruebal ).

1 RAM.- Random Access Memory


120

La figura 4.4 muestra los datos de la tabla 4.1 en barras para tener una mejor
visualización.

Ttenpcscteprooeso

segjxbs

inpfe ecolago eoocfeti ecofuate cero ro-ufa. rdxtl rdb±2 n±ct3 team ic^esa sda

Figura 4.4 Datos de ios tiempos de proceso de ios efectos

Procesador AMD ATHLON 750 MHz I


Procesador PENTIUM III INTEL 866 MHz I

Por lo tanto, entre mejores características tenga el computador, mejor serán los
resultados del tiempo de proceso de la simulación de los efectos.
121

CAPITULO 5
CONCLUSIONES Y RECOMENDACIONES

5.1 CONCLUSIONES

• Las ecuaciones de diferencias resultan útiles para la simulación de efectos


de voz sencillos tales como el eco, robot, coro y otros, debido a que no
utilizan modelos complicados de procesamiento.

• Según sea e! modelo de reverberador a simular, el número de filtros combo


y pasatodo necesarios, afectan considerablemente en eí procesamiento
total de la señal, haciendo necesario el empleo de otros métodos para
lograr disminuir dichos tiempos.

• Los parámetros básicos de variación de un efecto de voz en general son la


atenuación y el retardo, ya que los datos discretos de la señal se
encuentran almacenados en registros de memoria.

• Para la simulación de los efectos de reverberación se tiene que el tiempo


de proceso es muy alto, por lo que las ecuaciones de diferencias no son el
método adecuado, sino más bien la utilización de otras técnicas como la
generación de patrones de respuesta de frecuencia de locales.

• Con la ayuda de gráficas específicas como el espectrograma se tiene una


mejor visualización de los efectos que causan los diferentes modelos de
efectos de voz

• Los efectos eco y robot tienen una mejor posibilidad de variación, ya que
sus ecuaciones de diferencias respectivas no son muy complicadas.
122

La variación de la frecuencia de muestreo en el efecto robot, aumenta el


sonido metálico característico del mismo, por lo que valores menores a la
unidad, al ser multiplicados por la frecuencia de muestreo resaltan ésta
característica.

La reverberación es un fenómeno que presenta especiales dificultades


para su simulación, ya que en ella entran en juego un gran número de
variables.

El manejo adecuado de los conceptos básicos de funciones de


transferencia, hace posible ia obtención de simples modelos discretos, con
los cuales poder realizar efectos de voz elementales, con ia variación de
pocos parámetros.

Se comprobó que en todos lo efectos simulados, no se podían obtener los


mismos resultados, pues intervienen varios factores como, por ejemplo, el
constante procesamiento de ia señal en los archivos de sonido degradan
las características de audio, el que no todas las personas tenemos las
mismas propiedades auditivas y el que no se cuenta con el equipo
necesario para una buena reproducción sonora .

La simulación de efectos de voz hoy en día, es una rama del


procesamiento de señales muy utilizada para la elaboración de cuñas
comerciales tanto radiales como televisivas, por lo que con un
conocimiento de los principales parámetros de !a voz y un poco de ingenio
se lograrían buenos resultados.

Matlab sin lugar a dudas se ha convertido en una gran herramienta para


centros de educación superior, debido a su alta programación y
matemática avanzada.
123

5.2 RECOMENDACIONES

• Para tener una adecuada simulación los archivos de sonido deben ser
monofónicos, su frecuencia de muestreo de 8000 KHz y no superiores a los
10 segundos de grabación para evitar que ef tiempo de proceso sea
demasiado grande.

• Procurar insertar silencios tanto al inicio como al final del archivo en


análisis para evitar cortes o terminaciones bruscas.

• Escoger tiempos de análisis pequeños para poder distinguir los cambios en


las respectivas gráficas.

• Procurar en lo posible conectar a la salida de la tarjeta de sonido un equipo


de sonido para contar con la posibilidad de tener un mejor sonido y así
apreciar de mejor manera los efectos producidos.

• Para hacer una mejora del efecto robot, se recomienda disminuir la


velocidad , ya que con ello se resalta el sonido metálico característico del
mismo.

• El programa debería ser instalado en un computador pentium II, 64 Mb en


memoria RAM, como características mínimas , para evitar tiempos de
proceso demasiado largos.

• Si los archivos para análisis son grabados personalmente, se recomienda


utilizar el grabador de sonidos propio del sistema operativo Windows, sin
saturar el micrófono y seleccionando monofónico, 16 bits y 8KHz de
frecuencia de muestreo.

• Realizar la transformación de los archivos de extensión .m a (os de


extensión .p para reducir en algo el tiempo de proceso.
124

Para aprovechar en mejor forma las técnicas computacionales existentes


sería recomendable realizar este mismo trabajo pero en tiempo real, ya que
Matlab cuenta con dichas herramientas,

Sería recomendable igualmente utilizar el paquete Matlab para la


realización de varios programas de procesamiento de señales de audio
como por ejemplo uno que trate sobre las formantes de voz,
reconocimiento de patrones de voz, etc.
125

ANEXO A

CREACIÓN DE INTERFACES GRÁFICAS

Matlab dispone de comandos para crear ambientes gráficos o también llamados


interfaces, donde pueden existir gráficos, menús, texto, botones, sección de
ingreso de datos, etc.

Hay dos maneras de realizarlos:


a.- Mediante la guía de Matiab
b.~ Mediante comandos para programar

Mediante la guía de matlab, se ingresa por el menú principal en la opción file y


se selecciona Show GUI Layout Tool, como se indica en la figura A.1
t MATLAB Cornmand Window
! Be £dít' View Window Help
New
Open...

Fíun ScripL.

Load Workspace...
Save Workspace As...
.Show Workspace
_Ll
Show Graphics Property Editor INÜM"
Show GUIJ_ayouu ool

SetPath...
Preferences...

PrsilSehJp.,.
Prínt...
Print Selection .

Exit MATLAB Qrl-t-Q

Figura A.1

Luego aparece una pantalla ver figura A.2, donde se tiene los botones de los
comandos de Property Editor (propiedades de editor), Caliback Editor ( editor de
126

subrutinas), Alignment Tool (herramientas para alineación de bloques), Menú


Editor (editor de menús), Refresh ( actualización ) y Add Figure (Añadir figura).

-/ Guide Contio! Panel


Fue Oplions Tools Help

Rgure List

Active # 1 6 . 0 0 0 5 : MÁTLAB Help TJi.

Refresh List Add Figure

NewOb¡ectPaletle

Figura A.2 Panel para el diseño de ¡nterfaces

Luego se da un click en el botón Add Figure, para añadir una figura, y se


habilitarán los botones de los objetos que se encuentran en la sección baja de la
figura A.2, desde donde se pondrá cada objeto que se desee implementar en la
nueva figura siendo las siguientes opciones con las que se cuenta. La figura A.3
muestra dichas opciones.

9 h ¡
Figura A.3 Opciones para añadir objetos
127

a) botón de pulsamiento
b) área de edición
c) área de popup
d) radio botón
e) trame
f) gráfico
g) texto
h) lista
i) caja de selección
j) slider

Botón de pulsamiento .- este botón sirve para llamar a cualquier función interna
o externa.
Área de edición.- sirve para el ingreso de datos, los cuales podrán ir a fórmulas o
ejecutar ciertas funciones internas o externas.
Área de popup .- sirve para crear menús de opciones las cuales son
desplegadas cuando se realiza un click sobre ellas.
Radio botón.- sirve para realizar una selección de opciones, teniendo que dar un
click para ejecutar cualquier acción a este asignada. Teniendo como valor por
defecto cero cuando no esta seleccionado y uno cuando lo es.
Frame.- determina una sección en la pantalla la cual sirve para contener a una o
más herramientas de la interfaz.
Gráfico.- sirve para añadir ejes ai área de diseño de la nueva figura.
Texto.- sirve para añadir segmentos en los cuales van insertados texto.
Lista.- sirve para seleccionar de una determinada colección de opciones.
Check.- sirve para seleccionar con un visto bueno, cuando tenemos diferentes
opciones. Slider.- es una barra de desplazamiento útil cuando se tiene que
incrementar o disminuir el valor de ciertas variables, como por ejemplo la
variación del volumen de un archivo de sonido.

Para la explicación creemos una pantalla que cuente con una sección de ingreso
de datos, texto, y pulsadores, la figura A.4 muestra su contenido.
128

V Figure No. 1 -In| x|


File Edít Options Tools Help

Figura A.4 Pantalla de la nueva figura

Ahora debemos dar las indicaciones a cada opción para que cumpla con su tarea
específica, por ejemplo que en el texto tengamos el título Operaciones básicas en
los pulsadores las operaciones de suma , resta y salida de la pantalla, en la región
de edit para poder ingresar los valores de los dos números, los resultados sean
presentados en el interior del frame en una sección de texto.

Para ello debemos abrir la sección de edición de rutinas llamada Graphics


property editor , con dar doble click en cada Ítem o accediendo directamente al
editor al dar doble click en el icono del mismo. Aquí nosotros especificamos por
ejemplo valores como variables, llamado a subrutinas, etc.

Iniciemos con el ítem del texto para colocar el título, por tanto buscamos en ia
pantalla abierta del editor la opción string y colocamos el siguiente título
Operaciones básicas. La figura A.5 muestra el lugar donde ingresar el título .
129

File Options Tools Help

uiccmt-rol (edit ) EditTest-


uicontrol ftext Operací..) StaticT
umenu (¿File)
uimenu (&Edit) f igtíenuE
uimenu f&Tools) f iaMenuTJll
il
String 'Operaciones básicas1

Selected: 'on1
SelectionHignlight: ' on'
SliderStep: [0.0100 0.1000]
1 Uoer aciones bá
Stvle: 'text'

Show Object Browser Help

Show Property List Cióse

Figura A.5 Pantalla para ingreso del contenido del texto

En la parte superior del editor tenemos todos los elementos que constan en
nuestra nueva figura, por tanto buscamos los otros textos, para ingresar sus
etiquetas como también para los pulsadores. En la figura A.6 tenemos la pantalla
de la figura con sus respectivas etiquetas.
> Figure No. 1 ~í-- -JgJ x|
File Ecfit Options Tods Help

Operaciones básicas

Resultado
Suma

Resta

Salida

Figura A.6 Pantalla con las etiquetas de los textos

Ahora vamos a definir a las subrutinas tanto para la suma como para la resta, así
como los comandos para poder aceptar los valores ingresados.
130

Por tanto seleccionamos la opción callback para todas las opciones de los
objetos y ponemos los siguientes comandos:
'pruebaC'numerol1')1;
'pruebaC'numeroZ1')1;
'pruebaC'suma")';
'prueba("resta")';
'pruebaC'salir'1)1;
para las áreas de edición, pulsadores que ejecutan la suma, resta y salida
respectivamente.

Una vez realizadas estas tareas procedemos a guardar el archivo seleccionando


la opción save as y poniendo el nombre prueba. Cabe indicar que dichas
subrutinas son realizadas en el interior del programa., por tanto estas se van a
implementar en el segundo método por ser las mismas que aquí se utilizan.

Mediante el ingreso de comandos es la segunda manera para la creación de las


interfaces.
Por tanto debe quedar claro que estos comandos pueden ser ingresados en
cualquier editor de texto con la característica de que al ser grabados deben llevar
la extensión .m para que puedan ser reconocidos por el editor propio de Matlab.
Existen dos tipos de control básico que podemos programar estos son:

Uicontrol sirve para programar los objetos de la interfaz como botón pulsador,
slider, o caja de lista.
Uimenu sirve para programar los menús de la interfaz.

Tenemos nueve tipos de uicontroles que pueden ser añadidos, entre ellos:
a) botón de pulsamiento
b) área de edición
c) menús popup
d) radio botón
e) trame
f) texto
131

g) caja de lista
h) caja de selección
i) slider
los cuales tienen propiedades comunes siendo las más importantes las que a
continuación se detallan en la tabla A.1.

Nombre de propiedad Descripción Valor


Valor: ColorSpec
BackgroundColor Color de la figura Default: sistema
dependiente
Color verdadero de imagen
Cdata Valor: matrix
mostrada sobre ei control
Valor: ColorSpec
ForegroundColor Color del texto
Default: [0 0 0]
Etiqueta del Uicontrol,
String también de la caja de lista y Valor: string
menú popup

Visibilidad del uicontrol Valor: on, off


Visible
Defaulí: on

Enable Habilita o deshabilita el Valor: on, inactive, off


uicontro! Default: on
Valor: pushbutton,
togglebutton,
radiobutton, checkbox,
Style Tipo de objeto de uicontrol
edit, text, slider, frame,
íistbox, popupmenu
Default: pushbutton
Tamaño y localización del Valor: posición rectangular
Posttion
objeto en ia figura Default: [20 20 60 20]
Valor: pixels, normalized,
Unidades para interpretar la inches, centimeters,
Units
posición del vector points, characíers
Default: pixels
Callback Acción de control Valor: string
Valor actual de los objeto Valor; escalar o vector
Valué
uicontrol Default: objecto dependiente

Tabla A.1 Propiedades de los objeto uicontro!


132

Para lograr la interfaz anterior debemos empezar con la definición de una función
llamada prueba y como variable de control proceso , la.cual irá definiendo que
acción tomar en el trascurso del programa bajo el control de flujo de un switch
case, por tanto debemos tener definidas las variables que utilizaremos para
almacenar los valores del uicontrol como también los valores de los números para
el primer dato, segundo dato y resultado siendo estas dato1Jdato2J result, d1,d2 y
re.

el código sería:

function prueba(proceso)

global datol dato2 resul re d1 d2

ahora hacemos una pregunta si hay variables de entrada ai llamar a la interfaz

if nargin<1
proceso='in¡cio';
pn
end

Analizamos que función se va realizar, la cual dependerá del valor de la variable


proceso, para ello hacemos con un control de flujo.

switch(proceso)

si proceso es igual a inicio se genera la pantalla principal estableciéndose el color,


posición en la pantalla, ubicación de los objetos como botones pulsadores, área
de edición, texto de etiquetas, etc.

case 'inicio1

hO = figureCUnitsVpoints', ...
'Color',[0.8 0.8 0.8], ...
133

'Position',[33.75 247.5 288.75 168.75], ...


ToolBar'/none1);
9

estos comandos generan la etiqueta "Operaciones básicas", "Resultados "


respectivamente.

h1 = uicontrolCParent'.hO, ...
'Units'/points1, ...
'BackgroundColor',10.847058823529412 0.815686274509804
0.784313725490196], ...
'Position'.pS.ZS 141 112.5 15], ...
'String'/Operaciones básicas', ...
'Style'/text1);

texto - uicontrolCParent'.hO, ...


'Units'.'points', ...
IBackgroundColor',[0.847058823529412 0.815686274509804
0.784313725490196], ...
'Position'.pS.S 96.75 95.25 15], ...
'String'.'Resultados', ...
'Style'.'text');

estos comandos generan la primer y segunda área de edición respectivamente


con la llamada a subrutínas internas en el literal callback.

datol = uicontrolCParent'.hO, ...


'UnitsVpoints', ...
'BackgroundColor'.H 1 1], ...
'Position',[192 130.5 60 15.75], ...
'StringV, ...
'Style'/edit1, ...-
'Callback'/pruebaC'numerol'1)1);
134

dato2 = uicontrolCParent'.hO, ...


'UnitsYpoints', ...
'BackgroundColor',[1 1 1], ...
'Position'í[192.75 112.560 15.75], ...
'String',", ...
'Style'.'edit', ...
ICailbacki;prueba("numero2")1);

ahora generamos el primer botón pulsador para salir del programa, y en la opción
calíback es donde se llama a una función interna llamada salir.

salida = uicontrolCParent'.hO, ...


'Units'.'points1, ...
'BackgroundCoIor',[0.847058823529412 0.815686274509804
0.784313725490196], ...
'Position',[189.75 18 71.25 22.5], ...
'String'.'Salida', ...
'CalIbackYpruebaC'salir'1)');

Con las instrucciones siguientes generamos una trama que abarca la etiqueta
resultados y donde se presentará el valor después de realizar las operaciones.

frame = uicontrolCParent'.hO, ...


'Units'.'points1,...
'BackgroundCoiort,[0.847058823529412 0.815686274509804
0.784313725490196], ...
'Pos¡tionl,[21.7521 116.25114.75], ...
'Style'.'frame', ...
TagVFramel1);

resul - uicontrolCParent'.hO, ...


'Units'/points1, ...
135

'BackgroundColor',[0.847058823529412 0.815686274509804
0.784313725490196], ...
'Position',[27 45.75 101.25 24.75], ...
'foreground'/k1,...
'StyleYtext');

estos comandos son para generar los dos restantes botones pulsadores que
llevan como etiqueta suma y resta respectivamente, los cuales al ser pulsados
llaman a subrutinas internas para realizar las operaciones indicadas.

suma = uicontrol(TParent',hO, ...


'UnitsVpoints', ...
'BackgroundCoIor',[0.847058823529412 0.815686274509804
0.784313725490196], ...
'Position'.fISQ.TS 82.5 70.5 21.75], ...
'StringVSuma1, ...
•CalIbackVpruebaC'suma")1);

resta = uicontroK'Parent'.hO, ...


'UnitsVpoints1, ...
'BackgroundColor',[0.847058823529412 0.815686274509804
0.784313725490196], ...
'Position',[190.5 52.5 69.75 21.75], ...
'StringVResta1, ...
'CallbackVprueba("resta")');

Ahora generamos los casos de las subrutinas internas ;


Si es igual a numerol entonces se realiza la adquisición del valor ingresado en la
primer área de edición y se lo asigna a la variable d1.

case 'numerol'
136

Así mismo para la segunda área de edición almacenando el valor ingresado en la


variable d2.

case 'numero2'

d2=str2num(get(dato2,lstr¡ng'))

Si la variable proceso es igual a resta se activa esta subrutina y lo que hace es


utilizar los valores de las variables d1 y d2, restarlas y almacenar el nuevo
resultado en la variable re.

case 'resta1
re=d1-d2
prueba('resultado')

Así mismo para la subrutina suma, el resultado se almacena en la variable re

case 'suma1
re=d1+d2
prueba('resultado')

tanto para la suma como para la resta una vez realizada dicha operación se llama
a una nueva subrutina de etiqueta resultado la cual despliega en pantalla dicho
valor.

case 'resultado1
setíresul.'string'.re)

y con esta subrutina cierra la pantalla

case 'salir'
cióse all
clear all
137

cíe
end

íf nargout > O, fig = hO; end

Tenemos ahora el código completo y podremos ver la interfaz terminada


simplemente con digítar en la pantalla de comandos la palabra prueba y dando un
enter. En las figuras A.7 y A.8 se muestran los resultados de las operaciones
suma y resta de dos números ingresados respectivamente.

-é Figure No. 1
file jídit Jools Window

Operaciones básicas

2
Resultados
Suma

Resta

Saüda

Figura A.7 Pantalla de resultado de la suma

Jal x|
file Edit Tools Window H

Operaciones básicas

2
Resultados
Suma

.Resta

Salida

Figura A.8 Pantalla de resultado de la resta


138

Quedando a criterio del programador el diseño para la implementación de las


interfaces de acuerdo a las necesidades requeridas.

Para mayor información ver los manuales en formato pdf que se encuentran en el
directorio MATLABR11 en el subdirectorio help.
139

ANEXO B

MANUAL DE USUARIO DE LA INTERFAZ GRÁFICA


Para la simulación de tales efectos se diseñó una interfaz gráfica, con la cual se
puede visualizar y escuchar cada uno de los efectos ¡mplementados, para ello se
debe contar con una computadora la que tendrá los siguientes requerimientos
básicos;

Tarjeta de sonido.
Tarjeta de video.
Procesador 550Mhz mínimo.
64Mb en RAM
Parlantes.
Matlab (instalado con el toolbox de telecomunicaciones)

En primer lugar debemos instalar el programa MATLAB versión 5.3, teniendo en


cuenta que se instale el toolbox de telecomunicaciones, debido a que ciertas
funciones de procesamiento de señal vienen incorporadas en dicha herramienta.

Una vez instalado MATLAB insertamos el CD de instalación de los archivos,


seleccionando la carpeta tesis, la cual copiamos al disco duro de la máquina en
el subdirectorio work que está contenida en el directorio llamado MATLABR11.

Una vez instalada dicha carpeta accedemos al programa MATLAB y en la pantalla


de comandos digitamos cd tesis damos un enter, luego cd efectos y damos otro
enter, para digitar ia palabra inicio y acceder a la pantalla de presentación, ver
figura B.1
140

"EFECrOSDEVOZ

ESCUELA POLITECNICANACJONAU

INGENIERÍA EN ELECTRÓNICA Y TELECOMUNICACIONES

PROGRAMA DE SIMULACIÓN DE EFECTOS DE VOZ


RÉAU2ADO POR ; GUILLERMO YASELGA. PRADO
DIRIGIDO POR, DR GUALBERTO HIDALGO _
2000-2001

..r Inicio Salir I Ayuda

Figura B.1 Pantalla de presentación

En la cual podemos observar tres botones:

Inicio.- para acceder al interfaz gráfico.


Salir.- para cerrar la pantalla de presentación.
Ayuda .-para acceder al manual de ayuda en formato HTML.

Una vez que hayamos dado un click en inicio tenemos la siguiente pantalla, ver
figura B.2, la cual cuenta con;
a) un menú principal
b) área de gráficos para archivos de sonido
c) cuadro de visualización del efecto actual
d) área de ingreso de datos del tiempo
e) radio botón para parámetros de efectos
f) radio botón para sonido
g) control de velocidad
h) cuadro de presentación de características del archivo análisis
i) control de volumen
j) radio botón para zoom
k) botón para reset
I) botón de salida.
141

•¿rchivp Efectos Gráficas Filtros Manual HTML

, Volumen
jC Zoom
Sonido

Salir

Reset

Figura B,2 Pantalla de la interfaz gráfica

En el menú principal contamos con las siguientes alternativas:

Archivo.- Selecciona un archivo de sonido de formato wav,


Efectos.- este submenú tiene varias opciones como eco, coro, reverberación,
robot .teatro, iglesia y sala los cuales son aplicad, os al archivo seleccionado.
El figura B.3 muestra los contenidos de dicho menú.

Eco'
Coro

Reverberación *
Robot >•

': parámetros,, -

Figura B.3 Contenido de efectos


Ahora si seleccionamos la opción de eco se tiene las siguientes posibilidades, un
eco simple, largo, débil y fuerte, como lo indica la figura B.4.
142

¿imple
Coro
¿ébil;
.Reverberación
Fuerte
Robot • ' : '>-,

Figura B.4 Opciones del efecto eco

Si seleccionamos ei efecto coro tenemos dos opciones: un coro de dos voces y


otro de tres. La figura B.5 muestra dichas opciones.

Eco

Reverberación >,
Robot- >

Parámetros

Figura B.5 Opciones del efecto coro

En cambio para el efecto reverberación hay cinco alternativas una reverberación


clara .difusa, simulación de un Teatro, Iglesia y Sala como lo muestra la figura B.6

Coro
.

• Reverberación > . . "Clara


Robot > Djfusa

Parámetros Jeatro
iglesia

Sala

Figura B.6 Opciones del efecto reverberación


143

Por último el efecto robot con tres posibles opciones como lo indica la figura B.7.

Eco
Coro

Reverberación >

Robot2
: Parámetros
Robot3:

Figura B.7 Opciones del efecto Robot

Gráficas.- Se puede tener tres tipos de gráficas : el espectrograma, la densidad


espectral de potencia y la diferencia entre e! archivo original y el archivo con
efecto.

En el espectrograma se tiene una representación gráfica en dos dimensiones


entre la frecuencia y el tiempo distinguiendo por colores más intensos a las
componentes de mayor frecuencia, así como también una representación en tres
dimensiones de las variables tiempo frecuencia y amplitud. La figura B.8 muestra
el espectrograma en dos y tres dimensiones.

10000 100

8000

6000
-50
4000

2000
-100 xlo
frecuencia O O
2 4
Tiempo

Figura B.8 Espectrograma en dos y tres dimensiones

La densidad espectral de potencia se obtiene al aplicar la transformada rápida de


Fourier y se representa gráficamente tanto para ei archivo original como para el
144

Filtros.- Con la posibilidad de seleccionar filtros pasabajos, pasabanda y


pasaaltos,

Manual.- Con esta opción se muestra en pantalla el contenido de la teoría de los


efectos, en formato HTML, como funciones de transferencia, ecuaciones de
diferencias, gráficas, modelos, bibliografía, etc.

La figura B.9 muestra la pantalla inicial del manual.

J Archivo .Edición Ver Favoritos; íHeframtentas Ayuda

\a avoritos istoria!

j Dirección ¡@ C:\MATLABR11\work\html\efecto.html ¿H j Vínculos»

Interfaz gráfica para la simulación de


efectos de voz

Efectos de sonido

Coro
Reverberación

Teatro
Iglesia
Sala

Figura B.9 Pantalla de! manual en formato HTML

Una vez explicado lo anterior procedemos a dar un click en la opción abrir dei
menú principal y escribimos el nombre del archivo con el que se va a trabajar, o
dando doble click en el archivo que se desee abrir, por ejemplo en el archivo
prueba1.wav Ver figura B. 10
145

erectos de Voz
Buscar en: ^SJ efectos

]EMTRADA2 J resut
]M2 In4 ] saludo

j aplauso! ] mast2 ] silencio


]rnagtef 1 suli
| cabina auille 1 NOMAS 1 tono

V,—1« I chao 1 PLSWAIT luy


ÍSSOÍGIí P^IVMUNAVAL
hola2
O •^j holas -"-] prueba

f^rUTTl

' láM
jKfe<ítér ¿fcaa-í
Tipos de archivo: '" | *.wav Cancelar"

Figura B.10 Pantalla de selección de archivo de sonido

A continuación se gráfica el archivo en función del tiempo y se despliega las


características del mismo, como número de muestras, número de canales,
número de bits, frecuencia de muestreo y el tiempo en segundos de la duración
del archivo como lo indica la figura B.11.

lpruebal.wav | xj
Archivo Efectos Gráficas Filtros M.<3nual HTML

Figura B.11 Pantalla de ia interfaz con un solo gráfico


146

Después seleccionamos por ejemplo ei efecto eco del menú principal en la opción
simple para obtener la gráfica del archivo de sonido con efecto, como lo muestra
la figura B.12,

é piueba1.wav
Archivo Efectos Gráficas Fittros- Manual HTML

O ^^^&¿^&:H£d^

Figura B.12 Pantalla de la interfaz con las dos gráficas

Una vez abierto el archivo y presentadas las respectivas gráficas podremos


ejecutar el radio botón con etiqueta sonido y luego escuchar el archivo original
como e! archivo con efecto para tener una percepción de los cambios que sufrió el
mismo.

De la misma manera si queremos escuchar el efecto que se obtiene al cambiar la


frecuencia de muestreo seleccionamos con el mouse el slider de velocidad el cual
tiene valores desde 0.1 hasta 1.2 siendo estos factores multiplicados por la
frecuencia de muestreo original del archivo en análisis.
147

La figura B.13 indica dichos uicontroles.

jC'/Pararrtebosí
fy^'V'-' -\'--: "; •''
fí Sonoó, ;

;" Sonido

Figura B.13 Opciones de la pantalla principal

La ampliación de la sección de análisis se puede hacer de dos maneras:

La primera mediante un click en Zoom y después con el mouse hacemos un


recuadro sobre la gráfica para realizar el aumento, para regresar al tamaño
original simplemente damos un click con el botón derecho en el área del gráfico.

La segunda manera es ingresando los parámetros del tiempo inicial y final del
archivo a ser graficado para así poder observar mejor sus características, la figura
B.14 muestra dicha opción.

WiK&Zl

Figura B.14 Ingreso de datos del tiempo de análisis

Por ejemplo en el archivo anterior queremos hacer un análisis entre los tiempos 4
a 5.5 segundos, por tanto ingresamos estos valores en las respectivas áreas de
edición de la figura B.14 y damos un tab para aceptar dichos valores, teniéndose
solamente las muestras de los archivos de sonido correspondientes a ese
intervalo de tiempo, como lo indica la figura B.15.
148

-luí x|
Archivo. Efectos Gráficas Filtros ¿[anual HTML

Archivo original

45 r ' 5 _ 5,5
Archivo cor) efecfd'

Salir

Reset

Figura B.15 Pantalla con las gráficas en el intervalo de tiempo seleccionado.

Podremos variar los parámetros a nuestra voluntad en cualquier efecto que


estemos ejecutando con solo dar un click en radio botón con etiqueta Parámetros,
para acto seguido aplicar dichos valores al archivo original, la figura B.16 muestra
esta opción para el efecto eco.

atenuación
0.3

retardo
0.3

Cancel QK

Figura B.16 Parámetros del efecto eco.

Donde podemos apreciar un valor definido para la atenuación y retardo, si damos


un click en OK se ejecutará el efecto con dichos parámetros caso contrarío se
cancela dicha acción.
149

Para visualizar las diferentes gráficas que el interfaz dispone io hacemos


mediante el menú principal, por ejemplo podemos seleccionar el espectrograma,
la figura B.17 muestra dicha gráfica.

Sonido original

-50

-100

2 4
Tiempo
Sonido con efecto

Tiempo

Figura B.17 Espectrograma

También cuenta con la visualización en tres dimensiones del espectrograma ,


donde los ejes de la figura son el tiempo, amplitud y frecuencia.
La figura B.18 muestra dicho gráfico en tres dimensiones.
150

Sonido original

100-,-• — "

x10
frecuencia

Sonido con efecto

x10
frecuencia O O

Figura B.18 Visualízacion tridimensional del espectrograma

Si en cambio seleccionamos la densidad espectral de potencia obtenemos la


gráfica de la figura B.19. En cambio la figura B.20 nos muestra las diferencias
entre los dos archivos en análisis.

Sonido origina!

2000 4000 6000 8000 10000 12000


Frecuencia
Figura B.19 Gráfica de la densidad espectral
151

Archivo origina!

3 4
Diferencias entre acnívos
0.5

^ O

-0.5
3 4
Tiempo

Figura B.20 Gráfica de las diferencias entre los dos archivos

En caso de querer reiniciar el programa simplemente se debe dar un click en el


botón de etiqueta REINICIAR, y para salir en el de etiqueta SALIR.

El procedimiento para analizar cualquier otro archivo es el mismo, con la única


indicación de los archivos deben ser monofónicos para evitar tener archivos con
demasiado número de muestras, lo que ocupará demasiado espacio en disco
duro e incrementará el tiempo de ejecución del programa.
152

ANEXO C
PROGRAMAS COMERCIALES DE EFECTOS

En internet se pueden encontrar varias direcciones de programas que tratan sobre


efectos de voz, tales programas son versiones de evaluación con un período de
30 días, en las cuales no se cuentan con opciones corno: grabar, conversión de
formato, etc dependiendo de las limitaciones impuestas por el diseñador del
software.

Podemos nombrar a varios de estos programas como por ejemplo:

Goldwave
Mixvibespro
Cool edit
Sampled NeuroDancer
Effects Master

Goldwave

Este programa desarrollado por Chris S. Craig, es uno de los más completos de
los que existen en !a red.

Básicamente GoldWave es un editor de sonidos, en el cual se puede grabar,


convertir formatos de archivos de sonido, crear entretenidos sonidos para
páginas web, máquinas contestadoras, o sonidos de Windows. Cuenta con un set
de efectos y edición para la producción profesional de audio.

Tipos de ventanas en GoldWave

Existen tres tipos de ventana usadas por Goldwave:


153

La principal.- contiene un menú, botones de acceso directo, e información


acerca del programa. Esta ventana guarda todos los archivos de sonidos abiertos
en cascada es decir uno tras otro, similar a un procesador de palabras como
word, donde se puede tener varios archivos abiertos a la vez. La figura C1
muestra la pantalla principal de este programa.

• GoldWave - [Soundll .Jal x|


Ríe E3t EÍfects Vjéw Toóte Ópticos' WindoW. H -IflJxi

<p
QpenJ Savej Undi Cog 'OJt Mf«' tnm Sef Userj AS

n~ ri~ r
m&
Figura C.1 Ventana principal

La de control de dispositivos .- contiene osciloscopios y dispositivos de control


de sonido. Estos osciloscopios muestran el sonido tal y como es ejecutado así
como los controles que determinan el volumen, balance derecho e izquierdo de
los parlantes, y velocidad a la cual se ejecutan los archivos de sonido. La figura
C.2 muestra esta ventana.

-|g|x|
Mi°23_i r~>
0000

Figura C.2 Ventana de control

La ventana de sonidos.- en esta ventana se muestra el archivo seleccionado


identificando claramente las características del mismo, si este es monofónico es
mostrado con un simple gráfico en color verde, mientras que si es estéreo se
muestra usando una gráfica en color verde para el canal izquierdo y una gráfica
en color rojo para el canal derecho.
154

Se tiene la posibilidad de observar datos importantes como los tiempos de


ejecución del archivo en análisis, realizar aumentos de secciones para tener una
mejor visualización de segmentos importantes para la edición, etc.
La figura C.3 muestra dicha ventana.

-......T.-p-,„--.,—-—^...—-.,.-—-^—...r..,p-r.r.-.T-.~-1.,-..,.,,.„—-^—.p-p^p-^— _,—.-..,.—...-r.--.,—.—.r.,..—,,-,.—p—_-,..—-^.M..—r-..-,,......^ ,., | -.^.,.-


ÍO 2 4 6 8 10 12 14 16 18 20 22 24 26 28~ 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58

44100 Hz | 1:00.000 | O 000 to 1:00 000 Changed


Slereo Zoom 1:430S.45 ¡ !ToB;$0.02

Figura C.3 Ventana de sonido

Utilización de memoria

Goldwave utiliza una pequeña cantidad de memoria RAM para cada sonido
abierto, lo que hace que los tiempos de ejecución sean muy cortos.

Para mayor información visitar la dirección electrónica


http://www.goldwave.com

Mixvibespro

Programa desarrollado por Eric Gues, el cual simuia una consola de varios
canales, los cuales pueden alcanzar el número de 16.

Puede abrir el mayor número de formatos de archivos de sonido entre ellos


podemos citar: mp3, wav, au, aif, snd, midi, etc.

Dispone de controles para :


• mezcla automática
• mezcla manual
• volumen
155

• ganancia
• ecualizador
• velocidad
• grabar
• reproducir
• editar

También incluye una sección de efectos, básicamente cuenta con eco,


reverberación, flanger, coro, modulación, fase. La ventaja de este programa es
que son aplicados en tiempo real. La figura C.4 muestra la pantalla inicial.

Siart.vH» - MlxVíbes

Figura C.4 Ventana principal de mixvibespro

Para mayor información visitar la dirección electrónica


http://wvwv.mixvibes.com

Cool Edit

Desarrollado por David Johnston, es un programa para edición de archivos de


sonido, cuenta con un menú principal en el cual se puede seleccionar opciones
como cortar, pegar jnsertar silencios, analizar en el dominio del tiempo,
frecuencia, aplicar efectos como eco, reverberación, retardo, compresión,
distorsión, flanger, etc.
156

Cool Edit puede sintetizar cualquier sonido usando ruido y generación de tonos a
través de varias funciones de transformación de ondas.
Los archivos de sonido pueden ser editados sin importar el tamaño de los
mismos, teniendo como limitación la capacidad del disco duro.

Soporta los formatos de archivo de sonido más comunes para audio como PCM,
Microsoft ADPCM , WAV, Sound Blaster.VOC.etc.

Graba y ejecuta ondas de sonido usando cualquier tarjeta de sonido compatible


con windows.

La figura C.5 muestra la pantalla principal de este programa.

Cool Edit 95 - UNREGISTERED


File £dií Tiansfotm genérate Optíons

Zoom Ouí ü Full s'iew VIA Audio (WAVE) Installed


bií44Kcapabílity
Pía, i Stop ©1992-1996 SjTitrilliurn Software Corporation

Figura C.5 Pantalla principal de Cool Edit

Hoy en día se tiene la versión Cool Edit 2000 la cual cuenta con varios
subprogramas que interactúan entre sí para tener un mayor número de
posibilidades en cuestión de edición de archivos de sonido.

En esta versión el menú principal cuenta con opciones como por ejemplo la
••I'.-* creación de música mediante pentagramas en formato midi, un mayor número de
&,
variaciones de efectos de voz, todo esto mediante la inclusión de botones que
facilitan el acceso y optimizan el tiempo de ejecución.
157

La figura C.6 muestra la pantalla principa! de dicho programa.

^ Cool Edit Pro DEMO


Re "Ed\l" VJew * Tjañrfóniüt* líenéfate Ána^ize Fbvpfites jDptions" Whdow Help

©I332:Í 999 S^Sürríi

Figura C,6 Pantalla principal del Cool edit 2000

Para mayor información visitar la dirección electrónica


http://www.syntrillium.com

Sampled NeuroDancer

Desarrollado por un grupo de programadores üderados por Dario Bazzichetto.


Se caracteriza por tener una variedad de efectos de voz, entre ellos delay,
compresor, fíanger, reverberación, vibrato, etc.

Su menú principal es dinámico ya que ei acceso a cualquiera de las opciones lo


realiza mediante la pulsación de botones. En cuestión de gráficas solamente
cuenta con la representación en función del tiempo y la transformada de Fourier
del archivo en análisis.
158

Su tiempo de ejecución es muy buena.

La figura C.7 muestra la pantalia principal de dicho programa.

j£ File" Edil FX-Effects Plug-lns Víew Preferentes- WindcM Help

Í1ET *W FLQ TUS «IB PEU Cari EIP GFX

Start Seleclion: End Selection: Delta Seíecb'on: Cursor Pos;


S ampie: Ü [-H Sample; |p rrl Sample: ÍO rrj Sample: |S4GOO
Time [ms]: O -^[ Time (ms): | Q [-7-] Time [ms]: [p Tíme(ms). í 451 .25

2oom: f1-: r~~ i i1; 1-v I-I 1 ^ |125 [~r¡ | <--Selectioñ| 2oom focus; jLeft

Start Point: Loop Point: End Point:


Key: Sample: O -T-J Sample: [0_ f-r| Sample: |1 \~
Loop:
Forwatd Time (ms): O -^-j T¡me[ms):|o~ -^ Time (ms): 0.0226757hf-

For Help, press F1 ; |Name:T-S-T-NoName iWave size:64000 [Wave t¡me:145l,25 msec ^

Figura C.7 Pantalla principal de Sampled NueroDancer

Para mayor información visite la dirección electrónica.

www.sylaba.com/-neurod
www.Neurodancer.subnet.dk

EffectsMaster Versión 1.00

Desarrollado por Bulent Biyikoglu, es un programa para procesamiento de audio


escrito para el sistema 'operativo Windows 95. Este añade efectos como
compresión, distorsión, modulación, coro, eco, reverberación, retardo en estéreo,
además de contar con un ecualizador gráfico.
159

Este programa básicamente maneja archivos de sonido de formato wav, con ia


mayor variedad de tarjetas de sonido, esto significa que se puede usar para
muchos propósitos, tales como edición de archivos en off - line así como
escuchar CD's y añadiendo efectos en tiempo real.

Es compilado para Windows 95, lo que requiere un computador 486 DX266 con
una tarjeta de sonido full dúplex para operar apropiadamente al mínimo de los
requerimientos , lo ideal sería un computador pentium para poder escuchar más
claros los sonidos que trabajan a una frecuencia de muestreo de 44 KHz.

Para mayor información visite la dirección electrónica

http://rhythm.hai7Tiony-central.com/~ftp/software/windows/misc/effectsrnaster.txt
160

ANEXOD
GLOSARIO DE TÉRMINOS

Acústica
Es la ciencia que estudia el sonido, su transmisión, efectos, producción ,etc.

ADPCM
Adaptive Differentia! Pulse Code Modulation . Algoritmo de compresión de audio
basado en describir bajos niveles entre muestras muy cercanas.

Aiff
Audio Interchange File Format. Formato de archivo de sonido de la Macintosh.

Aliasing
Frecuencias que son producidas cuando una señal es muestreada con un valor
menor a la frecuencia de Nyquist.

Altura
Relacionado con la frecuencia de un sonido, a mayor frecuencia mayor altura.

Amplitud
Cantidad de una señal. Medida para determinar la cantidad de la fluctuación en la
presión del aire ( de un sonido), voltaje ( de una señal eléctrica), o dato numérico (
en aplicaciones digitales)

Ancho de Banda
Medida de capacidad de comunicación o velocidad de transmisión de datos de un
circuito o canal.
161

Armónicos
Ondas que son múltiplos de una determinada .frecuencia y cuyas intensidades
suelen ser menores que la frecuencia fundamental.

ASCII
American Standard Code of Information Interchange. Estándar reconocido que
engloba un número de caracteres útiles,

Au
Formato de sonido desarrollado por la empresa Sound.

Banda
Rango de frecuencias entre dos límites definidos.

Binario
Sistema de representación numérico que usa el cero y el uno como elementos.

Bit
Unidad elemental de información digital

Byte
Medida básica de capacidad informática ( 8 bits).

Canal
Vía ( canalización) de telecomunicaciones con una determinada capacidad (
velocidad) entre dos ubicaciones de una red.
162

CD
Compact Disc . Disco compacto óptico, de 12 cms de diámetro, que se utiliza para
almacenamiento binario.

Cascada
Conexión de bloques uno tras otro similar a la conexión en serie.

Ceros
Denominación que se da a las raíces del polinomio del numerador de la función
de transferencia.

Compresión
Técnica matemática para eliminar la información redundante.

Coloración
Término que se suele usar para expresar el efecto audible de ciertas frecuencias
cuyos niveles se ven aumentados artificialmente.

Cool Edit
Programa comercial de efectos de voz desarrollado por David Johnston.

Cuantificación
Proceso para la digitalización de señales la cual asigna valores dependiendo del
rango de resolución.

DAC

Conversor digital / análogo .Circuito que decodifica las señales digitales y las
convierte en analógicas.
163

Decibelio ( dB )
La décima parte de un bel, expresa un relación de potencias, intensidades y se
suele usar para expresar la atenuación o amplificación.

Decodificador
Sistema para convertir una señal cifrada en un código determinado a otro.

Digital
Sistema que usa muestras digitales ( valores discretos codificados en binario)
para representar señales analógicas.

Digitalización
Proceso de conversión del campo analógico al digital.

Distorsión
Adiciones de armónicos no deseados a la señal original. Cualquier cosa que
altere la señal original

Dolby
Laboratorios de sonido para sistema profesionales y caseros.

Dolby Stereo
Sistema dolby de sonido profesional para salas de cine.

ECC
Sistema de corrección de errores durante la transferencia de audio digital.

Ecuación de diferencias
Expresión matemática utilizada para representar modelos en e! dominio discreto.
164

Ecualizador
Dispositivo electrónico para variar los niveles de diversos márgenes de
frecuencias aumentándolas o disminuyéndolas.

Efecto
Cualquier forma de procesamiento de señal de audio.

Efecto Coro
Aquel que simula a dos o más personas hablando al mismo tiempo pero con un
ligero retardo entre ellos.

Efecto Eco
Aquel que añade muestras retardadas y atenuadas del archivo original.

Efecto Robot
Aquel que simula la voz metalizada de un robot.

Effects Master
Programa comercial de efectos de voz desarrollado por Bulent Biyikoglu.

Espectro
Conjunto de frecuencias determinadas.

Espectrograma
Gráfica que muestra la frecuencia en función del tiempo.

Estéreo
Reproducción o grabación de sonido mediante dos canales (izquierdo y derecho).
165

FFT
Fast Fourier Transform. Transformada Rápida de Fourier. Método computacional
eficiente de la estimación espectral de una señal.

Filtro
Circuito electrónico o eléctrico usado para limitar el paso de ciertas frecuencias en
una señal.

Filtro Combo
Aquel que tiene una respuesta de frecuencia parecida a un peine.

FIR
Finite Impulse Response. Característica de la función de transferencia de solo
ceros.

Filtro Pasatodo
Aquel que tiene la característica de respuesta de frecuencia plana en amplitud.

Fourier
Matemático Francés que descubrió la manera de descomponer una señal en una
suma de senos y cosenos.

Frecuencia
Número de ciclos por unidad de tiempo de una onda sonora. Se mide en Hz (
Herzios),

Frecuencia de corte
Frecuencia en la cual la ganancia disminuye en 3 dB.
166

Frecuencia de muestreo
Parámetro importante en la digitalización de señales. Es el número de muestras
por segundo que se toman de una señal en particular.

Función de transferencia
Ecuación que sirve para representar un modelo discreto.

Ganancia
Amplificación de señal.

GHz
Gigahertzio, equivale a un billón de ciclos por segundo

Goldwave
Programa de efectos de voz desarrollado por Chris S. Craig.

Hertzio
Unidad de medida para la frecuencia. Mide el número de oscilaciones por
segundo de una onda.

Hi-Fi
Alta fidelidad.

MR
Infinite Impulse Response. Característica de la función de transferencia de solo
polos, o de polos y ceros.
167

ISO
International Standards Organizaron

Ley A
Ley utilizada para comprimir señales de transmisión , es utilizada principalmente
en Europa.

Ley |i
Ley utilizada para compresión de señales usada principalmente en Estados
Unidos.

Matlab
Paquete computacional para estudios de ingeniería .

Micrófono
Dispositivo-que convierte señales acústicas en eléctricas.

Midi
/"
Musical Instruments Digital Interface. Formato de archivo de sonido que .utiliza
tablas o sonidos pregrabados. 4

Mixvibespro
Programa comercial de efectos de voz desarrollado por Eric Gues.'

Monofónico
Información de audio a través de un único canal
168

Moorer
James A. Moorer científico que estudio sobre modelos computacionales para
simular la reverberación.

MPEG
Moving Pictures Expert Group, Grupo de creadores de normas para desarrollar
estándares de compresión de video.

Mp3
Formato de archivo de sonido que utiliza compresión.

Multimedia
Sistemas informáticos que integran audio, vídeo y datos.

Octava
Intervalo tal que la frecuencia se duplica. Ejemplo: 64 - 128-256 Hz.

PCM
Pulse Code Modulation

Polos
Denominación que se da a las raíces del polinomio del denominador de la función
de transferencia.
169

Raw
Formato de archivo de sonido, el más elementa! de todos con frecuencia de
muestreo de 8000 Hz, número de bits por muestra igual a 8 y reproducción
monofónica.

Reverberación
Propiedad de la acústica que trata sobre las reflexiones de un sonido dentro de un
recinto.

Reverberador
Modelo formado por filtros para simular el efecto de reverberación.

RIFF
Resource Interchange File Format.

Sampled NeuroDancer
Programa comercial de efectos de voz desarrollado por Dario Bazzichetto.

Schroeder
Manfred Schroeder investigador de modelos digitales para la simulación de la
reverberación.

Sonido
Es el resultado del movimiento o vibración de un cuerpo.

Speed Rate
Tasa de cambio del oscilador de baja frecuencia.

También podría gustarte