FUNDACION UNIVERSITARIA SAN MATEO.
PROCESAMIENTO DIGITAL DE VOZ CON
MATLAB.
Carolina Ramirez – Danny Flores
Bogotá
Fundación Universitaria San Mateo
E-mailcramirezg@[Link]
E-mail dflorez@[Link]
Resumen—El procesamiento digital tiene muchas aplicaciones, dominio de frecuencia y dominio temporal de las seña les de la
en este caso se aplicará a la señal de voz, por ello existe una base voz, se puede apreciar las características en intervalos de
para el tratamiento de estas señales digitales, en este documento se milisegundos. Los formantes son picos en el espectro de voz
realizará un análisis de la voz humana, como funciona la señal de
audio por medio de MATLAB que permite la interacción grafica de
causados por frecuencias de resonancia, amplitud o
este proceso. MATLAB es un sistema que permite realizar diferentes amortiguamiento. Los formantes se pueden determinar por
tareas para contar con lenguajes de programación comunes, está medio de una representación de dominio frecuencial en el
especificado por los cálculos numéricos que puede realizar, es fácil espectro, donde se puede estudiar las características relevantes
de ejecutar y desde allí se puede crear conjunto de funciones por las de esta señal.
herramientas que tiene, con las cuales se puede realizar
procesamiento de señales. A pesar de que se realiza la representación de la señal de voz en
palabras clave—Señal de voz, audio, Ancho de banda, espectro. un espectro, no se obtiene un resultado final, arroja la solución
de la información y aun así se necesita de una representación en
OBJETIVOS tiempo y frecuencia donde se pueda analizar la intensidad de la
voz, evolución temporal en diferentes bandas de frecuencia y
Realizar la simulación en el software MATLAB, del para ello se utilizaría el espectrograma representación gráfi ca
procesamiento digital de la señal de voz para observar su del espectro.[2]
desempeño en las gráficas de la frecuencia, potencia y
dominio del tiempo.
III. ANALISIS ESPECTRAL DE LAS MUESTRAS
Graficar una señal de audio, mediante MATLAB para Se realiza una grabación de audio de voz humana y se aplicó́
conocer el comportamiento y funcionamiento en cuanto a su el siguiente código:
análisis espectral, de estas señales en los dominios del
tiempo y la frecuencia.
I. INTRODUCCION
En este trabajo se observa el procesamiento digital de señales,
haciendo la comparación entre un audio de voz humana y un
audio de guitarra, para realizar el análisis espectral de cada señal
que construye la transformada de Fourier, y comparación del
resultado de las gráficas tomando como referencia la señal de
En las líneas 3 al 5 se le indica el comando de lectura, y se
voz humana. Veremos la técnica de procesamiento digital por
realiza el cambio del código WAVREAD por
medio del software Matlab y sus graficas correspondientes a la
AUDIOREAD, los avances y actualizaciones que ha tenido el
potencia, frecuencia y dominio en el tiempo.
software Matlab han cambiado algunos códigos.
La Transformada de Fourier es una herramienta poderosa ya
que proporciona métodos para la resolución de ecuaciones
A continuación, lo que se muestra en las gráficas es la
difíciles de manejar, como, por ejemplo, las respuestas
transformada de Fourier mostrando su frecuencia, potencia y
dinámicas de sistemas eléctricos, lumínicos y térmicos”.[1]
tiempo. Obteniendo como Resultado la siguiente muestra:
II. ANALISIS ESPECTRAL DE LA SEN˜ AL DE VOZ ANALISIS
El estudio de las señales de audio ha evolucionado con Se realiza diferentes pruebas para tener conocimiento de cada
las técnicas que permiten plantear las características en el señal que construye el procesamiento digital de la voz humana,
Se puede observar que 1.7KHz es la mayor potencia.
FUNDACION UNIVERSITARIA SAN MATEO. 2
ANALISIS
Se realiza diferentes pruebas donde se puede evidenciar y
observar en la gráfica que 1.4 KHz es la mayor potencia, en el
dominio de la frecuencia
Figura 1. Grafica dominio del tiempo
También se realizó´ la grabación de guitarra eléctrica con el
mismo código de MATLAB, la cual dio el siguiente muestreo:
Figura 4. Grafica dominio del tiempo
ANALISIS
Se realiza diferentes pruebas en este ejercicio para tener
conocimiento de cada variable que muestra la gráfica que
construye la función en el dominio del tiempo
Se puede analizar la diferencia que se observa en estos dos
ejercicios la comparación de un audio de voz de una persona
al toque de una guitarra eléc trica, la forma en que influye la
transformada de Fourier permitiendo realizar el análisis
espectral de la eficiencia y contenido de la señal de la voz.
IV. PREGUNTAS
IV-A. ¿Cuál su concepto sobre el espectro?
El espectro electromagnético es la distribución de energía de ondas
electromagnéticas ejemplo: longitud de onda. El espectro
Figura 2. Grafica dominio de la frecuencia radioeléctrico es un medio en el cual se transmite frecuencia de
ondas radio electromagnéticas, por ejemplo: en el área de las
telecomunicaciones tv, radio, internet etc. Las cuales son
ANALISIS administradas por el estado
Se realiza diferentes pruebas y análisis de la señal de audio de
una guitarra eléctrica que construye la transformada de Fourier, IV-B. ¿Cuál es la frecuencia de señal de la voz humana?
donde Se puede observar que 1.7KHz es la mayor potencia.
Figura 3. Grafica dominio de la frecuencia Varía dependiendo del género sea femenino por la agudeza
de su voz esta entre 150 a 300 Hz y la del hombre maneja un
tono entre 100 a 200Hz.
IV-C. ¿Cuál es su concepto de Ancho de Banda?
Cantidad de información que puede ser enviada por algún medio,
expresada bytes por segundo, siempre estará expresada por unidad
de tiempo
IV-D. ¿Como se digitaliza una señal de Audio?
Como tal empieza por un audio analógico y lo va muestreando
digitalmente dependiendo la velocidad programada, hay un
elemento especial que se encarga de reconstruir la forma de la
onda original la envía como señal analógica, comienza a ser digital
FUNDACION UNIVERSITARIA SAN MATEO. 3
cuando se convierte en muestras digitales para a ser audio
analógico convertido a digital.
CONCLUSIÓN:
El software Matlab es una gran herramienta muy útil y precisa
para el análisis y la interpretación de las señales de audio las
señales de la voz humana se miden en Hz, atreves del dominio
del tiempo y la frecuencia, para su posterior análisis matemático.
Se realiza análisis y se compara el muestreo de las 2 señales y se
puede observar que la mayoría de los sonidos estos compuestos
por diferentes frecuencias y que varían a lo largo del tiempo en
su conversión de analógica a digital. En cuanto al análisis
espectral se pueden evidenciar las carencias y cualidades de
cualquier sonido.
REFERENCIAS
[1] Rojas-2012- Procesamiento digital de imágenes con
Matlab y SIMULINK.
[2] Navarro(tratamiento de la señal de audio)
[Link]
puntesextraccion [Link] pp. 6-7.
FUNDACION UNIVERSITARIA SAN MATEO. 4