0% encontró este documento útil (0 votos)

40 vistas4 páginas

UNIMAG PCM Proyecto1

El proyecto evaluativo consiste en comparar la precisión de dos métodos de clasificación de audio: uno basado en características extraídas directamente de archivos de audio y otro en espectrogramas generados a partir de estos. Se llevarán a cabo varias fases que incluyen la adquisición de datos, extracción de características, entrenamiento de modelos y evaluación de desempeño. Finalmente, se analizarán las diferencias en precisión y se discutirán las ventajas y desventajas de cada enfoque.

Cargado por

Jilme

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

40 vistas4 páginas

UNIMAG PCM Proyecto1

Cargado por

Jilme

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Proyecto 1 de Procesamiento de Contenido Multimedia

Programa de Ingeniería Electrónica

Profesor: RAFAEL DAVID LINERO RAMOS, MSc.
rlineror@[Link]

Proyecto Evaluativo 1: Comparación de Métodos de Clasificación en Audio e

Imágenes
Procesamiento de Contenido Multimedia

Objetivo General:

Evaluar la diferencia en precisión entre dos métodos de clasificación, uno basado en

las características extraídas directamente de archivos de audio y otro basado en la
clasificación de espectrogramas generados a partir de dichos audios.

Objetivos Específicos:

1. Extraer características relevantes de archivos de audio y utilizarlas en un

modelo de clasificación.

2. Convertir los audios en espectrogramas y evaluar la clasificación sobre las

imágenes generadas.

3. Comparar el desempeño de ambos enfoques en términos de precisión.

Metodología y Pasos del Proyecto

Fase 1: Adquisición y Preparación de Datos

1. Selección del dataset

o Elegir un conjunto de archivos de audio categorizados (pueden ser

sonidos ambientales, música, habla, etc.).

o Asegurar que haya un número balanceado de muestras por clase.

2. Preprocesamiento del audio

o Normalización de amplitud.

o Remoción de ruido si es necesario.

o Segmentación en fragmentos de duración uniforme (e.g., 3 segundos).

Proyecto 1, Procesamiento de Contenido Multimedia

Página 1 de 4
Proyecto 1 de Procesamiento de Contenido Multimedia
Programa de Ingeniería Electrónica
Profesor: RAFAEL DAVID LINERO RAMOS, MSc.
rlineror@[Link]

Fase 2: Clasificación Basada en Características de Audio

3. Extracción de características de audio

o Amplitud

o Valores pico a pico

o Valores RMS

o Espectro de energía y centroides espectrales.

o Correlaciones

o MFCCs (Mel Frequency Cepstral Coefficients).

4. Entrenamiento de modelos de clasificación

o Selección de modelos (SVM, Random Forest, Redes Neuronales, etc.).

o Entrenamiento y validación cruzada.

5. Evaluación del desempeño

o Medición de precisión.

o Análisis de matriz de confusión.

Fase 3: Clasificación Basada en Espectrogramas

6. Conversión de audio a imágenes

o Generación de espectrogramas con STFT (Short-Time Fourier Transform) o

Wavelet.

o Guardado de espectrogramas como imágenes en escala de grises o

color (usando Matplotlib u otra herramienta).

7. Entrenamiento de modelos de visión por computadora

o Uso de CNNs (Convolutional Neural Networks) como ResNet, VGG o

modelos personalizados.

o Aplicación de técnicas de aumento de datos para mejorar la

generalización.
Proyecto 1, Procesamiento de Contenido Multimedia

Página 2 de 4
Proyecto 1 de Procesamiento de Contenido Multimedia
Programa de Ingeniería Electrónica
Profesor: RAFAEL DAVID LINERO RAMOS, MSc.
rlineror@[Link]

8. Evaluación del desempeño

o Medición de precisión, sobre la clasificación de los espectrogramas.

o Comparación con la clasificación basada en audio crudo.

Fase 4: Comparación de Resultados y Conclusión

9. Comparación de métricas

o Comparar la precisión de ambos métodos.

o Analizar si hay diferencias significativas en la clasificación.

10. Discusión de ventajas y desventajas

• ¿El modelo basado en audio es más eficiente computacionalmente?

• ¿El modelo basado en espectrogramas mejora la precisión a costa de mayor

procesamiento?

11. Conclusiones finales

• Reflexionar sobre la aplicabilidad de cada método en diferentes escenarios.

• Proponer mejoras para futuros estudios.

Evaluación:

1. Entregables:

1.1. Los archivos de multimedia empleados en los ítems del punto 1 (Audios e
Imágenes) y los códigos desarrollados en Matlab (.m o .mlx) o en Python (.py
o .ipynb) en el proyecto.

1.2. Documento ejecutivo y presentación en la que se expliquen las técnicas

empleadas, lógica, construcción y funcionamiento de las fases 1, 2 y 3.

1.3. Un vídeo (grabación de pantalla en Matlab o Python) en el que se evidencie

usted explicando el funcionamiento de las fases 2 y 3.

Proyecto 1, Procesamiento de Contenido Multimedia

Página 3 de 4
Proyecto 1 de Procesamiento de Contenido Multimedia
Programa de Ingeniería Electrónica
Profesor: RAFAEL DAVID LINERO RAMOS, MSc.
rlineror@[Link]

2. Distribuciones:
100 %
Calidad del proyecto en documento y presentaciones 20 %
Presentación del proyecto en videos y sustentación 20 %
Diseño de las técnicas métodos de clasificación 20 %
Precisión de la clasificación de las señales (AeI) 20 %
Originalidad de los códigos desarrollados 20 %

3. Anotaciones:

Realice un punto y/o procesamiento a la vez.

En la fase 1 les sugiero ejemplos, pero lo que ustedes desean procesar es de libre
elección.

En los vídeos explicativos de sustentación del funcionamiento de sus

procesamientos, una herramienta muy útil es Teams, permite grabar pantalla y
tienen acceso a esta herramienta con sus correos institucionales.

Los videos explicativos de sustentación del funcionamiento de sus clasificaciones

pueden quedar almacenados en un link y este lo pueden agregar a las
presentaciones.

Realizar todos los entregables en una sola carpeta comprimida .rar o .zip.

Fecha de entrega: máximo el martes 11 de marzo de 2025 a las 03:59 p.m.

Al correo institucional rlineror@[Link]

Proyecto 1, Procesamiento de Contenido Multimedia

Página 4 de 4

También podría gustarte

Trabajo Final 1
Aún no hay calificaciones
Trabajo Final 1
4 páginas
Kfiq 7 J 1579067521
Aún no hay calificaciones
Kfiq 7 J 1579067521
147 páginas
Programa ProcesamientoDigitalSeñales
Aún no hay calificaciones
Programa ProcesamientoDigitalSeñales
1 página
Clasificación de Vocalizaciones de Ave
Aún no hay calificaciones
Clasificación de Vocalizaciones de Ave
15 páginas
Actividad - Computacion - Señales de Audio
Aún no hay calificaciones
Actividad - Computacion - Señales de Audio
2 páginas
Diseño de Un Modulador de Sonidos Am, FM, Con Filtros Que Permitan Su Modificación Usando Matlab 2.
Aún no hay calificaciones
Diseño de Un Modulador de Sonidos Am, FM, Con Filtros Que Permitan Su Modificación Usando Matlab 2.
18 páginas
Syllabus Del Curso Tratamiento Digital de Señales
Aún no hay calificaciones
Syllabus Del Curso Tratamiento Digital de Señales
10 páginas
EL228 - Informe Seccion 2024 2 Alcca Altamirano Torres
Aún no hay calificaciones
EL228 - Informe Seccion 2024 2 Alcca Altamirano Torres
4 páginas
Proyecto Ecuaciones Diferenciales
Aún no hay calificaciones
Proyecto Ecuaciones Diferenciales
2 páginas
Proyecto de Investigacion Del Lenguajes y Compiladores 20-08-2018
Aún no hay calificaciones
Proyecto de Investigacion Del Lenguajes y Compiladores 20-08-2018
3 páginas
Documento Proyecto Final-Gemán Sánchez-Kevin Badran PDF
Aún no hay calificaciones
Documento Proyecto Final-Gemán Sánchez-Kevin Badran PDF
14 páginas
Diseño Investigación
Aún no hay calificaciones
Diseño Investigación
2 páginas
LyA2 Antologia Unidad1
Aún no hay calificaciones
LyA2 Antologia Unidad1
16 páginas
Privados de Area Oral 2012
Aún no hay calificaciones
Privados de Area Oral 2012
4 páginas
EL115 Procesamiento Avanzado de Señales e Imagenes 201702
Aún no hay calificaciones
EL115 Procesamiento Avanzado de Señales e Imagenes 201702
5 páginas
Diseño de Compiladores Syllabus
Aún no hay calificaciones
Diseño de Compiladores Syllabus
36 páginas
IC-5701 Compiladores e Intérpretes - I Semestre 2015
Aún no hay calificaciones
IC-5701 Compiladores e Intérpretes - I Semestre 2015
10 páginas
Sílabo Procesamiento Digital de Señales
Aún no hay calificaciones
Sílabo Procesamiento Digital de Señales
4 páginas
Curso de Computación II: Estructuras y Algoritmos
Aún no hay calificaciones
Curso de Computación II: Estructuras y Algoritmos
10 páginas
Itiid-D-Proyecto Integrador I 2025 v2
Aún no hay calificaciones
Itiid-D-Proyecto Integrador I 2025 v2
26 páginas
Propuestas de Trabajos en Procesado de Señales
Aún no hay calificaciones
Propuestas de Trabajos en Procesado de Señales
3 páginas
ISIC-Lenguajes Automatas II
Aún no hay calificaciones
ISIC-Lenguajes Automatas II
10 páginas
Proyectos Fin de Carrera Ofertados 2011-2012
Aún no hay calificaciones
Proyectos Fin de Carrera Ofertados 2011-2012
11 páginas
ISC-Lenguajes y Automatas II
Aún no hay calificaciones
ISC-Lenguajes y Automatas II
4 páginas
Proyecto Final - Grupo6
Aún no hay calificaciones
Proyecto Final - Grupo6
4 páginas
Diseno de Compiladores
Aún no hay calificaciones
Diseno de Compiladores
3 páginas
Topicos Selectos de Programacion - ISC
Aún no hay calificaciones
Topicos Selectos de Programacion - ISC
11 páginas
Aplicación Web para Aprender LSM
Aún no hay calificaciones
Aplicación Web para Aprender LSM
14 páginas
010 - Programación Orientada A Objetos
Aún no hay calificaciones
010 - Programación Orientada A Objetos
8 páginas
Silabo de Lenguajes y Compiladores 2021-1 Sistemas
Aún no hay calificaciones
Silabo de Lenguajes y Compiladores 2021-1 Sistemas
5 páginas
Trabajo Ingenieria de Software
Aún no hay calificaciones
Trabajo Ingenieria de Software
4 páginas
EL115 Procesamiento Avanzado de Señales E Imágenes 201801
Aún no hay calificaciones
EL115 Procesamiento Avanzado de Señales E Imágenes 201801
6 páginas
Guía de Aprendizaje - Tarea 5 - Simulación de Un Sistema de Procesamiento Digital de Señales Aplicado
Aún no hay calificaciones
Guía de Aprendizaje - Tarea 5 - Simulación de Un Sistema de Procesamiento Digital de Señales Aplicado
6 páginas
Desarrollo de Audio en C++ Multiplataforma
Aún no hay calificaciones
Desarrollo de Audio en C++ Multiplataforma
221 páginas
Lenguajes y Automatas II, Temario Completo
Aún no hay calificaciones
Lenguajes y Automatas II, Temario Completo
10 páginas
Procesamiento Digital de Señales
Aún no hay calificaciones
Procesamiento Digital de Señales
12 páginas
Documentación
Aún no hay calificaciones
Documentación
264 páginas
PROYECTO EyPC
Aún no hay calificaciones
PROYECTO EyPC
12 páginas
Tesis 1
Aún no hay calificaciones
Tesis 1
158 páginas
Python para Inteligencia Artificial
Aún no hay calificaciones
Python para Inteligencia Artificial
3 páginas
Estructura de Desglose Del Trabajo (EDT)
Aún no hay calificaciones
Estructura de Desglose Del Trabajo (EDT)
6 páginas
10 - Syllabus Programacion Orientada Objetos-Electrica 2013
Aún no hay calificaciones
10 - Syllabus Programacion Orientada Objetos-Electrica 2013
9 páginas
Practica 2
Aún no hay calificaciones
Practica 2
11 páginas
Sistemas Digitales Aplicados para Procesamiento de Señales
Aún no hay calificaciones
Sistemas Digitales Aplicados para Procesamiento de Señales
3 páginas
Buscador Fonético con Redes Neuronales
Aún no hay calificaciones
Buscador Fonético con Redes Neuronales
61 páginas
Syllabus DSPI 16 I 20151
Aún no hay calificaciones
Syllabus DSPI 16 I 20151
5 páginas
Analisis Diseño de Inscripcion
Aún no hay calificaciones
Analisis Diseño de Inscripcion
9 páginas
Programación de Sistemas: Curso Integral
Aún no hay calificaciones
Programación de Sistemas: Curso Integral
12 páginas
2.3 Programación
Aún no hay calificaciones
2.3 Programación
3 páginas
D1 - Apunetes para La Primera Parte Del Curso
Aún no hay calificaciones
D1 - Apunetes para La Primera Parte Del Curso
40 páginas
Guia Presentación C4M Control2
Aún no hay calificaciones
Guia Presentación C4M Control2
20 páginas
Tema 6 - Expansión Térmica
Aún no hay calificaciones
Tema 6 - Expansión Térmica
21 páginas
Introducción a los Números Complejos
Aún no hay calificaciones
Introducción a los Números Complejos
76 páginas
Tabla de valores críticos F de Fisher
Aún no hay calificaciones
Tabla de valores críticos F de Fisher
4 páginas
Problemas y Ejercicios T-Student
Aún no hay calificaciones
Problemas y Ejercicios T-Student
4 páginas
Definiciones Jose Sierra
Aún no hay calificaciones
Definiciones Jose Sierra
3 páginas
Convivencia Inclusiva en el Aula
Aún no hay calificaciones
Convivencia Inclusiva en el Aula
3 páginas
La Diferenciación Celular
Aún no hay calificaciones
La Diferenciación Celular
2 páginas
Estrategias para Reducir Ausentismo y TMO
Aún no hay calificaciones
Estrategias para Reducir Ausentismo y TMO
10 páginas
Estadísticas para Negocios Efectivos
Aún no hay calificaciones
Estadísticas para Negocios Efectivos
6 páginas
Alejandrorodriguez Tareasemana1 Estadistica
Aún no hay calificaciones
Alejandrorodriguez Tareasemana1 Estadistica
5 páginas
Impacto del Desempleo en Perú 2018-2020
Aún no hay calificaciones
Impacto del Desempleo en Perú 2018-2020
14 páginas
Proyecto Buena Vista
Aún no hay calificaciones
Proyecto Buena Vista
37 páginas
Historia y evolución de la administración
Aún no hay calificaciones
Historia y evolución de la administración
25 páginas
Encuentro "Pasos por la Salud" 2023
100% (1)
Encuentro "Pasos por la Salud" 2023
4 páginas
Folleto de Seguridad
Aún no hay calificaciones
Folleto de Seguridad
1 página
Líneas de TX - PPT 03 (Abr-Oct24)
Aún no hay calificaciones
Líneas de TX - PPT 03 (Abr-Oct24)
46 páginas
Modelo Examen 1
Aún no hay calificaciones
Modelo Examen 1
11 páginas
Técnicas Efectivas de Reclamos
Aún no hay calificaciones
Técnicas Efectivas de Reclamos
3 páginas
Proyecto Guardianes Liceístas
100% (1)
Proyecto Guardianes Liceístas
19 páginas
Uso de Las Comas
Aún no hay calificaciones
Uso de Las Comas
2 páginas
Definición de Econegocios y Sostenibilidad
Aún no hay calificaciones
Definición de Econegocios y Sostenibilidad
22 páginas
Libro Admon. Personal 2022
Aún no hay calificaciones
Libro Admon. Personal 2022
522 páginas
Docente Jorge Garay 2
Aún no hay calificaciones
Docente Jorge Garay 2
15 páginas
Ejercicios de Distribución Poisson
Aún no hay calificaciones
Ejercicios de Distribución Poisson
5 páginas
Ética y Trabajo en Equipo en Datos
Aún no hay calificaciones
Ética y Trabajo en Equipo en Datos
16 páginas
SES. MAT LA MITAD DE UNA CANTIDAD (Refuerzo)
Aún no hay calificaciones
SES. MAT LA MITAD DE UNA CANTIDAD (Refuerzo)
4 páginas
Presentacion Direccion y Alta Gerencia
Aún no hay calificaciones
Presentacion Direccion y Alta Gerencia
25 páginas
Ra2 064 PDF
Aún no hay calificaciones
Ra2 064 PDF
3 páginas
Presentación TOIA
Aún no hay calificaciones
Presentación TOIA
17 páginas
Teoría de la Estimación Estadística
Aún no hay calificaciones
Teoría de la Estimación Estadística
2 páginas
Ecuaciones y La Regla de Tres
Aún no hay calificaciones
Ecuaciones y La Regla de Tres
3 páginas
SH5002-7H Esn
Aún no hay calificaciones
SH5002-7H Esn
172 páginas
Informe Voluntarios V 2025.docx - 20250610 - 142307 - 0000
Aún no hay calificaciones
Informe Voluntarios V 2025.docx - 20250610 - 142307 - 0000
4 páginas