0% encontró este documento útil (0 votos)
54 vistas21 páginas

Charla10 1

El documento describe dos métodos para detectar estribillos en canciones a través del análisis de la similitud entre segmentos musicales. El método principal identifica estribillos como diagonales en la matriz de similitud, mientras que el método alternativo busca el segmento más similar a toda la canción.

Cargado por

Erling Sanchez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
54 vistas21 páginas

Charla10 1

El documento describe dos métodos para detectar estribillos en canciones a través del análisis de la similitud entre segmentos musicales. El método principal identifica estribillos como diagonales en la matriz de similitud, mientras que el método alternativo busca el segmento más similar a toda la canción.

Cargado por

Erling Sanchez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Reconocimiento de Patrones

de Repetición

Proyecto de fin de carrera:


“Detección de Estribillos”

Gabriela Saráchaga
Virginia Sartori
Laura Vignoli
Índice
Introducción
Procedimiento General
Matriz de Similitud
Método Principal
“Estribillo”
Método Alternativo
“Resumen”
Herramientas de Cálculo
MFCC
Vectores de Cromas
Referencias
Introducción
Objetivo
Generar una síntesis (estribillo) de una canción
de forma automática
Motivación
Aumento de las bases de datos musicales
Aplicaciones:
Tienda de discos
Descarga de música de la web
Thumbnail (huella)
Base de datos a analizar: música popular
Características generales del estribillo
Parte más memorable de una canción
Repetición
Aumento en la dinámica: cambia
melodía, ritmo y armonía
Aumento en la sonoridad
Introducción de nuevos instrumentos
Duración de entre 10 y 30s aprox.
Procedimiento General
Entrada: Señal de audio y t  muestreada a 32
bit y 16 KHz en formato wav (obtenida desde
un archivo mp3)
Matriz de Similitud (S)
Visualización de estructura
de piezas musicales
Comparación de
características extraídas
Valor de S(i,j) proporcional
a la similitud entre
instantes i y j
Valores representados en
una imagen en escala de
grises, con blanco
correspondiendo a vectores
idénticos
Matriz de Similitud
Diagonal principal blanca
por comparar instantes
con sí mismos
Cuadros claros
representan fragmentos
homogéneos de la
canción
Fragmentos repetidos
(estribillos) son visibles
como diagonales casi
blancas paralelas a la
diagonal principal
Métodos de Análisis de la Matriz
2 métodos:
Método Principal
Detecta el estribillo, se basa en repeticiones

Método Alternativo
Enfoque distinto: Busca el intervalo más parecido
a la totalidad de la canción
Método Principal
Se resaltan las diagonales
Método Principal: problemas
Hueco en líneas = estribillos con distinta
entonación en alguna sílaba o palabra o a la
adición de instrumentos

Ej: Tracy Chapman –


She’s got her ticket

estribillos 1 y 2:
detalles 1 y 2:
Método Principal: problemas
Aparición de triángulos =
segmentos de canción
compuestos de pequeños
fragmentos iguales.

Ej. Police, Can’t stand loosing


you

Estos problemas se resuelven


considerando cada caso en el
tratamiento de las imágenes.
Método Alternativo
Resumen: el intervalo más
similar a la totalidad de la
canción
Dado un segmento de largo L
que comienza en k y termina
en k+L, la semejanza Q del
segmento con S, se calcula
como la suma de sus filas
entre k y k+L normalizada:
k L N
1
Q  k = ⋅∑ ∑ Si , j 
L
N⋅L i =k j =1

El máximo Q se corresponde
con el k inicio del segmento
buscado
Herramientas de cálculo
MFCC (Coeficientes Cepstrales de
Frecuencia Mel)
Usado para reconocimiento de voz, enfatiza
las bajas frecuencias
Se relaciona con la forma en que
percibimos los sonidos.

Vectores de Cromas
Basado en octavas y semitonos
MFCC: Extracción de Características
Variación del Cepstrum
C=IFFT(log(Densidad Espectral))
MFCC=IFFT(log(Coef.Mel(Dens.Espectral)))
MFCC: Coeficientes Mel
Mel : unidad de medida del pitch percibido

Banco de Filtros
triangulares,
centrados en la
frecuencia Mel.

Medida de distancia para S: distancia coseno


Vectores de Cromas: Extracción
Vectores de Cromas: Cálculo de
Similitud

La similitud S i , j  entre los vectores v  t i 


y v  t j  se define como:
vt 
 vt 

i j
∣ − ∣
max  v  t  max  v  t 
c c i c c j
S  i , j =1−
12
donde S i , j  varía de 0 a 1.
Ejemplo: MFCC vs Cromas
Alanis Morisette – Head over feet
MFCC Cromas
Ejemplo: MFCC vs Cromas
Alanis Morisette – Head over feet

MFCC Cromas Real


est 1: 34-58 33-57 35-60
est 2: 79-100 78-98 77-101
est 3: 186-207 181-208 185-208
est 4: 210-231 210-231 209-232
Ejemplo: Método Alternativo
Ana Belén – Sólo le pido a Dios

est 1:
est 2:
resumen (cromas):
Referencias
MFCC
Auditory Toolbok Michael Slaney
“Discovering Structure and Repetition in Musical Audio”
D.Van Dteeland, B.De Baets, H.De Meyer, M.Leman,
J.P. Martens, L.Clarisse, M.Lesaffre
“Visualizing Music and Audio using Self-Similarity”
Jonathan Foote

Vectores de Chromas
“A chorus-section detecting method for musical audio
signal” Masataka Goto

Resumen
“Automatic Music Summarization via Similarity
Analysis” Matthew Cooper and Jonathan Foote

También podría gustarte