SELECCIÓN DE VARIABLES
La selección de variables o feature selection es el proceso de escoger, dentro de la data, las
variables más consistentes, no redundantes y relevantes para ser usadas en la construcción del
modelo. El objetivo es reducir metódicamente el tamaño del conjunto de datos, buscando mejorar
la selección de las variables para mejorar el rendimiento del modelo a construir y reducir el costo
computacional del modelado.
En el caso que se está desarrollando, se cuentan con 90 variables asociadas a la variable Label, la
cual recoge los años de lanzamiento de la canción, por lo que se hace imperativo realizar este
proceso para reducir la cantidad de variables de entrada y mantener las más relevantes para la
construcción del modelo. Por lo anterior, se escogieron varias técnicas de selección de variables,
las cuales se presentan a continuación: