Grado en Ciencia e Ingeniería de Datos
Aprendizaje Automático I
Práctica
Objetivo
La práctica consistirá en la realización y presentación de un informe de un proyecto de Ciencia de
Datos, aplicando técnicas de Aprendizaje Automático. Durante el desarrollo del proyecto, se
utilizarán las técnicas vistas en el curso, y se aplicarán a un conjunto de datos seleccionados. El
informe se entregará en formato R Markdown y HTML, y debe ser claro, autocontenible, bien
organizado y justificado. Además, se debe especificar claramente las partes de la práctica realizadas
por cada componente del grupo. Todo se entregará en un único archivo comprimido.
Instrucciones
Cada grupo deberá entregar su informe a través del aula virtual, indicando en el mismo el nombre
de los integrantes y el número del grupo asignado por los profesores. La entrega debe ser realizada
por uno de los miembros del grupo.
Fecha máxima de entrega: 11 de marzo de 2025, a las 21:00 horas.
Rúbrica
1. (1 punto) Comprensión del problema. Explicación. Lectura de datos. Particiones
2. (3 puntos) Preparación de datos y análisis exploratorio de datos
3. (2 puntos) Técnicas de reducción de la dimensionalidad. Se deben obtener las componentes
principales de 2 modos y comparar los resultados:
• Usando la función prcomp() de R
• Sin usar ninguna función de R específicamente definida para obtener las componentes
principales.
Se puede realizar el estudio de componentes principales con los datos
https://data.scorenetwork.org/data/ironman_lake_placid_female_2022.csv , procedentes de la web
https://data.scorenetwork.org/triathlon/triathlon_lakeplacid_women_ironman.html Las variables a
usar para PCA son Swim.Time, Bike.Time y Run.Time.
4. (3 puntos) Aprendizaje no supervisado. Se debe:
• Diseñar una matriz de distancias o de desemejanza según las características de los datos.
• Comprobar si cumple las condiciones para ser una métrica o una medida de desemejanza
• Obtener resultados clustering tanto con métodos jerárquicos como no jerárquicos.
5. (1 punto) Conclusiones