Análisis y visualización de datos
Actividad 2
Situación
Una vez que se entregó la primera parte del informe, continua con la segunda
parte, enfocada en los aspectos demográficos y sociales. Los datos para esta
sección no están completamente listos para analizar, necesitan
preprocesamiento antes de poder construir los gráficos o tablas. Como sabe,
algunas de estas tareas son más prácticas y eficientes haciéndolas en Python
que manualmente (en Excel, por ejemplo).
Requerimientos
Para realizar esta actividad descargue los siguientes archivos:
Consignas
Como próximo paso, decide integrar distintas bases de datos que tiene
disponibles. Estas contienen variables demográficas: población, hogares y
viviendas, esperanza de vida y fecundidad.
1. En Jupyter, crear un nuevo notebook e importar las librerías
necesarias, y luego la base de proyecciones de población por año (en
formato .csv) y las otras (ej. expectativa de vida, fecundidad). Tener en
cuenta que algunas bases contienen datos de varios años y otras
tienen únicamente el año del censo 2010. Hacer los chequeos básicos
(head, describe, etc.).
2. Calcular un campo nuevo, densidad (población/superficie) y usar la
función descrita sobre ese campo nuevo.
3. Identificar si existe algún valor extremo en la densidad de población y
explicar a qué podría deberse esto.
El formato de entrega deberá realizarlo en un archivo PDF. Debe ser un
informe breve sobre una de las variables originales (por ejemplo, superficie),
con algunas medidas resumen (como percentiles, promedio, etc.).
Entrega
¡Llegaste al final de la actividad de este módulo! Recuerda guardar tus
respuestas y luego subirlas clicando en el botón "Enviar tarea".
Puedes consultar tus dudas con tus compañeros en el foro de la materia o
con tu tutor.