Tarea: Análisis de Datos con Python usando Datos Abiertos de Colombia
Curso: Introducción a Python
Objetivo:
El objetivo de esta tarea es que los estudiantes desarrollen habilidades prácticas en
el manejo de bases de datos, la generación de visualizaciones y el análisis de datos
utilizando Python. Para ello, se trabajará con datos reales obtenidos de la plataforma
de Datos Abiertos de Colombia.
Instrucciones:
1. Selección de la base de datos:
○ Visite la página de Datos Abiertos de Colombia.
○ Explore las diferentes bases de datos disponibles y seleccione un tema
de interés (por ejemplo, educación, salud, medio ambiente, transporte,
etc.).
○ Descargue la base de datos en un formato compatible con Python
(CSV, Excel, etc.).
2. Carga de la base de datos en Python:
○ Utilice Python para cargar la base de datos descargada.
○ Asegúrese de manejar correctamente los datos (por ejemplo, limpieza
de datos, manejo de valores nulos, etc.).
3. Generación de gráficas:
○ Genere al menos 10 gráficas de diferentes tipos que permitan analizar
las cifras de la base de datos. Los tipos de gráficas deben incluir, entre
otros:
■ Diagramas de barras.
■ Diagramas de torta (pie charts).
■ Gráficas de dispersión (scatter plots).
■ Histogramas.
■ Gráficas de líneas.
○ Asegúrese de que cada gráfica tenga un título descriptivo, etiquetas en
los ejes y una leyenda (si es necesario).
4. Personalización de gráficas:
○ Modifique los colores de las gráficas para mejorar su claridad y
estética.
○ Utilice diferentes paletas de colores o colores personalizados según
sea necesario.
Evaluación:
La evaluación de la tarea consistirá en responder 5 preguntas relacionadas con el
código implementado. Las preguntas se enfocarán en:
1. Explicación de las líneas de código para cargar la base de datos:
○ ¿Cómo se cargó la base de datos en Python?
○ ¿Qué bibliotecas se utilizaron y por qué?
2. Explicación de las líneas de código para generar las gráficas:
○ ¿Cómo se generaron las gráficas?
○ ¿Qué parámetros se utilizaron para personalizar las gráficas?
3. Explicación de las funciones utilizadas para generar las gráficas:
○ ¿Qué funciones de Python se utilizaron para crear las gráficas?
○ ¿Cómo funcionan estas funciones?
4. Explicación de las líneas de código para cambiar los colores en las gráficas:
○ ¿Cómo se modificaron los colores de las gráficas?
○ ¿Qué impacto tiene la elección de colores en la interpretación de los
datos?
Formato de entrega:
● Archivo de Python:
○ El archivo debe contener todo el código utilizado para cargar la base de
datos, generar las gráficas y personalizarlas.
○ El archivo debe estar correctamente comentado para facilitar su
comprensión.
● Fecha y hora de entrega:
○ La tarea debe cargarse en la plataforma antes del viernes 7 de marzo a
las 2:00 p.m.
○ Se recomienda llegar 5 minutos antes de la clase para asegurar la
entrega a tiempo.
Recomendaciones:
● Utilice bibliotecas como Pandas para el manejo de datos y Matplotlib para la
generación de gráficas.
● Revise la documentación oficial de las bibliotecas para explorar opciones
adicionales de personalización.
● Practique el código antes de la entrega para asegurarse de que funcione
correctamente.