Evaluación Sumativa Solemne I: Resolviendo problemas
con dplyr
Unidad 2: Limpieza y organización de datos en R
Asignatura: Tecnología para la gestión II
Evaluación Sumativa Solemne I: Resolviendo problemas con dplyr
Contenido(s):
• Manipulación de datos con dplyr.
• Lectura y escritura de archivos CSV con readr.
• Transformaciones de datos: selección, filtrado, ordenamiento, creación y renombrado de
columnas.
• Agrupamiento y resumen de datos.
• Aplicación de condicionales y uso de pipes (%>%).
Actividades:
El estudiante cargará una base de datos (qog_mod.csv) y aplicará funciones de dplyr para explorar y
transformar los datos. Deberá realizar operaciones como seleccionar columnas, filtrar por
condiciones, crear nuevas variables, renombrar columnas y calcular estadísticas agrupadas. También
exportará resultados a CSV y resolverá un ejercicio final de análisis encadenado mediante pipes.
Descripción de la actividad:
Esta Evaluación Sumativa Solemne I busca que el estudiante aplique las principales funciones del
paquete dplyr para resolver un conjunto de tareas relacionadas con el análisis de datos. A partir de
una base de datos de países, desarrollará un flujo de trabajo completo para preparar, transformar y
resumir información relevante sobre variables como corrupción, democracia y población.
Resultados de Aprendizaje:
El estudiante utiliza correctamente funciones de dplyr para manipular datos en R, demostrando
comprensión de las operaciones básicas de análisis y síntesis de información. Además, aplica
condicionales y agrupamientos de forma autónoma y genera salidas estructuradas útiles para el
análisis comparativo.
Carácter
Individual
Metodología
Aprendizaje basado en problemas (ABP): propone problemáticas reales, a través de las cuales los
estudiantes analizan diferentes escenarios posibles, aplicando los conceptos y conocimientos. Se
fomenta el razonamiento y juicio crítico.
Recursos complementarios:
Recursos revisados a lo largo de las Unidades 1 y 2.
Duración
3 horas
Evaluación
Se utilizará una rúbrica analítica, que consiste en un instrumento estructurado con criterios
específicos de evaluación y niveles de desempeño. Cada criterio será valorado según el grado de
cumplimiento demostrado por el estudiante, permitiendo una retroalimentación más detallada y
formativa sobre su desempeño.
Esta evaluación presenta características como:
Talleres Prácticos:
Realizar tareas prácticas relacionadas con el tema del taller, como la programación, la construcción, la
escritura, etc.
Estudio de Caso:
Analizar situaciones reales o hipotéticas para aplicar conocimientos teóricos en un contexto práctico.
Simulaciones:
Crear escenarios en los que los participantes deben actuar o tomar decisiones, imitando situaciones
reales.
Instrucciones:
Para el desarrollo de esta Evaluación Sumativa Solemne I, descarga el documento en formato .R
(haciendo clic desde aquí Solemne I) o lee en este mismo documento las consignas que deberás seguir
para completar la actividad:
1. Instalación y carga de librerías
a) Si no tienes instalado `tidyverse`, instálalo con: install.packages("tidyverse")
b) Cargar las librerías necesarias:
library(dplyr)
library(readr)
2. Cargar la base de datos "qog_mod.csv"
datos <- read_csv("qog_mod.csv")
3. Mostrar las primeras 6 filas de la base de datos.
4. Seleccionar solo las columnas "cname", "wdi_gdppppcon2011" y "ti_cpi".
5. Filtrar los países con un índice de percepción de la corrupción (ti_cpi) menor a 30.
6. Ordenar los países por PIB per cápita (`wdi_gdppppcon2011`) de mayor a menor.
7. Crear una nueva columna llamada "corrupcion_alta" que indique "Sí" si `ti_cpi` es menor a 30
y "No" en caso contrario.
8. Renombrar la columna "fh_ipolity2" como "indice_democracia".
9. Agrupar los datos por "region" y calcular el promedio de "indice_democracia" por región.
10. Guardar el resultado del ejercicio 9 en un archivo CSV llamado "democracia_por_region.csv".
11. Ejercicio final: análisis avanzado usando `dplyr`. Utilizando pipes (`%>%`), realiza los siguientes
pasos en un solo código:
a) Seleccionar las columnas "cname", "region", "wdi_pop" y "ti_cpi".
b) Crear una nueva columna "corrupcion_alta" que indique "Sí" si `ti_cpi` es menor a 30 y
"No" en caso contrario.
c) Filtrar los países con más de 50 millones de habitantes (`wdi_pop`).
d) Ordenar los datos en orden ascendente según "ti_cpi".
e) Agrupar por "region" y calcular el número de países con alta corrupción en cada región.
f) Mostrar el resultado final.