0% encontró este documento útil (0 votos)
89 vistas2 páginas

Taller Rstudio: Manejo de Datos en Estadística

Este documento presenta las instrucciones para un taller sobre la extracción, transformación y carga de datos desde Rstudio. El taller incluye 11 temas sobre el uso de funciones en Rstudio y paquetes como "datos" para manipular y analizar datos de vuelos, aerolíneas, aeropuertos y clima contenidos en tablas precargadas. Los estudiantes deben desarrollar cada tema mostrando código y resultados y subir la resolución a la plataforma Canvas.

Cargado por

marcoruiztorres
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
89 vistas2 páginas

Taller Rstudio: Manejo de Datos en Estadística

Este documento presenta las instrucciones para un taller sobre la extracción, transformación y carga de datos desde Rstudio. El taller incluye 11 temas sobre el uso de funciones en Rstudio y paquetes como "datos" para manipular y analizar datos de vuelos, aerolíneas, aeropuertos y clima contenidos en tablas precargadas. Los estudiantes deben desarrollar cada tema mostrando código y resultados y subir la resolución a la plataforma Canvas.

Cargado por

marcoruiztorres
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

FACULTAD DE CIENCIAS NATURALES Y MATEMÁTICAS - MESAP

MAESTRÍA EN ESTADÍSTICA APLICADA/ MANEJO DE DATOS


Taller Unidad 4: Extracción Transformación y Carga de datos desde Rstudio.
Instrucciones del taller:
- El taller es una actividad que se realiza en un grupal, luego de los aportes y desarrollo,
cada integrante debe subir la resolución a la plataforma Canvas.
- Se desarrolla en Rstudio.
- En la resolución de cada tema, se debe presentar el código y los resultados generados.
En caso de no estar alguno de los elementos se penalizará con el 50% de la puntuación
del tema.

Temas del Taller:


Desde Rstudio

Recomendación: Comprenda la estructura de las tablas Customer (Cliente), rental (alquiler),


payment (pago por el alquiler) , inventory (inventario o disponibilidad) y film (DVD) sus
conexiones y datos.
Desde Rstudio:
1. Utilice el paquete “datos” en Rstudio, el cual incorpora algunos dataframe con datos
precargados.

Comprenda las relaciones entre las tablas de datos.


Escriba los comandos en Rstudio para referencie la librería “datos” y revisar las
estructuras de las tablas vuelos, aviones, aerolíneas, aeropuertos y clima.
Utilizando las funciones dplyr:
2. Prepara un reporte considerando las columnas fecha_hora, vuelo, aerolínea,
código_cola, origen, destino y tiempo de vuelo, de aquellos vuelos operados las

MANEJO DE DATOS – TALLER 4


FACULTAD DE CIENCIAS NATURALES Y MATEMÁTICAS - MESAP

aerolíneas “AA: American Airlines” Inc. o “B6: JetBlue Airways”, durante el mes de junio
del 2013. Ordene por fecha de forma cronológica. Muestre las 10 primeras filas.
3. Para cada código de aerolínea determine la cantidad de atrasos en la salida y tiempo
promedio de atraso en la salida en vuelos programados. Considere que atrasos en la
salida debe ser mayor a cero. Muestre las 10 primeras filas.
4. Determine en cada fecha de salida programada, cuantos vuelos se realizaron. Muestre
las 10 primeras filas.
5. Filtre los vuelos para mostrar únicamente los aviones que han realizado al menos cien
viajes. Muestre las 10 primeras filas.
6. Bajo el supuesto que siempre los aviones viajaran con su capacidad máxima de
pasajeros. Determine para cada código de aerolínea la totalidad de vuelos realizados y
cantidad pasajeros desplazados. Muestre las 10 primeras filas.
7. Para cada Aeropuerto (nombre), durante el 2013, determine la cantidad de vuelos que
han despegado. Ordene por cantidad de vuelos. Muestre las 10 primeras filas.
8. Si por cada minuto de atraso en la salida o en la llegada, se le penaliza a la aerolínea con
USD 35, determine para cada aerolínea (código de aerolínea) el monto total por
penalidad. Muestre las 10 primeras filas.
9. Considerando que un indicador importante para realizar los despegues es el nivel de
visibilidad, siendo este muy riesgoso cuando es menor o igual 6; determine los vuelos
que se realizaron bajo estas condiciones. Muestre solo los 10 primeros registros.
10. Considerando los datos de vuelos, elabore una tabla resumen a lo ancho con la siguiente
estructura:
Filas: Aerolíneas
Columnas: Meses
Celda: tiempo de vuelo acumulado.
11. Considerando los datos de vuelos, elabore una tabla resumen a lo acho con la siguiente
estructura:
Filas: Lugar de origen
Columnas: Lugar de destino
Celda: cantidad de vuelos realizados.

MANEJO DE DATOS – TALLER 4

También podría gustarte