0% encontró este documento útil (0 votos)
73 vistas5 páginas

Laboratorio 1

Este documento presenta un laboratorio sobre estadística descriptiva que tiene como objetivos desarrollar habilidades para el análisis de datos usando R y argumentar soluciones a problemas basadas en el comportamiento de los datos. Incluye 14 problemas divididos en 3 bloques para clasificar y representar variables, analizar frecuencias, y realizar análisis descriptivos y comparaciones entre variables usando medidas estadísticas y gráficos. Los estudiantes deben analizar un conjunto de datos de pedidos de pizza usando técnicas estadísticas en R para responder

Cargado por

latincrow81
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
73 vistas5 páginas

Laboratorio 1

Este documento presenta un laboratorio sobre estadística descriptiva que tiene como objetivos desarrollar habilidades para el análisis de datos usando R y argumentar soluciones a problemas basadas en el comportamiento de los datos. Incluye 14 problemas divididos en 3 bloques para clasificar y representar variables, analizar frecuencias, y realizar análisis descriptivos y comparaciones entre variables usando medidas estadísticas y gráficos. Los estudiantes deben analizar un conjunto de datos de pedidos de pizza usando técnicas estadísticas en R para responder

Cargado por

latincrow81
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

LABORATORIO 1

Estadı́stica General
CMC0244
Tema: Estadı́stica descriptiva

1. Objetivos
Desarrollar habilidades para el manejo y análisis de datos a través del software R.

Argumentar soluciones a problemas propuestos a partir del comportamiento de los datos.


Ayudar a desarrollar un pensamiento que reconoce el elemento de la variabilidad.

2. Pregunta problematizadora:
Una base de datos aparentemente no contiene información alguna sobre el fenómeno que se está estudiando,
sin embargo algunas técnicas básicas, acompañada de las herramientas adecuadas nos permite sacar conclu-
siones muy valiosas sobre nuestro objeto de estudio. ¿Cuales son las técnicas que nos ayudará a entender
mejor el comportamiento de nuestra base de datos?

3. Resultados de aprendizaje:
Diferenciar variables categóricas de variables cuantitativas (discretas y continuas).
Analiza adecuadamente la información de variables cualitativas o categóricas.

Representa de manera tabular y gráfica (diagrama de barras, diagrama circular) variables categóricas.
Analiza adecuadamente la información de variables cuantitativas.
Representa de forma tabular y gráfica (histogramas, polı́gonos, diagrama de cajas) variables cuantita-
tivas.

Calcula e interpreta medidas de tendencia central (media, mediana, moda), medidas o ı́ndices de posi-
ción (percentiles, cuartiles) y medidas o ı́ndices numéricos de dispersión o volatilidad (rango, varianza,
desviación estándar, coeficiente de variación).

4. Recursos
Software R. RStudio o Rstudio Cloud (editores recomendados para trabajar con R).
5. Preguntas a responder por los estudiantes
Los datos en la data pizza delivery.csv corresponde a las observaciones de los domicilios de pizza que
realiza un restaurant italiano en la ciudad. Esta data contiene los pedidos del mes de mayo de 2014. El
pedido pasa por tres etapas, primero un operador central recibe el pedido y entrega la orden a un restaurant
que este cercano a la dirección del cliente. Uno de los cinco repartidores entrega la orden.
La data contiene:
day: El dı́a que se hizo el pedido.
date: La fecha en que se hizo el pedido.
time: Tiempo que demora la entrega.
operator: Operador que recibe la llamada dle cliente.
branch: La sucursal del restaurant.
driver: Repartidor.
temperature: La temperatura con la que fue entregada la pizza.
bill: La cuenta en euros (incluye bebidas, plato de pastas y postres)
pizzas: Número de pizzas.
free wine: Si tarda más de 40 minutos, entonces se les promete a los clientes una botella de vino
gratis.
got wine: ¿El repartidor lleva la botella de vino?
discount customer: ¿El cliente obtuvo un descuento?

Bloque 0
Problema 1.
Asigne a una variable x el vector (1,2,3,4).
Asigne a una variable y una secuencia de 1 a 10.
Asigne a una variable z una secuencia conteniendo solo los números pares de 1 a 10.
Asigne a una variable w un vector de ceros de largo 10.
En la tercera coordenada de la variable y cambie el 3 por un 1.

Problema 2.
Asigne la siguiente matriz a una variable x
 
1 2
3 4
 
5 6
7 8

Cambie en la matriz x el 5 por un 0.


Problema 3. Grafique las siguientes funciones entre 0 y 10.
x+1
x2 + 1
sen(x)

cos(x)
log(x)

Problema 4.

Cargue la data pizzadelivery.csv en una variable dat.


Aplique al data frame: str, dim, colnames, names, nrow, ncol, head y tail. ¿Qué información entre-
gan?
Transforme la temperature de grados Celsius a Fahrenheit

Filtre la información del conductor Domenico.


Determine los dı́as en que se pidieron más de 4 pizzas en un solo pedido.

Cierre: Los primeros tres problemas de este Bloque están diseñados para lograr familiaridad con el lenguaje
de programación R y el problema 4 apunta a tener una primera aproximación con la manipulación de bases
de datos.

Bloque 1
Problema 5. Clasifique las variables de la base de datos.
Problema 6. Realice un análisis de las frecuencias y construya gráficos de las variables cualitativas.
Problema 7. ¿Cual de los repartidores ha debido entregar más botella de vinos gratis? Realice gráficos y
analice frecuencias para fundamentar su respuesta.

Problema 8. ¿Cual es la sucursal que con mayor frecuencia ocurre lo siguiente: debiendo entregar una
botella de vino gratis, efectivamente la llevan? Realice gráficos y analice frecuencias para fundamentar su
respuesta.

Cierre: La clasificación de variables nos permite utilizar las herramientas de estadı́stica descriptiva co-
rrectamente para tener resultados cuya interpretación sea clara, por otro lado, el análisis de frecuencia es el
primer paso para conocer el comportamiento de nuestras variables. Los últimos dos problemas nos encami-
na a realizar un análisis bivariado de variables cualitativas, con el objetivo de descubrir posibles relaciones
existentes.

Bloque 2
Problema 9. Realice un análisis de las frecuencias de las variables cuantitativas. Utilice gráficos apropiados.
Problema 10. Compare las frecuencias de la temperatura por sucursal. ¿Qué conclusiones puede sacar de
esa comparación?
Problema 11. Cree un nueva variable que se llame fin de semana, en esa variable ponga un 1 si el dı́a en
day es viernes, sábado o domingo y 0 en otro caso.
Utilizando la variable fin de semana:

Compare la distribución del número de pizzas que se entregaron por pedido entre los fines de semana
y la semana.
Compare la distribución de la variable bill entre semana y fines de semana.

Cierre: Los problemas de este Bloque apuntan a entender el análisis básico de las frecuencias para variables
cuantitativas y creación de nuevas variables que nos ayuden a profundizar en el análisis exploratorio de una
base de datos.

Bloque 3
Problema 12. Realice un análisis descriptivo para las variables temperature, time.
Problema 13.
Considere la variable fin de semana que creamos en el taller pasado. ¿Existe diferencias en la variable
temperature entre los dı́as de semana y los fines de semana? ¿Existe diferencia en la variable time
entre los dı́as de semana y fines de semana?. Utilice frecuencias, medidas descriptivas, qq-plot y boxplot
para fundamentar sus conclusiones.
Considere la variable branch. ¿Existe diferencia en la variable time entre las diferentes sucursales?
¿Existe diferencia en la variable temperature entre las diferentes sucursales?. Utilice frecuencias, me-
didas descriptivas, qq-plot y boxplot para fundamentar sus conclusiones.

Problema 14. Considerando información que entregó el análisis anterior y basándose solo en tiempo de
entrega. ¿Cual de los repartidores tuvo un mejor desempeño durante el mes de mayo? Utilice frecuencias,
medidas descriptivas, qq-plot y boxplot para fundamentar sus conclusiones.

Cierre: Los problemas de este Bloque nos permite entender la importancia de las medidas descriptivas en
el análisis de una variable. Además, se resalta el uso de gráfico basados en medidas descriptivas de posición
para entender algunos aspectos distribucionales de las variables.
6. Condiciones de entrega:
1. Se deben incluir los nombres de los integrantes en el archivo entregable.
2. Solo se debe entregar UN ARCHIVO y este debe ser con extensión .rmd
3. Se debe marcar el archivo con nombre del profesor tallerista y el nombre y apellidos (ambos apellidos)
del autor de correspondencia (el estudiante encargado de subir el archivo a Interactiva Virtual).

También podría gustarte