Periodo NRC Estudiante Fecha
202050 Lino Suquilanda Bryan Alberto 2020-dic-13
Actividad de aprendizaje: Deber 1.1
Tema: Variables aleatorias, Medidas descriptivas y gráficos
Objetivos: Documentos guía:
Identificar las variables y sus tipos, así como - Semana 1: Estadística Descriptiva
su representación en tablas y gráficos. - Laboratorio 1_Excel
Valoración: Ponderación: Formato de entrega:
20 puntos 10% Formato pdf
Ejercic ios del deber :
- Ejercicios 1.1 al 1.5 (papel, esferos, calculadora)
- Ejercicios 1.17, 1.18 (Excel)
- Ejercicio 1.21 ((papel, esferos, calculadora, pero en los literales de media, desviación
estándar, coeficiente de asimetría, curtosis, tabla de frecuencia, hacerlo en Excel)
- Ejercicio 1.22 (Excel)
- Ejercicio 1.23 (En la interfaz R-Studio para R)
Enunc iados :
1.1. ¿Cuál es la diferencia entre población y muestra?
La población es el conjunto de elementos o unidades de observación que tienen
características comunes y que son objeto de estudio.
La muestra es una parte representativa de la población, que ha sido seleccionada para
el análisis.
Resulta conveniente estudiar una muestra cuando el tamaño de la población es
relativamente grande
1.2. Explique la diferencia entre variables cualitativas y cuantitativas
Las variables cualitativas son aquellas que no son susceptibles de medición, solo toman
atributos o cualidades.
Las variables cuantitativas, son susceptibles de medición, es decir toma valores
numéricos.
Cabe recalcar que sus gráficos estadisticos son diferentes también.
1.3. Explique la diferencia entre variables discretas y continuas
Una variable es discreta si toma un número finito de valores
Una variable continua si toma un número infinito de valores
Periodo NRC Estudiante Fecha
202050 Lino Suquilanda Bryan Alberto 2020-dic-13
1.4. En las siguientes variables identifique, su tipo y el nivel de medida
Variable Tipo Nivel de medida
a. Número de grietas superficiales Discreta Razón
b. Estado civil Cualitativas Nominal
c. Peso [Kg] Continua Intervalo
d. Ingresos mensuales ($) Continua Intervalo
e. Número de mascotas en casa Discreta Razon
f. Distancia para llegar a casa. Continua Intervalo
g. Nivel en la carrera Cualitativa Ordinal
h. Temperatura (°C) Continua Intervalo
i. Resistencia () Continua Intervalo
j. Velocidad (km/h) Continua Intervalo
1.5. Identifique el tipo de pregunta: abierta, cerrada o mixta.
Pregunta Tipo Codificación – Respuesta
a. ¿Realiza actividad física durante Cerrada 1. Si 2. No
la cuarentena?
b. ¿Por qué escogió PAFDE? Abierta ...........................................
c. ¿Cuál es su género? Cerrada 1. Femenino 2. Masculino
d. ¿Está de acuerdo con quedarse en Abierta 1. Si 2. No
casa durante la pandemia? ¿Por qué?.......................................
e. Número de chips defectuosos Abierta ........
f. ¿Cuál es el ingreso de sus padres? Abierta $........
g. ¿Cuál es el nivel de estrés que ha Cerrada 1. Bajo 2. Medio 3. Alto
sentido durante la cuarentena?
h. ¿Qué medidas de aseo ha tomado Cerrada 1. Gel en manos 2. Alcohol al ingresar a
casa 3. Lavado de manos 4. Otros
durante la cuarentena?
1.17. Complete y analice la variable X= Número de Alumnos. Graficar (x,ni)
Asignatura Número de alumnos (ni) fi= ni/n Ni Fi %
CCAA 1200 0.515 1200 0.515 51.5
GEOGRÁFICA 80 0.034 1280 0.549 3.4
Periodo NRC Estudiante Fecha
202050 Lino Suquilanda Bryan Alberto 2020-dic-13
SISTEMAS 1050 0.450 2330 1 45
TOTAL: 2330 1
1.18. Complete y analice la variable X= Número de hijos por familia. Graficar (x,fi)
Numero de hijos ni fi Ni Fi %
0 2 0,06061 2 0,06061 6,061
1 4 0,12121 6 0,18182 12,121
2 7 0,21212 13 0,39394 21,212
3 10 0,30303 23 0,69697 30,303
4 6 0,18182 29 0,87879 18,182
5 o más 4 0,12121 33 1 12,121
Total 33 1,0 100
Periodo NRC Estudiante Fecha
202050 Lino Suquilanda Bryan Alberto 2020-dic-13
0,35000
0,30303
0,30000
0,25000
0,21212
0,20000 0,18182
fi
0,15000 0,12121 0,12121
0,10000
0,06061
0,05000
0,00000
0 1 2 3 4 5 o más
X
1.21. Ejercicio 42, capítulo 2 del texto “Estadística para Administración y Economía”,
Mason/Lind/Marchal. Supuestamente un cereal para desayuno incluye 200 pasas
en cada caja. Una muestra de 60 cajas, el día de ayer, mostró el siguiente número
de pasas en cada caja. (Ejercicio 42, Cap. 2 “Estadística para Administración y
Economía”, Mason/Lind/Marchal). Analice los datos de las videocámaras a través
de una distribución de frecuencias.
191 195 196 198 198 199 200 200 200 201 202 203 204 205 206
193 195 197 198 199 199 200 200 201 202 202 203 204 205 206
193 196 197 198 199 200 200 200 201 202 202 204 205 206 206
193 196 197 198 199 200 200 200 201 202 203 204 205 206 207
Periodo NRC Estudiante Fecha
202050 Lino Suquilanda Bryan Alberto 2020-dic-13
Muestra de cajas
Media 200,37
Error típico 0,48
Mediana 200,00
Moda 200,00
Desviación estándar 3,72
Varianza de la muestra 13,86
Curtosis -0,27
Coeficiente de asimetría -0,31
Rango 16,00
Mínimo 191,00
Máximo 207,00
Suma 12022,00
Cuenta 60,00
Clases o intervalos: ]Li, Ls] o Li<X<=Ls
Li Ls Frec.Abs.(ni)
191 1
191 193,285714 3
193,285714 195,571429 2
195,571429 197,857143 6
197,857143 200,142857 21
200,142857 202,428571 10
202,428571 204,714286 7
204,714286 y mayor... 10
Periodo NRC Estudiante Fecha
202050 Lino Suquilanda Bryan Alberto 2020-dic-13
1.22. Ejercicio. Prob. Y Estadística aplicada a la Ing., Douglas Montgomery, George
RungerCap.1, Ejerc. 1.7. Un artículo publicado en Tecnnometrics (Vol. 19, 1977,
pág. 425) presenta los datos siguientes sobre el octanaje de varias mezclas de
gasolina.
83,4 87,7 88,5 89,3 89,9 90,5 91,1 91,8 92,7 94,2
84,3 87,8 88,6 89,6 90,0 90,6 91,1 92,2 92,7 94,4
84,3 87,9 88,7 89,7 90,1 90,7 91,2 92,2 93,0 94,7
86,7 88,2 88,9 89,8 90,1 90,8 91,2 92,3 93,2 96,1
86,7 88,3 88,9 89,8 90,3 90,9 91,5 92,3 93,3 96,5
86,7 88,3 89,0 89,8 90,4 91,0 91,5 92,6 93,3 98,8
87,4 88,3 89,2 89,9 90,4 91,0 91,6 92,7 93,4 98,8
87,5 88,4 89,2 89,9 90,4 91,0 91,6 92,7 93,7 100,3
87,6 88,5
Realice lo siguiente:
a. Diagrama de tallo y hojas
tallos hojas
8 3,4 4,3 4,3 6,7 6,7 6,7 7,4 7,5 7,6 7,7 7,8 7,9 8,2 8,3 8,3 8,3 8,4 8,5 8,5 8,6 8,7 8,9
9 0 0,1 0,1 0,3 0,4 0,4 0,4 0,5 0,6 0,7 0,8 0,9 1 1 1 1,1 1,1 1,2 1,2 1,5 1,5 1,6
10 0,3
b. Diagrama de caja
Periodo NRC Estudiante Fecha
202050 Lino Suquilanda Bryan Alberto 2020-dic-13
c. Tabla de distribución de frecuencias
Li Ls Frecuencia
84,3 2
84,3 86,078 0
86,078 87,856 8
87,856 89,633 17
89,633 91,411 26
91,411 93,189 15
93,189 94,967 8
94,967 96,744 2
96,744 98,522 0
98,522 y mayor... 3
d. Histograma de frecuencias
Histograma de frecuencias del
octanajane
30
25
FRECUENCIA
20
15
10
5
0
CLASE
Periodo NRC Estudiante Fecha
202050 Lino Suquilanda Bryan Alberto 2020-dic-13
e. Resumen de todas las medidas descriptivas
Octanajes
Media 90,65
Error típico 0,33
Mediana 90,4
Moda 92,7
Desviación estándar 2,97
Varianza de la muestra 8,81
Curtosis 1,69
Coeficiente de asimetría 0,63
Rango 16,9
Mínimo 83,4
Máximo 100,3
Suma 7433,6
Cuenta 82
Coeficiente de Variación 0,03
Medidas de posición
Percentil 5% 86,7
Percentil 95% 96,03
1.23. Con los datos de la Resistencia de 100 bobinas (Ohmios
32,7 33,1 33,2 33,3 33,4 33,5 33,5 33,6 33,7 33,8
32,8 33,1 33,2 33,3 33,4 33,5 33,5 33,6 33,7 33,9
32,9 33,1 33,2 33,3 33,4 33,5 33,5 33,6 33,7 33,9
32,9 33,1 33,2 33,3 33,4 33,5 33,5 33,6 33,7 33,9
32,9 33,1 33,2 33,3 33,4 33,5 33,6 33,6 33,7 33,9
33,0 33,1 33,2 33,3 33,4 33,5 33,6 33,6 33,8 34,0
33,0 33,1 33,2 33,3 33,4 33,5 33,6 33,6 33,8 34,0
33,0 33,1 33,2 33,3 33,4 33,5 33,6 33,7 33,8 34,1
33,0 33,1 33,3 33,4 33,4 33,5 33,6 33,7 33,8 34,1
33,0 33,2 33,3 33,4 33,4 33,5 33,6 33,7 33,8 34,4
Realice lo siguiente:
a. Diagrama de tallo y hojas
b. Diagrama de caja
c. Tabla de distribución de frecuencias
d. Histograma de frecuencias
e. Resumen de todas las medidas descriptivas
Periodo NRC Estudiante Fecha
202050 Lino Suquilanda Bryan Alberto 2020-dic-13
Deber
Alberto Lino
12/12/2020
resistencia<-rep(c(32.7,32.8,32.9,33,33.1,33.2,33.3,33.4,33.5,33.6,33.7,33.8,
33.9,34,34.1,34.4),c(1,1,3,5,9,9,10,12,14,13,8,6,4,2,2,1))
class(resistencia)
## [1] "numeric"
View(resistencia)
a. Diagrama de tallo y hojas
stem(resistencia,scale = 1, width = 80, atom = 1e-08)
##
## The decimal point is 1 digit(s) to the left of the |
##
## 326 | 0
## 328 | 0000
## 330 | 00000000000000
## 332 | 0000000000000000000
## 334 | 00000000000000000000000000
## 336 | 000000000000000000000
## 338 | 0000000000
## 340 | 0000
## 342 |
## 344 | 0
b. Diagrama de caja
boxplot(resistencia)
Periodo NRC Estudiante Fecha
202050 Lino Suquilanda Bryan Alberto 2020-dic-13
c. Tabla de distribución de frecuencias
table(resistencia)
## resistencia
## 32.7 32.8 32.9 33 33.1 33.2 33.3 33.4 33.5 33.6 33.7 33.8 33.9 34 34.1
34.4
## 1 1 3 5 9 9 10 12 14 13 8 6 4 2 2
1
d. Histograma de frecuencias
hist(resistencia)
e. Resumen de todas las medidas descriptivas
1.TENDENCIA CENTRAL
1.1 Media
mean(resistencia)
## [1] 33.441
1.2 Mediana
median(resistencia)
## [1] 33.45
Periodo NRC Estudiante Fecha
202050 Lino Suquilanda Bryan Alberto 2020-dic-13
1.3 Moda
library(modeest)
library(raster)
## Loading required package: sp
library(moments)
##
## Attaching package: 'moments'
## The following object is masked from 'package:modeest':
##
## skewness
mfv(resistencia)
## [1] 33.5
2.DISPERSION 2.1 Rango
range(resistencia)
## [1] 32.7 34.4
max(resistencia)-min(resistencia)
## [1] 1.7
2.2 Varianza
var(resistencia)
## [1] 0.09638283
2.3 Desviación Estandar
sd(resistencia)
## [1] 0.3104558
2.4 Coeficiente de variación
cv(resistencia)
## [1] 0.9283689
3.POSICION 3.1 Cuartiles
quantile(resistencia)
## 0% 25% 50% 75% 100%
## 32.70 33.20 33.45 33.60 34.40
3.2 Deciles
Periodo NRC Estudiante Fecha
202050 Lino Suquilanda Bryan Alberto 2020-dic-13
quantile(resistencia,seq(0,1,.1))
## 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
## 32.70 33.09 33.20 33.30 33.40 33.45 33.50 33.60 33.70 33.80 34.40
3.3 Percentiles
quantile(resistencia,c(.5,.7,.9))
## 50% 70% 90%
## 33.45 33.60 33.80
4.FORMA
4.1 Sesgo
library(e1071)
##
## Attaching package: 'e1071'
## The following objects are masked from 'package:moments':
##
## kurtosis, moment, skewness
## The following object is masked from 'package:raster':
##
## interpolate
## The following object is masked from 'package:modeest':
##
## skewness
skewness(resistencia)
## [1] 0.1926484
4.2 Curtosis
kurtosis(resistencia)
## [1] 0.02749776
Bibliografía
Montgomery D., y Runger G., (2003). Probabilidades y Estadística aplicadas a la Ingeniería.
Segunda Edición. Imusa.
Lind D., Marchal W., Wathen S., (2012). Estadística Aplicada A Los Negocios y La Economía.
Décimo quinta Edición. McGraw-Hill/Interamericana Editores.