Ejercicios de estadstica
INSTRUCCIONES:
Elija la metodologa adecuada segn el problema planteado. Se debe utilizar software
estadstico en el caso en que la metodologa elegida se encuentre implementada.
1. Visa Card USA estudi la frecuencia con que los consumidores de diversos rangos de edades
usan tarjetas plsticas (de crdito o de dbito) al pagar sus compras (Associated Press, 16 de
enero de 2006). A continuacin se presentan los datos muestrales de 300 clientes divididos en
cuatro grupos de edades
Grupo de edad
Forma de pago
18-24
25-34
35-44
45 y ms
Plstico
21
27
27
36
Efectivo o cheque
21
36
42
90
Tabla - 1
Pruebe la independencia entre el mtodo de pago y el grupo de edad. Cul es el valor p?
Usando un nivel de significancia del 0.05 Cul es su conclusin?
Respuesta:
Ho: La forma de pago y el grupo edad de la Tabla - 1 son independientes.
Ha: La forma de pago y el grupo edad de la Tabla - 1 no son independientes.
Usando Minitab, segn el texto "Estadstica para Negocios y economa" por Anderson,
Sweeney, y Williams (libro utilizado en clase por la profesora), se ingresan los valores de la
Tabla - 1, y se hace clic sobre el men Prueba Chi-cuadrada (tabla de dos factores en hoja de
trabajo)..., como se indica en la Fig. 1
Fig. 1
Desde el men Enviar seccin a Microsoft Word, Fig. 2, se obtiene los resultados que
se indican abajo.
Fig. 2
Prueba Chi-cuadrada: 18-24; 25-34; 35-44; 45 y ms
Los conteos esperados se imprimen debajo de los conteos observados
Las contribuciones Chi-cuadradas se imprimen debajo de los conteos esperados
18-24
21
15,54
1,918
25-34
27
23,31
0,584
35-44
27
25,53
0,085
45 y ms
36
46,62
2,419
Total
111
21
26,46
1,127
36
39,69
0,343
42
43,47
0,050
90
79,38
1,421
189
Total
42
63
69
126
300
Chi-cuadrada = 7,947; GL = 3; Valor P = 0,047
En donde: 1 se refiere a la forma de pago Plstico y 2 a la forma de pago Efectivo o cheque.
El Valor p, como se indica en los resultados es de 0,047.
Conclusin: Usando un nivel de significancia del 0,05, se observa que el Valor p (de 0,047) no
supera este nivel, por lo tanto se rechaza la hiptesis nula Ho.
2 . El nmero de llamadas telefnicas que llegan por minuto al conmutador de una empresa
tiene una distribucin de Poisson. Use un nivel de significancia del 10% y los siguientes datos
para probar esta suposicin
Nmero de llamadas por minutos
Frecuencia observada
15
31
20
15
13
Respuesta:
Ho: El nmero de llamadas telefnicas que llegan por minuto al conmutador tiene una
distribucin Poisson.
Ha: El nmero de llamadas telefnicas que llegan por minuto al conmutador no tiene una
distribucin Poisson.
= 0,1
Con esta informacin se construye la siguiente tabla, baso en el mtodo de prueba de bondad
y ajuste de la distribucin de Poisson(ampliar para mejor visibilidad):
Nmero de llamadas por
minutos
Frecuencia observada
0
1
2
3
4
5
6
15
31
20
15
13
4
2
7 o ms
Total
Numero
esperado de
2 minutos
numero de
Cuadrado de
con x
llamadas por
la
Freecuencia
frecuencia probabilidad llamadas(100 Observada(fi Frecuencia diferencia(fif(x)
observada
ei)^2
)
de poisson
esperada(ei)
2,15
13,53
15
13,53
0,1353
0
15,47
31
27,07
27,07
0,2707
31
49,94
27,07
20
27,07
0,2707
40
9,27
18,04
15
18,04
0,1804
45
15,82
9,02
13
9,02
0,0902
52
0,54
5,27
6
3,61
0,0361
20
1,20
0,0120
12
0,45
0,0045
chicuadrado
4,95
200
100
2
2,718281828
0,9955
100,00
100
Cuadrado de
la diferencia
dividido entre
la frecuencia
espererada
0,16
0,57
1,85
0,51
1,75
0,10
100,0000
grados de
libertad
4,00
pvalor
0,2929
Conclusiones:
Dado que el p-valor (0,2929) es mayor que (0,1) se concluye que no se rechaza la hiptesis
nula Ho, es decir, que el nmero de llamadas telefnicas que llegan por minuto al conmutador
tiene una distribucin Poisson.
3. Las siguientes son las calificaciones en los exmenes finales en un curso universitario
55
85
72
99
48
71
88
70
59
98
80
74
93
85
74
82
90
71
83
80
60
95
77
84
73
63
72
95
79
51
85
76
81
78
65
75
87
86
70
64
Use un nivel de significancia del 5% y realice una prueba para determinar si se debe rechazar
que una distribucin normal sea representativa de la distribucin poblacional de estas
calificaciones.
Respuesta:
Se utiliza la herramienta SSPS, y existen dos formas de acceso para ello. Ambos se refieren al
procedimiento Prueba de Kolmogorov-Smirnov para una muestra compara la funcin de
distribucin acumulada observada de una variable con una distribucin terica determinada,
que puede ser la normal, la uniforme, la de Poisson o la exponencial. La Z de KolmogorovSmirnov se calcula a partir de la diferencia mayor (en valor absoluto) entre las funciones de
distribucin acumuladas terica y observada. Esta prueba de bondad de ajuste contrasta si las
observaciones podran razonablemente proceder de la distribucin especificada.
A continuacin se muestra primera la secuencia de acceso a esta prueba (cuadros de dilogos
antiguos).
Fig. 3
En la siguiente imagen se muestra la segunda secuencia de acceso a este mtodo, y es el ms
moderno:
Fig. 3
Esta secuencia lleva a las siguientes ventanas:
Fig. 4
Fig. 5
Fig. 6
Los resultados obtenidos de esta prueba son los siguientes.
NPAR TESTS
/K-S(NORMAL)=Calificaciones
/STATISTICS DESCRIPTIVES QUARTILES
/MISSING ANALYSIS.
Pruebas no paramtricas
Notas
Resultados creados
26-MAY-2012 20:42:55
Comentarios
Entrada
Conjunto de datos activo
Conjunto_de_datos0
Filtro
<ninguno>
Peso
<ninguno>
Dividir archivo
<ninguno>
Nm. de filas del archivo de
40
trabajo
Los valores perdidos
Definicin de los perdidos
definidos por el usuario ser
tratados como perdidos.
Manipulacin de los valores
Los estadsticos para cada
perdidos
prueba se basan en todos
Casos utilizados
los casos con datos vlidos
para las variables usadas en
dicha prueba.
NPAR TESTS
/KS(NORMAL)=Calificaciones
Sintaxis
/STATISTICS
DESCRIPTIVES
QUARTILES
/MISSING ANALYSIS.
Recursos
Tiempo de procesador
00:00:00,02
Tiempo transcurrido
00:00:00,02
Nmero de casos
196608
permitidosa
a. Basado en la disponibilidad de memoria en el espacio de trabajo.
[Conjunto_de_datos0]
Estadsticos descriptivos
N
Media
Desviacin
Mnimo
Mximo
tpica
Percentile
s
25
Calificaciones
40
76,8250
12,42596
48,00
99,00
70,2500
Estadsticos descriptivos
Percentiles
50 (Mediana)
Calificaciones
77,5000
Prueba de Kolmogorov-Smirnov para una muestra
Calificaciones
N
40
Media
76,8250
Parmetros normalesa,b
Desviacin tpica
Diferencias ms extremas
75
12,42596
Absoluta
,091
Positiva
,037
Negativa
-,091
85,0000
Z de Kolmogorov-Smirnov
,578
Sig. asintt. (bilateral)
,892
a. La distribucin de contraste es la Normal.
b. Se han calculado a partir de los datos.
*Nonparametric Tests: One Sample.
NPTESTS
/ONESAMPLE TEST (Calificaciones) KOLMOGOROV_SMIRNOV(NORMAL=SAMPLE )
/MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE
/CRITERIA ALPHA=0.05 CILEVEL=95.
Pruebas no paramtricas
Notas
Resultados creados
26-MAY-2012 20:51:26
Comentarios
Conjunto de datos activo
Conjunto_de_datos0
Filtro
<ninguno>
Peso
<ninguno>
Dividir archivo
<ninguno>
Entrada
Nm. de filas del archivo de
40
trabajo
NPTESTS
/ONESAMPLE TEST
(Calificaciones)
KOLMOGOROV_SMIRNOV(
NORMAL=SAMPLE )
Sintaxis
/MISSING
SCOPE=ANALYSIS
USERMISSING=EXCLUDE
/CRITERIA ALPHA=0.05
CILEVEL=95.
Tiempo de procesador
00:00:00,53
Tiempo transcurrido
00:00:00,85
Recursos
[Conjunto_de_datos0]
Fig. 7
Conclusin:
Los datos suministrados se aproximan a una distribucin normal dentro de un nivel de
significancia del 5%.
4. Con objeto de determinar su efecto en el rendimiento de la gasolina en millas por galn en
los automviles de pasajeros, se prueban dos aditivos para gasolina. A continuacin aparecen
los resultados de esta prueba en 12 automviles; en cada automvil se probaron los dos
aditivos. Use un nivel de significancia del 5% y la prueba de los rangos con signo de Wilcoxon
para determinar si existe una diferencia significativa entre estos dos aditivos
Automvil
10
11
12
Aditivo 1
20.12
23.56
22.03
19.15
21.23
24.77
16.16
18.55
21.87
24.23
23.21
25.02
Aditivo 2
18.05
21.77
22.57
17.06
21.22
23.80
17.20
14.98
20.03
21.15
22.78
23.70
Respuesta:
Antes de realizar la prueba de los rangos con signo de Wilcoxon se observa la distribucin de
los datos para verificar si existe algn tipo de simetra, ya que la prueba asume este tipo de
relacin entre los datos. Se ha creado un grfico con estos datos, Fig. 8 , y efectivamente
podemos asumir que existe simetra entre los mismos, no siendo sesgadas.
Fig. 8
Otro punto que debe tomarse en cuenta es que la prueba se presenta como alternativa a la t
de Student cuando el supuesto de normalidad no es asumible, que es lo que se observa en la
Fig. 9.
Automvil
Aditivo 1
Aditivo 2
Diferencia
Diferencia Absoluta
20,12
18,05
2,07
2,07
23,56
21,77
1,79
1,79
22,03
22,57
-0,54
0,54
19,15
17,06
2,09
2,09
21,23
21,22
0,01
0,01
24,77
23,8
0,97
0,97
16,16
17,2
-1,04
1,04
18,55
14,98
3,57
3,57
21,87
20,03
1,84
1,84
10
24,23
21,15
3,08
3,08
11
23,21
22,78
0,43
0,43
12
25,02
23,7
1,32
1,32
Tabla - 2
A simple vista (ver tabla 1), se puede observar que el rendimiento del automvil con el Aditivo
1 es mejor que el del Aditivo 2, excepto por los automviles 3 y 7.
En particular, se usar la prueba de rangos con signo de Wilcoxon para la diferencia entre la
mediana de los rendimientos para los dos aditivos usados en las pruebas los 12 automviles.
Las hiptesis son las siguientes, para un nivel de significancia del 5%.
Ho: Existe una diferencia significativa entre las medianas de los rendimientos producidos por
los dos aditivos.
Ha: No existe una diferencia significativa entre las medianas de los rendimientos producidos
por los dos aditivos.
Usando SPSS, se siguen los siguientes pasos:
Fig. 9
Fig. 10
Fig. 11
Los primeros resultados que nos devuelve SPSS, son los siguientes:
*Nonparametric Tests: Related Samples.
NPTESTS
/RELATED TEST(Aditivo1 Aditivo2) WILCOXON
/MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE
/CRITERIA ALPHA=0.05 CILEVEL=95.
Pruebas no paramtricas
Notas
Resultados creados
Comentarios
27-MAY-2012 08:41:15
Entrada
Conjunto de datos activo
Conjunto_de_datos0
Filtro
<ninguno>
Peso
<ninguno>
Dividir archivo
<ninguno>
Nm. de filas del archivo de
12
trabajo
NPTESTS
/RELATED TEST(Aditivo1
Aditivo2) WILCOXON
Sintaxis
/MISSING SCOPE=ANALYSIS
USERMISSING=EXCLUDE
/CRITERIA ALPHA=0.05
CILEVEL=95.
Tiempo de procesador
00:00:00,25
Tiempo transcurrido
00:00:00,24
Recursos
[Conjunto_de_datos0]
Ntese que SPSS rechaza la hiptesis nula de que la diferencia entre ambos
redimientos es cero. Por lo que SSPS considera como hiptesis nula, lo que para la
respuesta de este ejercicio es la hiptesis alterna.
Para observar los resultados con ms detalle, SSPS nos da los siguientes resultados:
[Conjunto_de_datos0]
Estadsticos descriptivos
N
Media
Desviacin
Mnimo
Mximo
Percentiles
tpica
25
50 (Mediana)
75
Aditivo1
12
21,6583
2,73926
16,16
25,02
19,3925
21,9500
24,0625
Aditivo2
12
20,3592
2,89744
14,98
23,80
17,4125
21,1850
22,7275
Rangos
N
Rango promedio Suma de rangos
Rangos negativos
10a
7,00
70,00
Rangos positivos
2b
4,00
8,00
Empates
0c
Total
12
aditivo2 - aditivo1
a. aditivo2 < aditivo1
b. aditivo2 > aditivo1
c. aditivo2 = aditivo1
Estadsticos de contrastea
aditivo2 aditivo1
Z
-2,432b
Sig. asintt. (bilateral)
,015
Sig. exacta (bilateral)
,012
Sig. exacta (unilateral)
,006
Probabilidad en el punto
,001
a. Prueba de los rangos con signo de Wilcoxon
b. Basado en los rangos positivos.
Conclusin:
Como el P-valor es 0,012 (ver resultados en rojo, pgina anterior) y el nivel de significancia es de
5%(0,05) , es decir que 0,012< 0,05, entonces nos quedamos con la hiptesis que indica que no hay
diferencia significativa entre el rendimiento de los dos aditivos. Para SPSS, sta es la hiptesis
alternativa, para la respuesta de este ejercicio es la hiptesis nula, Ho.