Análisis Estadístico: Comparaciones y Pruebas
Análisis Estadístico: Comparaciones y Pruebas
El participante logrará conocer los procesos y herramientas necesarias de la etapa Analizar de la metodología.
Etapa ANALIZAR
El objetivo de la etapa Analizar es dar sentido a los datos recolectados durante los pasos de la etapa Medir y
establecer la relación causa -efecto que produce los defectos, retrasos, etc.
Contenidos Unidad 3:
1. Comparaciones
1. Comparaciones
Pruebas estadísticas
Discreta
Discreta
Continua
Continua
medias y Múltiple
Simple Prueba de
medianas medianas
Múltiples Ys
Análisis multivari
(Nota: No es lo mismo que gráficas Multi-Vari)
Ejemplo de 1 nivel
Comparando 30 llamadas de Bob contra una especificación
Ejemplo de 2 niveles
Comparando 30 llamadas de Bob vs. Jane
Ejemplo de 3 niveles
Comparando 30 llamadas de Bob, Jane y Walt
www.adistancia.frba.utn.edu.ar
Prueba t de 1 muestra
1-Sample t Test
⇒ Cuando comparamos la media de un proceso contra la media de otro proceso, o la media de un
proceso contra un objetivo, utilizamos la prueba t
⇒ Esta prueba utiliza una distribución t para estimar si los procesos son diferentes entre sí
⇒ Existen dos tipos de pruebas t:
Prueba t de 1 muestra (1-Sample t Test)
Prueba t de dos muestras (2-Sample t Test)
NOTA:
NOTA:
Un
Un solo nivel significacomparar
solo nivel significa compararel elproceso
proceso
Estudiar forma
contra un objetivo o especificación,
contra un objetivo o especificación,
(Ej.: µµ==25
(Ej.: 25 óó σσ==22))
Estudiar
estabilidad
Ejemplo de 1 nivel
Estudiar Estudiar 30 muestras del tiempo de llamadas de Bob
dispersión posición
¿Es la media del tiempo de llamadas de Bob
diferente de 25 segundos?
Estudiar forma
www.adistancia.frba.utn.edu.ar
Minitab – Estudio de forma
Graphical summary – Estadísticas
M ean 24.848
S tD ev 0.869
V ariance 0.756
S kew ness -0.339296
Kurtosis -0.972667
N 30
M inimum 23.319
1st Q uartile 24.073
M edian 25.065
3rd Q uartile 25.461
23.2 24.0 24.8 25.6 M aximum 26.058
95% C onfidence Interv al for M ean
24.524 25.173
95% C onfidence Interv al for M edian
24.349 25.320
95% C onfidence Interv al for S tD ev
9 5 % C onfidence Inter vals
0.692 1.169
Mean
Median
¿Datos normales?
Cuando p > 0.05 aceptamos la hipótesis de que
el proceso es normal
Cuidado con el tamaño de la muestra
www.adistancia.frba.utn.edu.ar
Probability Plot of Bob
Normal
99
Mean 24.85
StDev 0.8693
95 N 30
AD 0.562
90
P-Value 0.134
80
70
Percent
60
50
40
30
20
10
1
23 24 25 26 27
Bob
60
50
40
30
20
10
1
22 23 24 25 26 27 28
Bob
www.adistancia.frba.utn.edu.ar
Mapa de análisis – Paso 2
Estabilidad
Estudiar
estabilidad
Gráfica I-MR
Recuerde
Recuerdeque
querequiere
requierelala
normalidad
normalidad delos
de losdatos
datos
26
_
X=24.848
24
22
LC L=21.664
3 6 9 12 15 18 21 24 27 30
O bser v ation
4 U C L=3.911
3
Moving Range
2
__
M R=1.197
1
0 LC L=0
3 6 9 12 15 18 21 24 27 30
O bser v ation
www.adistancia.frba.utn.edu.ar
¿Qué es el valor p?
Esto es parte de la prueba de hipótesis:
Ho: Los datos son normales
Ha: Los datos no son normales
p es la probabilidad de cometer un error si rechazásemos Ho en función de la evidencia obtenida de la muestra
Rechazaremos Ho cuando p < 0.05
M ean 24.848
S tD ev 0.869
V ariance 0.756
S kew ness -0.339296
Kurtosis -0.972667
N 30
M inimum 23.319
1st Q uartile 24.073
M edian 25.065
3rd Q uartile 25.461
23.2 24.0 24.8 25.6 M aximum 26.058
95% C onfidence Interv al for M ean
24.524 25.173
95% C onfidence Interv al for M edian
24.349 25.320
95% C onfidence Interv al for S tD ev
9 5 % C onfidence Inter v als
0.692 1.169
Mean
Median
Estudiar
posición
www.adistancia.frba.utn.edu.ar
Minitab – 1-Sample t
Valores t
Declaraciones de la prueba t
⇒ Después de correr la prueba t, y de haber obtenido un valor p, estamos listos para generar un veredicto,
como sigue:
Si la media de la población es realmente μ, con base en la información provista por una
muestra de tamaño n, la probabilidad de equivocarnos al rechazar la hipótesis nula es
igual al valor p
⇒ Para el ejemplo:
Si decimos que la media real de la población NO es igual a 25, con base a la información
de los 30 datos (media de 24,8482 y desviación estándar 0,8693), tenemos una
probabilidad p = 34,7% de equivocarnos al rechazar la hipótesis nula
⇒ Generalmente deseamos un valor p < 5% para rechazar la hipótesis nula con la suficiente “confianza” de
no equivocarnos.
www.adistancia.frba.utn.edu.ar
Minitab
Otra forma de contestar la pregunta
Median
Basado
Basadoen
enla
lainformación
informaciónde
dela
lamuestra,
muestra,lalamedia
mediade
dela
lapoblación
poblaciónse
se
encuentra dentro de este intervalo de “confianza”
encuentra dentro de este intervalo de “confianza”
Estudiar Estudiar
dispersión posición
Este
Estemétodo
métodopermite
permiteestudiar
estudiarlaladispersión
dispersióndedeuna
unasola
solamuestra
muestra
H 0 :σ = Objetivo ¿El
¿El objetivo de la desviación estándar cae dentro delrango?
SiSies
objetivo de la desviación estándar cae dentro del rango?
esasí,
así,por
porobservación
observacióndedelalamuestra,
muestra,seseacepta
aceptaque
queeleldesvío
desvío
H A :σ ≠ Objetivo estándar del proceso es igual al objetivo
estándar del proceso es igual al objetivo
www.adistancia.frba.utn.edu.ar
Prueba t de 2 muestras
2-Sample t Test
Alias:
2-Sample t Test
Estudiar forma
NOTA:
NOTA:
Estudiar
Con
Con 2 niveles de laXXestamos
2 niveles de la estamoscomparando
comparando
estabilidad dos
dos procesos o“tratamientos”
procesos o “tratamientos”
Estudiar
Esta
Estaes
esuna
unaprueba
pruebattde
de22muestras
muestras
dispersión
Estudiar
posición Ejemplo de 2 niveles
Comparando 30 llamadas de Bob vs. Jane
Tamaño de muestra
⇒ Antes de obtener los datos, para poder generar conclusiones válidas, tenemos que determinar el tamaño
necesario de la muestra para realizar la prueba.
⇒ Existen reglas empíricas para seleccionar el tamaño de la muestra en función de la estadística que
estamos utilizando, pero esto sirve sólo como una guía rápida de referencia.
⇒ Minitab provee los medios para calcular tamaños de muestra en función del nivel de confianza, poder, y
distancia a discriminar.
Estudiar forma
www.adistancia.frba.utn.edu.ar
Minitab – Estudio de forma
Graphical summary - Estadísticas
Median
M ean 25.446
S tD ev 0.988
V ariance 0.976
S kew ness 0.275995
Kurtosis 0.172282
N 30
M inimum 23.535
1st Q uartile 24.629
M edian 25.503
3rd Q uartile 26.006
24 25 26 27 M aximum 27.677
95% C onfidence Interv al for M ean
25.077 25.815
95% C onfidence Interv al for M edian
25.034 25.981
95% C onfidence Interv al for S tD ev
9 5 % C onfidence Inter v als
0.787 1.328
Mean
Median
www.adistancia.frba.utn.edu.ar
Mapa de análisis – Paso 2
Estabilidad
Estudiar
estabilidad
27.0
26
_ _
X=24.848 25.5 X=25.446
24
24.0
22
LC L=21.664 LC L=22.887
1 4 7 10 13 16 19 22 25 28 1 4 7 10 13 16 19 22 25 28
O bser vation O bser vation
4 U C L=3.911 U C L=3.144
3
3
M ov ing Range
M ov ing Range
2
2
__ __
M R=1.197 1 M R=0.962
1
0 LC L=0 0 LC L=0
1 4 7 10 13 16 19 22 25 28 1 4 7 10 13 16 19 22 25 28
O bser vation O bser vation
www.adistancia.frba.utn.edu.ar
Mapa de análisis – Paso 3
Dispersión
Normal No normal
Apilar datos; Bartlett (F-Test) Levene
Estudiar
Prueba de
estabilidad Ho: σ2A= σ2B Ho: σ2A= σ2B
igualdad de
varianzas
Estudiar
dispersión
Si el valor p < 0.05, entonces las varianzas NO son iguales
Minitab
Stack, columns – Apilar columnas
www.adistancia.frba.utn.edu.ar
Minitab
Prueba de igualdad de varianzas
Levene's Test
Jane
Test Statistic
P-Value
0.23
0.633 Ha: sBob ≠ sJane
0.6 0.8 1.0 1.2
95% Bonferroni Confidence Intervals for StDevs
1.4
Valores p
Bob
Operator
Jane
23 24 25 26 27 28
Time ¿Qué decide?
Cuando
Cuandolalapoblación
poblaciónes
esnormal:
normal:
Use
Use la prueba F (F-test)cuando
la prueba F (F-test) cuandose
secomparan
comparansólo
sólodos
dosniveles
niveles
Use
Use la prueba de Barlett cuando se comparan más de dosniveles
la prueba de Barlett cuando se comparan más de dos niveles
Cuando
Cuandolalapoblación
poblaciónnonoes
esnormal:
normal:Use
Uselalaprueba
pruebade
deLevene
Levene
www.adistancia.frba.utn.edu.ar
Mapa de análisis – Paso 4
Posición
Minitab Qué preguntar
Varianzas desiguales 2-Sample t Test con varianzas 2-Sample t Test con varianzas
Estudiar desiguales, 1-Way ANOVA desiguales (n>25), 1-Way ANOVA,
posición Ho: µA= µB con transformación
Kriskal Wallis, Mood
Minitab:
2-Sample t Test
www.adistancia.frba.utn.edu.ar
Two-Sample T-Test and CI: Bob, Jane
Two-sample T for Bob vs Jane
N Mean StDev SE Mean
Bob 30 24.848 0.869 0.16
Jane 30 25.446 0.988 0.18 Valor p
Comparaciones “apareadas”
⇒ Algunas veces debemos “aparear” los datos antes de ejecutar una comparación
Un ejemplo es cuando comparamos mediciones hechas antes y después de una mejora utilizando el
mismo proceso u operador.
También la usamos cuando estudiamos un sistema de medición para ver si los diferentes operadores
miden de la misma manera al mismo conjunto de muestras.
⇒ Analizaremos un ejemplo en el que estamos tratando de probar si los vendedores cotizan igual un mismo
conjunto de productos
Tenemos 10 cotizaciones correspondientes a 2 vendedores.
Cada fila representa un mismo producto.
www.adistancia.frba.utn.edu.ar
Paired T-Test and Confidence Interval
El
Elvalor
valorpp<<5%
5%indica
indicaque
quelas
lascotizaciones
cotizacionesde
delos
losdos
dos
vendedores son estadísticamente diferentes
vendedores son estadísticamente diferentes
Utilice los mismo datos y realice un 2-Sample t Test para muestras independientes.
Stat>Basic Statistics>2 Sample t
Muestras en columnas diferentes: SalesP A y SalesP B
Marcar el cuadro “assume equal variances”
Comparación de proporciones
⇒ Cuando los datos son discretos y pueden expresarse como proporciones (defectuosos), se aplican las
pruebas de proporciones:
1-Proportion
2-Proportions
www.adistancia.frba.utn.edu.ar
Minitab:
1-Proportion
Errores Bob = 36
Sample size = 2500
p = 0.0144
Cuidado
Cuidadocon
coneleltamaño
tamañode delalamuestra,
muestra,
Ho: pBob = 0.01
siempre
siempreverifique
verifiqueelelpoder
poderde
delalaprueba
prueba
Ha: pBob > 0.01 cuando
cuandocompare
compareproporciones
proporciones
2 Proporciones
www.adistancia.frba.utn.edu.ar
Minitab:
2-Proportions
Errores Bob = 36
Errores Jane = 42
Sample size = 2500
pBob = 0.0144
pJane = 0.0168 Cuidado
Cuidadocon
coneleltamaño
tamañodedelalamuestra,
muestra,
Ho: pBob = pJane siempre
siempre verifique el poderde
verifique el poder delalaprueba
prueba
cuando compare proporciones
Ha: pBob ≠ pJane cuando compare proporciones
Valor p
Difference = p (1) - p (2)
Estimate for difference: -0.0024
95% CI for difference: (-0.00926943, 0.00446943)
Test for difference = 0 (vs not = 0): Z = -0.68 P-Value = 0.494
¿Qué decide?
www.adistancia.frba.utn.edu.ar
ANOVA (ANalysis Of VAriance)
Prueba de posición o tendencia central
Un
Unmodelo
modeloaditivo,
aditivo,donde
dondecadacadaobservación
observaciónes eslalasuma
sumadedelalamedia
mediageneral
generaldel
delproceso
proceso(µ),
(µ),
más la media (τ ) del tratamiento i, más un término variable o de error, normalmente
más la media (τi) del tratamiento i, más un término variable o de error, normalmente
i
distribuido
distribuidocon
conmediamedia00yydesvío estándarσ,σ,independiente
desvíoestándar independientedel
delnivel
nivelde
delos
losfactores
factores
NOTA:
NOTA:
Estudiar Con
Con 2 ó más niveles de laXXestamos
2 ó más niveles de la estamoscomparando
comparandodos
dosóó
estabilidad
más procesos o “tratamientos” entre sí
más procesos o “tratamientos” entre sí
Estudiar Esto
Estorequiere
requiereel
eluso
usode
deANOVA
ANOVA
dispersión
Estudiar
Ejemplo de 2 o más niveles
posición ¿Bob y Jane toman el mismo tiempo en sus llamadas?
¿Bob, Jane y Walt toman el mismo tiempo en sus llamadas?
www.adistancia.frba.utn.edu.ar
Ejemplo: Centro de llamadas
ANOVA
Un gerente de ventas desea conocer cuál de tres operadores toma diferente tiempo en contestar las llamadas.
Total
Variable Operator Count Mean Minimum Median Maximum
Time Bob 30 24.848 23.319 25.065 26.058
Jane 30 25.446 23.535 25.503 27.677
Walt 30 27.084 24.921 27.159 28.654
28
27
Stacked
26
25
24
23
Bob Jane Walt
Person
Usamos
Usamoslas
lasgráficas
gráficasde
deBob
BobyyJane
Janedel
del2-Sample
2-Samplett
Estudiar
estabilidad Test
Test
www.adistancia.frba.utn.edu.ar
Determine el tipo de datos
Un gerente de ventas desea conocer cuál de tres operadores toma diferente tiempo en contestar las llamadas.
Operador Atributo
¿Cuál es la X? ______________ ¿Tipo de datos? _______________
ANOVA
¿Qué herramienta utilizar ? _____________________________
Estudiar
dispersión Antes
Antesdederealizar
realizarla
laprueba
pruebaANOVA
ANOVAdebemos
debemosejecutar
ejecutarlas
las
pruebas de normalidad e igualdad de varianza
pruebas de normalidad e igualdad de varianza
Para estudiar la dispersión, usamos la prueba de igualdad de varianza dentro del menú de ANOVA en Minitab
La hipótesis es la siguiente:
⇒ Ho: Las varianzas de los procesos son iguales
⇒ Ha: Al menos una de las varianzas es diferente a las demás
www.adistancia.frba.utn.edu.ar
Use Data>Stack>Columns
www.adistancia.frba.utn.edu.ar
Prueba de igualdad de varianza
Bartlett's Test
Test Statistic 0.57
Bob P-Value 0.750
Lev ene's Test
Test Statistic 0.23
P-Value 0.798
p-Value
Person
Jane
Walt
0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5
95% Bonferroni Confidence Intervals for StDevs
Varianzas desiguales 2-Sample t Test con varianzas 2-Sample t Test con varianzas
Estudiar desiguales, 1-Way ANOVA desiguales (n>25), 1-Way ANOVA,
posición Ho: µA= µB con transformación
Kriskal Wallis, Mood
www.adistancia.frba.utn.edu.ar
Individual Value Plot of Stacked vs Person Boxplot of Stacked by Person
29 29
28 28
27 27
Stacked
Stacked
26 26
25 25
24 24
23 23
Bob Jane Walt Bob Jane Walt
Person Person
Ho: µ1 = µ2 = µ3
Ha: At least one µ is different
One-way ANOVA: Stacked versus Person Hay evidencia de que
Source DF SS MS F P por lo menos una de
Person 2 80.345 40.172 44.61 0.000 las medias es diferente
Error 87 78.344 0.901
Total 89 158.689
del resto
(Rechazar Ho)
S = 0.9490 R-Sq = 50.63% R-Sq(adj) = 49.50%
www.adistancia.frba.utn.edu.ar
Epsilon cuadrada: significado práctico
⇒ Usamos la suma de cuadrados para estimar la contribución del factor en la variación total del proceso.
⇒ El valor de épsilon es la proporción que tiene el factor o término en el total de la suma de cuadrados.
⇒ Tenemos que crear columnas de la fuente “source”, sumas de cuadrados “SS” y Epsilon square
Copie las columnas de efectos y sumas de cuadrados de la ventana de sesión en una tabla Minitab o
Excel.
Use la calculadora minitab o programe la fórmula en Excel para obtener la ecuación: Epsilon-sq =
SS/Total SS.
Source DF SS MS F P
Person 2 80.345 40.172 44.61 0.000
Error 87 78.344 0.901
Total 89 158.689
9
68
78.344
58.
Epsilon-sq = 80.345/158.69 1
= 0.5063
80.345
⇒ Esto significa que la persona contribuye con 50% de la variación total observada.
⇒ La contribución del factor “Person” es tanto estadística como prácticamente significativa.
Análisis de Residuos
El análisis de los residuos no indica nada significativo que invalide la aplicación de la herramienta (pero en
caso de dudas guarde y analice los residuos y los valores estimados).
Los residuos son normales, independientes y estables.
www.adistancia.frba.utn.edu.ar
Independencia
Residual Plots for Time
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
99.9
99 2
90 1
Residual
Percent
50 0
10 -1
1
-2
0.1
-3.0 -1.5 0.0 1.5 3.0 25.0 25.5 26.0 26.5 27.0
Residual Fitted Value
Normalidad
Histogram of the Residuals Residuals Versus the Order of the Data
2
20
1
Frequency
Residual
15
0
10
-1
5
-2
0
-1.6 -0.8 0.0 0.8 1.6 2.4 1 10 20 30 40 50 60 70 80 90
Residual Observation Order
Estabilidad
Pruebas de hipótesis
Datos no normales
Varianzas desiguales 2-Sample t Test con varianzas 2-Sample t Test con varianzas
Estudiar desiguales, 1-Way ANOVA desiguales (n>25), 1-Way ANOVA,
posición Ho: µA= µB con transformación
Kriskal Wallis, Mood
Prueba de Mann-Whitney
Non-parametric – Comparación de 2 muestras
Deseamos saber si hay una diferencia en los tiempos de embarque para productos enviados entre semana vs.
el fin de semana.
www.adistancia.frba.utn.edu.ar
Siga el mapa de análisis
⇒ Estudie forma
⇒ Estudie estabilidad
⇒ Estudie dispersión
Estudio de forma
Embarques de fin de semana
60
50
40
30
20
Median
Estudio de estabilidad
4
2
_ _
2 X=1.724 X=1.266
0 0
-2 LC L=-2.089 LC L=-1.201
5 10 15 20 25 30 35 40 45 50 5 10 15 20 25 30 35 40 45 50
Observation Observation
1
3 UC L=3.030
4.8 UC L=4.684
M ov ing Range
M ov ing Range
3.6
2
2.4
__
__ 1 MR=0.928
MR=1.434
1.2
5 10 15 20 25 30 35 40 45 50 5 10 15 20 25 30 35 40 45 50
Observation Observation
Recuerde
Recuerdeque
quesi
silos
losdatos
datosno
noson
sonnormales,
normales,el
elI-MR
I-MRchart
chartpuede
puededar
darresultados
resultados
engañosos; cuando no haya normalidad, use el run chart
engañosos; cuando no haya normalidad, use el run chart
www.adistancia.frba.utn.edu.ar
Estudio de dispersión
datos
W k endShippingTime
0 1 2 3 4 5 6
ShippingTime
Deseamos saber si hay una diferencia en los tiempos de embarque para productos enviados entre semana vs.
el fin de semana.
Prueba de Mood
www.adistancia.frba.utn.edu.ar
Mood Median Test: ShippingTime versus When
Mood median test for ShippingTime
Chi-Square = 0.64 DF = 1 P = 0.424
Mann-Whitney
Prueba no-paramétrica
Valor
Valorp:p:
SiSippfuera
fuerabajo
bajoentonces
entoncesexistiría
existiría
una diferencia entre las medianas
una diferencia entre las medianas
Ojo!
Ojo!Requiere
Requiereigualdad
igualdadde
devarianzas
varianzas
www.adistancia.frba.utn.edu.ar