0% encontró este documento útil (0 votos)
88 vistas29 páginas

Análisis Estadístico: Comparaciones y Pruebas

El módulo describe la etapa de Análisis en la metodología, cuyo objetivo es entender los datos recolectados mediante comparaciones y pruebas estadísticas. Estas incluyen pruebas t de una y dos muestras para comparar procesos contra objetivos o entre sí, y análisis de varianza de un factor para comparar niveles dentro de un proceso. El módulo explica cómo utilizar estas herramientas en Minitab para estudiar la forma, estabilidad, dispersión y posición de los datos.

Cargado por

Gonzalo Maggioni
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
88 vistas29 páginas

Análisis Estadístico: Comparaciones y Pruebas

El módulo describe la etapa de Análisis en la metodología, cuyo objetivo es entender los datos recolectados mediante comparaciones y pruebas estadísticas. Estas incluyen pruebas t de una y dos muestras para comparar procesos contra objetivos o entre sí, y análisis de varianza de un factor para comparar niveles dentro de un proceso. El módulo explica cómo utilizar estas herramientas en Minitab para estudiar la forma, estabilidad, dispersión y posición de los datos.

Cargado por

Gonzalo Maggioni
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Módulo 2- Etapa Analizar:

El participante logrará conocer los procesos y herramientas necesarias de la etapa Analizar de la metodología.

Etapa ANALIZAR

El objetivo de la etapa Analizar es dar sentido a los datos recolectados durante los pasos de la etapa Medir y
establecer la relación causa -efecto que produce los defectos, retrasos, etc.

Contenidos Unidad 3:

1. Comparaciones

1. Comparaciones

Pruebas estadísticas

Una sola X Múltiples Xs


X X
Discreta Continua Discreta Continua
Una sola Y

Discreta

Discreta

Chi-cuadrada Regresión Regresión


Regresión
Proporciones logística logística
logística
múltiple múltiple
Y
Y

Continua
Continua

One way ANOVA Two way ANOVA


Pruebas de Regresión 2, 3, .. factores Regresión
Y

medias y Múltiple
Simple Prueba de
medianas medianas
Múltiples Ys

Análisis multivari
(Nota: No es lo mismo que gráficas Multi-Vari)

ANOVA, pruebas de medias, medianas

One way ANOVA


Pruebas de medias y
medianas

Comparaciones con 1 Comparaciones con Comparaciones con 2 ó


nivel de la X 2 niveles más niveles

Ejemplo de 1 nivel
Comparando 30 llamadas de Bob contra una especificación

Ejemplo de 2 niveles
Comparando 30 llamadas de Bob vs. Jane

Ejemplo de 3 niveles
Comparando 30 llamadas de Bob, Jane y Walt

www.adistancia.frba.utn.edu.ar
Prueba t de 1 muestra
1-Sample t Test
⇒ Cuando comparamos la media de un proceso contra la media de otro proceso, o la media de un
proceso contra un objetivo, utilizamos la prueba t
⇒ Esta prueba utiliza una distribución t para estimar si los procesos son diferentes entre sí
⇒ Existen dos tipos de pruebas t:
 Prueba t de 1 muestra (1-Sample t Test)
 Prueba t de dos muestras (2-Sample t Test)

La prueba t se usa cuando no se conoce la desviación estándar de la población y se


usa la desviación estándar de las muestras para fines de cálculo

Mapa de análisis – 1-Sample t Test

One way ANOVA


Pruebas de medias y
medianas
Comparaciones con un
solo nivel de X

NOTA:
NOTA:
Un
Un solo nivel significacomparar
solo nivel significa compararel elproceso
proceso
Estudiar forma
contra un objetivo o especificación,
contra un objetivo o especificación,
(Ej.: µµ==25
(Ej.: 25 óó σσ==22))
Estudiar
estabilidad
Ejemplo de 1 nivel
Estudiar Estudiar 30 muestras del tiempo de llamadas de Bob
dispersión posición
¿Es la media del tiempo de llamadas de Bob
diferente de 25 segundos?

Mapa de análisis – Paso 1


Forma

Minitab Qué preguntar

Prueba de ¿Datos normales?


normalidad Cuando p > 0.05 aceptamos la hipótesis de que
el proceso es normal
Comparaciones con un Cuidado con el tamaño de la muestra
solo nivel de X

Estudiar forma

www.adistancia.frba.utn.edu.ar
Minitab – Estudio de forma
Graphical summary – Estadísticas

Summary for Bob


A nderson-D arling N ormality Test
A -S quared 0.56
P -V alue 0.134

M ean 24.848
S tD ev 0.869
V ariance 0.756
S kew ness -0.339296
Kurtosis -0.972667
N 30

M inimum 23.319
1st Q uartile 24.073
M edian 25.065
3rd Q uartile 25.461
23.2 24.0 24.8 25.6 M aximum 26.058
95% C onfidence Interv al for M ean
24.524 25.173
95% C onfidence Interv al for M edian
24.349 25.320
95% C onfidence Interv al for S tD ev
9 5 % C onfidence Inter vals
0.692 1.169
Mean

Median

24.4 24.6 24.8 25.0 25.2 25.4

¿Datos normales?
Cuando p > 0.05 aceptamos la hipótesis de que
el proceso es normal
Cuidado con el tamaño de la muestra

www.adistancia.frba.utn.edu.ar
Probability Plot of Bob
Normal
99
Mean 24.85
StDev 0.8693
95 N 30
AD 0.562
90
P-Value 0.134
80
70
Percent

60
50
40
30
20

10

1
23 24 25 26 27
Bob

Otro método para determinar normalidad

Probability Plot of Bob


Normal - 95% CI
99
Mean 24.85
StDev 0.8693
95 N 30
AD 0.562
90
P-Value 0.134
80
70
Percent

60
50
40
30
20

10

1
22 23 24 25 26 27 28
Bob

www.adistancia.frba.utn.edu.ar
Mapa de análisis – Paso 2
Estabilidad

Minitab Qué preguntar

Prueba de ¿Datos normales?


normalidad Cuando p > 0.05 aceptamos la hipótesis de que
el proceso es normal
Comparaciones con un Cuidado con el tamaño de la muestra
solo nivel de X
Gráfico ¿Contamos con un proceso estable que
I-MR proporcione evidencia de que los datos
provienen de un solo proceso o población?
Estudiar forma

Estudiar
estabilidad

Gráfica I-MR

Recuerde
Recuerdeque
querequiere
requierelala
normalidad
normalidad delos
de losdatos
datos

I-MR Chart of Bob


28 U C L=28.032
Individual Value

26
_
X=24.848
24

22
LC L=21.664
3 6 9 12 15 18 21 24 27 30
O bser v ation

4 U C L=3.911

3
Moving Range

2
__
M R=1.197
1

0 LC L=0
3 6 9 12 15 18 21 24 27 30
O bser v ation

¿Existen tendencias o patrones que proporcionen evidencia de que


los datos no son de una sola población o proceso?

www.adistancia.frba.utn.edu.ar
¿Qué es el valor p?
Esto es parte de la prueba de hipótesis:
Ho: Los datos son normales
Ha: Los datos no son normales
p es la probabilidad de cometer un error si rechazásemos Ho en función de la evidencia obtenida de la muestra
Rechazaremos Ho cuando p < 0.05

Summary for Bob


A nderson-D arling N ormality Test
A -S quared 0.56
P -V alue 0.134

M ean 24.848
S tD ev 0.869
V ariance 0.756
S kew ness -0.339296
Kurtosis -0.972667
N 30

M inimum 23.319
1st Q uartile 24.073
M edian 25.065
3rd Q uartile 25.461
23.2 24.0 24.8 25.6 M aximum 26.058
95% C onfidence Interv al for M ean
24.524 25.173
95% C onfidence Interv al for M edian
24.349 25.320
95% C onfidence Interv al for S tD ev
9 5 % C onfidence Inter v als
0.692 1.169
Mean

Median

24.4 24.6 24.8 25.0 25.2 25.4

Mapa de análisis – Paso 3


Posición
Minitab Qué preguntar

Prueba de ¿Datos normales?


normalidad Cuando p > 0.05 aceptamos la hipótesis de que
el proceso es normal
Comparaciones con un Cuidado con el tamaño de la muestra
solo nivel de X
Gráfico ¿Contamos con un proceso estable que
I-MR proporcione evidencia de que los datos
provienen de un solo proceso o población?
Estudiar forma Normal No Normal

1-Sample t Test 1-Sample t Test (si n > 25)


Estudiar
estabilidad Ejemplo: Transforme los datos o utilice
(Ho: μ = 25.0) una prueba no paramétrica

Estudiar
posición

Valor p < 0.05


La media de la población no es igual al valor especificado (objetivo)

www.adistancia.frba.utn.edu.ar
Minitab – 1-Sample t

Minitab: Ventana de sesión


1-Sample t test para igualdad

1-Sample t Test: Bob


Test of μ = 25 vs μ ≠ 25 Valor p:

Variable N Mean StDev SE Mean 95% CI T P


Bob 30 24.8482 0.8693 0.1587 (24.5236, 25.1728) -0.96 0.347

Ho: Media de (Bob) = 25 ¿Qué decide?


Ha: Mean (Bob) ≠ 25

Valores t

⇒ Los valores t son unidades de desviación estándar.


⇒ Por ejemplo: Un valor t de +2,00 nos dice que la media del proceso está a una distancia de 2σ del objetivo .
 A partir de la distribución normal sabemos que cualquier valor fuera de la faja σ de ± 2
alrededor de la media tiene muy baja probabilidad de ocurrencia (< 4,56%).
⇒ Cada valor t está asociado con una probabilidad p.
 Por ejemplo: Un valor t de -1,96 en una muestra de tamaño n = 10 (9 df) está asociado con un
valor p de 0,0408, lo que significa que existe sólo una probabilidad igual a 4,08% de encontrar
valores inferiores a -1,96 desviaciones estándar de la media de la muestra.
⇒ Normalmente, para efectos de 6s, utilizamos niveles de confianza p de 0,05 a 0,10.

Declaraciones de la prueba t

⇒ Después de correr la prueba t, y de haber obtenido un valor p, estamos listos para generar un veredicto,
como sigue:
 Si la media de la población es realmente μ, con base en la información provista por una
muestra de tamaño n, la probabilidad de equivocarnos al rechazar la hipótesis nula es
igual al valor p
⇒ Para el ejemplo:
 Si decimos que la media real de la población NO es igual a 25, con base a la información
de los 30 datos (media de 24,8482 y desviación estándar 0,8693), tenemos una
probabilidad p = 34,7% de equivocarnos al rechazar la hipótesis nula
⇒ Generalmente deseamos un valor p < 5% para rechazar la hipótesis nula con la suficiente “confianza” de
no equivocarnos.

www.adistancia.frba.utn.edu.ar
Minitab
Otra forma de contestar la pregunta

Summary for Bob


A nderson-D arling N ormality Test
A -S quared 0.56
P -V alue 0.134
M ean 24.848
S tD ev 0.869
V ariance 0.756
S kew ness -0.339296
Kurtosis -0.972667
N 30
M inimum 23.319
1st Q uartile 24.073
M edian 25.065
3rd Q uartile 25.461
23.2 24.0 24.8 25.6 M aximum 26.058
95% C onfidence Interv al for M ean
24.524 25.173
95% C onfidence Interv al for M edian
24.349 25.320
95% C onfidence Interv al for S tD ev
9 5 % C onfidence Inter vals
0.692 1.169
Mean

Median

24.4 24.6 24.8 25.0 25.2 25.4

Basado
Basadoen
enla
lainformación
informaciónde
dela
lamuestra,
muestra,lalamedia
mediade
dela
lapoblación
poblaciónse
se
encuentra dentro de este intervalo de “confianza”
encuentra dentro de este intervalo de “confianza”

Mapa de análisis – Paso 4


Dispersión

Summary for Bob


A nderson-Darling Normality Test
A -Squared 0.56
P -V alue 0.134
M ean 24.848
StDev 0.869
V ariance 0.756
Skew ness -0.339296
Comparaciones con un Kurtosis -0.972667
solo nivel de X N 30
M inimum 23.319
1st Q uartile 24.073
M edian 25.065
3rd Q uartile 25.461
23.2 24.0 24.8 25.6 M aximum 26.058
95% C onfidence Interv al for M ean
Estudiar forma 24.524 25.173
95% C onfidence Interv al for M edian
24.349 25.320
95% C onfidence Interv al for StDev
9 5 % Confidence Inter vals
0.692 1.169
Estudiar Mean
estabilidad
Median

24.4 24.6 24.8 25.0 25.2 25.4

Estudiar Estudiar
dispersión posición
Este
Estemétodo
métodopermite
permiteestudiar
estudiarlaladispersión
dispersióndedeuna
unasola
solamuestra
muestra
H 0 :σ = Objetivo ¿El
¿El objetivo de la desviación estándar cae dentro delrango?
SiSies
objetivo de la desviación estándar cae dentro del rango?
esasí,
así,por
porobservación
observacióndedelalamuestra,
muestra,seseacepta
aceptaque
queeleldesvío
desvío
H A :σ ≠ Objetivo estándar del proceso es igual al objetivo
estándar del proceso es igual al objetivo

www.adistancia.frba.utn.edu.ar
Prueba t de 2 muestras
2-Sample t Test

One way ANOVA


Pruebas de medias y
medianas

Comparaciones con 1 Comparaciones con Comparaciones con 2 ó


nivel de la X 2 niveles más niveles

Ejemplo de 2 niveles (2-Sample t)


Comparando 30 llamadas de Bob vs. Jane
Pruebas de 2 niveles

Alias:
2-Sample t Test

One way ANOVA


Comparaciones de 2 Pruebas de medias y
niveles medianas

Estudiar forma
NOTA:
NOTA:
Estudiar
Con
Con 2 niveles de laXXestamos
2 niveles de la estamoscomparando
comparando
estabilidad dos
dos procesos o“tratamientos”
procesos o “tratamientos”
Estudiar
Esta
Estaes
esuna
unaprueba
pruebattde
de22muestras
muestras
dispersión

Estudiar
posición Ejemplo de 2 niveles
Comparando 30 llamadas de Bob vs. Jane
Tamaño de muestra

⇒ Antes de obtener los datos, para poder generar conclusiones válidas, tenemos que determinar el tamaño
necesario de la muestra para realizar la prueba.
⇒ Existen reglas empíricas para seleccionar el tamaño de la muestra en función de la estadística que
estamos utilizando, pero esto sirve sólo como una guía rápida de referencia.
⇒ Minitab provee los medios para calcular tamaños de muestra en función del nivel de confianza, poder, y
distancia a discriminar.

Mapa de análisis – Paso 1


Forma

Minitab Qué preguntar

Prueba de ¿Datos normales?


normalidad Cuando p > 0.05 aceptamos la hipótesis de que
el proceso es normal
Comparaciones con un Cuidado con el tamaño de la muestra
solo nivel de X

Estudiar forma

www.adistancia.frba.utn.edu.ar
Minitab – Estudio de forma
Graphical summary - Estadísticas

Summary for Bob


A nderson-D arling N ormality Test
A -S quared 0.56
P -V alue 0.134
M ean 24.848
S tD ev 0.869
V ariance 0.756
S kew ness -0.339296
Kurtosis -0.972667
N 30
M inimum 23.319
1st Q uartile 24.073
M edian 25.065
3rd Q uartile 25.461
23.2 24.0 24.8 25.6 M aximum 26.058
95% C onfidence Interv al for M ean
24.524 25.173
95% C onfidence Interv al for M edian
24.349 25.320
95% C onfidence Interv al for S tD ev
9 5 % C onfidence Inter v als
0.692 1.169
Mean

Median

24.4 24.6 24.8 25.0 25.2 25.4

Summary for Jane


A nderson-D arling N ormality Test
A -S quared 0.28
P -V alue 0.618

M ean 25.446
S tD ev 0.988
V ariance 0.976
S kew ness 0.275995
Kurtosis 0.172282
N 30

M inimum 23.535
1st Q uartile 24.629
M edian 25.503
3rd Q uartile 26.006
24 25 26 27 M aximum 27.677
95% C onfidence Interv al for M ean
25.077 25.815
95% C onfidence Interv al for M edian
25.034 25.981
95% C onfidence Interv al for S tD ev
9 5 % C onfidence Inter v als
0.787 1.328
Mean

Median

25.0 25.2 25.4 25.6 25.8 26.0

www.adistancia.frba.utn.edu.ar
Mapa de análisis – Paso 2
Estabilidad

Minitab Qué preguntar

Prueba de ¿Datos normales?


normalidad Cuando p > 0.05 aceptamos la hipótesis de que
el proceso es normal
Comparaciones con un Cuidado con el tamaño de la muestra
solo nivel de X
Gráfico ¿Contamos con un proceso estable que
I-MR proporcione evidencia de que los datos
provienen de un solo proceso o población?
Estudiar forma

Estudiar
estabilidad

Minitab – Prueba de estabilidad


Gráfica I-MR

I-MR Chart of Bob I-MR Chart of Jane


28 U C L=28.032 28.5
U C L=28.005
Indiv idual V alue

Indiv idual V alue

27.0
26
_ _
X=24.848 25.5 X=25.446
24

24.0
22
LC L=21.664 LC L=22.887
1 4 7 10 13 16 19 22 25 28 1 4 7 10 13 16 19 22 25 28
O bser vation O bser vation

4 U C L=3.911 U C L=3.144
3

3
M ov ing Range

M ov ing Range

2
2
__ __
M R=1.197 1 M R=0.962
1

0 LC L=0 0 LC L=0
1 4 7 10 13 16 19 22 25 28 1 4 7 10 13 16 19 22 25 28
O bser vation O bser vation

www.adistancia.frba.utn.edu.ar
Mapa de análisis – Paso 3
Dispersión

Minitab Qué preguntar

Prueba de ¿Datos normales?


normalidad Cuando p > 0.05 aceptamos la hipótesis de que
el proceso es normal
Cuidado con el tamaño de la muestra
Comparaciones de 2
niveles
Gráfico ¿Contamos con un proceso estable que
I-MR proporcione evidencia de que los datos
Estudiar forma provienen de un solo proceso o población?

Normal No normal
Apilar datos; Bartlett (F-Test) Levene
Estudiar
Prueba de
estabilidad Ho: σ2A= σ2B Ho: σ2A= σ2B
igualdad de
varianzas
Estudiar
dispersión
Si el valor p < 0.05, entonces las varianzas NO son iguales

Preparando los datos

⇒ Minitab manipula datos en columnas.


⇒ Deseamos tener la siguiente estructura:
 Una sola columna con todas las mediciones.
 Una columna con “identificadores”.
⇒ En este ejemplo deseamos las siguientes columnas:
 “Operator” (con los nombres de Bob y Jane).
 “Time” (con los datos de Bob y Jane).
⇒ Desde luego, deseamos identificar cada valor con su operador.
⇒ Minitab nos ayuda a realizar esta tarea…

Minitab
Stack, columns – Apilar columnas

www.adistancia.frba.utn.edu.ar
Minitab
Prueba de igualdad de varianzas

Test for Equal Variances for Time


F-Test
Test Statistic 0.77
Bob P-Value 0.495 Ho: sBob = sJane
Operator

Levene's Test

Jane
Test Statistic
P-Value
0.23
0.633 Ha: sBob ≠ sJane
0.6 0.8 1.0 1.2
95% Bonferroni Confidence Intervals for StDevs
1.4
Valores p

Bob
Operator

Jane

23 24 25 26 27 28
Time ¿Qué decide?

Cuando
Cuandolalapoblación
poblaciónes
esnormal:
normal:
Use
Use la prueba F (F-test)cuando
la prueba F (F-test) cuandose
secomparan
comparansólo
sólodos
dosniveles
niveles
Use
Use la prueba de Barlett cuando se comparan más de dosniveles
la prueba de Barlett cuando se comparan más de dos niveles
Cuando
Cuandolalapoblación
poblaciónnonoes
esnormal:
normal:Use
Uselalaprueba
pruebade
deLevene
Levene

www.adistancia.frba.utn.edu.ar
Mapa de análisis – Paso 4
Posición
Minitab Qué preguntar

Prueba de ¿Datos normales ?


normalidad Si el valor p < 0.05 el proceso NO es normal
Cuidado con el tamaño de la muestra

Gráfica ¿Contamos con un proceso estable que


Comparaciones de 2
I-MR proporcione evidencia de que los datos
niveles
provienen de un solo proceso o población?
Normal No normal
Estudiar forma
Apilar datos; Bartlett (F-Test) Levene
Prueba de Ho: σ2A= σ2B Ho: σ2A= σ2B
igualdad de
Estudiar varianzas
estabilidad
2-Sample t Test con igual 2-Sample t Test con igual varianza
Varianzas iguales varianza (n>25), 1-Way ANOVA, con
1-Way ANOVA transformación
Estudiar Ho: µA= µB Mann-Whitney, Kriskal-Wallis,
dispersión Mood

Varianzas desiguales 2-Sample t Test con varianzas 2-Sample t Test con varianzas
Estudiar desiguales, 1-Way ANOVA desiguales (n>25), 1-Way ANOVA,
posición Ho: µA= µB con transformación
Kriskal Wallis, Mood

Si el valor p < 0.05, la media de las dos poblaciones NO es igual

Comparación de dos medias

⇒ Existen dos formas clásicas para comparar dos medias:


 2-Sample t Test
 ANOVA de 1 factor
⇒ Veamos el 2-Sample t Test…

Realizaremos el 2-Sample t Test


⇒ Este es una prueba de un solo factor (X) a dos niveles (Bob vs. Jane) y 1 salida cuantitativa (Y)

Minitab:
2-Sample t Test

Ho: MediaBob = MediaJane


Ha: MediaBob ≠ MediaJane

www.adistancia.frba.utn.edu.ar
Two-Sample T-Test and CI: Bob, Jane
Two-sample T for Bob vs Jane
N Mean StDev SE Mean
Bob 30 24.848 0.869 0.16
Jane 30 25.446 0.988 0.18 Valor p

Difference = mu (Bob) - mu (Jane)


Estimate for difference: -0.597866
95% CI for difference: (-1.079021, -0.116711)
T-Test of difference = 0 (vs not =): T-Value = -2.49 P-Value = 0.016 DF = 57

Comparaciones “apareadas”

⇒ Algunas veces debemos “aparear” los datos antes de ejecutar una comparación
 Un ejemplo es cuando comparamos mediciones hechas antes y después de una mejora utilizando el
mismo proceso u operador.
 También la usamos cuando estudiamos un sistema de medición para ver si los diferentes operadores
miden de la misma manera al mismo conjunto de muestras.
⇒ Analizaremos un ejemplo en el que estamos tratando de probar si los vendedores cotizan igual un mismo
conjunto de productos
 Tenemos 10 cotizaciones correspondientes a 2 vendedores.
 Cada fila representa un mismo producto.

Use Minitab > Stat > Basic Statistics > Paired t


Minitab calcula la diferencia (delta) entre “Sales A” y “Sales B”

Sales A Sales B Delta


13.2 14.0 -0.80000 Probamos si la
8.2 8.8 -0.60000 diferencia (Delta) es
10.9 11.2 -0.30000 igual a 0
14.3 14.2 0.10000
10.7 11.8 -1.10000
6.6 6.4 0.20000 H o :δ = 0
9.5 9.8 -0.30000
Ha : δ ≠ 0
10.8 11.3 -0.50000
8.8 9.3 -0.50000 Donde δ = X Sales A − X Sales B
13.3 13.6 -0.30000

www.adistancia.frba.utn.edu.ar
Paired T-Test and Confidence Interval

Paired T for SalesP A - SalesP B

N Mean StDev SE Mean


SalesP A 10 10.630 2.451 0.775
SalesP B 10 11.040 2.518 0.796
Difference 10 -0.410 0.387 0.122

95% CI for mean difference: (-0.687, -0.133)


T-Test of mean difference = 0 (vs not = 0): T-Value = -3.35 P-Value =0.009

El
Elvalor
valorpp<<5%
5%indica
indicaque
quelas
lascotizaciones
cotizacionesde
delos
losdos
dos
vendedores son estadísticamente diferentes
vendedores son estadísticamente diferentes

Haciendo el análisis erróneo

Utilice los mismo datos y realice un 2-Sample t Test para muestras independientes.
Stat>Basic Statistics>2 Sample t
Muestras en columnas diferentes: SalesP A y SalesP B
Marcar el cuadro “assume equal variances”

Two-sample T for SalesP A vs SalesP B

N Mean StDev SE Mean


SalesP A 10 10.63 2.45 0.78
SalesP B 10 11.04 2.52 0.80

Difference = mu MAT A - mu MAT B


Estimate for difference: -0.41
95% CI for difference: (-2.74, 1.92)
T-Test of difference = 0 (vs not =): T-Value = -0.37 P-Value = 0.716 DF = 18
Both use Pooled StDev = 2.49

Comparación de proporciones

⇒ Cuando los datos son discretos y pueden expresarse como proporciones (defectuosos), se aplican las
pruebas de proporciones:
 1-Proportion
 2-Proportions

1 Proporción contra estándar

⇒ Realizaremos la prueba 1-Proportion.


⇒ Este es una prueba de un solo factor (X) (errores de Bob) contra un estándar de referencia (la media de la
población).
⇒ La columna Err_Bob representa la cantidad de errores de procesamiento observados en 10 muestras de
250 facturas cada una.
⇒ El gerente del área quiere saber si el promedio de errores de Bob es superior a la media histórica del
departamento, de 1%.

www.adistancia.frba.utn.edu.ar
Minitab:
1-Proportion

Errores Bob = 36
Sample size = 2500
p = 0.0144
Cuidado
Cuidadocon
coneleltamaño
tamañode delalamuestra,
muestra,
Ho: pBob = 0.01
siempre
siempreverifique
verifiqueelelpoder
poderde
delalaprueba
prueba
Ha: pBob > 0.01 cuando
cuandocompare
compareproporciones
proporciones

Test and CI for One Proportion


Valor p
Test of p = 0.01 vs p > 0.01
95%
Lower Exact
Sample X N Sample p Bound P-Value ¿Qué decide?
1 36 2500 0.014400 0.010710 0.022

2 Proporciones

⇒ Realizaremos la prueba 2-Proportions.


⇒ Este es una prueba de un dos factores (X) (errores de Bob, errores de Jane) comparados entre si.
⇒ Las columnas Err_Bob y Err_Jane representan las cantidades de errores de procesamiento observados en
10 muestras de 250 facturas de cada uno de ellos respectivamente.
⇒ El gerente del área quiere saber si después de proveer un adiestramiento en el área, los promedios de
errores de Bob y Jane son iguales.

www.adistancia.frba.utn.edu.ar
Minitab:
2-Proportions

Errores Bob = 36
Errores Jane = 42
Sample size = 2500
pBob = 0.0144
pJane = 0.0168 Cuidado
Cuidadocon
coneleltamaño
tamañodedelalamuestra,
muestra,
Ho: pBob = pJane siempre
siempre verifique el poderde
verifique el poder delalaprueba
prueba
cuando compare proporciones
Ha: pBob ≠ pJane cuando compare proporciones

Usar sólo cuando se hace


la prueba para determinar
que la diferencia sea igual a
0

Test and CI for Two Proportions


Sample X N Sample p
1 36 2500 0.014400
2 42 2500 0.016800

Valor p
Difference = p (1) - p (2)
Estimate for difference: -0.0024
95% CI for difference: (-0.00926943, 0.00446943)
Test for difference = 0 (vs not = 0): Z = -0.68 P-Value = 0.494

¿Qué decide?

www.adistancia.frba.utn.edu.ar
ANOVA (ANalysis Of VAriance)
Prueba de posición o tendencia central

⇒ Es la herramienta para comparar dos o más medias.


⇒ La hipótesis nula de la prueba ANOVA declara que las medias de todos los procesos son iguales
⇒ Ho: µa = µb = µc = µd = µe
⇒ La hipótesis alternativa, en contrapartida, es que AL MENOS una de las medias de los procesos
es diferente a las demás
⇒ Ha: Al menos un µ es diferente del resto
⇒ El modelo estadístico de ANOVA es
i = 1, 2, ..., a
y ij = µ + τ i + ε ij ( NID,0, σ ) 
 j = 1, 2, ..., n
Constantes

Un
Unmodelo
modeloaditivo,
aditivo,donde
dondecadacadaobservación
observaciónes eslalasuma
sumadedelalamedia
mediageneral
generaldel
delproceso
proceso(µ),
(µ),
más la media (τ ) del tratamiento i, más un término variable o de error, normalmente
más la media (τi) del tratamiento i, más un término variable o de error, normalmente
i
distribuido
distribuidocon
conmediamedia00yydesvío estándarσ,σ,independiente
desvíoestándar independientedel
delnivel
nivelde
delos
losfactores
factores

One way ANOVA


Pruebas de medias y
medianas

Comparaciones con 1 Comparaciones con Comparaciones con 2 ó


nivel de la X 2 niveles más niveles

Ejemplo de 2 niveles (One way ANOVA)


Comparando 30 llamadas de Bob vs. Jane

Ejemplo de 3 niveles (One way ANOVA)


Comparando 30 llamadas de Bob, Jane y Walt

One way ANOVA


Comparaciones con 2 ó
más niveles Pruebas de medias y
medianas
Estudiar forma

NOTA:
NOTA:
Estudiar Con
Con 2 ó más niveles de laXXestamos
2 ó más niveles de la estamoscomparando
comparandodos
dosóó
estabilidad
más procesos o “tratamientos” entre sí
más procesos o “tratamientos” entre sí
Estudiar Esto
Estorequiere
requiereel
eluso
usode
deANOVA
ANOVA
dispersión

Estudiar
Ejemplo de 2 o más niveles
posición ¿Bob y Jane toman el mismo tiempo en sus llamadas?
¿Bob, Jane y Walt toman el mismo tiempo en sus llamadas?

www.adistancia.frba.utn.edu.ar
Ejemplo: Centro de llamadas
ANOVA

Un gerente de ventas desea conocer cuál de tres operadores toma diferente tiempo en contestar las llamadas.

Bob Jane Walt


25.3 26.0 28.4
26.1 25.9 27.5
24.1 26.0 27.6
24.8 26.4 27.4
26.0 26.0 24.9
… … ...
Pregunta práctica:
¿Cómo comparan los tiempos de llamada de Bob, Jane, y Walt?

Total
Variable Operator Count Mean Minimum Median Maximum
Time Bob 30 24.848 23.319 25.065 26.058
Jane 30 25.446 23.535 25.503 27.677
Walt 30 27.084 24.921 27.159 28.654

Boxplot of Stacked vs Person


29

28

27
Stacked

26

25

24

23
Bob Jane Walt
Person

Mapa de análisis ANOVA – Paso 2


Forma

Minitab Qué preguntar

Prueba de ¿Datos normales ?


normalidad Si el valor p < 0.05 el proceso NO es normal
Cuidado con el tamaño de la muestra

Comparaciones de 2 ¿Contamos con un proceso estable que


niveles Gráfica
I-MR proporcione evidencia de que los datos
provienen de un solo proceso o población?
Estudiar forma

Usamos
Usamoslas
lasgráficas
gráficasde
deBob
BobyyJane
Janedel
del2-Sample
2-Samplett
Estudiar
estabilidad Test
Test

www.adistancia.frba.utn.edu.ar
Determine el tipo de datos

Un gerente de ventas desea conocer cuál de tres operadores toma diferente tiempo en contestar las llamadas.

Tiempo de llamada ¿Tipo de datos? _______________


¿Cuál es la Y? ______________ Variable

Operador Atributo
¿Cuál es la X? ______________ ¿Tipo de datos? _______________

ANOVA
¿Qué herramienta utilizar ? _____________________________

Mapa de análisis ANOVA – Paso 3


Dispersión

Minitab Qué preguntar

Prueba de ¿Datos normales ?


normalidad Si el valor p < 0.05 el proceso NO es normal
Cuidado con el tamaño de la muestra

Gráfica ¿Contamos con un proceso estable que


Comparaciones de 2
I-MR proporcione evidencia de que los datos
niveles
provienen de un solo proceso o población?
Normal No normal
Estudiar forma
Apilar datos; Bartlett (F-Test) Levene
Prueba de Ho: σ2A= σ2B Ho: σ2A= σ2B
igualdad de
Estudiar varianzas
estabilidad

Estudiar
dispersión Antes
Antesdederealizar
realizarla
laprueba
pruebaANOVA
ANOVAdebemos
debemosejecutar
ejecutarlas
las
pruebas de normalidad e igualdad de varianza
pruebas de normalidad e igualdad de varianza

Si el valor p < 0.05, la media de las dos poblaciones NO es igual

Para estudiar la dispersión, usamos la prueba de igualdad de varianza dentro del menú de ANOVA en Minitab
La hipótesis es la siguiente:
⇒ Ho: Las varianzas de los procesos son iguales
⇒ Ha: Al menos una de las varianzas es diferente a las demás

NOTA: Los datos deben apilarse para realizar esta prueba

⇒ Use la siguiente estructura en la tabla:


 Una sola columna para las mediciones
 Una columna para los identificadores
⇒ En el ejemplo use columnas para:
 Operador (con Bob, Jane, y Walt como valores)
 Tiempo (con los datos de Bob, Jane, y Walt)
⇒ Leyendo por fila obtenemos el dato y su creador.

www.adistancia.frba.utn.edu.ar
Use Data>Stack>Columns

www.adistancia.frba.utn.edu.ar
Prueba de igualdad de varianza

Test for Equal Variances for Stacked

Bartlett's Test
Test Statistic 0.57
Bob P-Value 0.750
Lev ene's Test
Test Statistic 0.23
P-Value 0.798
p-Value
Person

Jane

Walt

0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5
95% Bonferroni Confidence Intervals for StDevs

Mapa de análisis ANOVA – Paso 4


Posición
Minitab Qué preguntar

Prueba de ¿Datos normales ?


normalidad Si el valor p < 0.05 el proceso NO es normal
Cuidado con el tamaño de la muestra

Gráfica ¿Contamos con un proceso estable que


Comparaciones de 2
I-MR proporcione evidencia de que los datos
niveles
provienen de un solo proceso o población?
Normal No normal
Estudiar forma
Apilar datos; Bartlett (F-Test) Levene
Prueba de Ho: σ2A= σ2B Ho: σ2A= σ2B
igualdad de
Estudiar varianzas
estabilidad
2-Sample t Test con igual 2-Sample t Test con igual varianza
Varianzas iguales varianza (n>25), 1-Way ANOVA, con
1-Way ANOVA transformación
Estudiar Ho: µA= µB Mann-Whitney, Kriskal-Wallis,
dispersión Mood

Varianzas desiguales 2-Sample t Test con varianzas 2-Sample t Test con varianzas
Estudiar desiguales, 1-Way ANOVA desiguales (n>25), 1-Way ANOVA,
posición Ho: µA= µB con transformación
Kriskal Wallis, Mood

Si el valor p < 0.05, la media de las dos poblaciones NO es igual

www.adistancia.frba.utn.edu.ar
Individual Value Plot of Stacked vs Person Boxplot of Stacked by Person
29 29

28 28

27 27
Stacked

Stacked

26 26

25 25

24 24

23 23
Bob Jane Walt Bob Jane Walt
Person Person

Ho: µ1 = µ2 = µ3
Ha: At least one µ is different
One-way ANOVA: Stacked versus Person Hay evidencia de que
Source DF SS MS F P por lo menos una de
Person 2 80.345 40.172 44.61 0.000 las medias es diferente
Error 87 78.344 0.901
Total 89 158.689
del resto
(Rechazar Ho)
S = 0.9490 R-Sq = 50.63% R-Sq(adj) = 49.50%

Individual 95% CIs For Mean Based on


Pooled StDev
Level N Mean StDev ----+---------+---------+---------+-----
Bob 30 24.850 0.870 (----*---)
Jane 30 25.453 0.990 (---*---)
Walt 30 27.087 0.982 (----*---)
----+---------+---------+---------+-----
24.80 25.60 26.40 27.20

www.adistancia.frba.utn.edu.ar
Epsilon cuadrada: significado práctico

⇒ Usamos la suma de cuadrados para estimar la contribución del factor en la variación total del proceso.
⇒ El valor de épsilon es la proporción que tiene el factor o término en el total de la suma de cuadrados.
⇒ Tenemos que crear columnas de la fuente “source”, sumas de cuadrados “SS” y Epsilon square
 Copie las columnas de efectos y sumas de cuadrados de la ventana de sesión en una tabla Minitab o
Excel.
 Use la calculadora minitab o programe la fórmula en Excel para obtener la ecuación: Epsilon-sq =
SS/Total SS.
Source DF SS MS F P
Person 2 80.345 40.172 44.61 0.000
Error 87 78.344 0.901
Total 89 158.689

9
68

78.344
58.
Epsilon-sq = 80.345/158.69 1
= 0.5063
80.345

⇒ Esto significa que la persona contribuye con 50% de la variación total observada.
⇒ La contribución del factor “Person” es tanto estadística como prácticamente significativa.

ANOVA: ¿Qué aprendimos?

⇒ Hay un operador diferente a los demás.


⇒ El “box plot” nos muestra que Walt toma más tiempo que los demás operadores.
⇒ Ahora hay que preguntar “¿por qué?”.
⇒ ¿Es Walt personalmente responsable o hay otros factores que hacen que el promedio de su tiempo
procesamiento de llamadas sea mayor?.

Análisis de Residuos

El análisis de los residuos no indica nada significativo que invalide la aplicación de la herramienta (pero en
caso de dudas guarde y analice los residuos y los valores estimados).
Los residuos son normales, independientes y estables.

Seleccione “Four in one”

www.adistancia.frba.utn.edu.ar
Independencia
Residual Plots for Time
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
99.9
99 2
90 1

Residual
Percent
50 0

10 -1
1
-2
0.1
-3.0 -1.5 0.0 1.5 3.0 25.0 25.5 26.0 26.5 27.0
Residual Fitted Value
Normalidad
Histogram of the Residuals Residuals Versus the Order of the Data
2
20
1
Frequency

Residual
15
0
10
-1
5
-2
0
-1.6 -0.8 0.0 0.8 1.6 2.4 1 10 20 30 40 50 60 70 80 90
Residual Observation Order

Estabilidad

Pruebas de hipótesis
Datos no normales

Mapa de análisis – Paso 4


Posición
Minitab Qué preguntar

Prueba de ¿Datos normales ?


normalidad Si el valor p < 0.05 el proceso NO es normal
Cuidado con el tamaño de la muestra

Gráfica ¿Contamos con un proceso estable que


Comparaciones de 2
I-MR proporcione evidencia de que los datos
niveles
provienen de un solo proceso o población?
Normal No normal
Estudiar forma
Apilar datos; Bartlett (F-Test) Levene
Prueba de Ho: σ2A= σ2B Ho: σ2A= σ2B
igualdad de
Estudiar varianzas
estabilidad
2-Sample t Test con igual 2-Sample t Test con igual varianza
Varianzas iguales varianza (n>25), 1-Way ANOVA, con
1-Way ANOVA transformación
Estudiar Ho: µA= µB Mann-Whitney, Kriskal-Wallis,
dispersión Mood

Varianzas desiguales 2-Sample t Test con varianzas 2-Sample t Test con varianzas
Estudiar desiguales, 1-Way ANOVA desiguales (n>25), 1-Way ANOVA,
posición Ho: µA= µB con transformación
Kriskal Wallis, Mood

Si el valor p < 0.05, la media de las dos poblaciones NO es igual

Prueba de Mann-Whitney
Non-parametric – Comparación de 2 muestras

Deseamos saber si hay una diferencia en los tiempos de embarque para productos enviados entre semana vs.
el fin de semana.

www.adistancia.frba.utn.edu.ar
Siga el mapa de análisis
⇒ Estudie forma
⇒ Estudie estabilidad
⇒ Estudie dispersión

Estudio de forma
Embarques de fin de semana

Probability Plot of WkendShippingTime


Normal
99
Mean 1.724
StDev 1.372
95 N 50
AD 1.408
90
P-Value <0.005
80
70
Percent

60
50
40
30
20

10 Summary for WkendShippingTime


5 A nderson-D arling N ormality Test
A -S quared 1.41
P -V alue < 0.005
1
-2 -1 0 1 2 3 4 5 6 M ean 1.7236
S tD ev 1.3716
WkendShippingTime V ariance 1.8812
S kew ness 1.03135
Kurtosis 0.51038
N 50
M inimum 0.0587
1st Q uartile 0.5960
M edian 1.3322
3rd Q uartile 2.3806
0.0 1.2 2.4 3.6 4.8
M aximum 5.6664
¿Que decide? 95% C onfidence Interv al for M ean
1.3338 2.1134
95% C onfidence Interv al for M edian
0.9605 1.9738
95% C onfidence Interv al for S tD ev
95% Confidence Intervals
1.1457 1.7092
Mean

Median

1.0 1.2 1.4 1.6 1.8 2.0 2.2

Estudio de estabilidad

I-MR Chart of WkendShippingTime I-MR Chart of M-FShippingTime


6 1 4
UC L=5.537 UC L=3.733
Indiv idual V alue
Indiv idual V alue

4
2
_ _
2 X=1.724 X=1.266

0 0

-2 LC L=-2.089 LC L=-1.201

5 10 15 20 25 30 35 40 45 50 5 10 15 20 25 30 35 40 45 50
Observation Observation

1
3 UC L=3.030
4.8 UC L=4.684
M ov ing Range
M ov ing Range

3.6
2

2.4
__
__ 1 MR=0.928
MR=1.434
1.2

0.0 LC L=0 0 LC L=0

5 10 15 20 25 30 35 40 45 50 5 10 15 20 25 30 35 40 45 50
Observation Observation

Recuerde
Recuerdeque
quesi
silos
losdatos
datosno
noson
sonnormales,
normales,el
elI-MR
I-MRchart
chartpuede
puededar
darresultados
resultados
engañosos; cuando no haya normalidad, use el run chart
engañosos; cuando no haya normalidad, use el run chart

www.adistancia.frba.utn.edu.ar
Estudio de dispersión

Test for Equal Variances for ShippingTime


F-Test
Test Statistic 0.45
M-FShippingTime P-Value 0.005
Lev ene's Test
When

Test Statistic 4.68


P-Value 0.033
W k endShippingTime

0.6 0.8 1.0 1.2 1.4 1.6 1.8


95% Bonferroni Confidence Intervals for StDevs Recuerde
que
debemos
M-FShippingTime
apilar los
When

datos
W k endShippingTime

0 1 2 3 4 5 6
ShippingTime

Prueba de medianas de Mood


Non-parametric – Comparación de 2 o más muestras

Deseamos saber si hay una diferencia en los tiempos de embarque para productos enviados entre semana vs.
el fin de semana.

Siga el mapa de análisis


⇒ Estudie forma
⇒ Estudie estabilidad
⇒ Estudie dispersión

Prueba de Mood

www.adistancia.frba.utn.edu.ar
Mood Median Test: ShippingTime versus When
Mood median test for ShippingTime
Chi-Square = 0.64 DF = 1 P = 0.424

When N<= N> Median Q3-Q1


M-FShippingTime 27 23 1.12 1.21
WkendShippingTime 23 27 1.33 1.78

Individual 95.0% CIs


When --------+---------+---------+--------
M-FShippingTime (---------*-----------)
WkendShippingTime (----------*-----------------)
--------+---------+---------+--------
1.05 1.40 1.75
Overall median = 1.22

A 95.0% CI for median(M-FShippingTime) - median(WkendShippingTime): (-1.00,0.30)

Mann-Whitney
Prueba no-paramétrica

Mann-Whitney Test and CI: WkendShippingTime, M-FShippingTime


N Median
WkendShippingTime 50 1.3322
M-FShippingTime 50 1.1152

Point estimate for ETA1-ETA2 is 0.2808


95.0 Percent CI for ETA1-ETA2 is (-0.1056,0.7211)
W = 2733.0
Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0.1526

Valor
Valorp:p:
SiSippfuera
fuerabajo
bajoentonces
entoncesexistiría
existiría
una diferencia entre las medianas
una diferencia entre las medianas
Ojo!
Ojo!Requiere
Requiereigualdad
igualdadde
devarianzas
varianzas

www.adistancia.frba.utn.edu.ar

También podría gustarte