ao UNIVERSIDAD MopaALipaAD
bed CONTINENTAL | | VirTUAL
MANUAL AUTOFORMATIVO
ESTADISTICA II
Claudio Alvaro Cerrén LandeoGada ator es responsable del contenido de si propio text,
De eae etissa!
(© Universidad Continental S.C 2012
(J Join 355, Miralores, Lined
“Teléfono: 218 2760
Derechos reserdos
Primera Fain: Noviembre 201
raj: 5M ejemplares
Auto: Chau Atanas Corie Lado
(Oficina de Prockicetn de Contes yReextce
Imprese en ol Pent -Rebelars 54.6
{Js Los Boaques 855 EI Tambo -Huancaya
Fond Editorial de Ia Universidad Continental
“Toot los derechos reservados.
Esta publicacn no puede ser repr, en todo en panes ni registra en 0
sida por wo tama de eeupetacign de infomation, eng fom pr
in meio sea meeanico, oloquimice, cleetsnico, magnetic, eeetroSplico, por
Totorop tier ote sinel erm pretin par ensita de fs UniversINDICE
INTRODUCCION iy
PRESENTACION DE LA ASIGNATURA 8
COMPETENCIA DE LA ASIGNATURA 8
UNIDADES pIDAcTICAS 9
TIEMPO MINIMO DE ESTUDIO 8
UNIDAD I: MUESTREO Y ESTIMACIGN DE PARAMETROS n
DIAGRAMA DE PRESENTACION DE LA UNIDAD | "1
ORGANIZACION DE LOS APRENDIZAIES u
TEMA N? 1: THOMAS HOBBES 1
E_Definiciones basicas 13
EX Tipos de muestreo probabilistieo “4
LECTURA SELECCIONADA N°1 "
2Funciona la terapia de contacto? Mario Triola. pp. 319 7
ACTIVIDAD N° a
TEMA.N® 2: ESTIMACIGN Y TAMANOS DE MUESTRA a1
El Estimacisn de Ia proporcién poblacional 2
Il Estimacion de la media poblacional al
El Estimacién de a varianza poblacional 21
Il Determinacién del tamaitos de muestra al
CONTROL DE LECTURA N° 1 a
GLOSARIO DE LA UNIDAD 1 18
BIBLIOGRAFIA DE LA UNIDAD | 18
AUTOEVALUACION DE LA UNIDAD | 18
UNIDAD II: PRUEBA DE HIPGTESIS Y ANALISIS DE VARIANZA 13
DIAGRAMA DE PRESENTACION DE LA UNIDAD II 13
ORGANIZACION DE LOS APRENDIZAIES 13
TEMA N° 1: PRUEBA DE HIPOTESIS 14
MB Definiciones bisicas uu
HA Prucha de aseveracién para la media “IEW Prueba de aseveracion para la praporeién
u
Prueba de aseveracion para la yarianza 4
TEMA N° 2: INFERENCIA A PARTIR DE DOS MUESTRAS "7
BEL Inferencia acerca de dos medias, proporciones para mucstras independientes 17
GW Inferencia a partir de datos pareados 17
EX Comparacién de ta variacion de dos muestras 7
TEMA N° 3: ANALISIS DE VARIANZA "
Hl ANOVA de un factor fe
HB ANOVA de dos factores 7
LECTURA SELECCIONADA N° 1 7
La paradoja del cumpleaitos Blog Estaditiea para todos
ACTIVIDAD N° 1 18
ACTIVIDAD N° 2 18
TAREA ACADEMICA N° 1 18
GLOSARIO DE LA UNIDAD II 18
BIBLIOGRAFIA DE LA UNIDAD It 18
AUTOEVALUACION DE LA UNIDAD It 18
UNIDAD III: ESTADISTICA NO PARAMETRICA 13
DIAGRAMA DE PRESENTACION DE LA UNIDAD 4
ORGANIZACION DE LOS APRENDIZAIES 13
TEMA N° 1: PRUEBA DEL SIGNO 4
El Prucha del signo “4
EW Prueba de rangos con signo de Wilcoxon para datos apareados u
BB Prucha de la suma de rangos con signo de Wilcoxon para muestras independientes “u
TEMA N° 2: EXPERIMENTOS MULTINOMIALES Y TABLAS DE CONTINGENCIA
THI Bondad de ajuste 7
BI Independencia y homogeneidad 7
TEMA N° 3: PRUEBAS NO PARAMETRICAS 4
Hl Prucha de Kruskal Wallis 4
HF Prucha de correlacion de rangos 14
EB Prucha de rachas aLECTURA SELECCIONADA N° 1 a7
Los estudiantes clasifican a las uiversidades dle In misma manera que el U.S. News and World Report? Mario
Tiiola. pp. 675.
ACTIVIDAD N°1 18
ACTIVIDAD N°2 18
CONTROL DE LECTURA N° 2 B
GLOSARIO DE LA UNIDAD III 4
BIBLIOGRAFIA DE LA UNIDAD III 4
AUTOEVALUACION DE LA UNIDAD III 4
UNIDAD IV: CORRELACION, REGRESION Y CONTROL ESTADISTICO DE PROCESOS 13
DIAGRAMA DE PRESENTACION DE LA UNIDAD 3
ORGANIZACION DE LOS APRENDIZAIES 13
TEMA N° 1; CORRELACION Y REGRESION 13
MB Correlacion y regresién lineal 4
HA Correlacion y regresion miltiple fe
Il Flaboracion de modelos de regresi6n 4
TEMAN® 2: CONTROL ESTADISTICO DE PROCESOS 15
Ill Graficos de control para la media y varianza 7
IX Graficos de control para atributos 7
LECTURA SELECCIONADA N° 1 31
09
demuestreo ¥ clerror
Si el muestreo es sin reemplazo y a frac
cestindar serie
=|
yylos limites de confianza se calculan con la siguiente fr
=
Ejemplo
Un articulo publicado en un diario local indica que el tiempo promedio em-
pleadlo por los hogares de Lima Metropolitana en ver televisién en el horario
de 8 pam. a 11 pam. es de 7.75 horas. Suponga que el tiempo tiene sina distri=
bucida aproximadamente normal con desviacion estindar de 345 horas. Para
corroborar dicha afirmaciGn un grape de estudiantes selecciona una muestia
dle 180 hogares de .M. y obtuve que el tiempo promedio fue de 7,42 horas
por semana :Sera cierta in afirmaciGn publicada por el diario local al 96% de
onfianza?
Solitein
42siendo
i) Lav estimaeidn puntual de pes x =
i) -a=098 w= 0.04emtonces: Zpgi =240.98)
iw FW)=72 -Q, 29).
yra la distrbueidén normal estan-
la distribucign tes my simi
En aparien
darizada, Ambas distribuciones tienen forma de campana. Sin embargo, la dis.
Luibucion {tiene mayor area en los extremos y menor en el centro, a diferencia,
de la distibueidn normal
Stender Shade
rormd demnbanon
terete witha Te
FIGURA N“Oi: Ejemplo de grafiens de la distribucion tStudent para diferentes
tamafos de muestea (Triola, 2009)
Ejemplo
El jefe del drea de prensa de un diario desea evaluar la habilidad de s equipo:
ide trabajo en el digitado de una misma notiela, Para realizar dicho estudio se
leceiona al azar tma muestra aleatoria de redactores obstenicnd los siguicntes|
resultados (en
or
6379 82-79-69 8B BH OS 90
B28 4
Asumiendo que los tiempos se distribuyen normalmente. Halle ¢ interprete un
Intervalo del 95% de confianza para ¢l tiempo medio ulilizado en el tipeado
de una noticia
Solucisn:
4) La estimacién puntual para pes =7,645 sienda s= 1.8507
4i) Como el nivel de confianza es 95%, Faia
iit)
L () = 7,645 — 2,0930
2.0930
8597) 8597)
$7,645 + 2,0930
e770 y 8.1130
Interprotacién: Con un 95% de confianza entre 6.7746 y 8.1130 minutos se en-
contrari la media del tiempo ntilizade por todos los redactores en cl digitado.
de una noticia,
Ejemplo
Pamela, estudiante de estadistiea para Ciencias de la Empresa piensa que el
sgasto promerlin semanal en fatocopias de los estudiantes de st facultad es de
53.5 soles, Para verificar si cs cierto Io que est pensande ha clegide al azar wna
muestra de 9 estudiantes de an total de 120 estudiantes que llevan el curso de
estadistica para comumicadores, resultando los siguientes gastoseet ccs aman
35 2B 9TH DHS
Sila variable aleatoria objeto de estudio sigue una distribucién normal. Con un
intervalo de confianza del 96% para la media del gasto semanal en fotocopias
por estudiante ;sert cierto lo que piensa Pamela?
Solucisn:
1) ne; N=120; 100.96
fi) “2.3889 siencdlo s= 0.7639 y n/N=0.07580.05
= 238804 (ease09) O79) (120-9
d | 020-1)
= 178665 ws 2.9912
Conclusién: Con un nivel de confianza del 969% se puede deeir que el gato
;romedio semanal en fotocopias de los estudiantes ce si faculiad es menor a
3.5 soles, por lo que pedriamos decir que lo que piensa Pamela no es cierto.
El ESTIMACION DE LA VARIANZA POBLACIONAL
Supongamos una muestra aleatoria de n observaciones de una distribucién N(jB).
Si Bes desconocida y la varianza muesiral observada es entonces el intervalo de
confianza para la varianza poblacional al nivel de confianza del 100(15)% viene
dado por:
donde Zitat sulawe PLZ) < Bipae]=% y
ian oolqve PLS Zia} =.
vlavariable aleatoria Z,- sigue una distribucién 7 de Pearson con n-1_ grados
de libertad
cs
@
ai
FIGURA N°05: VALORES CRITIGOS DE L.A DISTRIBUGION CHEGUADRADO
(Triola, 2008)Yoon NTT SSO La
= Para obtener el valor erica 2.7 ubicar cl 9 on la coltmna de gradas de libertad
p00:
0.975 (rea hacia la detecha del 7° ) en la parte superior horizontal.
+ Para obtener el valor eritico 19,025 ubicar el 9 en la columnade grados de liber
tad y 0.025 (rea hacia la derecha del 7) en la parte superior horizontal,
jemplo
Un fabricante de baterias para automdvies afirma que sus haterias durarin, en
promedio, tes afios con una varianza de un aio. Si cinco de estas baterias Gener
duraciones de 1.9, 2.4, 80, 35 y 42 aos, construya nn intervalo de contianza del
95% para 7 -y decida sila afirmacién del tabricante de que 7 = 1 es vilida,
Suponga que la poblacién de duraciones de las baterias se distribuye de forma
aproximadamente normal
Solucién
Ds =0815 a
4) Elyalor BR1-/2,, es un valorfi2 con B= 541 grados de libertad, que deja un area
de 0,025 a la iquierda y por lo tanto un dizea de 0,975 a la derecha, es B20,975 =
0.484; de la misma forma, el valor 828/2 es igual a 820,025 = 11,143.
)
G-MO815) (> _ G-1K0815)
1143 0.484
iy)
03<0? <67
Interpretacién: Con 95% de confianza entre 0,3 y 6,7 se encontrar la varianza de
la duracidn de Ins baterfas, Sfes posible considerar como vilida la afirmacién del
fabricante porque el intervalo hallido contiene a la unidad,
Ejemplo
Se desea estimar la varianza de la longitud de ciertos cables, En una muestra de 29
cables se encuentra quie I longitu tiene uma media de 80 mv una desviacién de 3
sm. Hallar un intervalo con una cont para la varianza de las longitudes
de los cables,
Solueidin
8
n=25
i)
NC.=0.95= 0.025, a
iit)
Zoors29 =124011, Zeon. = 39-3641
a)
Wx9 2, x9
39.3641 12.4011
»Pe
Pete orc) ear
549<07 $1742
ww
234<0<417
Intexpretacién: Se puede afirmar con un 95% de confianza que la desviacién estan-
dar de la longitu de dichos cables se encuentra entrea 2.34 m y4.17im,
[El DETERMINACION DEL TAMANO DE MUESTRA
Existen tres factores que determinan el tamaio de una muestra; ninguno tiene
alguna relacidn directa con ol tamaio de la poblacisn, Estos son’
-El grado de confianza elegido.
- Elximo error permitido.
Lavariacién de la poblacién,
41, Para estimar la media poblacional
= pan
= a B(N-Dtro”
Donde:
: Esel error permitidos
2% El yalor estindar normal asociado con el grado de confianza elegido,
La desiacién de la poblacidn, obtenida de estudios anteriores, experiencias pre-
vias ose puede estimar la desviacion estindar muestral mediante un estudio piloto
‘no: Tamale de muestra caleulada de una poblacién infinita
Nz Tamafio de poblacién
Se dice que w cs finita si la relacion n/N > 5%
4.2, Para estimar la proporeion poblacional
Donde:
E:Esel error permitida;
2: El valor estindar normal asociado con el grado de confianza elegido,
P: La proportidn de éxito de la poblacion, obtenida de estudios anteriores, expe-
riencias previas o se puede estimar la proporeidn de éxito muestral mediante un
estudio pilota,
4g La proporcién de fracaso de la poblacién se obtiene por complemento de pq= keene ian
Tamatio de poblaciéa
mplo
Se desea estimar el peso promedio de los cos que son Henadas por in niievo ins
trumento en tina industria, Se conace que el peso de un saco que se Mena con este
instrumento es una variable aleatoria con distributcion normal, Si se supone que la
desviacion tipiea del peso es de 0.5 ky, Determine el tamaiio de muestra aleatoria
necesaria para dleterminar una probabilidad igual a 0,98 de que el estimado y el
parimetro se diferencien modularmente en menos de 0,1 ky,
Solucion
eon o .05
i) 2, = 16
ia) n= (Cone y é
a
Evidentemente un tamaiio ee muestra no puede ser fraceionario por lo quese debe
apraximar por exceso, El tamafo de muestra seria de 97
Fjemplo
La Direceidn Regional de Trabajo phines realizar un estudio con el objetivo de
conocer el promedio de horas semanales trabajadas por las taujeres del servicio do-
méstico, La muestra sera extrafda de wna poblacién de 10000 mujeres que figuran
en los registros del seguro social y de las cuales se conoce a través de un estudio
piloto que su varianza es de 9.648, Trabajando con un nivel de confianza de 0.95
yestando dispuiestos a admitir un error maxima de 0,1, seudl debe ser el tamaio
uestral requerido?
Solueidny
8) 0=0.1; 6 = 9.648, = 0.08
» Za
»_(eens y a
§) Coma 19000¢3706x(3706-1), se corrige el tamaiio de muestra
3706
yy
T0000
704
jemplo
En un lote de fraseos para medicina, con una poblacién de $000 unidades, se desea
cestimar kt media de la capacidad en centimetros cibicus de los mismos. A waves
de un premuestro de tamatio 35 se ha estimade que la desviacién esténdar es de
2 centimetros ctibicos. Si queremos tener una precisién 0.25 cm’, y un nivel de
Significancia del 9%. 2De que tama debe de ser la muestra?
SolidiUNIDAD I; MUESTREO Y ESTIMACION DE PARAMETROS
1) 0.25 em; = em
) Zz 218
iit), NOZ
w+oZl,
iv) 8000(2)70.8 }?
MOOS THIS
we) go 1229812
3153
239
Solo faltaria muestrear 204 frascos, pues los datos de los 35 frascos del premuestreo
siguen sienda vilidos,
Bjemplo
Ena
region toman leche en el desayuno, Sise sabe que existen 1500 niios y deseamos
ener una precisién del 10 %, con un nivel de signifieancia del 5%, 2De que tama
fio debe de ser la muestra?
investigacién, se desea determinar en que proparcién los nifios de una
Solucion
1) N=1500; e=10%=0.1; a= 0.05
1500055055
OD + CR OSG
)
Se deben muestrear 90 nites.
Cuadro N09; Distintos niveles de confine utilzados ent la prctica
Nivel de
Confionss 973% 99 SHE HE SHAS STE OTE
Valores
az 5.00 258293203200. .a8
FF ssi
sta actividad puede consultarla en st aula viral= keene ian
CONTROL DE LECTURAN* 1
Esta actividad puedte consuftarla en su aula vietal
A,
I cepecsesasoen
EOD asec
‘Triola, M. (2012). Fuaditica. México : Pearson Faucacién
Berenson, My Levine, D. (2010). Estadistica Basion on Administacién, Conceptos y aplicacio.
nies, Mexico: Prentice Hall
ecenmmarniravemT
esucla el siguiente cuestionario, mareando la respuesta correcta en cada caso, para
fijar los conceptos e ideas furndamentales tratados en la Unidad:
1. Correlicione:
Es una técnica en elquc el sujeto no sabes ests Mucstreo estraifcado
Reeacestiel alesis
ee ee ears eet)
D) | eee gies tomatoe
‘posed de sr elegido>
Seleeciona directamente los individios de bx Muestra aleatorin
poblacién para la miesra
Sapa Sa ea ep eee Mileaea ae
‘ala Keximo clement de la poblacion pcan
Subdividimosa ls poblaciin en al menos dos
5 sugrupos diferentes, cada subgrupo posce gran Eatudio a ciegas
ay
»
2) 35424
4) 5A,2,31
©) 53214
‘Una de sus obras mis importantes cle Maguiavelo fue
a) 0.014
b) v.15
©) 0x07
@) 0.028,
©) 0.198UNIDAD I; MUESTREO Y ESTIMACION DE PARAMETROS
3
EI siguiente intervalo de confianza se obtiene de un
(0.883.
1, Se conoce el valor de la desviaci6n estindar poblacionsal,
normal
LS emplea para n<30 sila poblacidn tiene wna distribuci
IV. Se conoce el valor de la media poblacional
ample.
V. Lamuestea es una muestra aleator
a, my Ww
by Ly ¥
OLIV yv
aay
e) MIVy
El ancho de un interwalo de confianea para una proporcisa ser
a) Mis angosto para un nivel confianza de 99% que para un nivel conflanza de
95%.
>) Mis amplio para una muestra de tamaiio 100 que para wna muestra de tamaiio
50,
¢) Mis amplio para tina desviacidn estindar de 3.56 que para un nivel de confianza
de 90%
4) Mis amplio cuando la proparcidn de la muestra sea 0.50 que cuando la propor
‘eign de a muestra sea 0.20,
¢) Mis amplio a nivel de confianza 99% que al de 95%
Un grupo de consumidores desea estimar el monto de las Eacturas de enengia elec
trica para ol mes de marzo para las viviendas unifamiliares del distrito ce Huallias,
(Gon hase en estudios reilizados en otras ciuelades cercanas a ésta, se determing ua
esviaci6n estindar de 25 dolates. El grupo desea estimar el monto promedio para
marzo dentro de #5 délares del promedia verdadero con 99% de confianza. Calcule
cl mcjor tamano ce muestra
a) 205
b) 167
135
4) 08
©) 152
Un ampli intervalo de confianza indica que:
|. Existe mayor probabilidad de estimar parimetro con el estimador
1H, Hay una variabilidad considerable en los datos muestrales
TILLa estimacion puntual obtenida de la muestra no puede estar cerea del verdade-
ro valor del parimetra poblacional
IN. Hay poca variabilidad el estimador es cercano al parémetra
V. Livestimacisn por intervalo no es vila
Bi
wii
4"use Hoonione
el Pesce 00: worsacovesTnACGN a anit,
Son verdaderos:
a) LULylV
by my v
owyy
«nym
oly
8. Com la siguiente informacidn:
P= 2.58, = 0.01
Defina el interval de confianza para la desviaci6n estindar:
a) 1.039<0<2.775
by Lisl ) Constitucionalismo
©) Democracia
4d) Ninguna de las anteriores
20, John Locke establece que existe en Ia naturaleza del hombre wna amenaza latente
e.
4) Oportinismo
>) Conflieto,
©) Confiabilidad
4) Ninguna de las anteriores
BESTADISTICA I
a UNL ba
E) UNIDAD II: PRUEBA DE HIPOTESIS Y ANALISIS DE VARIANZA
a DIAGRAMA DE PRESENTACION DE LA UNIDAD It
AUTOEVALUACION SEOUL |
FBborcanizacion DE LOS APRENDIZAJES
es ed fo
‘Tema N' 1: Prucba de hip6tsa 1, Gonoce y praca 1s pror
Dene cedimienten de In pricha de
rch de aseveral6n pata pens pt
tamedia ones a
5. Pech severe para
propareian
4: Pructa de seeracon para
1. Valora bs importancia de ta
cstimacidn de paraimetros
pdr del wat
dle muestra y compricka be
pate patna ded
2. Compara dos conjustos de
‘Tema N°2: Inferenciaa partir ator muestraes 5 apea be
de dos estas prucbs de hips area de
Ho Inferencia acerca de dos Syseanictrsticas poblaiona
meds. proporciones para ks
accra tndepeiiente
2 Inferencia a partic de datos
pleated
Comparacin del vartacin
she des mics Actividad N° 2
‘Tema N° Se Inferencia a partir T™Pe® Academies N°
Pape pe aay
ANOVA de un fictor
[Link] ded actores
Apt andi de erin
de un faciory de dos factores
Lecture slecconeds 371
1a puradoja del cumpeaion
Blog staditica para tis
“Avsoreacion de a UnidadCs)
co
DDE HIPGTESIS Y ANALISIS DE VARIANZA
TEMA N° 1: PRUEBA DE HIPOTESIS
Los métodos estudisdos en la Unidad anterior usan la informacién proporcionada por
Jos estadisticos muestrales para estimar con cierta probabilidad el valor de un pardme-
tro pablacional. En éste Unidad se introducini la prucha de hipstesis que supone a
priori el valor del parimetro y sobre la base de la informacion obtenida en una mies
fya se somete prueba la supesicién, para luego tomar eon eierta probabilidad, ka
dcisién de recharar o no recharar In hipdtesis. En éste pinto es importante se
ls expresin “no rechazaa” pudiera ser sustituida por “aceplar", sin embargo a
hacerlo es necesario atencler cuidadosamente algunas explieaciones que se daran mis
adelante, La pricha de hipétesis también conocida como docimasia contrastae
cid de hipstesis es uno de los métodos estadisticos mis usados en las ciencias naturales
por ser un procedimniento que le proporciona al investigador un crterio objewvo part
tomar decisiones con hase a in raimero limitadlo de observaciones.
Esta proposicin que finalmente es aceplada © rechazada recibe el nombre de hi
potesis, Este es imo de los aspectos mis tiles de ka inferencia estadistiea, pesto que
‘muchos tipos de problemas de toma de decisiones, prichas a experimentos en el mune
do de la ingenierfa, ciencias de la salud, cencias sociales, administracion, economia,
etc,, pueden formutarse como problemas de prucha de hipstesis,
Il DEFINICIONES BASICAS
11. Hipotesis
Una hipstesisestadistica es una proposicién o supuesto sobre los parimetros
dle una © mis poblaciones
ipétests estadistica
Gaalquier afirmacién o conjetura que se hace a cerea de la distsbucidin de una
‘o mas poblaciones
Fj
El promedio ponderado de los alumnos de UCCI en el semestre
perior a 14
1.3. Hipotesis simple
salquicr hipstesis estadistica que especifica completamente Ia dstribuc
la poblaciéa, especifica la for
a de la elistribucion y el valor de su parimetro,
Ejemplo:
E] ingreso mensual promedio de les empleados de cierta empresa es de 800
nuevas soles, suponiendo que los ingresos se distibuven normalmente con
desviacion estindar de 30,
1.4. Hipotesis compu
Gualquier hipdtesis estadistica que NO especifica completamente la distribu
fn de la poblacign,
Ejemplos
E] ingreso mensual promedio de los empleados de cierta empress es SUPE
RIOK 2 900 nuevos soles, suponiendo que los ingresos se distribuyen normal
mente con dessiaeién estindar de 30.
Hipotesis aula (10)
Es la hipdtesis que esaceptada provisionalmente como verdaderay enya valider
serd sometida a comprobacion
ip6tesis alternativa (hI)
Es una hipotesis contraria a la hipotesis nul, se acepta en caso que la hipatesis
intl sea rechazada,
Es importante recordar que las hipétesis siempre son proposiciones sobre laPAUSE AIL)
poblacién o distribuci6n bajo estudio, no proposiciones sobre la muestra, Por
lo general, el valor del parimetra de Ia poblacién especificado en la hipsitesis
tila se determina en wna de tres maneras diferentes;
= Puede ser resultado de la experiencia pasada o del conocimiento del proce:
+0, entonces el objetivo de Ia prucba de hipstesis usalmente es determina si
tha cambiado el valor del parimetre
Puede obtenerse a partir de alguns teorfa © modelo que se relaciona con
el proceso bajo estudio. En este caso, €1 objetivo de la prueba de hipstesis es
vetificar la eorka o modelo,
Cuando et valor del parimetro proviene le consideraciones externas tales
como las especificaciones de disefia 0 ingenieria, o de abligaciones com
tractuales, En esta situacidn, el objetivo usual de la prueba de hipstesis e pro
bar el cumplimiento de las especificaciones
1.7, Planteamiento de hipotesis
Es importante tener en cuenta que cl signo igual siempre debe ir vinculade a
Tx hipstesis aula.
2)H0: 958,
Hi 838,
s)H0: 928,
Hn a8, HO. 6=0, yill 848,
10, 0=8, y 11,:8<8,
1.10, ERROR TIPO LY It
“ACEPTARH, ‘CORRECTO ERROR TIPO 11
ke ®
RECHAZAR HY, ERROR TIPOT ‘CORRECTO
a cB)
ESTADISTICA I
Tea
47UntveRsipaD
CONTINENTAL
Vieraat
Cs)
co
DDE HIPGTESIS Y ANALISIS DE VARIANZA
Nivel de Significacion (a)
Es la probabilidad de cometer un error de tipo
(error tipo 1)
P(rechazar H, cuando es verdadera)
Potencia de una Prueba
Es la probabiliclad de cometer un error de tipo 1
(error ipa)
(aceptar H, cuando es fala)
1.11, Regla de decision
Es la division de la disuibucién muestral del estadistico de la prueba en dos
‘partes niuttamente exchiyentes:
Region Critica (RC): region de rechazo de HO
Regidn de Aceptacidin (RA): regidn de no rechazo de 0
Depende de la hipétesisalternativa HI del nivel de significacién y ka distribu
cidn muestra del estadistica
Prucha de Hipétesis Bilateral
‘a Phicha de das cola.
ay HI8=8,
sf *
“C e
Prucha de Hipétesis unilateral
9 Prueba de una cola,
Ho:8=8, y H1:8<8,
Prucha de Hipstesis unilateral
© Bruch de una cola,
H0:9=8, y HI:859,PAUSE AIL)
1.12. Procedimiento de la prueba de hips
La prucha de hipstesis estadistica consta del
sate procedimiento:
1, Planteamiento de las hipstests. Establezea la aseveracidn qute desea ser pro-
dada y exprésela en forma simbélica, 10 y 11. EI signo igual siempre debe ir
Nincukido eon la HO.
2, Establecimiento del nivel de confianza, De acuerdo ala gravedad de comecer
1 error tipo Tse establece el valor a, Es usual consierar los valores 0.05 y
0.01. Este valor nos permitiré caleular valor critica de la pricha quie priede
ser z, Lo chi cuadrado,
5, Galleulo del estadistico de prucha, Se identifica el estadistica pertinente para
1h prueba realizada y su respectiva distibucidn, Iuego se realiza el cilcule
dol mismo al cual ustialmente se le denomina valor caleulado, Se realiza un
agrifica de la distribucidn que incluya el valor eritico, cl estadistica de priicha
yas regiones de rechazo 0 critica y de aceptacion
4, Establecimiento de la regla de decision, Rechace la HO si el estadistico de
prueba se eneuentsa en la region de eritica © de rechazo, Acepte la HO si el
estadistico de prueba se encueentra en la regién ee acepracién,
mma de decisién. Establezca la conchisién indicande si existe evidencia
iuestral suliciente para aceptar lt HO (FEEAHO) o los datos muestrales
sustentan la aseveracidn de la HD porlo que no lny evidencia estadistica para
aceptar HO (EEERHO)
[Gl PRUEBA DE ASEVERACION PARA LA MEDIA
Supongamos que de nna poblacién normal con media desconocida py varianca
conocida BF se extrae tna muestra dé tamatio n, entonces de la distribuctn de la
yedia muestral X se obliene la prucha estadistica o estaditic:
=u
sin
Ejemplo
Fuumar cigarros de la marea X produce en promedio 0.6 mg de nicotina. Hl depar.
ltamento de ingenieria del fabricante propone un fillto nuevo que supuestamente
reducini la produccién de nicotina, Se toma una muestra de 50 cigartos con el
mucto filro y se encuentra que el promedio de nicotina es de 0.55 mg. Con wna
cestindar de 0.56, -Debe aceptarse la aseveracidn del depactamento de
Ingenieria con e significacisn de 2.5 por ciento?
Solucisn
i) El pardmetro de interés es la media de la poblacién , se desea prabar
Ho: p=0.60
Hi: p
La certificadora quieve corroborar ka hip6tesis de investigacion de que el nivel me-
dia de benceno en la planta de fabricacién excede a 1 ppm, Donde esla verdadera
media, La prueba es unilateral derecha.
i) EL nivel de
(desviaci6n estindar muestral conoeida y n<30) y ubicarlo en la grifica que corres.
pondea una prueba de hipétesis unilateral derecha,
Ho:
ificancia es 2=0.05, lo que nos permite ealeular el valor eritico t
——
v Ts
Ui) El estimador es t ealeulado,
iv) Fl valor caleutado Lo estadisticn de prucba 2.80 se encurentia a la dereeha,
de 1,729 on la regidn erttica o de rechavo, Existe evidencia estadistica para
sechzar la Ho,
+) Ta centificadora de calidad por lo tanto Hoga a la conclusién que >1 ppm y
ue la panta esta violando las norms gubernamentales con wna contiabilidad
asociada de 4=0.05,PAUSE AIL)
[El PRUEBA DE ASEVERACION PARA LA PROPORCION
‘Supongainos que de tina poblacién de tamatio N de la cual se obtione una muestra
de tamano n, existen x elementos favorables ala caracteristica que se esti analizan-
de,
Entonces la proporcién muestra es
esis aula,
Siendo m elvalor presente en la hipé-
El estadistica de prcha
Fuporeas (— 7 spores)
a
El tamayio de muestra de muestra debe ser Jo suficientemente grande para que li
‘prucha sea vilida. Como regla prictica: p 24, 924 ¥ pagel
Ejemplo
Elempleo de acero intemperizado en la construccién de puentes para autopistas ht
sido tema de considerable controversia, Los eriticos han eitado temas de earresion,
[graves del acera intemperizado y estan tratando de convencer a las atoridades de
{que prohiban su uso en la construccién dle puentes. Por otro lado las corporaciones
acereris aseguran que estas acusaciones son exageradas y dicen que 99% de todos
Jos puentes de acero intemperizado en operacién tienen un buen desemperio, sin
dlaiios graves por corrosicn. A fin de proba esta aseveracidn, un equipo de ingenie-
ros experts de La industtia del acero evalusaron 40 puentes de acero intemperizado
seleccionados al azar y encontraron que 36 de ellos mostraban wn hen desempe-
fo. {Hay pruchas con =0,05 de que la verdadera proporcién de puentes de acero
intemperizado que presentan un buen desempeiio sea menor que 0.95 que es ka
cifta citada por las corporaciones?
Solucién
i) El parimetra de interés es uma proporcién de la poblacién , se desea prabar
HO: x =0.95
Hin < 09%
Donde ¢s la verdadera proporcidn de todos los puentes de autopista de acero
intemperizado que muestran un buen desempeno, siendo la prucha unilateral ia-
quierda
ii) EI nivel de significaneia ¢ 00.05, lo que nos permite caleua el valor exit
7 ubicarlo on In geifiea que corresponde a tuna pricha de hipétesis unilateral
izquiierda,
|
res
P
os-08
os 05)
6
¥) Se puede rechavar la hipétesis mula con 00.05, ya que el valor calenlado 0 esti
‘mador-1.78 cac a la irqsicrda del-1.545 lo que indica que se encientra en la region
ESTADISTICA
ao
51Ca
DDE HIPGTESIS Y ANALISIS DE VARIANZA
de rechazo,
v4) Por lo tanto, existe evidencia estadistica para sustentar a hipétesis de que la
proporcidn de puentes de autopista de acera intemperizada que tienen bien des-
cmpotio es menor que 0.5
Ejemplo
Un estudio realizado a famadores que intentaban dejar el hibito con terapi de
parches le nicotina revels que 39 de ellos contimaaban famando un aio despues
de iniciado el tratamiento y 32 habfan dejado de fumar (segtin datos de "High-Dose
Nicotine Patch Therapy’, de Dale et al, Journal of the American Medical Associa-
tion, vol. 274, niim, 17). Utilice un nivel de significancia de 0.10 para probar Ia
aseveracion de que, de los fumadores que intentaban dejar el cigarrillo, la mayoria
contin fumando wn ano después de inicir el tratamiento, -Sugieren estos resale
tados que la terapia de parches de nieotina es inetiear?
Solucisiy
{El parimetro de interés es una proporcién de la pablacién m , se desea probar:
Donde ¢s la verdadera proporcién de todos los que continiian fmande un ano
después de iniciar el tratamiento, siendo la prueba unilateral derechs,
i) El nivel de significancia es 60.1, lo que nos permite caleular el valor critica 2 y
uubicarlo en la grifica:
MN
oe
fil) p — 2, por lo que wulizando los datos del problema:
fn) El estadstico de pmicha es
z 2 Aamoree
aeons Taree)
os -05
ea sna
1%
+) Bl estadistico de prcha 0.4 cae a la iquierda del valor eritice 1.645 en la regis
de acepta e-evideneia
n, por lo que e
istiea para aceptar la hipdesis mula
i) Como el 50% o menos deja de fuunay, Ia terapia de parches n0 es eficaz
Il PRUEBA DE ASEVERACION PARA LA VARIANZA,
Supongamos que de una poblacién de tamaito N de la cual se obtiene wna muestra
de tamaiwo 0, existen x elemento
c debe
ada se la siempre y enanda se trate de poblacio
nes normale y el estadistico de prueba sla variable Jucuadrads con (al) grados
de libertad y que se expresa come:
Para aplicar una prucha de bipstesis relativa a la varianza de una poblacisn
asnmir que la distsibucion Jecus
(n-1)s*
>Ca SU AUT MSS ag 1)
EI proceso que sigue sina prucha de hipétesis para la yarianza os el mismo que
utilizamos en las anteriores secciones, es muy ustal aplicar esta prucha cutando se
‘require comprobar el grado de vatiabilidad de un proceso.
Ejemplo
Se sabe que el contenido en gramos de wn producto fabricado por una
compaaia, no retine las especificaciones sila varianza de un lote de produecion
se aleja demasiado hacia arriba o hacia dehajo de 6.
de produccién reine ls especificaciones,
raids aleatoria
‘Comprobar siuun gran Tote
me de dicho Iote arroj6 una varianza de 7.3. Utiizar un
hhivel de significaeidn del 5%, Se sabe que el contenido del producto se distibuye
normalmente.
Solucion
) H0:82 BOS
He:@2 O65
it) La pricha es bilateral con un nivel de significacién: 20.05, el valor ertico jt
cuadrado es
i) El cvterio de decision sera el siguiente: *Si el valor de B caleulado ex menor
que 8.90652 0 mayor que 32.8525, se rechava la hipétesis nua de que la varianza
sigue sieudo de 6.5, con tn nivel de significaciGn del 5%
iv) Fl estadi
la tormula
izando
fico de pruicha se caleulateniendlo en ctenta m
Game? _ (0-973
e 65
¥) Gomo el estadistico de prueba 21.34 se encuentra en la regién de confianza 0
de aceptacién. Entonces con podemos afirmar con sm nivel de significancia del
5% que existe evidencia estadistica para aceptar que la varianvza del contenido del
pprodlcto el mismo,
Fjemplo,
Un supervisor de control de calidad en wna enlatadora sabe que la cantidad exacta
contenida en cada lata varia, pues hay ciertos fictores imposibles de controlar que
afectan la eantidad de Henado, El Henado medio por lata es importante pero igual
mente importante es la variacion 22 de la cantidad de Nenado, Si2 es grande,
algunas latas contendrin muy poco y otras, demasiado, Has agencias reguladoras
‘especifican que Ia desviacién estindar de la cantidad de llenaco debe ser menor
{que 0.1 onzas. El supervisor de comtrol de calidad muestres n=10 Iatas y midis a
cant
ad de llenadlo en cada uma, Los datos se reproducen a continueién.
79) 79 798 801 797 7.95 BOR RMD ROL——BOD
JEsta informackén proporcionsa con un nivel de significancia del 0.05 pruebas sufi
ientes de que la desviacién estindar Bide las mediciones de llenado es menor que
0.1 onzas?
ohucién
) HO: Bod
Ha: c01
it) La prucha es unilateral iquierda, con
0.05, por lo que el valor critica es:
i) El estadistico de prueba se calcula utilizando la desviacibn estindar de ka mes:
tra sO. yPE OS er a IL)
© -1)x0.0457 _
2 16
or
scobuerconwics
fn) Como el estadistico de prucba 1.66 es menor que 3.825 y cae en la regién de
rechazo, existe evidencia estadistica para rechavar ka hipotesis mula, Entonces el
supervisor puede legar a In conclusién con un nivel de significacidn del 0.05 de
que la varianza de la poblacin de todas las cantidades de Henado es menor que
0.01, 0 sealBe0.1
TEMA N° 2: INFERENCIA A PARTIR DE DOS MUESTRAS
Ml INFERENCIA ACERCA DE DOS MEDIAS, PROPORCIONES PARA
MUESTRAS INDEPENDIENTES. (TRIOLA, 2009)
En la prietica, se presenta una diversidad de problemas en la industria y en las
ciencias sociales que nos sugieren confrontar cual de dos procesos em
jor que el
otro ala hz de la media que arroja cada uno de ellos, Se nos podria ocurtir por
ejemplo: a) verificar si el consumo de gasolina entre dos marcas de vehieulos se
puede considerar idéntico por el contrario una marca es mas econdmica que
otra, b) Verificar si los salarios de la industria metabtirgiea se pueden considerar
‘ono superiores a los silarios de [a industria textil en una regidn, c) Verificar si el
contenid de determinada snstancia en ma articulo fabricado par una companifa A
8 inferior o no al contenido de dicha sustancia en cl mismo articulo fabricado por
‘una compatiia B de la competencia ete
En cuanto a la distribucién en el muestrca de In diferencia de medias, recordemos
los siguientes tres casos:
Silas dos poblaciones son normales, las diferencias de Ins medias muestrales tamm-
bign se distribuirin normalmente cualquiera sea el tamano de las muicstras, No
obstante, sino se conocen las desviaciones estindar poblacionales (U1 y 2), éstas
pueden ser remplaadlas por la dessiaciones estindar de las rmuestras (s1 y 92), 81
Jos tamatios de las muestras som mayores que 30 (al >50 y nZ 250 o nl +2 >60).
Segtin el teorema central del Iimite, si las dos poblaciones no son normales o
no sabemos si se cumple 6 no éste comportamiento, las diferencias de las medias
mvestrales se distribuirdn aproximadamente como una disteibucién normal, si los
amaiios de las muestzas son mayores que 30 (nl >30y n2.>80.0 n +2 >60)
Si kas dos poblaciones son normales 0 esti
¥y por otra parte no conacemos la desviaciones estindar poblacionales y ademas
Jos tamanos de las muestras son menores que 30 (n] <0 yn2 <30 onl +n2 <60),
centonces, las diferencias de las anedias muestrales se distribuirin de acuerdo a la
ley tstucent
Con el fin de resolver kas prucbas de hipstesis para la diterencia de medias, debe:
‘mos tener en enenta el mismo procediniento y las mismas reghas que seguimos para
Jas pruchas de hipdtesis para la media
11 Inferencia acerca de dos medias
Es la divisién de Ia distribucién muestral del estadistico de la prucha en dos
partes mutwamiente excluyentes:PAUSE AIL)
uadro N° 11: ESTADISTIGOS PARA DOS MEDIAS.
ESTADISTICA
Coe
y G4 A
= deseo a tude
Gree ata
jemplo
‘Una compaiia de transportes requiere comprar un gran lote de buses para el trans
porte urbano con el fin de reemphuzar su parque automotor y para tal fin desea
comprahar la afirmacién hecha por el proveedor de la marca B, en el sentido de
que la marca.A es menos ahorradora de combustible. Para tal fin Ia empresa toma
tuna muestra aleatoria de 35 vehiculos marea A y encuentra que lt mista tiene wa
promedio en el rendimiento de 18 kildmetros/galén con una desviacidn estindar
de 8 kildmetros/galén, mientras que una muestra de 32 vehiculos marca B presenta
tun promedio de 22 kilometros/galén con desviacion estindar de 3 hilbmetios /
adn. Leanct oi fy <—taaes . Lasalternativas
de un lado se watarian de manera simila
Hjemplo
Un fabricante desea comparar el proceso de armado contin para uno de sus pro
uctos con un método proptisto que supuestamente reduce el tiempo de armada,
Se seleccionaron ocho trabajadores de la planta de armnado y se les pidis que arma
ran kas unidacles con ambos procesos. Les siguientes son Ios tempos observaddos en
Cio 1 TNO ORATION NFO
. = -
i a z
5 a >
. * *
: “ *
En @=06 , zexiste alguna razén para creer que el tiempo de armado para el pro-
eso actual és mayor que el del método propuesta por mas de dos minutos?
Soluetiny
1) tavhipstesnso: Hy {Mp =2 Hiifty >2PAUSE AIL)
fi) Calealande las diferencias:
ESTADISTICA
Coe
2 a Es a 0695
4 6 2 2 53025
. 2 s 7 002s
* * = * 1302s
7 s 2 7 0025
. a 2 5 0.0025
ax 3
ay DoE 475 y 8,
48) El estadiitico de prucha seri 8 L907
¥) Finalmente, fgy.j =#g 9 = 1.895. , debido a que 2.107 > 1.895 rechazamor 10,
yaceptamos la HI: el tempo de armado para el proceso actual es mayor en dos
'mimutas que el método propnesto,
COMPARACION DE LA VARIACION DE DOS MUI
Supéngase que son dos las poblaciones de interés, por ejemplo X1 y X2, donde
STRAS.
18,¢3.d2.03 , we desconocen, Deseamosprotar ipGtss relat ala igualdad
delaras Apselae! . Comdgec quer dimen tarmiatrs
blestorias de tamaton! dela poblacién 1yde mano m2 del poblacign 2 ysean
‘S296 2 lasarianzas de muestra, Para probar I alternatva de dos tados:
Hy:o)=0}
Hy,:o) #03
Timamaougien amma A macenqé eae REEL
2-1 grades de ibertad s
Rechavariamos H0si Fy > F,
fami 28 A a3
81 Fy> Fay inet srocharariomos Hy 0
Bemplo
Los siguientes son tiempos de quemado (en minutos) de seriales uminosas de dos
lipos diferentes.
RMATIVO
59CO a Ue AU
Ce a a
mm
Trucbe la hipstesis de que las dos varianaas sean iguales. Use ot =.6
Solucisin
») Hy:op=03
Hole
ii Nivel de signifcaneia. or = 0.6
inj =ROREI 108,
Del mismo mode: Feats 0.218
ii) La regi de confianza ents dala por [0:248; 4.03], Si el F calcula eae fuera
del internat dado entonces se rechara ka hipGtesis ul,
'n) Con los datos:
H=3 6
Xy=0
spa
S104
a
Ra 341-087
cateulamos “8 35 = jon.
Se er ee
TEMA N° 3: ANALISIS DE VARIANZA
Cuando se requiere hacer inferencias acerea de las medias de di
partir del analisis de las muestras de ellas se aplica un estudio denominado Anilisis de
Varianza (ANOVA).
En un ANOVA (Mata, 2013) se aplican tratamientosa entidades denominadas unidades
experimentales, Hl atributo de las entidades que se desea medi recibe el nombre de
factor. En dicho estudio puede aplicarse modelos de efectos fijos o aleatorios. En un mo-
lo de efectos fj, se seleccionan tratamientos especificos o se fijan antes del estudio
isticamente). En un modelo de efectos aleatorios, os tratamientos wilizdos
se seleccionan aleatoriamente.
Estas téenieas se pueden utilizar en mnchas campos tales coma:
Un gerente de compras de un supermercado puede interesaese en compara la dur
bilidad de ciertas baterins en el almacén de 3.0 mis proveedores.
- Un gerente de produecién puede analizar el rendimiento de tres 0 mis procesos para
determinar si hay diferencia entre ellos,
= Un analista financiero desea saber si hay diferencias en el margen de operacién dePAUSE AIL)
‘Hjemplo
‘Una pequenia empresa que elabora botanas (papas fits, cacahuates, ete) tiene 4 ras
para el reparte de sus proclctos dentro de la eivlad. Para cubrir estas nits tiene 4 con-
uctores bisicos y uno complementario, el conductor complementario srve para cubrir
Tas antsencias 0 vacaciones 6 enfermedad de los otros 4 y se le ocupa para otros mencs
teres si no se Te requiere como conductor. El puesto de conductar complementaria se
rota entre todos los choferes sobre una misma base menstial Es importante tanto desde
el punto de visa de eficiencia, como de justicia, que todas las rutas tenga la miso du
rracién, también es importante que todos los conductores sean ignalmente eficientes en
todas las rutas para que los conductores puedan sustituirse el ano al otro sin pérdida de
Luempo, por ello la gerencia de distribucion implements un programa de capacitac
para que los conductoresse familiaricen con todas ls rutas. Al cabo de esta capacitaeién
se hicieron recorridos de prucba con el objetivo de investigar, por una parte, si todas las
ntas se recorrian en el mismo tiempo y por otta parte silos conductores eran jgualmen-
te eficientes en todas. La gerencia de distrihucién desea saber sil tiempo medio de las
cuatro rutas es igual ys I eficiencia de todos los conductores en las rutas es igual. La
informacion de los recorridos ylos conductores se dita continusciGn:
‘Cuadro NH; Conductores vs Recortidos
EEE me ee]
reas _ sae
Becera ae 239 22 250
Cervantes 225 20 25 261
Domingues 22 233 259 25
Exeamilla az 25 ar 281
En este ejemplo se tienen datos se casifican de acuerdo con dos variables: el conductor
y kenuata que son, entonces, los 2 faetores, Aqui ls hipsesis que se prueban son:
Para las rutas
Ho: fly = Hg = He = Ho
HLL: Por lo menos 1
corras,
de las medias poblacionales de los tatamientos no es igual las
En donde las
vrentes medias son las medias de las 4 ruts.
Para los conductores
tno: fy = Ma = Hy = My
H1: Por lo menos una de las mesias poblacionales de los bloques (conductores) no es
igual las otras
En donde las
snes medlias son las meebias de os 5 conductores.
En este ejemplo, el tratamiento son las diferentes rutas y a la variable del conductor,
‘cuyos datos estin en los renglones, se le conoce como grupos, su ver, tratamientos y
grupos son Tos dos Factores a los que se refiere ef nombre de esta técnica de anilisis le
varianza de dos factores
‘Un detalle que vale la pena tener presente respecto a este ANOVA de 2 Factores es que
se tione in solo dato para eadla conductor y para cada ruta, ya que el andlisis de varianiza
de este par de factores, se refiere también a conjuntos de datos clasificados de aewerdo
‘com 2 variables, pero en este cas,
actores,
n cuando menos 2 obvervaciones para cada par de
ClCs) DDE HIPGTESIS Y ANALISIS DE VARIANZA
co
SUPUESTOS DE UN ESTUDIO ANOVA
Los supuestos en que se basa la prucbs t de dos mucstras que utiliza mucstias inde-
pendientes sor:
Las poblaciones son normales,
1n288 poblacionales son fguales
= Las muestras estén seleccionadas independientemente
MII Anova de un factor,
Como el ANOVA de un eriterio es una generabizacién de la prueba de t para dos
:uestras, los supuestos para cl ANOVA de umn eriterio son:
das las poblaciones k son normale
a)
0-6 factor requiere del céileulo de dos estima
El métovdo de ANOVA con un crite
clones independientes para @ la varianza pobla
comin, Estas dos estima
asouerazacrioniisoes) ys?) SPs aeniuen concasuan ue aenuicaeate
hnwestrasy se denomina etinaciGn de la varanea a interior dels muvestas les
s
tndfdeotene una disribucién muestra resutando: *~ 52° ator efico para
Ja prueba Fes: 2, =1E(2=1)_, donde el mimerode grads de ibertad pars el
numnerador es ei para el denominador es kvl), siendo. el nivel de significancia
siendo k = niimere de muestra
PROCEDIMIENTO
1. Determinarsi las mestras provienen de poblac
2. Proponer las hipstesis,
3. Encontrar las medias poblacionales y las varianzas,
4. Eneantrar la estimacién de la varianza al interior de kas muestras. y sus grados
de libertad aseciados gh
5. Caleolar la gran media para la muestra de las medias muéstrales.
6, Determinar la estimacion de la varianza entre muestras_y sus grados de libertad
asociaclos,
7. Hallar el valor del estadistico de la prueba B
8. Caleular el valor ertico para
rasa en gib y gly
9. Decidir ise rechaza HD,
Para ello se utlizan las siguientes formulas
Suma de extadrados total (SST @ SCT)
Sav
ser= 2
Suma de cstadrados de los tratamientos o niveles (SSTr o SCL)
ISCIR yr 1, (Xj - xP
aPAUSE AIL)
Suma dle ewadlrados del error (SSE 0 SCE)
sce=> Lu, ~X;y
i it
‘ambien $C
Scr set
Grados de libertad
Gl Toules= 11
(GL rata
Gil Error =n
‘Cuadraclos medios (MS © CM)
rer=Scr/ GL Scr
PeTr=SCTr / GL. Sct
PCE = SCE / Gl. SCE
Estadistico caleulade Fe
Fealeulado =PCTr / PCE
Regla de decisién
Si Fealculado es mayor al Feritico se rechaza Ho indicando que los efectos de los
diferentes niveles del factor tienen efecto significativo en la respuesta
La tabla de ANOVA final queda como sigue:
(Cuuadro N15: Tabla ANOVA
a) sce =z
Pct
‘Variacton total scr at rer
Ejemplo
‘Una empresa ensambla cuadros para un solo modelo de bicieleta, La planta trabaja
5 tumos: el matutino, el vespertine y el nocturne. Los trabajadores se rotan cada
no de los turnos, por lo-que, al eabo de un trimestte, todos ellos laboraron los
tres tumos, El director de produccidn quisiera saber si existe diferencia entre la
produccién promedio de los 3 turnos, ya que la fibrica trabsja a plena capacidad
desde hace ms de un atio y no hay variaciones signifieativas en el mimero de em-
pleados, en la maquinaria, ni en tos procesos prodhictivos; el director considera que
con un anilisis de yarianza puede contestar esta pregunta; para ello obtiene una
rmiestraaleatoria de la proddiiceidn de 6 dias de cada taro. Los datos se muestran
a continuacidn:
‘TURNO
63Moowuono TTR SION
us
m1 1 120
as 10 132
a5 1 ue
135 129 136
4 8 138
8) Las hipdtesis son:
Ho fly = fly = fly
H1:Porlomenos unade
es igual las otras
iy X,=137 3) = 1k 3, =127 , siendo ba media global
129+141+...4138
%
fi) Se obtiene la suma de euadrados totales:
las medias pablacionales de los bloques (conductores) no
Eewaa = 35
SOP = (29-135? + + 044-1397 4038-13574 +148-139) 4118-139) + 4 38-139)
SCT=1608
iv) Se obtiene la suma de euadrados de las vatiaciones entre los tratamientox
SCTR = 6137-135)? + 6(141-135)? + 6(127-135)? = 624
¥) Se obtiene la sums de eualrados de a variaci6n aleatoria también Hamada suma
de euadrados del error, yes la vatiacién dentro del tratamiento,
SCH = (129-137)? +. +44—-137) +03
140)? ++ (18-127)? +, +(138-127)? = 984
Aqui es importante resaltar el modelo en el que se basi el diseito completamente
aleatorizado de un factor que se ilustra con el ejemplo,
vi) Con las sumas encontradas hasta aqui se puede verificar la jgualdad:
SCT = SCTR+ SCE
1608 = 6244984
vii) Se obsiene el promedio de los eusadrados entre tratamientos PCTR, pars ello se
divide SCR entre los gracos de libertad dle los tratamientos gtratamientos. Este ex
el primer promedio de cuadrados (varianza),
porr- 24
2
12,
sit) Se obtionen la media de los euadrados del ertor PCE, para ello se divide SCE
entre los grados de libertad totale gtotaes. Este es el segundo promedio de cite
drados,
984
PCE 6.6
B-3
i) Se obtienc el valor empirico de F,0sea el F ealeulado, que es el cociente de estos
dos tillimos promedios de cuadracles.
x PCTR _ 312
Gtoiete PCE 6 6
») ElyalorF
ftico se busca en la tabla conespondiente a la distribucin F, para elPAUSE AIL)
nivel de significancia correspondiente 0.05 con 2 grados de libertad para el nuume-
y 15 graclos de Rbertad y 15 grados de Kbertad para el denominador
Feritico = 3.8
si) La regla de decisis
rechaza la Ho si el Fealeulada es mayor que el Fertico
Por lo tanto como 4.76 es mayor que 3.68 rechazamos Ia hipétesis mula y conclu
mos que por lo menos una de las medias no es igual a his otras,
Para el dircetar de pradduccién de la fibrica Ia conchisién indica que no todos los
mos trabajan igual, sino que existen diferencias entre ellos,
‘La misma serie de datas trahajada en el Excel arroja lo signiente:
Haciendo click en Aniliss de datos, nego en Andlisis de Varianza de un factor y
scleccionand las celdas donde se encuentra la serie de datos se tiene:
= moe OK Es
‘Donde encontramos e valor ealeulada y valor critico para tomar la misma decisin,
Ejercicioy
Se disefiaron 4 tipos diferentes de examen para evaluar el aprovechamiento en un
‘eutso de eapacitacidn y, para probar s existen diferencias significativas en el diver
dle los exsimenes se cligié tin conjunto de 40 trabajacores en capacitacién y se les
asigné uno de los 4 eximenes al azar, los tratamientos. Los resultados se muestran
yyse incluyen los promedios de cada tratamiento:
ciPUA UL ALCL
EXAMENES
a
7” oe
n om ” 7”
0 7 7s "
” a 6 7”
ro 6 a “
a Pa 9 5
” 0 os 0
9% eo a 6
63 6 o e
0 86 6 0
na 886 a5 762.
PROMEDIO
Como los exdmenes se asignaron aleatoriamente a los tubajadores, se peusaria
que las diferencias entre los promedios de las calificaciones en los 4 subconjuntos
se dehen a diferencias entre los propios eximenes, salva diferencias aleatorias o
errores normales de muestreo qule en este caso pueden deberse a diferencias per-
sonales entre los examinados. Verifique Ud si hay diferencias entre las medias de
los 4 eximenes.
Hl ANOVA DE DOS FACTORES
Cuando en un experimento, dos factores pueden influenciar las unidades experi-
‘mentales, se usa un ansilisis de varianza dle des vias denominado disenio de blogue
aleatorizadlo, en el cual se comparan k tratamientos ubicados en columnas con blo-
ques que se hasan en tin factor wbicada en rfilas.
nado N16: ANOVA DOS FACTORES,
7] nD
1
2
3
MEDIAS (VERTICAL) MEDIA GLOMAL
En este caso la desviacién enadritica tatal puede ser desdablada en tres sumandos
debido a razones intergrupales (por efectos del tratamiento) simbolizada como
DC en un sumanclo debido a razones intergrupales (por efectos de errores aleato-
ios) DCE. yen o1rosumando debido a ravonesde blogue DCbloque. La desviackony
cadritica intrabloque DCbloque es similar a la desviacidn cuadratica de los trate
ientos s6lo que en vez de trabajar a nivel de los términos de una fia, se trabaja
a nivel de los términos de una columna, De manera anloga, ¢1 evadrade medio
Intrabloque es similar al cwadrado medio intragrapo sélo que en ver de trabajar a
jel de los términos de wna fila se hace a nivel de los téruinos de una colamna.
DCE
re
El cuadiado medio de los errores se define como: CMA
Se generan entonces las siguientes razones:Pe
eee ay Se Oe oy
teat riteegaas nents Milo,
CMerr CMerr
El criterio de deciién ex si Fealculado < F,
Ihipotesis uta.
Frat
+o rechavar la
centr
Ejemplo,
La tabla que se presenta 4 continuaciGn corresponde a una muestra aleatoria del
proceso de produccidn de una empresa metal meciiniea que registra ka produeeidn
oblenida durante cinco dias consecutivos. Los bloques corresponden a los cinco
dias de la semana y los tratamientos la produceién en unidades fsicas obtenidas
de cada maquina,
Para un nivel de significancia del 9% se requiere determina si las diferencias entre
laprochtceién de las maquinas son significativas
Solncidn
4) La solucidn la realizaremos integramente utilizando et Excel, para ello eo
piamos la tabla dada a una hoja de Excel, vamos Datos...Anlisis de Datos. ..¥
Anilisis de Varianza de dos Factores con una sola muestra por grupo.
i)
ili dd: =
ih) Tego:| Yoomono ENTE Dae Cac
eR SS pee ee we
Se observa que Fealeulades
bipétesis mulay se coneluye que ka produce
significativas.
2,89895 el cual es mayor que el = por lo que ve rechaza la
media de ls miquinas tienen diferencias
Fjervicio
El Jofe de Departamento de la universidad esti desarrollande un programa de evalu
cid de docentes que debe ser efectado por losalumnos. Para estos efectos se sleecion
indaleatoriamente a 5 ahimnos de un saldin de clases yse picid que evalien a ss exntro
profesores del ciclo que esta a punto de concluir, La calificaciGn de los docentes sobre
tun escala vigesimal se presenta en el siguiente citar:
ma 12 Ms tsa
*s ‘6 12 we
wes re rst 2
a 10s 162 ws
etic un eto ANOVA e incerpree les rstados. © de sie
ifcanci del 005
3] LECTURA SELECGIONADA N° 1
LAPARADOJA DEL CUMPLEASOS
no dirs que es a probabidad de queen wn grapo de 29 personas dos de elas
celebren su cxipleaitos el misino dia? Pues ahora caleilala, ;Coincide tu intuiciSa con
lo que dicen las matemiticas?
La paradoja del cumpleaios establece que si hay 23 personas reunicas hay una probabie
lidad del 50,7% de que al menos dos personas de ellas cumplan auios el misino dia, Para
60 o mis personas la probabildad es mayor del 99%. Obyiamente es casi del 100% para
$366 personas (Lenienda en cirenta los aitos bsiestos)
En sentido estricto esto no es na paradoja ya que no es una contradiceidn légica; es
tuna paradoja en el sentido que es una verdad matemtica que contradice la csabre el tamanio minimo que deheria tener un grupo para que sea més probable que
improbable que dos personas compartan el dia del cumpleafios, la mayoria de las per
soiias se equivaca por completo.
La respuesta intuitiva que se da a menudo es 183, es decir 365 dividido entre dos. La
ceantidadl correcta no esalgo a lo que la gente pueda Hear Fielmente y,ciertamente, 1
[Por intuieidn, Fs bastante extrafio que las primeras estimaciones sean inferiares a 40, Y
sin embargo la respuesta es 23
La clave para entender estas "sorprendentes” recurrencias es pensar que hay muchas
pposibilidades de encontrar parejas que cumplan afios el mismo dis,
Un anilisis superficial asume que 23 dias (cumpleaios de las 23 personas) es una frac-
ion demasiado pequetia del posible nimero de dias distintos (365) para esperar repe-
ticiones. asi seria si esperiramos la repeticién de un dia dado, Pero las repeticiones,
cen el caso supnesta, peden darse entre dos dias cualesquiera, con lo que éstas prieden
ccombinarse entre si de un ntimero de formas que aumenta ripidamente con el niimero
de elementos.a considerar: Ask
‘+ Entre dos personas Cl y C2 s6lo eabe uuta posibilidad de repeticidn de cumpleatios:
cree,
© Con tres ya hay tres posbilidades (
cl=9; c2=C9)
© Con cuatro ya habria sein, (459) /2=6
+ Conn grupo de 10 personas, (1089) /2=45 posibilidades
= Con 25 personas, hay (29422) 2 = 253 parejas distintas, cada uno de ellas es una
‘eandidata potencial para eumplir la paradoja
+ Yasfsucesivamente, en uno de 40, ya son 780 las parejas, y 1770 8 juntamos 60 per
No hay que malinterpreiar lo que nos dice esta paradoja: Si entramos en
Gién con 22 personas, la probabilidad de que cualquiera eumpla ios el mismo dia que
usted, no ¢s del 50%, es mucho mas baja, sélo hay un 6% de probabilidades. Esto es de-
bidoa que ahora silo hay 22 parejas posible y se necesitan
mis de um 50% de probabilidades de que esto ocurra
a del cumpleaiios consiste en preguntar sel cumpleaiios
8 coincide con el cumpleaios de alguna de las otras
13 personas para que hava
Elproblema real de
de cualquiera de las 23 perso
personas,
Ejemplos de coincidencins
‘+ En losjngadoros de Osasima (liga 2008 /06) hay coincidencias de cumpleaiios
+ De un total de silo 19 monarcas espaiioles desde los reyes Catdlicos, coinciden
Carlos T con Carlos TV (11 de noviembre) y José T con Juan GatlosT (5 de enero),
+ De Ios 4U presidentes dee USA hasta Reagan: Polk y Harding nacieron wn 2 de 10-
viembre.
Puedes creer que esto puede ser casualidad o sé eres mal pensadlo que esti preparado,
‘por eso nadia mejor que hacer un estudio probabilstica riguraso de esta paradoja
Estimacion de la probabilidad,
Coil es la probabilidad de que en wn grupo den personas, porlo menos dos de ellas
‘oincidan en su curnpleafios desechamos les aos bisiestos los gemelos, y asuinin
‘que existen 365 cumpleatios que tienen la misma prohabilidad.
Solucién
Utilizando la regla de Laplace yla combinatoria:
El tro es caleular primero In probabilidad de n personas tengan cumpleatios diferen-
‘Sea el sucesos
A= Pal menos dos personas celebran sa cumpleasis a la ver")
ys complementatio:
‘Ac= "no hay eos personas que celebren su cumpleatios ala ve2")
{Caso particular
El nvimero de casos posihles de celebraciin de cumpleaios, supanienclo el aio de 865
69(Bzczaes |
CO a Ue AU
3655 = 6,478 x 10 19
Fl nvimero de casos faverables : como la primera de las personas puede hal
tino de los 365 dias del aft, la siguiente unos de los 364 dias restamtes y asf stcesiva-
mente, restltanS65 x 984 x $88 x 352 = 96] =6,308 « 10 18 casos de que no existan dos
personas que
Aplicanddo la regla de Laplace
(Ac) =casos favorables/ casos posible
P(A) =1- ple) = 1-0973 = 0,027
Fl problema puede generalizanse para una reunion de n personas,
ayan nacido el mismo aia
1203 / BATS = 097%
1a probuabilidad de que al m
y— 3658364303 -(365-n+1}
365"
Para n = 23, 30 y 50 la probabilidad mencionada es: 51, 0.71 y 0.97 respectivamente.
Como se ve, para n = 28 existe, aproximadamente, una prababilidad a la par que por
Jo menos coineidan dos eumpleatios, y cuando n= 50, tenemos easi la certeza de que
ocurira la coincidencia,
108 dos de ellas cumplsn aiios el mismo dia ex
a
ACTIVIDAD N°
Esta activiiad puede consutarls en su suka virtual
a
ACTIVIDAD N° 2
Esta activiiad puede consultarl en st sua victal,
FE cen ssuneinsen
Esta actividad puede consultarla en su aula vital
ry
commons
DD vissocraria neta vunan
‘Triola, M.(2012). Estadistien, México: Pearson Ealueacisn
Berenson, M.y Levine, D. (2010) Eadistca Basica en Adminishracion, Concepls apicaco
nies, Mexico: Prentice Fall
Mendenhall Sincich Probabilidad y Estadistin para Ingenieria.y Ciencias, Prentice Hal. Cue
ta Falcon
Diaz, A. (2013), EMadistice Aptienda a ta Adainistacion y Bemomia, Me
Edin
caw Hill, Primera
AUTOEVALUACION DELA UNIDAD TT
Jos at
nos aios se han reyistrado un gran nvimero de lavadoras de ropa, tanto elec-
tudnicas como mecinicas, con serias fallas en su funcionamiento, Se desea analizar yPAUSE AIL)
‘compara el costo de reparacion de cada tipo de avteficto, Para ello se ha seleecionade
‘ina muestra aleatoria de cada tipo de lavadora y se han registrado en la tabla los costos
de reparacién en soles, Se sabe que el mimero de falls ene distibucién normal,
Ta 7s 61 tse zoe ss 79 Ts Te tow ata
128 39150 11188 20953
‘Aun nivel de signifieacion del 5%, dos costos de reparacion de ambos tpos de
lavadoras son homogeneos?
Respecto a la resolucisn del probleia marque lo incorrecto,
A) Ho:f21 =e
HI B21 +822
2
By A=
) Fag
0.2491
©) FI=0.2688
D) Fe=372
§) =es7273
2 En los tiltimos atios se han registrado un gran nrimero de lavadoras de ropa,
tanto electrdnicas como mecanicas, con serias fallas en su funcionamiento. Se desea
aanalizar y comparar el costo de reparacién de cada tipo de artefacto, Para ello se
hia seleccionado una muestra aleatoria de cada ipo de lavadara y se han registrado
co Ia tabla los costas de reparacién cn soles, Se sabe que el nsimero de fallas tiene
distribucion normal.
178 16L 194-204 1851791720 ABT
128 89150 191109 BS Skt or
1 costo de reparacién de las lavadoras electrénicas os signifieativamente superior
al costo de reparacidn de las lavadoras mecinicas? Utiice un nivel de significacién
el 5%,
Respecto a la resohucidn del problema marque lo incorrecto.
A) Ho <2
Hi >
7, sth awh
es
B)
D) Teritico= 1,75205,
E) Aum nivel de signifieacidn del 3%, se puede afirmar que el costo de reparaci6n
de las Iavadoras clectrdnicas es significativamente miperior al costo de reparacién.
de las lavadoras mecanicas
3. El ingeniero de control de calidad de la fabrica M, alirma que la ade
cierto material que producen es mayor que la resistencia del misino material produ
‘ido por la Librica N. Un laboratorio particular realiza un experimento sobre estos
cilUntveRsipaD
CONTINENTAL
CO a Ue AU
iaterialexy los resltados (en ohrnins) se muestra a continuacién:
FOEYIN 0.140 ose 04s 0.142 oas oar 0.57
135. 0,140,
ivel de significancia del 5%, indique lo correeto.
a 0.135 0140 0,136 0,142 0.138
_Asuma pobliciones norimales. Con unt
a) Fealeulado = 0.9622
b) F eritico
©) tealeulado= 1.8695
98229
4) t eritico
©) Se rechaza lo que afirma el ingenieto,
4- Un fabricante de impresoras desea estimar la vida media de sus margaritas de ime
presion, La estimacion ha de estar dentro de 2 horas en torno a media y tener un
nivel de confianza del 90%. Si sma muestra piloto revela una desviseién tipiea do 25,
hors, zcul debe ser el tamaio de la muestra?
ay lot
by aaa
out
aus
©) 02
5- En los siltimos afios se han registrado un gran niimero de lavadoras de ropa, tan
to electrénicas como mecanicas, con seria fallas en sit funcionamiento, Se desea
analizar y comparar el costo de reparacién de cada tipo de artefacto. Para ello se
hha seleccionado tina muestra aleatoria de eacla tipo de lavadora y se han registrado,
cx Is tabla los contos le reparacidn en soles, Se sabe que el aimere de fallas tiene
distribucidn normal,
EE EE EE
GGT] 7161 toon nes 179 ars 17108 Ist es
Eto tas 209 ss sto
Aun nivel de signifieacian del 5%, respecto a la homogeneidad del costo de repa-
rrcin de ambos tipos de lavadoras, no es correcto:
a) Fexp= 0.24911
b) F eritico=0.2688 y 3.72
15.87
TRA
6) El costa de reparacién es homogéneo
©) Varian (1
©) Varianaa (2
6- Varios accielentes de aulomonilisticos menores ocurrieron en varios eruces de alto
Hiesgo en un distrito urbano a pesar de los sefalamientos de trinsito (semitoros)
El departamento de trinsito afirma que na modificacidn en el tipo de semstoro
redlucira los accidentes, Los integrantes de la junta municipal han acordado
tun experimento que se ha propesto, Se eligieron aleatoriamente ocho ences y se
‘modificaron los semforos corresponddientes, Unlice wn nivel de signifieacién del
14% para analizar sila junta logts su objetivo, si el ntimero de accidentes de
durante un periodo de seis meses antes y desputés ce las modificaciones fe:
8) B-0.005
by Tealeulado=2.8152
©) T eritico = 2.798PAUSE AIL)
4) Sd= 2.8277
oF =25
Relicione las columns:
4) Probabilidad de aceptar Ia hipétesis mula dado que es falsa, ( )Probabibidad de
rechazar la hipétesis nula dado que es verdadera,
>) Prucha de independencia ( )Emunciado acerca del parimetro de una o mis
poblaciones.
©) Probabilidad del error de tipo! ( )Analiza la ssociacién entre variables,
4) Hipotesis ( )Probabibidad de error tipo TE
ayedba
1b) cbda
each
4) acdb
@) deba
S- El proyecto académico de un ingeniero es el disefio de un experimento a fin de de-
terminar el rendimiento de 4 variedadles de papa sin tener en eventa la influeneia
de la fertiidad de las tierras de cultiv, Las 20 parcelas de igual fertilidad que le
fueron asignadas las divs en 4 yrupos de 5 parcelas cada una, A cada grupo de
parvelas le asigné ima variedad distinta de papa escogida al azar, resultando un di
seo completamente aleatorizado, Los rendimientos medidos en kilogeamos de las
cinco variedadles por parcela se dan en ka tabla que sigue,
vi ve vs. Ma
5 52 53 cy
58 5 50
6 50 a a
a oo a o
5 3 4
Alnivel de significacién del 5% zse puede inferir que exisien iter
‘yas entre las producciones medias de las 4 variedades de papa?
Luego settle fo incorreeto,
a) 00.05
b) Ho: p= ye=45= 1
©) SCA=426
d) scT=189)
©) Fesitico=3.16
iruna de 4 marcas de new
‘9 La empresa de transportes “DEL, VALLE” va a adqq
ingticos que hay en el mercado. 1 ingeniero de pruebas de la empresa dise
experimento escogiendo al azar seis neunaticos de eada marca de earacteristicas
similares. En el laboratorio de prichas, con uma carga especifica simulada, observ
Ih duracion de cada neumitico hasta que se deteriore, Los datos
miles de kilémetros se can en la tabla siguiente,
edondeados enUntveRsipaD
CONTINENTAL
CO a Ue AU
ees
NI Ng NS Nt
5 6 “6 59
1s a 00 oa
50 = 0 a
oo a 30 66
is 0 a 7
65 ca 61 7"
Alnivel de signifieancia del 5% zindican estos datos que las mareas de
producen efectos significativos en el rendimiento®
Luego marque lo incorrecto,
a) Fealeulado=6.77
) SCT=1550.90
©) SCA781.40,
4) SCE=709.5
a0
6) Feriti
10. Una empresa de confecciones textiles realiza im estudio para determinar el mejor
‘de tres métodos de montaje de una prenda especifica. Con este fin diseaé un ex
perimento para comparar los tres métodas seleccionandlo cinco operarios que
supone ton de velocidad homo,
sa para reducir Ia variacién debido a los oper
Flos, asignanlo a cacha operatio los res métados por tiempos igtales, El numero de
prendas terminadas por cada operario y con cada método en el iempo fijado se da
con la tabla que sign
Al nivel de significancs
montaje de las prendas?
5% cexistid alguna diferencia entre los métodos de
Marque lo incorrecte,
a) SCA=44.8
) SCE=16.533,
9) Scr=68.9)
4) FB=0.377
©) FAs 714ESTADISTICA I
a UNL ud
E) UNIDAD III: ESTADISTICA NO PARAMETRICAS
8 DIAGRAMA DE PRESENTACION DE LA UNIDAD III
AUTOEVALUACION SEOUL |
Fi oreanzacicn DE LOS APRENDIZAIES
‘Tema N° 1: Pruebas desiguos 1, pli ls pha de signo y 1 Valora relleshanente lt
1. Prcha del signe agos co signo para series portancin de las prcas no
2 Prucbs de ranges con sign dedatosdependicntese inde: parsmetrieay, de ln modem
de Wilcoxon para datos apa penslicntes fe prediccdin y métodos de
reas ann amos scree de cimtrolde proces esa
5, Prcba de I sua de rangos
Cont ages de Wiest pars
Invests independicnter
fos para fata de deco-
‘Tema N° 2: Experientos mule 9. Reals is pruebas no para
tinomiscs y talas de contin. metrics x series de datos de-
pendienteseindependientes
=
T Bond de aos 4. Vala a aestoriedad de una
2 Independencay homogenci muestra aplicanda fa prueba
dad Ae rach
‘Team N* 3: Prusbas no
at panan rn
TV Prucbade Krushal— Willis Actividad N* 2
2 Pricha de corencién de Conta! de Lectara N"2
oy
$s Puch de rachas
‘Lectura seleccionada N°I
alls estudiantes chica 3
ios universdades de la misma
manera que el US. News and
Work Report? Maio."
Pigina 673
Aocvauacion de la Unidad IMoomuoso ETT Uae
TEMA N° 1: PRUEBAS DE SIGNOS
Como has podido observar la mayorta de las prucbas que hemos realizado se refiere al
anilisis del parimetro poblacional como la media, varianza ¥ praporcién para lo cual
se hicieron suptiestos sobre las poblaciones a quiienes pertenecian las muestra, dichos
suputestos por ejemplo era que provenian de poblaciones con comportamiento normal
Pero en la prictica no siempre las poblaciones son normales por lo que ya no podr
‘mos aplicar los métoclos anteriormente estudiados, se necesita para ello algrin métado
alternative que requiers dich suposicin, Estos métodos 5
tno paramétiieas 0 sin distribueién, los cules nos permiten realizar inferenctas en sit
ciones donde no comacemos el campartamiento prababilistic de la variable en anlisis.
Su gran ventaja respecto a los métodos paramctricos es que utiliza céleulos que no son
tan laboriosos ademsis de no tener en cuenta fa forma de la distibucion (Kunci6n de
probabilidad). Hay que tener en euienta que las pruebas no paramétrieas se ven Limite
as por la perdida de informaciéa al trabajar s6lo con los rangos por lo que a menudo
no son tan claras o eficientes pero esto se ve recompensido por la sencillez, rapier y
necesidad de utilizar poca informacién.
1 conocidos come Pruebas
En realidad existe una gran cantidad de pruebas de las cuales desarrellaremos las mas
conacidas ¥ uilizadas, de las cules podemos observar su eficiencia respecto a las prie-
bas paramétricas
Cuadro N° 16: TIPOS DE PRUEBAS PARAMETRIGAS V NO PARAMETRICAS.
TE
Teo PRUEBAPARANETRICA | PRUEBA NO PaRaMETRIGA | DE LA PRUEBA NO
Roar
POBLACION NORMAL
Datos apareados dela Prucbato prueba Prueba del signo 0.03
dates muestra Prueba de rangos com 005
siguo de Wilcoxon
Dosmuesiras _Pruchato prucha x Prucba de la uma de 0.98
Independientes ‘anges de Wilcoxon
Vavias muestrasANOVA(prucbaF)—_Prucba de Kruskal 0.98
Independientes ‘als
Corveacion Corvelactén tical Pruchadecorrelacion 0.91
de rangos ordenados
‘Acatoridad ——-Pruchano paraméiriea_—Pruchaderachas Sin bases para
comparacion
Para las pruchas de signosy alguna otra prucha no paramérica, al lugar que oeupa cada
dato ordenado de menor a mayor se le conoce como rango, y si hay algsin empate entre
Jos rangos se utiliza la media de dichos rangos en cada wo de los datos, de la siguiente
forma!
Serie de datos inicals 6:6 01 1;14:14 y 16
Analisis de rangos
‘Se observa que es el promedio de‘UNIDAD 111: ESTADISTICA NO PARAMETRIC
Ml PRUEBA DEL SIGNO.
La pnicha no paramétrica mas sencilla es ol cantraste de signos, la que se utilien
principalmente para contrastar la hipStesis sobre Ia posicién central (mediana) de
tana distribucion poblacional o para analizar datos de muestras pareadas o ens.
zadas de wna poblacién. Al igual quc la media, la mediana es una medida de com
‘en este caso reterida a la ubicaci6a, por ello también se le conoce a li
suo como prueba de ubicacion, Por ejemplo, el Contsaste de Iipotesis
Tos estuulios de mercadtos para analizar la preferencia
ema de
prueba de
de signo se utiliza mucho ©
de los consumidores entre dos productos, para verificar si un revo
produceién auimenta fa efieieneia de los trabajaclores, para a
labilidad entre dos directivos de sina misma empresa, ete. Fl procedimiento dle la
ppruicha del signo se resume en el siguiente diagrama,
Por razones de simplicidad utilizaremos como estadistico de pracba (x) al mero
de veces en que ocurre el signo menos frecuente.
Es importante indicar que como toda prucha no paramétiiea no existe el supuesto
de normalidad respectaa la pablacién, pera sirequiere que la muestra sea aleatoria
ppara darle valider,
Se supone que se tienen datos antes y después para una muestra yse esean compa
rar estos conjuntos de datos correspondicntes. Se hace restando las abservaciones
or pares, yse anota el signo algebraico resultante, No es importante la magnitud
de la diferencia, sino solo i resulta un signe mis © un signo menos.
DIAGRAMA N° 01: PRUEBA DEL SIGNO
ae
a aaaee
Oe ee
al
La hipstesis nua establece que no existe diferencia en los conjuuntos de datos, Si
esto es cierto, entonces un signo mis y un siguo menos son igualmente probables.
La probabilidad (7) de que ocurra cualquiera es de 0.50. Una prucha de dos ex
Bi
wii
i]Moomuoso ETT Uae
Ho; m = po MedI-Med2
Hem 2 po MedleMed2
Donde m yp son los niimeros de signos menos y de signos mis, respectivamente,
Del misino modo utilizando la probabilidad
Ho: n= 035
Him s05.
Una pricha de un solo extreme es
Ho:m=p
HL
mop
Hom =p
Himep.
Lo que quicre decir que si dos conjuntos de datos tienen medians iguales, enton-
ces el nvimero ie sighos positivos debe ser aproximadamente igual al niimero de
signos negative.
Ejemplo
Sele pidid a un grupo de 20 aumnos que calificaran el desempeno de 2 protesores,
de acuerdo con varios eriterios yen una escala de 1 10, Se abiuvieron los result
dos quie se mucstran a continiacidn
(CALIFICACION
8
s
10 5 4
7 10
12 ° ‘
1s 5 3
“ 4 4
15 ie °
” 10 °
16 z
20 ‘
Probar a un nivel de significancia de 0.05 la hipstesis de que no existe diferencia
‘entre las calificaciones asignadas por 1os alumuios los dos profesores
Solucisin[roc Eee 1
i) Planteames kas hipstesis
HO; Medi = Med
HI: Med + Med2
‘ode manera equivalent
HO: «1 =0.5
Hi: xl 205
ii) Hatlamos los signos de fas diferencias restando X1-X2:
; ;
s : ;
iii) Alencontzar las diferencias igual a cero, eliminamos us respectivos pares por lo
que el nuevo tama de muestra es n=16, Importante recordar que el cero
signo, parlo que na se le pitede asignar el signa positive,
|) Hl estadistico de prueba x es el
Irecuente, por lo que x=8,
mero de veces que se repite el signo menos
¥) Contrastando com la tabla de valores eriticos para Ia prucha del signo de Mario
‘Triola el valor ertico con wn nivel de significancia de 0.05 y n=16, es: 3. La tabla de
valores eriticos se presenta a eontinuiacin,
vi) Se rechaza la hipstesis nula si el estadistico de prucha es menor 0 igual que
valor eritco, Por lo tanto, al ser el estadistico de prueba mayor que el valor eritico,
se acepta ka hipdtesis nula, por lo que existe evidencia estadistica para aseverar que
no hay diferencia en la opinin de Tos almnos respecte a las ealifcaciones de los
dos profesores.
Esimportante notar que li tabla de valores crticos para la prucha del signo evita
que usemos un aniliss adicional utilizando la distribucion de probabilidad bine:
rial con P=0.5 y n=16y comparar la probabilidad acumulada generada por lames:
way el nivel de significancia.= PaO any
GUADRO N° 17: VALORES CRITICOS PARA LA PRUEBA DEL SIGNO,
INACOLA)
co
z a = = .
Z 5 = 7 a
F 5 = z a
7 Ei o o °
8 ° o ° 1
° ° ° 1 1
a ° 1 1 2
2 1 1 2 2
13 1 1 2 3
“4 1 2 2 3
15 2 2 3 3
16 2 2 3 4
ra 2 3 4 4
1» 5 4 4 5
20 3 4 5 5
a 4 4 5 6
2 4 5 5 6
2 4 5 6 7
Pa 5 5 6 zi
s 5 ‘ 7 7
Notas
1. * Indica que no es posible obtener un valor en regién critica
2, Rechace la hipétesis nua si el niimero del signo menos frecttente (x) es mejor
que o igual al valor en la tabla
3, Para valoresdle n mayores que 29, se utiliza una aprox, normal con
(FAUTA HACER FORMULA)
emple
Un analista de mercado desea medir la efectividad de una campaita promocional
del producto de sut empresa. Antes de la campana, selecciona 12 tiendas minoristas
_yrogistra las ventas del mes. Durante el segundo mes setertnina la campatia promo‘UNIDAD 111: ESTADISTICA NO PARAMETRIC
ional y se registran de muevo las ventas, Fl enadro siguiente muestra los niveles de
‘ventas, del primer y segundo mes.
Se clesea probar con un nivel de significancta de 0.05 que la eampaiia promocional
incrementé las ventas.
a a
1 ‘4000
‘000
800
1700
6500
$3900
4900
$5000
T 1700
$5100 5200
7200
$3300
PLlGdie
g
3
it
2
Sohicisn
4) Planteamos las hipstesi:
Horm=p.
Hi:m>p
‘Se entiende que para que Ia promocisn sea exitosa se requiere que el niimero de dite
rrencias negativas sea pertinentemente grande, o sea interesa que el mimero de signos
‘menos sea mayor que el ntimero de signos positives. Planteando de otra manera utile
zzanco ka probabilidad:
O:x1 = 0.8
Mizal> 05
i itt gpd ie
PTs Ts SENT |
: a — :
$5700
EEGi?
10 $5100
‘6000
3800
1700
36500
3900
1900
‘5000
sa700
$5200
" $8300 7200
$2700 sssa00
ii) Eliminandlo los coras, e valor de n=10, El estadistico de pracha es x=3
{) Utiizando la tabla de valores eritieos para ka prteba del signo al 0,05 en una cok
elvalor eritica es
¥) Como el estadistico de prueba es
yyor que el valor erilico no se rechaza ka hi