0% encontró este documento útil (0 votos)
234 vistas141 páginas

Manual Autoformativo

MK
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
234 vistas141 páginas

Manual Autoformativo

MK
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF o lee en línea desde Scribd
ao UNIVERSIDAD MopaALipaAD bed CONTINENTAL | | VirTUAL MANUAL AUTOFORMATIVO ESTADISTICA II Claudio Alvaro Cerrén Landeo Gada ator es responsable del contenido de si propio text, De eae etissa! (© Universidad Continental S.C 2012 (J Join 355, Miralores, Lined “Teléfono: 218 2760 Derechos reserdos Primera Fain: Noviembre 201 raj: 5M ejemplares Auto: Chau Atanas Corie Lado (Oficina de Prockicetn de Contes yReextce Imprese en ol Pent -Rebelars 54.6 {Js Los Boaques 855 EI Tambo -Huancaya Fond Editorial de Ia Universidad Continental “Toot los derechos reservados. Esta publicacn no puede ser repr, en todo en panes ni registra en 0 sida por wo tama de eeupetacign de infomation, eng fom pr in meio sea meeanico, oloquimice, cleetsnico, magnetic, eeetroSplico, por Totorop tier ote sinel erm pretin par ensita de fs Univers INDICE INTRODUCCION iy PRESENTACION DE LA ASIGNATURA 8 COMPETENCIA DE LA ASIGNATURA 8 UNIDADES pIDAcTICAS 9 TIEMPO MINIMO DE ESTUDIO 8 UNIDAD I: MUESTREO Y ESTIMACIGN DE PARAMETROS n DIAGRAMA DE PRESENTACION DE LA UNIDAD | "1 ORGANIZACION DE LOS APRENDIZAIES u TEMA N? 1: THOMAS HOBBES 1 E_Definiciones basicas 13 EX Tipos de muestreo probabilistieo “4 LECTURA SELECCIONADA N°1 " 2Funciona la terapia de contacto? Mario Triola. pp. 319 7 ACTIVIDAD N° a TEMA.N® 2: ESTIMACIGN Y TAMANOS DE MUESTRA a1 El Estimacisn de Ia proporcién poblacional 2 Il Estimacion de la media poblacional al El Estimacién de a varianza poblacional 21 Il Determinacién del tamaitos de muestra al CONTROL DE LECTURA N° 1 a GLOSARIO DE LA UNIDAD 1 18 BIBLIOGRAFIA DE LA UNIDAD | 18 AUTOEVALUACION DE LA UNIDAD | 18 UNIDAD II: PRUEBA DE HIPGTESIS Y ANALISIS DE VARIANZA 13 DIAGRAMA DE PRESENTACION DE LA UNIDAD II 13 ORGANIZACION DE LOS APRENDIZAIES 13 TEMA N° 1: PRUEBA DE HIPOTESIS 14 MB Definiciones bisicas uu HA Prucha de aseveracién para la media “ IEW Prueba de aseveracion para la praporeién u Prueba de aseveracion para la yarianza 4 TEMA N° 2: INFERENCIA A PARTIR DE DOS MUESTRAS "7 BEL Inferencia acerca de dos medias, proporciones para mucstras independientes 17 GW Inferencia a partir de datos pareados 17 EX Comparacién de ta variacion de dos muestras 7 TEMA N° 3: ANALISIS DE VARIANZA " Hl ANOVA de un factor fe HB ANOVA de dos factores 7 LECTURA SELECCIONADA N° 1 7 La paradoja del cumpleaitos Blog Estaditiea para todos ACTIVIDAD N° 1 18 ACTIVIDAD N° 2 18 TAREA ACADEMICA N° 1 18 GLOSARIO DE LA UNIDAD II 18 BIBLIOGRAFIA DE LA UNIDAD It 18 AUTOEVALUACION DE LA UNIDAD It 18 UNIDAD III: ESTADISTICA NO PARAMETRICA 13 DIAGRAMA DE PRESENTACION DE LA UNIDAD 4 ORGANIZACION DE LOS APRENDIZAIES 13 TEMA N° 1: PRUEBA DEL SIGNO 4 El Prucha del signo “4 EW Prueba de rangos con signo de Wilcoxon para datos apareados u BB Prucha de la suma de rangos con signo de Wilcoxon para muestras independientes “u TEMA N° 2: EXPERIMENTOS MULTINOMIALES Y TABLAS DE CONTINGENCIA THI Bondad de ajuste 7 BI Independencia y homogeneidad 7 TEMA N° 3: PRUEBAS NO PARAMETRICAS 4 Hl Prucha de Kruskal Wallis 4 HF Prucha de correlacion de rangos 14 EB Prucha de rachas a LECTURA SELECCIONADA N° 1 a7 Los estudiantes clasifican a las uiversidades dle In misma manera que el U.S. News and World Report? Mario Tiiola. pp. 675. ACTIVIDAD N°1 18 ACTIVIDAD N°2 18 CONTROL DE LECTURA N° 2 B GLOSARIO DE LA UNIDAD III 4 BIBLIOGRAFIA DE LA UNIDAD III 4 AUTOEVALUACION DE LA UNIDAD III 4 UNIDAD IV: CORRELACION, REGRESION Y CONTROL ESTADISTICO DE PROCESOS 13 DIAGRAMA DE PRESENTACION DE LA UNIDAD 3 ORGANIZACION DE LOS APRENDIZAIES 13 TEMA N° 1; CORRELACION Y REGRESION 13 MB Correlacion y regresién lineal 4 HA Correlacion y regresion miltiple fe Il Flaboracion de modelos de regresi6n 4 TEMAN® 2: CONTROL ESTADISTICO DE PROCESOS 15 Ill Graficos de control para la media y varianza 7 IX Graficos de control para atributos 7 LECTURA SELECCIONADA N° 1 31 09 demuestreo ¥ clerror Si el muestreo es sin reemplazo y a frac cestindar serie =| yylos limites de confianza se calculan con la siguiente fr = Ejemplo Un articulo publicado en un diario local indica que el tiempo promedio em- pleadlo por los hogares de Lima Metropolitana en ver televisién en el horario de 8 pam. a 11 pam. es de 7.75 horas. Suponga que el tiempo tiene sina distri= bucida aproximadamente normal con desviacion estindar de 345 horas. Para corroborar dicha afirmaciGn un grape de estudiantes selecciona una muestia dle 180 hogares de .M. y obtuve que el tiempo promedio fue de 7,42 horas por semana :Sera cierta in afirmaciGn publicada por el diario local al 96% de onfianza? Solitein 42siendo i) Lav estimaeidn puntual de pes x = i) -a=098 w= 0.04emtonces: Zpgi =240.98) iw FW)=72 -Q, 29). yra la distrbueidén normal estan- la distribucign tes my simi En aparien darizada, Ambas distribuciones tienen forma de campana. Sin embargo, la dis. Luibucion {tiene mayor area en los extremos y menor en el centro, a diferencia, de la distibueidn normal Stender Shade rormd demnbanon terete witha Te FIGURA N“Oi: Ejemplo de grafiens de la distribucion tStudent para diferentes tamafos de muestea (Triola, 2009) Ejemplo El jefe del drea de prensa de un diario desea evaluar la habilidad de s equipo: ide trabajo en el digitado de una misma notiela, Para realizar dicho estudio se leceiona al azar tma muestra aleatoria de redactores obstenicnd los siguicntes| resultados (en or 6379 82-79-69 8B BH OS 90 B28 4 Asumiendo que los tiempos se distribuyen normalmente. Halle ¢ interprete un Intervalo del 95% de confianza para ¢l tiempo medio ulilizado en el tipeado de una noticia Solucisn: 4) La estimacién puntual para pes =7,645 sienda s= 1.8507 4i) Como el nivel de confianza es 95%, Faia iit) L () = 7,645 — 2,0930 2.0930 8597) 8597) $7,645 + 2,0930 e770 y 8.1130 Interprotacién: Con un 95% de confianza entre 6.7746 y 8.1130 minutos se en- contrari la media del tiempo ntilizade por todos los redactores en cl digitado. de una noticia, Ejemplo Pamela, estudiante de estadistiea para Ciencias de la Empresa piensa que el sgasto promerlin semanal en fatocopias de los estudiantes de st facultad es de 53.5 soles, Para verificar si cs cierto Io que est pensande ha clegide al azar wna muestra de 9 estudiantes de an total de 120 estudiantes que llevan el curso de estadistica para comumicadores, resultando los siguientes gastos eet ccs aman 35 2B 9TH DHS Sila variable aleatoria objeto de estudio sigue una distribucién normal. Con un intervalo de confianza del 96% para la media del gasto semanal en fotocopias por estudiante ;sert cierto lo que piensa Pamela? Solucisn: 1) ne; N=120; 100.96 fi) “2.3889 siencdlo s= 0.7639 y n/N=0.07580.05 = 238804 (ease09) O79) (120-9 d | 020-1) = 178665 ws 2.9912 Conclusién: Con un nivel de confianza del 969% se puede deeir que el gato ;romedio semanal en fotocopias de los estudiantes ce si faculiad es menor a 3.5 soles, por lo que pedriamos decir que lo que piensa Pamela no es cierto. El ESTIMACION DE LA VARIANZA POBLACIONAL Supongamos una muestra aleatoria de n observaciones de una distribucién N(jB). Si Bes desconocida y la varianza muesiral observada es entonces el intervalo de confianza para la varianza poblacional al nivel de confianza del 100(15)% viene dado por: donde Zitat sulawe PLZ) < Bipae]=% y ian oolqve PLS Zia} =. vlavariable aleatoria Z,- sigue una distribucién 7 de Pearson con n-1_ grados de libertad cs @ ai FIGURA N°05: VALORES CRITIGOS DE L.A DISTRIBUGION CHEGUADRADO (Triola, 2008) Yoon NTT SSO La = Para obtener el valor erica 2.7 ubicar cl 9 on la coltmna de gradas de libertad p00: 0.975 (rea hacia la detecha del 7° ) en la parte superior horizontal. + Para obtener el valor eritico 19,025 ubicar el 9 en la columnade grados de liber tad y 0.025 (rea hacia la derecha del 7) en la parte superior horizontal, jemplo Un fabricante de baterias para automdvies afirma que sus haterias durarin, en promedio, tes afios con una varianza de un aio. Si cinco de estas baterias Gener duraciones de 1.9, 2.4, 80, 35 y 42 aos, construya nn intervalo de contianza del 95% para 7 -y decida sila afirmacién del tabricante de que 7 = 1 es vilida, Suponga que la poblacién de duraciones de las baterias se distribuye de forma aproximadamente normal Solucién Ds =0815 a 4) Elyalor BR1-/2,, es un valorfi2 con B= 541 grados de libertad, que deja un area de 0,025 a la iquierda y por lo tanto un dizea de 0,975 a la derecha, es B20,975 = 0.484; de la misma forma, el valor 828/2 es igual a 820,025 = 11,143. ) G-MO815) (> _ G-1K0815) 1143 0.484 iy) 03<0? <67 Interpretacién: Con 95% de confianza entre 0,3 y 6,7 se encontrar la varianza de la duracidn de Ins baterfas, Sfes posible considerar como vilida la afirmacién del fabricante porque el intervalo hallido contiene a la unidad, Ejemplo Se desea estimar la varianza de la longitud de ciertos cables, En una muestra de 29 cables se encuentra quie I longitu tiene uma media de 80 mv una desviacién de 3 sm. Hallar un intervalo con una cont para la varianza de las longitudes de los cables, Solueidin 8 n=25 i) NC.=0.95= 0.025, a iit) Zoors29 =124011, Zeon. = 39-3641 a) Wx9 2, x9 39.3641 12.4011 » Pe Pete orc) ear 549<07 $1742 ww 234<0<417 Intexpretacién: Se puede afirmar con un 95% de confianza que la desviacién estan- dar de la longitu de dichos cables se encuentra entrea 2.34 m y4.17im, [El DETERMINACION DEL TAMANO DE MUESTRA Existen tres factores que determinan el tamaio de una muestra; ninguno tiene alguna relacidn directa con ol tamaio de la poblacisn, Estos son’ -El grado de confianza elegido. - Elximo error permitido. Lavariacién de la poblacién, 41, Para estimar la media poblacional = pan = a B(N-Dtro” Donde: : Esel error permitidos 2% El yalor estindar normal asociado con el grado de confianza elegido, La desiacién de la poblacidn, obtenida de estudios anteriores, experiencias pre- vias ose puede estimar la desviacion estindar muestral mediante un estudio piloto ‘no: Tamale de muestra caleulada de una poblacién infinita Nz Tamafio de poblacién Se dice que w cs finita si la relacion n/N > 5% 4.2, Para estimar la proporeion poblacional Donde: E:Esel error permitida; 2: El valor estindar normal asociado con el grado de confianza elegido, P: La proportidn de éxito de la poblacion, obtenida de estudios anteriores, expe- riencias previas o se puede estimar la proporeidn de éxito muestral mediante un estudio pilota, 4g La proporcién de fracaso de la poblacién se obtiene por complemento de pq = keene ian Tamatio de poblaciéa mplo Se desea estimar el peso promedio de los cos que son Henadas por in niievo ins trumento en tina industria, Se conace que el peso de un saco que se Mena con este instrumento es una variable aleatoria con distributcion normal, Si se supone que la desviacion tipiea del peso es de 0.5 ky, Determine el tamaiio de muestra aleatoria necesaria para dleterminar una probabilidad igual a 0,98 de que el estimado y el parimetro se diferencien modularmente en menos de 0,1 ky, Solucion eon o .05 i) 2, = 16 ia) n= (Cone y é a Evidentemente un tamaiio ee muestra no puede ser fraceionario por lo quese debe apraximar por exceso, El tamafo de muestra seria de 97 Fjemplo La Direceidn Regional de Trabajo phines realizar un estudio con el objetivo de conocer el promedio de horas semanales trabajadas por las taujeres del servicio do- méstico, La muestra sera extrafda de wna poblacién de 10000 mujeres que figuran en los registros del seguro social y de las cuales se conoce a través de un estudio piloto que su varianza es de 9.648, Trabajando con un nivel de confianza de 0.95 yestando dispuiestos a admitir un error maxima de 0,1, seudl debe ser el tamaio uestral requerido? Solueidny 8) 0=0.1; 6 = 9.648, = 0.08 » Za »_(eens y a §) Coma 19000¢3706x(3706-1), se corrige el tamaiio de muestra 3706 yy T0000 704 jemplo En un lote de fraseos para medicina, con una poblacién de $000 unidades, se desea cestimar kt media de la capacidad en centimetros cibicus de los mismos. A waves de un premuestro de tamatio 35 se ha estimade que la desviacién esténdar es de 2 centimetros ctibicos. Si queremos tener una precisién 0.25 cm’, y un nivel de Significancia del 9%. 2De que tama debe de ser la muestra? Solidi UNIDAD I; MUESTREO Y ESTIMACION DE PARAMETROS 1) 0.25 em; = em ) Zz 218 iit), NOZ w+oZl, iv) 8000(2)70.8 }? MOOS THIS we) go 1229812 3153 239 Solo faltaria muestrear 204 frascos, pues los datos de los 35 frascos del premuestreo siguen sienda vilidos, Bjemplo Ena region toman leche en el desayuno, Sise sabe que existen 1500 niios y deseamos ener una precisién del 10 %, con un nivel de signifieancia del 5%, 2De que tama fio debe de ser la muestra? investigacién, se desea determinar en que proparcién los nifios de una Solucion 1) N=1500; e=10%=0.1; a= 0.05 1500055055 OD + CR OSG ) Se deben muestrear 90 nites. Cuadro N09; Distintos niveles de confine utilzados ent la prctica Nivel de Confionss 973% 99 SHE HE SHAS STE OTE Valores az 5.00 258293203200. .a8 FF ssi sta actividad puede consultarla en st aula viral = keene ian CONTROL DE LECTURAN* 1 Esta actividad puedte consuftarla en su aula vietal A, I cepecsesasoen EOD asec ‘Triola, M. (2012). Fuaditica. México : Pearson Faucacién Berenson, My Levine, D. (2010). Estadistica Basion on Administacién, Conceptos y aplicacio. nies, Mexico: Prentice Hall ecenmmarniravemT esucla el siguiente cuestionario, mareando la respuesta correcta en cada caso, para fijar los conceptos e ideas furndamentales tratados en la Unidad: 1. Correlicione: Es una técnica en elquc el sujeto no sabes ests Mucstreo estraifcado Reeacestiel alesis ee ee ears eet) D) | eee gies tomatoe ‘posed de sr elegido> Seleeciona directamente los individios de bx Muestra aleatorin poblacién para la miesra Sapa Sa ea ep eee Mileaea ae ‘ala Keximo clement de la poblacion pcan Subdividimosa ls poblaciin en al menos dos 5 sugrupos diferentes, cada subgrupo posce gran Eatudio a ciegas ay » 2) 35424 4) 5A,2,31 ©) 53214 ‘Una de sus obras mis importantes cle Maguiavelo fue a) 0.014 b) v.15 ©) 0x07 @) 0.028, ©) 0.198 UNIDAD I; MUESTREO Y ESTIMACION DE PARAMETROS 3 EI siguiente intervalo de confianza se obtiene de un (0.883. 1, Se conoce el valor de la desviaci6n estindar poblacionsal, normal LS emplea para n<30 sila poblacidn tiene wna distribuci IV. Se conoce el valor de la media poblacional ample. V. Lamuestea es una muestra aleator a, my Ww by Ly ¥ OLIV yv aay e) MIVy El ancho de un interwalo de confianea para una proporcisa ser a) Mis angosto para un nivel confianza de 99% que para un nivel conflanza de 95%. >) Mis amplio para una muestra de tamaiio 100 que para wna muestra de tamaiio 50, ¢) Mis amplio para tina desviacidn estindar de 3.56 que para un nivel de confianza de 90% 4) Mis amplio cuando la proparcidn de la muestra sea 0.50 que cuando la propor ‘eign de a muestra sea 0.20, ¢) Mis amplio a nivel de confianza 99% que al de 95% Un grupo de consumidores desea estimar el monto de las Eacturas de enengia elec trica para ol mes de marzo para las viviendas unifamiliares del distrito ce Huallias, (Gon hase en estudios reilizados en otras ciuelades cercanas a ésta, se determing ua esviaci6n estindar de 25 dolates. El grupo desea estimar el monto promedio para marzo dentro de #5 délares del promedia verdadero con 99% de confianza. Calcule cl mcjor tamano ce muestra a) 205 b) 167 135 4) 08 ©) 152 Un ampli intervalo de confianza indica que: |. Existe mayor probabilidad de estimar parimetro con el estimador 1H, Hay una variabilidad considerable en los datos muestrales TILLa estimacion puntual obtenida de la muestra no puede estar cerea del verdade- ro valor del parimetra poblacional IN. Hay poca variabilidad el estimador es cercano al parémetra V. Livestimacisn por intervalo no es vila Bi wii 4" use Hoonione el Pesce 00: worsacovesTnACGN a anit, Son verdaderos: a) LULylV by my v owyy «nym oly 8. Com la siguiente informacidn: P= 2.58, = 0.01 Defina el interval de confianza para la desviaci6n estindar: a) 1.039<0<2.775 by Lisl ) Constitucionalismo ©) Democracia 4d) Ninguna de las anteriores 20, John Locke establece que existe en Ia naturaleza del hombre wna amenaza latente e. 4) Oportinismo >) Conflieto, ©) Confiabilidad 4) Ninguna de las anteriores B ESTADISTICA I a UNL ba E) UNIDAD II: PRUEBA DE HIPOTESIS Y ANALISIS DE VARIANZA a DIAGRAMA DE PRESENTACION DE LA UNIDAD It AUTOEVALUACION SEOUL | FBborcanizacion DE LOS APRENDIZAJES es ed fo ‘Tema N' 1: Prucba de hip6tsa 1, Gonoce y praca 1s pror Dene cedimienten de In pricha de rch de aseveral6n pata pens pt tamedia ones a 5. Pech severe para propareian 4: Pructa de seeracon para 1. Valora bs importancia de ta cstimacidn de paraimetros pdr del wat dle muestra y compricka be pate patna ded 2. Compara dos conjustos de ‘Tema N°2: Inferenciaa partir ator muestraes 5 apea be de dos estas prucbs de hips area de Ho Inferencia acerca de dos Syseanictrsticas poblaiona meds. proporciones para ks accra tndepeiiente 2 Inferencia a partic de datos pleated Comparacin del vartacin she des mics Actividad N° 2 ‘Tema N° Se Inferencia a partir T™Pe® Academies N° Pape pe aay ANOVA de un fictor [Link] ded actores Apt andi de erin de un faciory de dos factores Lecture slecconeds 371 1a puradoja del cumpeaion Blog staditica para tis “Avsoreacion de a Unidad Cs) co DDE HIPGTESIS Y ANALISIS DE VARIANZA TEMA N° 1: PRUEBA DE HIPOTESIS Los métodos estudisdos en la Unidad anterior usan la informacién proporcionada por Jos estadisticos muestrales para estimar con cierta probabilidad el valor de un pardme- tro pablacional. En éste Unidad se introducini la prucha de hipstesis que supone a priori el valor del parimetro y sobre la base de la informacion obtenida en una mies fya se somete prueba la supesicién, para luego tomar eon eierta probabilidad, ka dcisién de recharar o no recharar In hipdtesis. En éste pinto es importante se ls expresin “no rechazaa” pudiera ser sustituida por “aceplar", sin embargo a hacerlo es necesario atencler cuidadosamente algunas explieaciones que se daran mis adelante, La pricha de hipétesis también conocida como docimasia contrastae cid de hipstesis es uno de los métodos estadisticos mis usados en las ciencias naturales por ser un procedimniento que le proporciona al investigador un crterio objewvo part tomar decisiones con hase a in raimero limitadlo de observaciones. Esta proposicin que finalmente es aceplada © rechazada recibe el nombre de hi potesis, Este es imo de los aspectos mis tiles de ka inferencia estadistiea, pesto que ‘muchos tipos de problemas de toma de decisiones, prichas a experimentos en el mune do de la ingenierfa, ciencias de la salud, cencias sociales, administracion, economia, etc,, pueden formutarse como problemas de prucha de hipstesis, Il DEFINICIONES BASICAS 11. Hipotesis Una hipstesisestadistica es una proposicién o supuesto sobre los parimetros dle una © mis poblaciones ipétests estadistica Gaalquier afirmacién o conjetura que se hace a cerea de la distsbucidin de una ‘o mas poblaciones Fj El promedio ponderado de los alumnos de UCCI en el semestre perior a 14 1.3. Hipotesis simple salquicr hipstesis estadistica que especifica completamente Ia dstribuc la poblaciéa, especifica la for a de la elistribucion y el valor de su parimetro, Ejemplo: E] ingreso mensual promedio de les empleados de cierta empresa es de 800 nuevas soles, suponiendo que los ingresos se distibuven normalmente con desviacion estindar de 30, 1.4. Hipotesis compu Gualquier hipdtesis estadistica que NO especifica completamente la distribu fn de la poblacign, Ejemplos E] ingreso mensual promedio de los empleados de cierta empress es SUPE RIOK 2 900 nuevos soles, suponiendo que los ingresos se distribuyen normal mente con dessiaeién estindar de 30. Hipotesis aula (10) Es la hipdtesis que esaceptada provisionalmente como verdaderay enya valider serd sometida a comprobacion ip6tesis alternativa (hI) Es una hipotesis contraria a la hipotesis nul, se acepta en caso que la hipatesis intl sea rechazada, Es importante recordar que las hipétesis siempre son proposiciones sobre la PAUSE AIL) poblacién o distribuci6n bajo estudio, no proposiciones sobre la muestra, Por lo general, el valor del parimetra de Ia poblacién especificado en la hipsitesis tila se determina en wna de tres maneras diferentes; = Puede ser resultado de la experiencia pasada o del conocimiento del proce: +0, entonces el objetivo de Ia prucba de hipstesis usalmente es determina si tha cambiado el valor del parimetre Puede obtenerse a partir de alguns teorfa © modelo que se relaciona con el proceso bajo estudio. En este caso, €1 objetivo de la prueba de hipstesis es vetificar la eorka o modelo, Cuando et valor del parimetro proviene le consideraciones externas tales como las especificaciones de disefia 0 ingenieria, o de abligaciones com tractuales, En esta situacidn, el objetivo usual de la prueba de hipstesis e pro bar el cumplimiento de las especificaciones 1.7, Planteamiento de hipotesis Es importante tener en cuenta que cl signo igual siempre debe ir vinculade a Tx hipstesis aula. 2)H0: 958, Hi 838, s)H0: 928, Hn a8, HO. 6=0, yill 848, 10, 0=8, y 11,:8<8, 1.10, ERROR TIPO LY It “ACEPTARH, ‘CORRECTO ERROR TIPO 11 ke ® RECHAZAR HY, ERROR TIPOT ‘CORRECTO a cB) ESTADISTICA I Tea 47 UntveRsipaD CONTINENTAL Vieraat Cs) co DDE HIPGTESIS Y ANALISIS DE VARIANZA Nivel de Significacion (a) Es la probabilidad de cometer un error de tipo (error tipo 1) P(rechazar H, cuando es verdadera) Potencia de una Prueba Es la probabiliclad de cometer un error de tipo 1 (error ipa) (aceptar H, cuando es fala) 1.11, Regla de decision Es la division de la disuibucién muestral del estadistico de la prueba en dos ‘partes niuttamente exchiyentes: Region Critica (RC): region de rechazo de HO Regidn de Aceptacidin (RA): regidn de no rechazo de 0 Depende de la hipétesisalternativa HI del nivel de significacién y ka distribu cidn muestra del estadistica Prucha de Hipétesis Bilateral ‘a Phicha de das cola. ay HI8=8, sf * “C e Prucha de Hipétesis unilateral 9 Prueba de una cola, Ho:8=8, y H1:8<8, Prucha de Hipstesis unilateral © Bruch de una cola, H0:9=8, y HI:859, PAUSE AIL) 1.12. Procedimiento de la prueba de hips La prucha de hipstesis estadistica consta del sate procedimiento: 1, Planteamiento de las hipstests. Establezea la aseveracidn qute desea ser pro- dada y exprésela en forma simbélica, 10 y 11. EI signo igual siempre debe ir Nincukido eon la HO. 2, Establecimiento del nivel de confianza, De acuerdo ala gravedad de comecer 1 error tipo Tse establece el valor a, Es usual consierar los valores 0.05 y 0.01. Este valor nos permitiré caleular valor critica de la pricha quie priede ser z, Lo chi cuadrado, 5, Galleulo del estadistico de prucha, Se identifica el estadistica pertinente para 1h prueba realizada y su respectiva distibucidn, Iuego se realiza el cilcule dol mismo al cual ustialmente se le denomina valor caleulado, Se realiza un agrifica de la distribucidn que incluya el valor eritico, cl estadistica de priicha yas regiones de rechazo 0 critica y de aceptacion 4, Establecimiento de la regla de decision, Rechace la HO si el estadistico de prueba se eneuentsa en la region de eritica © de rechazo, Acepte la HO si el estadistico de prueba se encueentra en la regién ee acepracién, mma de decisién. Establezca la conchisién indicande si existe evidencia iuestral suliciente para aceptar lt HO (FEEAHO) o los datos muestrales sustentan la aseveracidn de la HD porlo que no lny evidencia estadistica para aceptar HO (EEERHO) [Gl PRUEBA DE ASEVERACION PARA LA MEDIA Supongamos que de nna poblacién normal con media desconocida py varianca conocida BF se extrae tna muestra dé tamatio n, entonces de la distribuctn de la yedia muestral X se obliene la prucha estadistica o estaditic: =u sin Ejemplo Fuumar cigarros de la marea X produce en promedio 0.6 mg de nicotina. Hl depar. ltamento de ingenieria del fabricante propone un fillto nuevo que supuestamente reducini la produccién de nicotina, Se toma una muestra de 50 cigartos con el mucto filro y se encuentra que el promedio de nicotina es de 0.55 mg. Con wna cestindar de 0.56, -Debe aceptarse la aseveracidn del depactamento de Ingenieria con e significacisn de 2.5 por ciento? Solucisn i) El pardmetro de interés es la media de la poblacién , se desea prabar Ho: p=0.60 Hi: p La certificadora quieve corroborar ka hip6tesis de investigacion de que el nivel me- dia de benceno en la planta de fabricacién excede a 1 ppm, Donde esla verdadera media, La prueba es unilateral derecha. i) EL nivel de (desviaci6n estindar muestral conoeida y n<30) y ubicarlo en la grifica que corres. pondea una prueba de hipétesis unilateral derecha, Ho: ificancia es 2=0.05, lo que nos permite ealeular el valor eritico t —— v Ts Ui) El estimador es t ealeulado, iv) Fl valor caleutado Lo estadisticn de prucba 2.80 se encurentia a la dereeha, de 1,729 on la regidn erttica o de rechavo, Existe evidencia estadistica para sechzar la Ho, +) Ta centificadora de calidad por lo tanto Hoga a la conclusién que >1 ppm y ue la panta esta violando las norms gubernamentales con wna contiabilidad asociada de 4=0.05, PAUSE AIL) [El PRUEBA DE ASEVERACION PARA LA PROPORCION ‘Supongainos que de tina poblacién de tamatio N de la cual se obtione una muestra de tamano n, existen x elementos favorables ala caracteristica que se esti analizan- de, Entonces la proporcién muestra es esis aula, Siendo m elvalor presente en la hipé- El estadistica de prcha Fuporeas (— 7 spores) a El tamayio de muestra de muestra debe ser Jo suficientemente grande para que li ‘prucha sea vilida. Como regla prictica: p 24, 924 ¥ pagel Ejemplo Elempleo de acero intemperizado en la construccién de puentes para autopistas ht sido tema de considerable controversia, Los eriticos han eitado temas de earresion, [graves del acera intemperizado y estan tratando de convencer a las atoridades de {que prohiban su uso en la construccién dle puentes. Por otro lado las corporaciones acereris aseguran que estas acusaciones son exageradas y dicen que 99% de todos Jos puentes de acero intemperizado en operacién tienen un buen desemperio, sin dlaiios graves por corrosicn. A fin de proba esta aseveracidn, un equipo de ingenie- ros experts de La industtia del acero evalusaron 40 puentes de acero intemperizado seleccionados al azar y encontraron que 36 de ellos mostraban wn hen desempe- fo. {Hay pruchas con =0,05 de que la verdadera proporcién de puentes de acero intemperizado que presentan un buen desempeiio sea menor que 0.95 que es ka cifta citada por las corporaciones? Solucién i) El parimetra de interés es uma proporcién de la poblacién , se desea prabar HO: x =0.95 Hin < 09% Donde ¢s la verdadera proporcidn de todos los puentes de autopista de acero intemperizado que muestran un buen desempeno, siendo la prucha unilateral ia- quierda ii) EI nivel de significaneia ¢ 00.05, lo que nos permite caleua el valor exit 7 ubicarlo on In geifiea que corresponde a tuna pricha de hipétesis unilateral izquiierda, | res P os-08 os 05) 6 ¥) Se puede rechavar la hipétesis mula con 00.05, ya que el valor calenlado 0 esti ‘mador-1.78 cac a la irqsicrda del-1.545 lo que indica que se encientra en la region ESTADISTICA ao 51 Ca DDE HIPGTESIS Y ANALISIS DE VARIANZA de rechazo, v4) Por lo tanto, existe evidencia estadistica para sustentar a hipétesis de que la proporcidn de puentes de autopista de acera intemperizada que tienen bien des- cmpotio es menor que 0.5 Ejemplo Un estudio realizado a famadores que intentaban dejar el hibito con terapi de parches le nicotina revels que 39 de ellos contimaaban famando un aio despues de iniciado el tratamiento y 32 habfan dejado de fumar (segtin datos de "High-Dose Nicotine Patch Therapy’, de Dale et al, Journal of the American Medical Associa- tion, vol. 274, niim, 17). Utilice un nivel de significancia de 0.10 para probar Ia aseveracion de que, de los fumadores que intentaban dejar el cigarrillo, la mayoria contin fumando wn ano después de inicir el tratamiento, -Sugieren estos resale tados que la terapia de parches de nieotina es inetiear? Solucisiy {El parimetro de interés es una proporcién de la pablacién m , se desea probar: Donde ¢s la verdadera proporcién de todos los que continiian fmande un ano después de iniciar el tratamiento, siendo la prueba unilateral derechs, i) El nivel de significancia es 60.1, lo que nos permite caleular el valor critica 2 y uubicarlo en la grifica: MN oe fil) p — 2, por lo que wulizando los datos del problema: fn) El estadstico de pmicha es z 2 Aamoree aeons Taree) os -05 ea sna 1% +) Bl estadistico de prcha 0.4 cae a la iquierda del valor eritice 1.645 en la regis de acepta e-evideneia n, por lo que e istiea para aceptar la hipdesis mula i) Como el 50% o menos deja de fuunay, Ia terapia de parches n0 es eficaz Il PRUEBA DE ASEVERACION PARA LA VARIANZA, Supongamos que de una poblacién de tamaito N de la cual se obtiene wna muestra de tamaiwo 0, existen x elemento c debe ada se la siempre y enanda se trate de poblacio nes normale y el estadistico de prueba sla variable Jucuadrads con (al) grados de libertad y que se expresa come: Para aplicar una prucha de bipstesis relativa a la varianza de una poblacisn asnmir que la distsibucion Jecus (n-1)s* > Ca SU AUT MSS ag 1) EI proceso que sigue sina prucha de hipétesis para la yarianza os el mismo que utilizamos en las anteriores secciones, es muy ustal aplicar esta prucha cutando se ‘require comprobar el grado de vatiabilidad de un proceso. Ejemplo Se sabe que el contenido en gramos de wn producto fabricado por una compaaia, no retine las especificaciones sila varianza de un lote de produecion se aleja demasiado hacia arriba o hacia dehajo de 6. de produccién reine ls especificaciones, raids aleatoria ‘Comprobar siuun gran Tote me de dicho Iote arroj6 una varianza de 7.3. Utiizar un hhivel de significaeidn del 5%, Se sabe que el contenido del producto se distibuye normalmente. Solucion ) H0:82 BOS He:@2 O65 it) La pricha es bilateral con un nivel de significacién: 20.05, el valor ertico jt cuadrado es i) El cvterio de decision sera el siguiente: *Si el valor de B caleulado ex menor que 8.90652 0 mayor que 32.8525, se rechava la hipétesis nua de que la varianza sigue sieudo de 6.5, con tn nivel de significaciGn del 5% iv) Fl estadi la tormula izando fico de pruicha se caleulateniendlo en ctenta m Game? _ (0-973 e 65 ¥) Gomo el estadistico de prueba 21.34 se encuentra en la regién de confianza 0 de aceptacién. Entonces con podemos afirmar con sm nivel de significancia del 5% que existe evidencia estadistica para aceptar que la varianvza del contenido del pprodlcto el mismo, Fjemplo, Un supervisor de control de calidad en wna enlatadora sabe que la cantidad exacta contenida en cada lata varia, pues hay ciertos fictores imposibles de controlar que afectan la eantidad de Henado, El Henado medio por lata es importante pero igual mente importante es la variacion 22 de la cantidad de Nenado, Si2 es grande, algunas latas contendrin muy poco y otras, demasiado, Has agencias reguladoras ‘especifican que Ia desviacién estindar de la cantidad de llenaco debe ser menor {que 0.1 onzas. El supervisor de comtrol de calidad muestres n=10 Iatas y midis a cant ad de llenadlo en cada uma, Los datos se reproducen a continueién. 79) 79 798 801 797 7.95 BOR RMD ROL——BOD JEsta informackén proporcionsa con un nivel de significancia del 0.05 pruebas sufi ientes de que la desviacién estindar Bide las mediciones de llenado es menor que 0.1 onzas? ohucién ) HO: Bod Ha: c01 it) La prucha es unilateral iquierda, con 0.05, por lo que el valor critica es: i) El estadistico de prueba se calcula utilizando la desviacibn estindar de ka mes: tra sO. y PE OS er a IL) © -1)x0.0457 _ 2 16 or scobuerconwics fn) Como el estadistico de prucba 1.66 es menor que 3.825 y cae en la regién de rechazo, existe evidencia estadistica para rechavar ka hipotesis mula, Entonces el supervisor puede legar a In conclusién con un nivel de significacidn del 0.05 de que la varianza de la poblacin de todas las cantidades de Henado es menor que 0.01, 0 sealBe0.1 TEMA N° 2: INFERENCIA A PARTIR DE DOS MUESTRAS Ml INFERENCIA ACERCA DE DOS MEDIAS, PROPORCIONES PARA MUESTRAS INDEPENDIENTES. (TRIOLA, 2009) En la prietica, se presenta una diversidad de problemas en la industria y en las ciencias sociales que nos sugieren confrontar cual de dos procesos em jor que el otro ala hz de la media que arroja cada uno de ellos, Se nos podria ocurtir por ejemplo: a) verificar si el consumo de gasolina entre dos marcas de vehieulos se puede considerar idéntico por el contrario una marca es mas econdmica que otra, b) Verificar si los salarios de la industria metabtirgiea se pueden considerar ‘ono superiores a los silarios de [a industria textil en una regidn, c) Verificar si el contenid de determinada snstancia en ma articulo fabricado par una companifa A 8 inferior o no al contenido de dicha sustancia en cl mismo articulo fabricado por ‘una compatiia B de la competencia ete En cuanto a la distribucién en el muestrca de In diferencia de medias, recordemos los siguientes tres casos: Silas dos poblaciones son normales, las diferencias de Ins medias muestrales tamm- bign se distribuirin normalmente cualquiera sea el tamano de las muicstras, No obstante, sino se conocen las desviaciones estindar poblacionales (U1 y 2), éstas pueden ser remplaadlas por la dessiaciones estindar de las rmuestras (s1 y 92), 81 Jos tamatios de las muestras som mayores que 30 (al >50 y nZ 250 o nl +2 >60). Segtin el teorema central del Iimite, si las dos poblaciones no son normales o no sabemos si se cumple 6 no éste comportamiento, las diferencias de las medias mvestrales se distribuirdn aproximadamente como una disteibucién normal, si los amaiios de las muestzas son mayores que 30 (nl >30y n2.>80.0 n +2 >60) Si kas dos poblaciones son normales 0 esti ¥y por otra parte no conacemos la desviaciones estindar poblacionales y ademas Jos tamanos de las muestras son menores que 30 (n] <0 yn2 <30 onl +n2 <60), centonces, las diferencias de las anedias muestrales se distribuirin de acuerdo a la ley tstucent Con el fin de resolver kas prucbas de hipstesis para la diterencia de medias, debe: ‘mos tener en enenta el mismo procediniento y las mismas reghas que seguimos para Jas pruchas de hipdtesis para la media 11 Inferencia acerca de dos medias Es la divisién de Ia distribucién muestral del estadistico de la prucha en dos partes mutwamiente excluyentes: PAUSE AIL) uadro N° 11: ESTADISTIGOS PARA DOS MEDIAS. ESTADISTICA Coe y G4 A = deseo a tude Gree ata jemplo ‘Una compaiia de transportes requiere comprar un gran lote de buses para el trans porte urbano con el fin de reemphuzar su parque automotor y para tal fin desea comprahar la afirmacién hecha por el proveedor de la marca B, en el sentido de que la marca.A es menos ahorradora de combustible. Para tal fin Ia empresa toma tuna muestra aleatoria de 35 vehiculos marea A y encuentra que lt mista tiene wa promedio en el rendimiento de 18 kildmetros/galén con una desviacidn estindar de 8 kildmetros/galén, mientras que una muestra de 32 vehiculos marca B presenta tun promedio de 22 kilometros/galén con desviacion estindar de 3 hilbmetios / adn. Leanct oi fy <—taaes . Lasalternativas de un lado se watarian de manera simila Hjemplo Un fabricante desea comparar el proceso de armado contin para uno de sus pro uctos con un método proptisto que supuestamente reduce el tiempo de armada, Se seleccionaron ocho trabajadores de la planta de armnado y se les pidis que arma ran kas unidacles con ambos procesos. Les siguientes son Ios tempos observaddos en Cio 1 TNO ORATION NFO . = - i a z 5 a > . * * : “ * En @=06 , zexiste alguna razén para creer que el tiempo de armado para el pro- eso actual és mayor que el del método propuesta por mas de dos minutos? Soluetiny 1) tavhipstesnso: Hy {Mp =2 Hiifty >2 PAUSE AIL) fi) Calealande las diferencias: ESTADISTICA Coe 2 a Es a 0695 4 6 2 2 53025 . 2 s 7 002s * * = * 1302s 7 s 2 7 0025 . a 2 5 0.0025 ax 3 ay DoE 475 y 8, 48) El estadiitico de prucha seri 8 L907 ¥) Finalmente, fgy.j =#g 9 = 1.895. , debido a que 2.107 > 1.895 rechazamor 10, yaceptamos la HI: el tempo de armado para el proceso actual es mayor en dos 'mimutas que el método propnesto, COMPARACION DE LA VARIACION DE DOS MUI Supéngase que son dos las poblaciones de interés, por ejemplo X1 y X2, donde STRAS. 18,¢3.d2.03 , we desconocen, Deseamosprotar ipGtss relat ala igualdad delaras Apselae! . Comdgec quer dimen tarmiatrs blestorias de tamaton! dela poblacién 1yde mano m2 del poblacign 2 ysean ‘S296 2 lasarianzas de muestra, Para probar I alternatva de dos tados: Hy:o)=0} Hy,:o) #03 Timamaougien amma A macenqé eae REEL 2-1 grades de ibertad s Rechavariamos H0si Fy > F, fami 28 A a3 81 Fy> Fay inet srocharariomos Hy 0 Bemplo Los siguientes son tiempos de quemado (en minutos) de seriales uminosas de dos lipos diferentes. RMATIVO 59 CO a Ue AU Ce a a mm Trucbe la hipstesis de que las dos varianaas sean iguales. Use ot =.6 Solucisin ») Hy:op=03 Hole ii Nivel de signifcaneia. or = 0.6 inj =ROREI 108, Del mismo mode: Feats 0.218 ii) La regi de confianza ents dala por [0:248; 4.03], Si el F calcula eae fuera del internat dado entonces se rechara ka hipGtesis ul, 'n) Con los datos: H=3 6 Xy=0 spa S104 a Ra 341-087 cateulamos “8 35 = jon. Se er ee TEMA N° 3: ANALISIS DE VARIANZA Cuando se requiere hacer inferencias acerea de las medias de di partir del analisis de las muestras de ellas se aplica un estudio denominado Anilisis de Varianza (ANOVA). En un ANOVA (Mata, 2013) se aplican tratamientosa entidades denominadas unidades experimentales, Hl atributo de las entidades que se desea medi recibe el nombre de factor. En dicho estudio puede aplicarse modelos de efectos fijos o aleatorios. En un mo- lo de efectos fj, se seleccionan tratamientos especificos o se fijan antes del estudio isticamente). En un modelo de efectos aleatorios, os tratamientos wilizdos se seleccionan aleatoriamente. Estas téenieas se pueden utilizar en mnchas campos tales coma: Un gerente de compras de un supermercado puede interesaese en compara la dur bilidad de ciertas baterins en el almacén de 3.0 mis proveedores. - Un gerente de produecién puede analizar el rendimiento de tres 0 mis procesos para determinar si hay diferencia entre ellos, = Un analista financiero desea saber si hay diferencias en el margen de operacién de PAUSE AIL) ‘Hjemplo ‘Una pequenia empresa que elabora botanas (papas fits, cacahuates, ete) tiene 4 ras para el reparte de sus proclctos dentro de la eivlad. Para cubrir estas nits tiene 4 con- uctores bisicos y uno complementario, el conductor complementario srve para cubrir Tas antsencias 0 vacaciones 6 enfermedad de los otros 4 y se le ocupa para otros mencs teres si no se Te requiere como conductor. El puesto de conductar complementaria se rota entre todos los choferes sobre una misma base menstial Es importante tanto desde el punto de visa de eficiencia, como de justicia, que todas las rutas tenga la miso du rracién, también es importante que todos los conductores sean ignalmente eficientes en todas las rutas para que los conductores puedan sustituirse el ano al otro sin pérdida de Luempo, por ello la gerencia de distribucion implements un programa de capacitac para que los conductoresse familiaricen con todas ls rutas. Al cabo de esta capacitaeién se hicieron recorridos de prucba con el objetivo de investigar, por una parte, si todas las ntas se recorrian en el mismo tiempo y por otta parte silos conductores eran jgualmen- te eficientes en todas. La gerencia de distrihucién desea saber sil tiempo medio de las cuatro rutas es igual ys I eficiencia de todos los conductores en las rutas es igual. La informacion de los recorridos ylos conductores se dita continusciGn: ‘Cuadro NH; Conductores vs Recortidos EEE me ee] reas _ sae Becera ae 239 22 250 Cervantes 225 20 25 261 Domingues 22 233 259 25 Exeamilla az 25 ar 281 En este ejemplo se tienen datos se casifican de acuerdo con dos variables: el conductor y kenuata que son, entonces, los 2 faetores, Aqui ls hipsesis que se prueban son: Para las rutas Ho: fly = Hg = He = Ho HLL: Por lo menos 1 corras, de las medias poblacionales de los tatamientos no es igual las En donde las vrentes medias son las medias de las 4 ruts. Para los conductores tno: fy = Ma = Hy = My H1: Por lo menos una de las mesias poblacionales de los bloques (conductores) no es igual las otras En donde las snes medlias son las meebias de os 5 conductores. En este ejemplo, el tratamiento son las diferentes rutas y a la variable del conductor, ‘cuyos datos estin en los renglones, se le conoce como grupos, su ver, tratamientos y grupos son Tos dos Factores a los que se refiere ef nombre de esta técnica de anilisis le varianza de dos factores ‘Un detalle que vale la pena tener presente respecto a este ANOVA de 2 Factores es que se tione in solo dato para eadla conductor y para cada ruta, ya que el andlisis de varianiza de este par de factores, se refiere también a conjuntos de datos clasificados de aewerdo ‘com 2 variables, pero en este cas, actores, n cuando menos 2 obvervaciones para cada par de Cl Cs) DDE HIPGTESIS Y ANALISIS DE VARIANZA co SUPUESTOS DE UN ESTUDIO ANOVA Los supuestos en que se basa la prucbs t de dos mucstras que utiliza mucstias inde- pendientes sor: Las poblaciones son normales, 1n288 poblacionales son fguales = Las muestras estén seleccionadas independientemente MII Anova de un factor, Como el ANOVA de un eriterio es una generabizacién de la prueba de t para dos :uestras, los supuestos para cl ANOVA de umn eriterio son: das las poblaciones k son normale a) 0-6 factor requiere del céileulo de dos estima El métovdo de ANOVA con un crite clones independientes para @ la varianza pobla comin, Estas dos estima asouerazacrioniisoes) ys?) SPs aeniuen concasuan ue aenuicaeate hnwestrasy se denomina etinaciGn de la varanea a interior dels muvestas les s tndfdeotene una disribucién muestra resutando: *~ 52° ator efico para Ja prueba Fes: 2, =1E(2=1)_, donde el mimerode grads de ibertad pars el numnerador es ei para el denominador es kvl), siendo. el nivel de significancia siendo k = niimere de muestra PROCEDIMIENTO 1. Determinarsi las mestras provienen de poblac 2. Proponer las hipstesis, 3. Encontrar las medias poblacionales y las varianzas, 4. Eneantrar la estimacién de la varianza al interior de kas muestras. y sus grados de libertad aseciados gh 5. Caleolar la gran media para la muestra de las medias muéstrales. 6, Determinar la estimacion de la varianza entre muestras_y sus grados de libertad asociaclos, 7. Hallar el valor del estadistico de la prueba B 8. Caleular el valor ertico para rasa en gib y gly 9. Decidir ise rechaza HD, Para ello se utlizan las siguientes formulas Suma de extadrados total (SST @ SCT) Sav ser= 2 Suma de cstadrados de los tratamientos o niveles (SSTr o SCL) ISCIR yr 1, (Xj - xP a PAUSE AIL) Suma dle ewadlrados del error (SSE 0 SCE) sce=> Lu, ~X;y i it ‘ambien $C Scr set Grados de libertad Gl Toules= 11 (GL rata Gil Error =n ‘Cuadraclos medios (MS © CM) rer=Scr/ GL Scr PeTr=SCTr / GL. Sct PCE = SCE / Gl. SCE Estadistico caleulade Fe Fealeulado =PCTr / PCE Regla de decisién Si Fealculado es mayor al Feritico se rechaza Ho indicando que los efectos de los diferentes niveles del factor tienen efecto significativo en la respuesta La tabla de ANOVA final queda como sigue: (Cuuadro N15: Tabla ANOVA a) sce =z Pct ‘Variacton total scr at rer Ejemplo ‘Una empresa ensambla cuadros para un solo modelo de bicieleta, La planta trabaja 5 tumos: el matutino, el vespertine y el nocturne. Los trabajadores se rotan cada no de los turnos, por lo-que, al eabo de un trimestte, todos ellos laboraron los tres tumos, El director de produccidn quisiera saber si existe diferencia entre la produccién promedio de los 3 turnos, ya que la fibrica trabsja a plena capacidad desde hace ms de un atio y no hay variaciones signifieativas en el mimero de em- pleados, en la maquinaria, ni en tos procesos prodhictivos; el director considera que con un anilisis de yarianza puede contestar esta pregunta; para ello obtiene una rmiestraaleatoria de la proddiiceidn de 6 dias de cada taro. Los datos se muestran a continuacidn: ‘TURNO 63 Moowuono TTR SION us m1 1 120 as 10 132 a5 1 ue 135 129 136 4 8 138 8) Las hipdtesis son: Ho fly = fly = fly H1:Porlomenos unade es igual las otras iy X,=137 3) = 1k 3, =127 , siendo ba media global 129+141+...4138 % fi) Se obtiene la suma de euadrados totales: las medias pablacionales de los bloques (conductores) no Eewaa = 35 SOP = (29-135? + + 044-1397 4038-13574 +148-139) 4118-139) + 4 38-139) SCT=1608 iv) Se obtiene la suma de euadrados de las vatiaciones entre los tratamientox SCTR = 6137-135)? + 6(141-135)? + 6(127-135)? = 624 ¥) Se obtiene la sums de eualrados de a variaci6n aleatoria también Hamada suma de euadrados del error, yes la vatiacién dentro del tratamiento, SCH = (129-137)? +. +44—-137) +03 140)? ++ (18-127)? +, +(138-127)? = 984 Aqui es importante resaltar el modelo en el que se basi el diseito completamente aleatorizado de un factor que se ilustra con el ejemplo, vi) Con las sumas encontradas hasta aqui se puede verificar la jgualdad: SCT = SCTR+ SCE 1608 = 6244984 vii) Se obsiene el promedio de los eusadrados entre tratamientos PCTR, pars ello se divide SCR entre los gracos de libertad dle los tratamientos gtratamientos. Este ex el primer promedio de cuadrados (varianza), porr- 24 2 12, sit) Se obtionen la media de los euadrados del ertor PCE, para ello se divide SCE entre los grados de libertad totale gtotaes. Este es el segundo promedio de cite drados, 984 PCE 6.6 B-3 i) Se obtienc el valor empirico de F,0sea el F ealeulado, que es el cociente de estos dos tillimos promedios de cuadracles. x PCTR _ 312 Gtoiete PCE 6 6 ») ElyalorF ftico se busca en la tabla conespondiente a la distribucin F, para el PAUSE AIL) nivel de significancia correspondiente 0.05 con 2 grados de libertad para el nuume- y 15 graclos de Rbertad y 15 grados de Kbertad para el denominador Feritico = 3.8 si) La regla de decisis rechaza la Ho si el Fealeulada es mayor que el Fertico Por lo tanto como 4.76 es mayor que 3.68 rechazamos Ia hipétesis mula y conclu mos que por lo menos una de las medias no es igual a his otras, Para el dircetar de pradduccién de la fibrica Ia conchisién indica que no todos los mos trabajan igual, sino que existen diferencias entre ellos, ‘La misma serie de datas trahajada en el Excel arroja lo signiente: Haciendo click en Aniliss de datos, nego en Andlisis de Varianza de un factor y scleccionand las celdas donde se encuentra la serie de datos se tiene: = moe OK Es ‘Donde encontramos e valor ealeulada y valor critico para tomar la misma decisin, Ejercicioy Se disefiaron 4 tipos diferentes de examen para evaluar el aprovechamiento en un ‘eutso de eapacitacidn y, para probar s existen diferencias significativas en el diver dle los exsimenes se cligié tin conjunto de 40 trabajacores en capacitacién y se les asigné uno de los 4 eximenes al azar, los tratamientos. Los resultados se muestran yyse incluyen los promedios de cada tratamiento: ci PUA UL ALCL EXAMENES a 7” oe n om ” 7” 0 7 7s " ” a 6 7” ro 6 a “ a Pa 9 5 ” 0 os 0 9% eo a 6 63 6 o e 0 86 6 0 na 886 a5 762. PROMEDIO Como los exdmenes se asignaron aleatoriamente a los tubajadores, se peusaria que las diferencias entre los promedios de las calificaciones en los 4 subconjuntos se dehen a diferencias entre los propios eximenes, salva diferencias aleatorias o errores normales de muestreo qule en este caso pueden deberse a diferencias per- sonales entre los examinados. Verifique Ud si hay diferencias entre las medias de los 4 eximenes. Hl ANOVA DE DOS FACTORES Cuando en un experimento, dos factores pueden influenciar las unidades experi- ‘mentales, se usa un ansilisis de varianza dle des vias denominado disenio de blogue aleatorizadlo, en el cual se comparan k tratamientos ubicados en columnas con blo- ques que se hasan en tin factor wbicada en rfilas. nado N16: ANOVA DOS FACTORES, 7] nD 1 2 3 MEDIAS (VERTICAL) MEDIA GLOMAL En este caso la desviacién enadritica tatal puede ser desdablada en tres sumandos debido a razones intergrupales (por efectos del tratamiento) simbolizada como DC en un sumanclo debido a razones intergrupales (por efectos de errores aleato- ios) DCE. yen o1rosumando debido a ravonesde blogue DCbloque. La desviackony cadritica intrabloque DCbloque es similar a la desviacidn cuadratica de los trate ientos s6lo que en vez de trabajar a nivel de los términos de una fia, se trabaja a nivel de los términos de una columna, De manera anloga, ¢1 evadrade medio Intrabloque es similar al cwadrado medio intragrapo sélo que en ver de trabajar a jel de los términos de wna fila se hace a nivel de los téruinos de una colamna. DCE re El cuadiado medio de los errores se define como: CMA Se generan entonces las siguientes razones: Pe eee ay Se Oe oy teat riteegaas nents Milo, CMerr CMerr El criterio de deciién ex si Fealculado < F, Ihipotesis uta. Frat +o rechavar la centr Ejemplo, La tabla que se presenta 4 continuaciGn corresponde a una muestra aleatoria del proceso de produccidn de una empresa metal meciiniea que registra ka produeeidn oblenida durante cinco dias consecutivos. Los bloques corresponden a los cinco dias de la semana y los tratamientos la produceién en unidades fsicas obtenidas de cada maquina, Para un nivel de significancia del 9% se requiere determina si las diferencias entre laprochtceién de las maquinas son significativas Solncidn 4) La solucidn la realizaremos integramente utilizando et Excel, para ello eo piamos la tabla dada a una hoja de Excel, vamos Datos...Anlisis de Datos. ..¥ Anilisis de Varianza de dos Factores con una sola muestra por grupo. i) ili dd: = ih) Tego: | Yoomono ENTE Dae Cac eR SS pee ee we Se observa que Fealeulades bipétesis mulay se coneluye que ka produce significativas. 2,89895 el cual es mayor que el = por lo que ve rechaza la media de ls miquinas tienen diferencias Fjervicio El Jofe de Departamento de la universidad esti desarrollande un programa de evalu cid de docentes que debe ser efectado por losalumnos. Para estos efectos se sleecion indaleatoriamente a 5 ahimnos de un saldin de clases yse picid que evalien a ss exntro profesores del ciclo que esta a punto de concluir, La calificaciGn de los docentes sobre tun escala vigesimal se presenta en el siguiente citar: ma 12 Ms tsa *s ‘6 12 we wes re rst 2 a 10s 162 ws etic un eto ANOVA e incerpree les rstados. © de sie ifcanci del 005 3] LECTURA SELECGIONADA N° 1 LAPARADOJA DEL CUMPLEASOS no dirs que es a probabidad de queen wn grapo de 29 personas dos de elas celebren su cxipleaitos el misino dia? Pues ahora caleilala, ;Coincide tu intuiciSa con lo que dicen las matemiticas? La paradoja del cumpleaios establece que si hay 23 personas reunicas hay una probabie lidad del 50,7% de que al menos dos personas de ellas cumplan auios el misino dia, Para 60 o mis personas la probabildad es mayor del 99%. Obyiamente es casi del 100% para $366 personas (Lenienda en cirenta los aitos bsiestos) En sentido estricto esto no es na paradoja ya que no es una contradiceidn légica; es tuna paradoja en el sentido que es una verdad matemtica que contradice la c sabre el tamanio minimo que deheria tener un grupo para que sea més probable que improbable que dos personas compartan el dia del cumpleafios, la mayoria de las per soiias se equivaca por completo. La respuesta intuitiva que se da a menudo es 183, es decir 365 dividido entre dos. La ceantidadl correcta no esalgo a lo que la gente pueda Hear Fielmente y,ciertamente, 1 [Por intuieidn, Fs bastante extrafio que las primeras estimaciones sean inferiares a 40, Y sin embargo la respuesta es 23 La clave para entender estas "sorprendentes” recurrencias es pensar que hay muchas pposibilidades de encontrar parejas que cumplan afios el mismo dis, Un anilisis superficial asume que 23 dias (cumpleaios de las 23 personas) es una frac- ion demasiado pequetia del posible nimero de dias distintos (365) para esperar repe- ticiones. asi seria si esperiramos la repeticién de un dia dado, Pero las repeticiones, cen el caso supnesta, peden darse entre dos dias cualesquiera, con lo que éstas prieden ccombinarse entre si de un ntimero de formas que aumenta ripidamente con el niimero de elementos.a considerar: Ask ‘+ Entre dos personas Cl y C2 s6lo eabe uuta posibilidad de repeticidn de cumpleatios: cree, © Con tres ya hay tres posbilidades ( cl=9; c2=C9) © Con cuatro ya habria sein, (459) /2=6 + Conn grupo de 10 personas, (1089) /2=45 posibilidades = Con 25 personas, hay (29422) 2 = 253 parejas distintas, cada uno de ellas es una ‘eandidata potencial para eumplir la paradoja + Yasfsucesivamente, en uno de 40, ya son 780 las parejas, y 1770 8 juntamos 60 per No hay que malinterpreiar lo que nos dice esta paradoja: Si entramos en Gién con 22 personas, la probabilidad de que cualquiera eumpla ios el mismo dia que usted, no ¢s del 50%, es mucho mas baja, sélo hay un 6% de probabilidades. Esto es de- bidoa que ahora silo hay 22 parejas posible y se necesitan mis de um 50% de probabilidades de que esto ocurra a del cumpleaiios consiste en preguntar sel cumpleaiios 8 coincide con el cumpleaios de alguna de las otras 13 personas para que hava Elproblema real de de cualquiera de las 23 perso personas, Ejemplos de coincidencins ‘+ En losjngadoros de Osasima (liga 2008 /06) hay coincidencias de cumpleaiios + De un total de silo 19 monarcas espaiioles desde los reyes Catdlicos, coinciden Carlos T con Carlos TV (11 de noviembre) y José T con Juan GatlosT (5 de enero), + De Ios 4U presidentes dee USA hasta Reagan: Polk y Harding nacieron wn 2 de 10- viembre. Puedes creer que esto puede ser casualidad o sé eres mal pensadlo que esti preparado, ‘por eso nadia mejor que hacer un estudio probabilstica riguraso de esta paradoja Estimacion de la probabilidad, Coil es la probabilidad de que en wn grupo den personas, porlo menos dos de ellas ‘oincidan en su curnpleafios desechamos les aos bisiestos los gemelos, y asuinin ‘que existen 365 cumpleatios que tienen la misma prohabilidad. Solucién Utilizando la regla de Laplace yla combinatoria: El tro es caleular primero In probabilidad de n personas tengan cumpleatios diferen- ‘Sea el sucesos A= Pal menos dos personas celebran sa cumpleasis a la ver") ys complementatio: ‘Ac= "no hay eos personas que celebren su cumpleatios ala ve2") {Caso particular El nvimero de casos posihles de celebraciin de cumpleaios, supanienclo el aio de 865 69 (Bzczaes | CO a Ue AU 3655 = 6,478 x 10 19 Fl nvimero de casos faverables : como la primera de las personas puede hal tino de los 365 dias del aft, la siguiente unos de los 364 dias restamtes y asf stcesiva- mente, restltanS65 x 984 x $88 x 352 = 96] =6,308 « 10 18 casos de que no existan dos personas que Aplicanddo la regla de Laplace (Ac) =casos favorables/ casos posible P(A) =1- ple) = 1-0973 = 0,027 Fl problema puede generalizanse para una reunion de n personas, ayan nacido el mismo aia 1203 / BATS = 097% 1a probuabilidad de que al m y— 3658364303 -(365-n+1} 365" Para n = 23, 30 y 50 la probabilidad mencionada es: 51, 0.71 y 0.97 respectivamente. Como se ve, para n = 28 existe, aproximadamente, una prababilidad a la par que por Jo menos coineidan dos eumpleatios, y cuando n= 50, tenemos easi la certeza de que ocurira la coincidencia, 108 dos de ellas cumplsn aiios el mismo dia ex a ACTIVIDAD N° Esta activiiad puede consutarls en su suka virtual a ACTIVIDAD N° 2 Esta activiiad puede consultarl en st sua victal, FE cen ssuneinsen Esta actividad puede consultarla en su aula vital ry commons DD vissocraria neta vunan ‘Triola, M.(2012). Estadistien, México: Pearson Ealueacisn Berenson, M.y Levine, D. (2010) Eadistca Basica en Adminishracion, Concepls apicaco nies, Mexico: Prentice Fall Mendenhall Sincich Probabilidad y Estadistin para Ingenieria.y Ciencias, Prentice Hal. Cue ta Falcon Diaz, A. (2013), EMadistice Aptienda a ta Adainistacion y Bemomia, Me Edin caw Hill, Primera AUTOEVALUACION DELA UNIDAD TT Jos at nos aios se han reyistrado un gran nvimero de lavadoras de ropa, tanto elec- tudnicas como mecinicas, con serias fallas en su funcionamiento, Se desea analizar y PAUSE AIL) ‘compara el costo de reparacion de cada tipo de avteficto, Para ello se ha seleecionade ‘ina muestra aleatoria de cada tipo de lavadora y se han registrado en la tabla los costos de reparacién en soles, Se sabe que el mimero de falls ene distibucién normal, Ta 7s 61 tse zoe ss 79 Ts Te tow ata 128 39150 11188 20953 ‘Aun nivel de signifieacion del 5%, dos costos de reparacion de ambos tpos de lavadoras son homogeneos? Respecto a la resolucisn del probleia marque lo incorrecto, A) Ho:f21 =e HI B21 +822 2 By A= ) Fag 0.2491 ©) FI=0.2688 D) Fe=372 §) =es7273 2 En los tiltimos atios se han registrado un gran nrimero de lavadoras de ropa, tanto electrdnicas como mecanicas, con serias fallas en su funcionamiento. Se desea aanalizar y comparar el costo de reparacién de cada tipo de artefacto, Para ello se hia seleccionado una muestra aleatoria de cada ipo de lavadara y se han registrado co Ia tabla los costas de reparacién cn soles, Se sabe que el nsimero de fallas tiene distribucion normal. 178 16L 194-204 1851791720 ABT 128 89150 191109 BS Skt or 1 costo de reparacién de las lavadoras electrénicas os signifieativamente superior al costo de reparacidn de las lavadoras mecinicas? Utiice un nivel de significacién el 5%, Respecto a la resohucidn del problema marque lo incorrecto. A) Ho <2 Hi > 7, sth awh es B) D) Teritico= 1,75205, E) Aum nivel de signifieacidn del 3%, se puede afirmar que el costo de reparaci6n de las Iavadoras clectrdnicas es significativamente miperior al costo de reparacién. de las lavadoras mecanicas 3. El ingeniero de control de calidad de la fabrica M, alirma que la ade cierto material que producen es mayor que la resistencia del misino material produ ‘ido por la Librica N. Un laboratorio particular realiza un experimento sobre estos cil UntveRsipaD CONTINENTAL CO a Ue AU iaterialexy los resltados (en ohrnins) se muestra a continuacién: FOEYIN 0.140 ose 04s 0.142 oas oar 0.57 135. 0,140, ivel de significancia del 5%, indique lo correeto. a 0.135 0140 0,136 0,142 0.138 _Asuma pobliciones norimales. Con unt a) Fealeulado = 0.9622 b) F eritico ©) tealeulado= 1.8695 98229 4) t eritico ©) Se rechaza lo que afirma el ingenieto, 4- Un fabricante de impresoras desea estimar la vida media de sus margaritas de ime presion, La estimacion ha de estar dentro de 2 horas en torno a media y tener un nivel de confianza del 90%. Si sma muestra piloto revela una desviseién tipiea do 25, hors, zcul debe ser el tamaio de la muestra? ay lot by aaa out aus ©) 02 5- En los siltimos afios se han registrado un gran niimero de lavadoras de ropa, tan to electrénicas como mecanicas, con seria fallas en sit funcionamiento, Se desea analizar y comparar el costo de reparacién de cada tipo de artefacto. Para ello se hha seleccionado tina muestra aleatoria de eacla tipo de lavadora y se han registrado, cx Is tabla los contos le reparacidn en soles, Se sabe que el aimere de fallas tiene distribucidn normal, EE EE EE GGT] 7161 toon nes 179 ars 17108 Ist es Eto tas 209 ss sto Aun nivel de signifieacian del 5%, respecto a la homogeneidad del costo de repa- rrcin de ambos tipos de lavadoras, no es correcto: a) Fexp= 0.24911 b) F eritico=0.2688 y 3.72 15.87 TRA 6) El costa de reparacién es homogéneo ©) Varian (1 ©) Varianaa (2 6- Varios accielentes de aulomonilisticos menores ocurrieron en varios eruces de alto Hiesgo en un distrito urbano a pesar de los sefalamientos de trinsito (semitoros) El departamento de trinsito afirma que na modificacidn en el tipo de semstoro redlucira los accidentes, Los integrantes de la junta municipal han acordado tun experimento que se ha propesto, Se eligieron aleatoriamente ocho ences y se ‘modificaron los semforos corresponddientes, Unlice wn nivel de signifieacién del 14% para analizar sila junta logts su objetivo, si el ntimero de accidentes de durante un periodo de seis meses antes y desputés ce las modificaciones fe: 8) B-0.005 by Tealeulado=2.8152 ©) T eritico = 2.798 PAUSE AIL) 4) Sd= 2.8277 oF =25 Relicione las columns: 4) Probabilidad de aceptar Ia hipétesis mula dado que es falsa, ( )Probabibidad de rechazar la hipétesis nula dado que es verdadera, >) Prucha de independencia ( )Emunciado acerca del parimetro de una o mis poblaciones. ©) Probabilidad del error de tipo! ( )Analiza la ssociacién entre variables, 4) Hipotesis ( )Probabibidad de error tipo TE ayedba 1b) cbda each 4) acdb @) deba S- El proyecto académico de un ingeniero es el disefio de un experimento a fin de de- terminar el rendimiento de 4 variedadles de papa sin tener en eventa la influeneia de la fertiidad de las tierras de cultiv, Las 20 parcelas de igual fertilidad que le fueron asignadas las divs en 4 yrupos de 5 parcelas cada una, A cada grupo de parvelas le asigné ima variedad distinta de papa escogida al azar, resultando un di seo completamente aleatorizado, Los rendimientos medidos en kilogeamos de las cinco variedadles por parcela se dan en ka tabla que sigue, vi ve vs. Ma 5 52 53 cy 58 5 50 6 50 a a a oo a o 5 3 4 Alnivel de significacién del 5% zse puede inferir que exisien iter ‘yas entre las producciones medias de las 4 variedades de papa? Luego settle fo incorreeto, a) 00.05 b) Ho: p= ye=45= 1 ©) SCA=426 d) scT=189) ©) Fesitico=3.16 iruna de 4 marcas de new ‘9 La empresa de transportes “DEL, VALLE” va a adqq ingticos que hay en el mercado. 1 ingeniero de pruebas de la empresa dise experimento escogiendo al azar seis neunaticos de eada marca de earacteristicas similares. En el laboratorio de prichas, con uma carga especifica simulada, observ Ih duracion de cada neumitico hasta que se deteriore, Los datos miles de kilémetros se can en la tabla siguiente, edondeados en UntveRsipaD CONTINENTAL CO a Ue AU ees NI Ng NS Nt 5 6 “6 59 1s a 00 oa 50 = 0 a oo a 30 66 is 0 a 7 65 ca 61 7" Alnivel de signifieancia del 5% zindican estos datos que las mareas de producen efectos significativos en el rendimiento® Luego marque lo incorrecto, a) Fealeulado=6.77 ) SCT=1550.90 ©) SCA781.40, 4) SCE=709.5 a0 6) Feriti 10. Una empresa de confecciones textiles realiza im estudio para determinar el mejor ‘de tres métodos de montaje de una prenda especifica. Con este fin diseaé un ex perimento para comparar los tres métodas seleccionandlo cinco operarios que supone ton de velocidad homo, sa para reducir Ia variacién debido a los oper Flos, asignanlo a cacha operatio los res métados por tiempos igtales, El numero de prendas terminadas por cada operario y con cada método en el iempo fijado se da con la tabla que sign Al nivel de significancs montaje de las prendas? 5% cexistid alguna diferencia entre los métodos de Marque lo incorrecte, a) SCA=44.8 ) SCE=16.533, 9) Scr=68.9) 4) FB=0.377 ©) FAs 714 ESTADISTICA I a UNL ud E) UNIDAD III: ESTADISTICA NO PARAMETRICAS 8 DIAGRAMA DE PRESENTACION DE LA UNIDAD III AUTOEVALUACION SEOUL | Fi oreanzacicn DE LOS APRENDIZAIES ‘Tema N° 1: Pruebas desiguos 1, pli ls pha de signo y 1 Valora relleshanente lt 1. Prcha del signe agos co signo para series portancin de las prcas no 2 Prucbs de ranges con sign dedatosdependicntese inde: parsmetrieay, de ln modem de Wilcoxon para datos apa penslicntes fe prediccdin y métodos de reas ann amos scree de cimtrolde proces esa 5, Prcba de I sua de rangos Cont ages de Wiest pars Invests independicnter fos para fata de deco- ‘Tema N° 2: Experientos mule 9. Reals is pruebas no para tinomiscs y talas de contin. metrics x series de datos de- pendienteseindependientes = T Bond de aos 4. Vala a aestoriedad de una 2 Independencay homogenci muestra aplicanda fa prueba dad Ae rach ‘Team N* 3: Prusbas no at panan rn TV Prucbade Krushal— Willis Actividad N* 2 2 Pricha de corencién de Conta! de Lectara N"2 oy $s Puch de rachas ‘Lectura seleccionada N°I alls estudiantes chica 3 ios universdades de la misma manera que el US. News and Work Report? Maio." Pigina 673 Aocvauacion de la Unidad I Moomuoso ETT Uae TEMA N° 1: PRUEBAS DE SIGNOS Como has podido observar la mayorta de las prucbas que hemos realizado se refiere al anilisis del parimetro poblacional como la media, varianza ¥ praporcién para lo cual se hicieron suptiestos sobre las poblaciones a quiienes pertenecian las muestra, dichos suputestos por ejemplo era que provenian de poblaciones con comportamiento normal Pero en la prictica no siempre las poblaciones son normales por lo que ya no podr ‘mos aplicar los métoclos anteriormente estudiados, se necesita para ello algrin métado alternative que requiers dich suposicin, Estos métodos 5 tno paramétiieas 0 sin distribueién, los cules nos permiten realizar inferenctas en sit ciones donde no comacemos el campartamiento prababilistic de la variable en anlisis. Su gran ventaja respecto a los métodos paramctricos es que utiliza céleulos que no son tan laboriosos ademsis de no tener en cuenta fa forma de la distibucion (Kunci6n de probabilidad). Hay que tener en euienta que las pruebas no paramétrieas se ven Limite as por la perdida de informaciéa al trabajar s6lo con los rangos por lo que a menudo no son tan claras o eficientes pero esto se ve recompensido por la sencillez, rapier y necesidad de utilizar poca informacién. 1 conocidos come Pruebas En realidad existe una gran cantidad de pruebas de las cuales desarrellaremos las mas conacidas ¥ uilizadas, de las cules podemos observar su eficiencia respecto a las prie- bas paramétricas Cuadro N° 16: TIPOS DE PRUEBAS PARAMETRIGAS V NO PARAMETRICAS. TE Teo PRUEBAPARANETRICA | PRUEBA NO PaRaMETRIGA | DE LA PRUEBA NO Roar POBLACION NORMAL Datos apareados dela Prucbato prueba Prueba del signo 0.03 dates muestra Prueba de rangos com 005 siguo de Wilcoxon Dosmuesiras _Pruchato prucha x Prucba de la uma de 0.98 Independientes ‘anges de Wilcoxon Vavias muestrasANOVA(prucbaF)—_Prucba de Kruskal 0.98 Independientes ‘als Corveacion Corvelactén tical Pruchadecorrelacion 0.91 de rangos ordenados ‘Acatoridad ——-Pruchano paraméiriea_—Pruchaderachas Sin bases para comparacion Para las pruchas de signosy alguna otra prucha no paramérica, al lugar que oeupa cada dato ordenado de menor a mayor se le conoce como rango, y si hay algsin empate entre Jos rangos se utiliza la media de dichos rangos en cada wo de los datos, de la siguiente forma! Serie de datos inicals 6:6 01 1;14:14 y 16 Analisis de rangos ‘Se observa que es el promedio de ‘UNIDAD 111: ESTADISTICA NO PARAMETRIC Ml PRUEBA DEL SIGNO. La pnicha no paramétrica mas sencilla es ol cantraste de signos, la que se utilien principalmente para contrastar la hipStesis sobre Ia posicién central (mediana) de tana distribucion poblacional o para analizar datos de muestras pareadas o ens. zadas de wna poblacién. Al igual quc la media, la mediana es una medida de com ‘en este caso reterida a la ubicaci6a, por ello también se le conoce a li suo como prueba de ubicacion, Por ejemplo, el Contsaste de Iipotesis Tos estuulios de mercadtos para analizar la preferencia ema de prueba de de signo se utiliza mucho © de los consumidores entre dos productos, para verificar si un revo produceién auimenta fa efieieneia de los trabajaclores, para a labilidad entre dos directivos de sina misma empresa, ete. Fl procedimiento dle la ppruicha del signo se resume en el siguiente diagrama, Por razones de simplicidad utilizaremos como estadistico de pracba (x) al mero de veces en que ocurre el signo menos frecuente. Es importante indicar que como toda prucha no paramétiiea no existe el supuesto de normalidad respectaa la pablacién, pera sirequiere que la muestra sea aleatoria ppara darle valider, Se supone que se tienen datos antes y después para una muestra yse esean compa rar estos conjuntos de datos correspondicntes. Se hace restando las abservaciones or pares, yse anota el signo algebraico resultante, No es importante la magnitud de la diferencia, sino solo i resulta un signe mis © un signo menos. DIAGRAMA N° 01: PRUEBA DEL SIGNO ae a aaaee Oe ee al La hipstesis nua establece que no existe diferencia en los conjuuntos de datos, Si esto es cierto, entonces un signo mis y un siguo menos son igualmente probables. La probabilidad (7) de que ocurra cualquiera es de 0.50. Una prucha de dos ex Bi wii i] Moomuoso ETT Uae Ho; m = po MedI-Med2 Hem 2 po MedleMed2 Donde m yp son los niimeros de signos menos y de signos mis, respectivamente, Del misino modo utilizando la probabilidad Ho: n= 035 Him s05. Una pricha de un solo extreme es Ho:m=p HL mop Hom =p Himep. Lo que quicre decir que si dos conjuntos de datos tienen medians iguales, enton- ces el nvimero ie sighos positivos debe ser aproximadamente igual al niimero de signos negative. Ejemplo Sele pidid a un grupo de 20 aumnos que calificaran el desempeno de 2 protesores, de acuerdo con varios eriterios yen una escala de 1 10, Se abiuvieron los result dos quie se mucstran a continiacidn (CALIFICACION 8 s 10 5 4 7 10 12 ° ‘ 1s 5 3 “ 4 4 15 ie ° ” 10 ° 16 z 20 ‘ Probar a un nivel de significancia de 0.05 la hipstesis de que no existe diferencia ‘entre las calificaciones asignadas por 1os alumuios los dos profesores Solucisin [roc Eee 1 i) Planteames kas hipstesis HO; Medi = Med HI: Med + Med2 ‘ode manera equivalent HO: «1 =0.5 Hi: xl 205 ii) Hatlamos los signos de fas diferencias restando X1-X2: ; ; s : ; iii) Alencontzar las diferencias igual a cero, eliminamos us respectivos pares por lo que el nuevo tama de muestra es n=16, Importante recordar que el cero signo, parlo que na se le pitede asignar el signa positive, |) Hl estadistico de prueba x es el Irecuente, por lo que x=8, mero de veces que se repite el signo menos ¥) Contrastando com la tabla de valores eriticos para Ia prucha del signo de Mario ‘Triola el valor ertico con wn nivel de significancia de 0.05 y n=16, es: 3. La tabla de valores eriticos se presenta a eontinuiacin, vi) Se rechaza la hipstesis nula si el estadistico de prucha es menor 0 igual que valor eritco, Por lo tanto, al ser el estadistico de prueba mayor que el valor eritico, se acepta ka hipdtesis nula, por lo que existe evidencia estadistica para aseverar que no hay diferencia en la opinin de Tos almnos respecte a las ealifcaciones de los dos profesores. Esimportante notar que li tabla de valores crticos para la prucha del signo evita que usemos un aniliss adicional utilizando la distribucion de probabilidad bine: rial con P=0.5 y n=16y comparar la probabilidad acumulada generada por lames: way el nivel de significancia. = PaO any GUADRO N° 17: VALORES CRITICOS PARA LA PRUEBA DEL SIGNO, INACOLA) co z a = = . Z 5 = 7 a F 5 = z a 7 Ei o o ° 8 ° o ° 1 ° ° ° 1 1 a ° 1 1 2 2 1 1 2 2 13 1 1 2 3 “4 1 2 2 3 15 2 2 3 3 16 2 2 3 4 ra 2 3 4 4 1» 5 4 4 5 20 3 4 5 5 a 4 4 5 6 2 4 5 5 6 2 4 5 6 7 Pa 5 5 6 zi s 5 ‘ 7 7 Notas 1. * Indica que no es posible obtener un valor en regién critica 2, Rechace la hipétesis nua si el niimero del signo menos frecttente (x) es mejor que o igual al valor en la tabla 3, Para valoresdle n mayores que 29, se utiliza una aprox, normal con (FAUTA HACER FORMULA) emple Un analista de mercado desea medir la efectividad de una campaita promocional del producto de sut empresa. Antes de la campana, selecciona 12 tiendas minoristas _yrogistra las ventas del mes. Durante el segundo mes setertnina la campatia promo ‘UNIDAD 111: ESTADISTICA NO PARAMETRIC ional y se registran de muevo las ventas, Fl enadro siguiente muestra los niveles de ‘ventas, del primer y segundo mes. Se clesea probar con un nivel de significancta de 0.05 que la eampaiia promocional incrementé las ventas. a a 1 ‘4000 ‘000 800 1700 6500 $3900 4900 $5000 T 1700 $5100 5200 7200 $3300 PLlGdie g 3 it 2 Sohicisn 4) Planteamos las hipstesi: Horm=p. Hi:m>p ‘Se entiende que para que Ia promocisn sea exitosa se requiere que el niimero de dite rrencias negativas sea pertinentemente grande, o sea interesa que el mimero de signos ‘menos sea mayor que el ntimero de signos positives. Planteando de otra manera utile zzanco ka probabilidad: O:x1 = 0.8 Mizal> 05 i itt gpd ie PTs Ts SENT | : a — : $5700 EEGi? 10 $5100 ‘6000 3800 1700 36500 3900 1900 ‘5000 sa700 $5200 " $8300 7200 $2700 sssa00 ii) Eliminandlo los coras, e valor de n=10, El estadistico de pracha es x=3 {) Utiizando la tabla de valores eritieos para ka prteba del signo al 0,05 en una cok elvalor eritica es ¥) Como el estadistico de prueba es yyor que el valor erilico no se rechaza ka hi

También podría gustarte