0% encontró este documento útil (0 votos)
156 vistas9 páginas

Pruebas de Hipótesis en Estadística

El documento presenta los conceptos básicos de las pruebas de hipótesis, incluyendo la hipótesis nula y alternativa, los tipos de errores y decisiones correctas, y los diferentes tipos de pruebas estadísticas. Explica cómo se formula un modelo estadístico para una pregunta de investigación en términos de hipótesis y analiza los factores a considerar al seleccionar el nivel de significancia, como el riesgo de cometer errores tipo I o II. Finalmente, ilustra estos conceptos con un ejemplo sobre
Derechos de autor
© Attribution Non-Commercial (BY-NC)
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
156 vistas9 páginas

Pruebas de Hipótesis en Estadística

El documento presenta los conceptos básicos de las pruebas de hipótesis, incluyendo la hipótesis nula y alternativa, los tipos de errores y decisiones correctas, y los diferentes tipos de pruebas estadísticas. Explica cómo se formula un modelo estadístico para una pregunta de investigación en términos de hipótesis y analiza los factores a considerar al seleccionar el nivel de significancia, como el riesgo de cometer errores tipo I o II. Finalmente, ilustra estos conceptos con un ejemplo sobre
Derechos de autor
© Attribution Non-Commercial (BY-NC)
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

12.

1 PRUEBAS DE HIPOTESIS

Se inicia con una situacin en la cual se plantea una pregunta que permite introducir las ideas bsicas del anlisis inferencial mediante pruebas de hiptesis. Modelo estadstico El modelo estadstico se basa en un mtodo de demostracin comnmente empleado en matemticas, en el que se asume una hiptesis y se obtiene un resultado absurdo, concluyndose que la hiptesis de partida es falsa. Se le conoce como mtodo por contradiccin o reduccin al absurdo. La adaptacin de este mtodo en estadstica parte de dos hiptesis lgicas-, la hiptesis nula y la hiptesis alterna, representadas como H0 y H1, respectivamente. A continuacin se ver cmo quedara formulado el modelo en este caso. Modelo estadstico para la pregunta de investigacin H0: El nuevo medicamento tiene el mismo efecto que el medicamento en uso. H1: El nuevo medicamento reduce ms el colesterol que el medicamento en uso. La pregunta de investigacin se ha transformado en una hiptesis (hiptesis de investigacin) H1 adems, encabeza el modelo una hiptesis H0 un resultado posible de la prueba, aunque lgicamente opuesto a lo que los qumicos planearon; esto es, opuesto al objetivo de la investigacin. La idea de esta estrategia es que al final del proceso de prueba se llegue a la decisin de rechazar H0, apoyando con ello H1: la corroboracin de que se cumpli el objetivo de investigacin. La estructura y la mecnica del modelo tienen la hiptesis nula H0 como el referente alrededor del cual se desarrollan el anlisis estadstico y se toma la decisin final; esto da lugar a slo dos decisiones: aceptar H0 o rechazar H0. Errores y aciertos en la toma de decisiones Como la prueba de las hiptesis se sustenta en una muestra aleatoria, el modelo puede llevar a decisiones correctas e incorrectas. Por ejemplo, si se rechaza la hiptesis nula siendo verdadera, se dice que se comete un error tipo I; si se acepta la hiptesis nula siendo en realidad falsa, se comete un error tipo II. Los otros dos casos posibles corresponderan a decisiones correctas, ver tabla 12.1. Tabla 12.1 Decisiones posibles en las pruebas de Hiptesis H0 es Verdadera Rechazar H0 Aceptar H0 Error Tipo I No hay Error (Decisin Correcta ) H0 es Falsa No hay Error (Decisin Correcta ) Error Tipo II

Anlisis de los errores y aciertos en las pruebas de hiptesis La probabilidad condicional, y ms tarde el teorema del lmite central, permitir analizar estadsticamente los errores tipo I y tipo II, y las decisiones correctas. Se empezar expresando los diferentes resultados de la tabla 12.1 en trminos de probabilidad condicional. P(rechazar H0|H0 es verdadera) = P(error tipo I) P(aceptar H0|H0 es verdadera) = 1 P(aceptar H0|H0 es falsa) = P(error tipo II) - P (rechazar H0|H0 es falsa) = Potencia = 1- A continuacin se analizarn cada una de las cuatro decisiones posibles usando como referente el caso del medicamento para reducir el colesterol. 1. Error tipo I: Rechazar Ho, cuando es verdadera. En el caso del medicamento, significara que la prueba de hiptesis lleva a los experimentadores a rechazar que el medicamento desarrollado tiene el mismo efecto que el medicamento en uso (favoreciendo con ello H1), cuando en realidad ambos tienen el mismo efecto. Este tipo de error sera muy costoso tanto para la sociedad como para el laboratorio farmacutico. El experimentador puede tomar directamente el control de la probabilidad de este error fijndola. Se representa como , y se le conoce como nivel de significancia. Los valores comunes que se asignan a son 0.1, 0.05 y 0.01, lo cual significara, en el segundo caso, que de cada 100 muestras aleatorias, alrededor de 5 conduciran a este error. Debido a la situacin de riesgo en este ejemplo, los qumicos podran decidir bajar el nivel de , por ejemplo a 0.0001, lo que significara que de cada 10 000 muestras posibles, una de ellas los conducira a cometer el error tipo I. Esto les dara ms confianza; hay que ver, sin embargo, a cambio de qu se obtiene esta confianza y, en todo caso, si conviene. 2. Decisin correcta: Aceptar H0 cuando es verdadera. En este caso, en realidad el nuevo medicamento no reduce ms el colesterol que el medicamento en uso y la prueba de hiptesis lleva a los qumicos a esto, correctamente. Si bien es un revs para la investigacin realizada y para la inversin econmica, no habra, sin embargo, consecuencias externas. La probabilidad de la decisin es 1 , y si se ha establecido muy baja, por ejemplo 0.0001, la probabilidad es entonces muy alta: 0.9999 (prcticamente el evento seguro). Hasta aqu la seleccin pequesima de parece correcta. Obsrvese que, al fijar , se fija automticamente 1 - . 3. Error tipo II: Aceptar H0 cuando es falsa. En el ejemplo que se est usando, significara que la prueba lleva a los experimentadores a aceptar que el nuevo medicamento tiene el mismo efecto que el medicamento en uso (aceptar H1, cuando en realidad el nuevo medicamento reduce ms el colesterol (Ho es falsa). Este tipo de error es muy costoso en cuanto a la prdida de un mejor medicamento para la sociedad y el trabajo de investigacin realizado. La probabilidad de cometer este tipo de error es . El valor de , sin embargo, no lo fija directamente el experimentador, sino que es una funcin de varios factores; entre otros la magnitud de , el tamao de la muestra y la varianza de la distribucin de muestras (desconocida en general). No obstante, simplificando dicha funcionalidad con el fin de

continuar el anlisis, puede decirse que es inversamente proporcional respecto a , entre ms pequeo es el valor de , mayor es el valor de . Por lo tanto, si se fija un valor de muy pequeo, se incrementa considerablemente la probabilidad de cometer el error tipo II. 4. Decisin correcta: Rechazar H0 cuando es falsa. En relacin con el ejemplo que se est empleando, esto significara que la prueba lleva a los experimentadores a rechazar que el nuevo medicamento tiene el mismo efecto que el medicamento en uso (rechazar H0), siendo esto efectivamente as (H0 es falsa). Esta es la situacin ideal, en la que el investigador quisiera estar siempre. La probabilidad de tomar esta decisin correctamente es 1 - , y se le conoce como la potencia de la prueba. Si se tom muy baja, resultara alta, y, consecuentemente, la probabilidad de tomar esta decisin correctamente sera muy baja. Resumen Despus de haber analizado los errores y las decisiones correctas involucradas en las pruebas de hiptesis, se tiene que el investigador debe tomar una decisin respecto al valor del nivel de significancia . Debe seleccionar un valor de que le d suficiente confianza, pero no tan pequeo que lo ponga en un alto riesgo de cometer el error tipo II y de tener una potencia de la prueba baja. A fin de continuar la formalizacin del modelo y el anlisis se pasar a ver las diversas formas de plantear las hiptesis de una prueba. Tipos de pruebas estadsticas La hiptesis nula H0 siempre establece que el parmetro (desconocido) de inters, por ejemplo la media poblacional u, es igual a un valor especificado (conocido) u0:H0:u = u0. La hiptesis alterna H establece que el parmetro es menor que (<), mayor que (>), o simplemente no igual a ( ) al valor especificado u0. Verbalizando: La hiptesis nula expresa que se mantiene el statu quo, es decir, que la situacin no ha cambiado, mientras que la hiptesis alterna establece que la situacin se ha modificado en alguna direccin especfica o, simplemente, que ha cambiado. Se clasifica una prueba estadstica como de cola izquierda, de cola derecha o de dos colas, de acuerdo con la hiptesis alterna seleccionada. Tabla 12.2 Formalizacin y clasificacin de las pruebas estadsticas (Parmetros u) Cola Izquierda Cola Derecha Dos Colas H0 : u = u0 H0 : u = u0 H0 : u = u0 H1: u < u0 H1: u > u0 H1: u u0

La construccin matemtica de una prueba estadstica usa la hiptesis nula para asignar un nmero especfico u0 al parmetro u, no un rango de nmeros; por lo tanto, estrictamente hablando, la hiptesis nula H0 debera contener solamente el smbolo igual. Sin embargo, tradicionalmente en los textos, y hoy en da en los programas de cmputo, se usa el smbolo de desigualdad en la hiptesis nula opuesto al que se mostr en la hiptesis alterna.

Por lo tanto, si la hiptesis alterna es H1: u < u0, la correspondiente hiptesis nula aparece como H0: u u0; si la hiptesis alterna es H1: u > u0, se tiene que H0: u u0 y, finalmente, si H1: u u0, entonces H0: u = u0. Hecha esta aclaracin, y con el fin de no crear confusin con la bibliografa recomendada, en el texto y en el programa 12.1 se usar la notacin tradicional, quedando los 3 modelos posibles, como se ve en la tabla 12.3. Tabla 12.3 Pruebas estadsticas en notacin tradicional (Parmetros u) Cola Izquierda Cola Derecha Dos Colas H0: u u0 H0: u u0 H0: u = u0 H1: u < u0 H1: u > u0 H1: u u0 En el caso del nuevo medicamento, el valor especificado u0 correspondera a la media del medicamento en uso. El modelo estadstico formal en la notacin tradicional sera de cola izquierda, y quedara finalmente as: Modelo estadstico final para el caso del nuevo medicamento H0: u u0 (El nuevo medicamento tiene el mismo efecto que el medicamento en uso) H1: u < u0 (El nuevo medicamento reduce ms el colesterol que el medicamento en uso) Con el fin de aplicar los avances y de cubrir aspectos pendientes, se plantea una nueva situacin. Situacin: Temperatura normal del cuerpo Podra decirse que la temperatura normal media del cuerpo es 98.6(37C). No obstante, investigaciones mdicas recientes dan pie a postular que la temperatura normal media es menor que 98.6F. La pregunta de investigacin puede entonces plantearse as: Pregunta de investigacin: Es la temperatura normal media del cuerpo menor que 98.6F? Modelo estadstico: escribiendo la pregunta en trminos de hiptesis: Ho: la temperatura normal media del cuerpo es 98.6F (la situacin no ha cambiado). H1: la temperatura normal media del cuerpo es menor que 98.6F (la realidad es otra). Para avanzar en el planteamiento del modelo se considera temperatura normal media del cuerpo como el parmetro desconocido u, y a 98.6F como el valor especificado u0. Con esto, y tomando en cuenta H1, se tiene una prueba de cola izquierda, y el modelo estadstico en la notacin tradicional queda: H0: u 98.6F H1: u < 98.6F Nivel de significancia. El siguiente paso es seleccionar un valor de a conveniente. Suele recurrirse a los valores recomendados 0.1, 0.05 y 0.01, dependiendo de la situacin particular. Dado que la nueva situacin no es tan delicada como la del nuevo medicamento, se puede tomar = 0.1 o = 0.05. Se tomar el segundo valor. Nivel de significancia: = 0.05

Estadstico de prueba El hecho de que la temperatura de la muestra sea menor que 98.6F no es, sin embargo, suficiente para decidir que la temperatura normal del cuerpo es menor que 98.6F, ya que, debido a la variabilidad de las medias de las muestras, cualquiera puede quedar arriba o debajo de 98.6F. La pregunta es si la diferencia es significativa estadsticamente hablando; esto es, si se encuentra suficientemente debajo de 98.6F para considerar que su ubicacin no es debida al azar sino al hecho de que la temperatura normal es en realidad menor que 98.6F. Se requiere entonces, en este caso, un valor abajo del cual pueda rechazarse la hiptesis nula pero arriba del cual se acepte la hiptesis nula; esto es, de un valor lmite o crtico, como se muestra en la figura 12.1.

Para establecer numricamente el valor crtico es necesario hacer dos consideraciones: 1. El tamao de muestra es grande (130), y, por lo tanto, el teorema del lmite central permite considerar que la distribucin de muestras x es normal.

2. Partiendo del hecho de que H0 es verdadera, la media de la distribucin de las muestras es igual a 98.6F y su varianza (x) es igual a / n . De acuerdo con estas consideraciones, las regiones de rechazo y aceptacin de la figura 12.1, pueden expresarse en trminos de la distribucin normal, como se ve en la figura 12.2. La consideracin 2 permite, adems, establecer el valor crtico como z(0.05); esto es, como el punto a la izquierda del cual se encuentra 5% de las muestras con los valores ms bajos (vea figura 12.3a). En general el valor crtico se denota como z ( ) . Si se estandariza la distribucin normal de muestras, se tiene la figura 12.3b). Al consultar las tablas de distribucin normal estandarizada se tiene que z ( 0.05) = -1.645.

Ahora toca pasar el valor medio de la muestra 98.25 a su equivalente en la distribucin normal estandarizada empleando para ello la expresin z

. En sta, sin

embargo, no se conoce , pero como la muestra es grande, la desviacin estndar de la muestra puede emplearse como un estimador, quedando:

z0 Az

X s X n

98.25 98.6 0.7332 130

=-5.44

Se le llama estadstico de prueba por la funcin que desempea el valor

numrico que se obtiene de l z(0) . A dicho valor se le denomina valor observado. Conclusin: Para tomar la decisin final, simplemente se sita el valor observado -5.44 en el eje horizontal de la figura 12.3b. Como queda en la regin de rechazo, la decisin final es rechazar la hiptesis nula, favorecindose con ello la hiptesis alterna. Cabe recordar que, debido a que la decisin se toma con base en una muestra, los resultados no son categricos y que, por tanto, no es posible tener conclusiones del tipo: se rechaza la hiptesis nula y, por tanto, la temperatura normal del cuerpo humano es menor que 98.6F, sino que ms bien se expresa teniendo presente la probabilidad del error tipo I:

Con un nivel de significancia a de 0.05, se rechaza que la temperatura normal media del cuerpo humano sea de 98.6F, favorecindose el planteamiento de que la temperatura es menor. El desarrollo mostrado correspondera a una prueba de hiptesis de la media poblacional (muestra grande); no obstante, pueden distinguirse en ste los aspectos bsicos de una prueba para cualquier otro parmetro. Sin embargo, antes de abordar en detalle distintos parmetros, se presentan algunos aspectos complementarios.

Pruebas de cola derecha y dos colas Si en una prueba de hiptesis de la media la formulacin de las hiptesis (modelo estadstico) lleva a una prueba de cola derecha, el valor crtico z ( ) quedar a la derecha de u = 0 en la distribucin normal estandarizada (vea figura 12.4a), sealando la regin donde se encuentran los valores mustrales ms altos, que conduciran a cometer el error tipo I.

En el caso de una prueba de hiptesis de la media, donde la formulacin de las hiptesis lleva a una prueba de dos colas, los valores crticos z ( / 2) quedarn a derecha e izquierda de u = 0 en la distribucin normal estandarizada (vea figura 12.46), sealando las regiones donde se encuentran los valores mustrales ms pequeos (a la izquierda de -z ( 12) ) y ms grandes (a la derecha de z ( 12) ), que conduciran a un error tipo I. Finalmente, los pasos restantes para llegar a una conclusin son similares a los que se dieron en el ejemplo de la temperatura.

Anlisis de y Se est ahora en condiciones de analizar la relacin de las probabilidades de cometer el error tipo I y el error tipo II en la situacin de la temperatura normal del cuerpo que se discuti anteriormente.

Si H0 es verdadera, la distribucin normal de las medias puede representarse por la curva normal (en negro) de la figura 12.5. La probabilidad a de cometer el error tipo I es igual al rea bajo la curva normal (en gris) a la izquierda de z ( ) . Si, por otro lado, H0 es falsa y el valor verdadero de la poblacin es menor que 98.6F, por ejemplo u(a), entonces la probabilidad de cometer el error tipo II es equivalente al rea bajo la curva normal (en gris) a la derecha de z ( ) . Al reducir a se desplaza z ( ) a la izquierda, aumentando (la probabilidad de cometer el error tipo II). Si, por el contrario, se aumenta , z ( ) se desplaza a la derecha reducindose . Ejemplo 12.1 a) Las regiones de rechazo y aceptacin de H0 para a = 0.1, 0.01 en la situacin de la temperatura normal del cuerpo humano. b) Qu hubiera pasado si la media de la muestra x hubiera sido mayor o igual que 98.6F?

Solucin a) Si a = 0.1, z ( ) se recorre a la derecha de -1.645: z (0.1) = -1.285. La regin de riesgo de cometer el error tipo I se ampla. Por otro lado, si ( ) =0.01, z ( ) se recorre a la izquierda de -1.645: z (0.01) = -2.325. La regin de riesgo de cometer el error tipo I se reduce. b) Como se vio anteriormente, el hecho de que la media muestral quede debajo de 98.6F no es suficiente para rechazar H0, sino que ms bien da pie a continuar el proceso, ya que, por el contrario, si la media de la muestra hubiera resultado mayor o igual a 98.6F (x 98.6F), el valor observado z (0) resultara positivo, y, de acuerdo con la figura 12.3b, quedara en la regin de aceptacin de H0, dejando irrelevantes el resto de los clculos.

También podría gustarte