0% encontró este documento útil (0 votos)
33 vistas16 páginas

Taller de Bioestadística: Contraste de Hipótesis

Este documento presenta los pasos para realizar un contraste de hipótesis para probar parámetros de una población o comparar dos poblaciones. Describe los pasos como definir las hipótesis nula y alternativa, elegir la prueba estadística, establecer el nivel de significancia, calcular el estadístico, tomar una decisión y llegar a una conclusión.

Cargado por

Rocio Taborda
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
33 vistas16 páginas

Taller de Bioestadística: Contraste de Hipótesis

Este documento presenta los pasos para realizar un contraste de hipótesis para probar parámetros de una población o comparar dos poblaciones. Describe los pasos como definir las hipótesis nula y alternativa, elegir la prueba estadística, establecer el nivel de significancia, calcular el estadístico, tomar una decisión y llegar a una conclusión.

Cargado por

Rocio Taborda
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Bioestadística y diseño experimental. (Taller 2019). Lic.

en Genética (Plan 2017)


Facultad de Ciencias Exactas, Químicas y Naturales. UNaM

TALLER DE BIÓSTADÍSTICA
Y DISEÑO EXPERIMENTAL
CARRERA: Lic. en Genética

MATERIAL TEÓRICO Y TRABAJOS

CONTRASTE DE HIPÓTESIS

UNIDAD III : 2°PARTE- ESTADÍSTICA INFERENCIAL

1) Introducción y conceptos claves ---------------------------------------------------------------- pag 2

2) Contraste para una población: -----------------------------------------------------------------------pag 3

a) Parámetros : Media, Varianza y Proporción


b) Bondad de ajuste (Normalidad (Ajuste a la distribución Teórica)

3) Contrastes para comparar dos poblaciones -------------------------------------- pag.. 6

a) Diferencia de medias
b) Diferencia de varianzas
c) Diferencia de proporciones

Autor: Esp. Rolón Esteban Eduardo , marzo 2019 . Página 1


Bioestadística y diseño experimental. (Taller 2019). Lic. en Genética (Plan 2017)
Facultad de Ciencias Exactas, Químicas y Naturales. UNaM

TEMA 1.2 : CONTRASTE DE HIPÓTESIS


1) INTRODUCCIÓN Y CONCEPTOS CLAVES

En el capítulo anterior definimos conceptos claves tales como nivel de significancia, p-valor,
hipótesis nula y alternativa, es importante que los tengas a mano, los vas a necesitar.

En esta segunda parte nos avocaremos al “Contraste de Hipótesis”, también llamada “Prueba de
Hipótesis o Test de Hipótesis” para una y dos poblaciones.

La importancia de este procedimiento estadístico radica en que los resultados servirán de


evidencia estadística mente significativa para la toma de decisión tanto de un médico, ingeniero,
genetista, entre otros profesionales que requieran de rigurosos modelos matemáticos y que
necesiten cuantificar su riesgo en la toma de decisión. Si bien los autores lo dividen entre 4 y 9
pasos aquí se presentarán en 7 pasos:

PASOS DE UN CONTRASTE Este protocolo debe ser cuidadosamente


realizado para disminuir los sesgo debidos a
1°) DATOS Y SUPUESTOS los instrumentos de medición, observadores,
procedimientos o de impugnación por no
2°) PLANTEO DE HIPOTESIS
cumplir con los pasos previamente definidos
3°) ELECCIÓN ESTADÍSTICO DE PRUEBA

4°) NIVEL DE SIGNIFICANCIA Y LÍMITES

5°) CÁLCULO DEL ESTADÍSTICO

6°) DECISIÓN

7°) CONCLUSIÓN

Cuando realizamos un contraste se pueden dar 4 resultados finales, ya que existen dos hipótesis
contrarias y dos situaciones que una de ellas sea Falsa y lo otra verdadera.

1°) Siendo verdadera la hipótesis nula, sea rechazada (Error tipo I)

2°) Siendo verdadera la hipótesis nula , no sea rechazada

3°) Siendo falsa la hipótesis nula, sea rechazada

4°) Siendo falsa la H0 , no sea rechazada ( Error tipo II)

El error tipo 1 se lo puede se lo puede definir con anterioridad por el investigador y equivale al
nivel de significancia “α” , ( 1 – α) se denomina confianza del test . Luego de realizar la prueba
podemos determinar el p-valor que sería el riesgo estadístico de obtener ese valor o más alejado
que el parámetro a pesar de ser verdadera la hipótesis nula.

Autor: Esp. Rolón Esteban Eduardo , marzo 2019 . Página 2


Bioestadística y diseño experimental. (Taller 2019). Lic. en Genética (Plan 2017)
Facultad de Ciencias Exactas, Químicas y Naturales. UNaM

1) CONTSTE PARA PARÁMETROS DE UNA SOLO POBLACIÓN

1.1) Probar hipótesis vinculadas a los parámetros poblacionales

PROTOCOLO O MEDIA PROPORCIÓN VARIANZA


N° PASOS DE UN µ P
CONTRASTE

Datos, Identificar el tipo de variable, tipo de muestreo, observar si se cuenta con


1 suposiciones y
algún parámetro y en lo posible probar con algunos supuestos tales como
la normalidad (bondad de ajuste : Shapiro-Wilks, Kolmogorov, Ji
objetivo del cuadrado, etc…) de la población respecto a la variable.
contraste
Finalmente se retoma el objetivo o la pregunta y se establece una
hipótesis de investigación, generalmente es la contraria a la nula.

Hipótesis nula : H0
Aquí se plantea lo Bilateral P= Bilateral
2 contrario a lo que se
µ= P≤ =
busca aceptar, y se la
toma como verdadera Unilateral P≥ Unilateral
para que se cumplan las µ≤ ≤ o ≥
leyes de distribución de o Ej. Ho : =
probabilidad de los µ≥ Ej. Ho: p= 0,40 H1 : =
estadísticos en el H1: p≠0,40
muestreo .
Luego se presenta H1
contradiciendo la H0

̂ Estadístico : Ji-cuadrado
3
Estadístico de √ √
prueba ( fórmula y z Sigue una distribución llamada Ji-
distribución ) cuadrada (tabla F, Daniel) con v=
Si n < 30 y n-1 grados de libertad
desconozco σ ̂
z


t z
gl=n-1

Cuando es bilateral hay que


Nivel de buscar ambos límites utilizando la Supongamos n= 15, cuando es
significancia y campana normal y los valores de bilateral buscamos dos límites
4 Regla de decisión z para α/2 y 1-α/2 de lo de para α/2 y 1-α/2 para
contrario un solo límite. Por gl =14 por tabla. Por ejemplo si
ejemplo si me piden un 90% de me piden un 95% de confianza
confianza tengo un 0,10/2=0,05 tengo un 0,05/2=0,025
buscando en tabla z 0,05 = -1,64 buscando en tabla x2 0,025= 5,63
y z 0,95 =1,64 y x2 0,975 =26,12 gl=14 ( tabla F)

Autor: Esp. Rolón Esteban Eduardo , marzo 2019 . Página 3


Bioestadística y diseño experimental. (Taller 2019). Lic. en Genética (Plan 2017)
Facultad de Ciencias Exactas, Químicas y Naturales. UNaM

Se reemplaza el estadístico, el parámetro hipotético y las demás


Calculo del variables de cálculo.
estadístico
Supongamos los dos ejemplos del paso uno con sus
correspondientes límites anteriormente planteados :

5 Si a) Ho: p = 0,40 se obtuvo ̂ = 0,36, con n=32

Zc= = -1,73( cae en zona de rechazo , con α= 0,10)


Y por otra lado se quiere probar que b) la varianza no es igual a 144


, entonces :
cae en zona de rechazo con α= 0,0,5)

Hay evidencia se para rechazar


Se rechaza H0 y se acepta H1 Ho
6 Decisión

Se concluye que la proporción


es menor a 0,40 con un p- Hay evidencia estadísticamente
valor= 2x0,04 =0,08( tabla significativa para decir que la
7 Conclusión para z=-1,73). varianza es diferente a 144
Es decir se rechaza con un riesgo El riesgo p-valor es menor a
de equivocarme inferior a mi nivel 0,05
de significancia que era igual
0,10.
Modelo de los siete pasos para un contraste de hipótesis

1)Datos y suposiciones 2)Unilateral 3) Como n < 30 y


Se sabe que la muestra se desconocemos σ
extrajo de n= 25, de población usaremos
con distribución normal .
H0 : µ ≥ gr
Media muetral = 2,4 gr y
Desv. Muestral=0,8 . H1 : µ <
Se cree que la media de la

t gl=n-1
población de semillas es menor
a 2,5 gr . ( Ver tabla o aplicación)
4)Regla : Tomaré 95% de confianza es decir 5%=0,05 en la tabla de T-Student par gl=v=
25-1 = 24 con ( 1- α) = 0,95 buscando en tabla tLim(24; 0,95 ) = -1,74 o aplicación. : Se rechaza
Ho tc es menor a – 1,71

5) Calculo de estadístico 4) Decisión : 5) Conclusión : No hay


No se rechaza H0 ya tc evidencia suficiente
mayor a t=-1,71 . Por otra para suponer que las
( ) parte el p-valor es 0,26 mayor semillas tienen una
√ al nivel de significancia del a, media inferior a 2,5 gr
0,05 ya establecido.

Autor: Esp. Rolón Esteban Eduardo , marzo 2019 . Página 4


Bioestadística y diseño experimental. (Taller 2019). Lic. en Genética (Plan 2017)
Facultad de Ciencias Exactas, Químicas y Naturales. UNaM

1.2) Pruebas de bondad de ajuste para la normalidad de la variable

Prueba de Shapiro – Wilks ( mejorada)

Prueba de Kolmogorov

También la encontrarás en el menú de cualquier programa estadístico, en este caso te


mostraremos un ejemplo del InfoStat en el cual se pone a prueba la hipótesis nula que:
“ La muestra de ajusta al modelo normal “ o dicho de otra manera que “ la muestra proviene de
una población con distribución normal “ . Un de las ventajas de esta última es que se puede
ajustar a cualquier distribución, La desventaja es que hay que estar atento de colocar que se
quiere ajustar a una normal y contar con la media y desvío estándar poblacional

Autor: Esp. Rolón Esteban Eduardo , marzo 2019 . Página 5


Bioestadística y diseño experimental. (Taller 2019). Lic. en Genética (Plan 2017)
Facultad de Ciencias Exactas, Químicas y Naturales. UNaM

3) CONTRASTE DE HIPÓTESIS PARA COMPARAR DOS POBLACIONES

3.1) Retomando lo del tema anterior uno de los propósitos de la estadística inferencial es extraer
conclusiones acerca de la naturaleza de una población, ahora bien en ocasiones se quiere
comparar dos poblaciones, para ello se utilizará como parámetros : la
diferencia de medias △μ = ( μ2- μ1) y las proporciones muestrales △p=( p2- p1).

En este sentido utilizaremos los correspondientes estimadores : △̂ ̅ ̅ y las


proporciones muestrales △ ̂ ̂ ̂

El muestreo en ambas poblaciones debe ser probabilístico, el más utilizado es el muestreo


aleatorio simple, en el que todos los elementos de la población tienen la misma probabilidad de
ser extraídos e incluidos en la muestra.

Existen otros tipos de muestreo como el muestreo por conglomerados, sistemático y estratificado
que también son válidos ya que son probabilísticos.

De la misma manera que en estadística 1 y el tema anterior cuando contamos con dos
poblaciones, debemos estudiar a sus estimadores en cuanto a su distribución, valor más esperado
E(x) y desvío estándar (error estándar) , por lo cual la aplicación de los principios de la
estadística inferencial deben hacerse en tres partes:

I. Las distribuciones muestrales


II. La estimación
III. El contraste de hipótesis.

Este apunte está organizado de manera que nos centraremos por razones de tiempo en los
contrastes de hipótesis , asumiendo que en todos estos casos las poblaciones son normales o en
el caso que no lo sean las muestras son de tamaños mayores de treinta para asegurar la
normalidad del estimador , en este caso los estimadores son :

1) Diferencia de medias para muestras independientes: ⃐ ̅̅̅̅


a) Varianzas Iguales ( Homocedáticas)
b) Varianzas distintas ( No Homocedáticas)
2) Diferencia de medias para muestras apareadas: ̅ , donde di= xi-yi
3) Diferencia de proporciones: ⃐ ̅̅̅̅̅

Los tres estimadores cumplen que si ambos poblaciones son normales, o en el caso que no lo
sean, las muestras son grandes se distribuyen normalmente.

Y en el caso de muestras chicos lo hacen conforme a una distribución T de Student con n-1
grados de libertad siempre y cuando las poblaciones tengan distribuciones normales

En este sentido será clave que se hagan las pruebas de normalidad y de variancias iguales antes
de realizar el contraste de hipótesis.

Autor: Esp. Rolón Esteban Eduardo , marzo 2019 . Página 6


Bioestadística y diseño experimental. (Taller 2019). Lic. en Genética (Plan 2017)
Facultad de Ciencias Exactas, Químicas y Naturales. UNaM

3.2) Contrastes de diferencia entre medias poblacionales independientes

Este tipo de contraste también es aplicado para diferencia de medias, pero en los casos en los
que se comparan medias poblacionales para un carácter determinado en dos poblaciones
distintas. Sean dos poblaciones normales N   x ,  x  
y N  y , y  con  x y  y conocidas, de
las cuales se extraen dos muestras aleatorias e independientes de tamaño nx y ny
respectivamente. Con un nivel de significación α dado, queremos realizar los siguientes
contrastes:

Contraste de medias con varianzas conocidas:

De manera similar al caso del contraste para una media, queremos en esta ocasión
contrastar la hipótesis de que las dos poblaciones (cuyas varianzas suponemos
conocidas) sólo difieren en una cantidad

frente a hipótesis alternativas que darán lugar a contrastes unilaterales o bilaterales. Para
ello nos basamos en la distribución del siguiente estadístico de contraste:

1. Contraste bilateral o de dos colas:

Se define entonces : Se acepta H 0 si:  z / 2  zexp  z / 2

y el test consiste en:

Autor: Esp. Rolón Esteban Eduardo , marzo 2019 . Página 7


Bioestadística y diseño experimental. (Taller 2019). Lic. en Genética (Plan 2017)
Facultad de Ciencias Exactas, Químicas y Naturales. UNaM

Ejemplo: Un equipo de investigadores desea saber si los datos que han recolectado proporcionan
la evidencia suficiente para indicar una diferencia entre las concentraciones medias de ácido úrico
en el suero de individuos normales e individuos con síndrome de Down. Los datos presentan las
concentraciones de acido úrico en el suero de 12 individuos con síndrome de Down y 15
individuos sanos. Las medias son x 1=4.5mg/100ml y x 2=3.4mg/100ml.

Resolución:

El contraste es H0:  1-  2 = 0 o  1=  2

H1:  1-  2 ≠ 0 o  1≠  2

Si  =0.05, los valores críticos de z son ± 1.96. Se rechaza H0 a menos que -1.96<zcalculada<1.96.

Cálculo de la estadística de prueba:

(4.5  3.4)  0 1. 1
zc= = =2.82
1 / 12  1 / 15 0.39

Como 2.82 es mayor que 1.96 se rechaza la hipótesis nula. Se concluye que, de acuerdo con
estos datos, hay indicios de que las medias de las poblaciones son diferentes.

a) Contraste de medias homocedáticas (varianzas desconocidas)

Aplicable al caso en el que deseamos contrastar la diferencia de medias de dos poblaciones


independientes cuando sólo conocemos que las varianzas de ambas poblaciones son iguales,
pero desconocidas. El problema a contrastar es:

El estadístico que usaremos para el contraste ya lo hemos visto. Si suponemos que H0 es cierta
se tiene

𝑥 𝑥 𝜇 𝜇
𝑡𝑒𝑥𝑝 𝑡𝑐 ( ̴) se distribuye conforme a una Tteo( n1+n2-2;1-α/2)
𝑆𝑝 𝑆𝑝
√( +𝑛 )
𝑛1

Donde Desvío ponderado : 𝑛 𝑠 + 𝑛 𝑠


𝑆𝑝
𝑛 +𝑛

Nota: t exp : estadísdico de prueba experimental Tc= estadístico de pruieba calculado y la T


representa el valor de la distribución de probabilidad llamada T- Student que se utiliza para
muestras menores de 30, cuando no se conoce la varianza poblacional y la población tiene una
distribución aproximadamente normal.

Autor: Esp. Rolón Esteban Eduardo , marzo 2019 . Página 8


Bioestadística y diseño experimental. (Taller 2019). Lic. en Genética (Plan 2017)
Facultad de Ciencias Exactas, Químicas y Naturales. UNaM

1. Contraste bilateral

Para el contraste de significación :

Se tiene como en casos anteriores que el contraste adecuado consiste en definir

Tteo( n1+n2-2;1-α/2)

Y rechazar o admitir la hipótesis nula siguiendo el criterio

Luego calculamos: , tomamos una decisión y


√( + )
1
redactamos la conclusión.

Ejemplo: Un grupo de investigadores colecto datos acerca de las concentraciones de amilasa en


el suero de muestras de individuos sanos y de individuos hospitalizados. Desean saber si es
posible concluir que las medias de las poblaciones son distintas. Los datos son las mediciones de
amilasa en suero de n2= 15 individuos sanos y n1= 22 individuos hospitalizados. Las medias
muestrales y sus desviaciones estándar son las siguientes:

x 1=120 unidades/ml s1=40 unidades/ml

x 2=96 unidades/ml s2=35 unidades/ml

Solución: El contraste es: H0:  1-  2 = 0 y H1:  1-  2 ≠ 0

Si definimos a  =0.05, los valores críticos de t son ± 2.0301. Se rechaza H0 a menos que -
2.0301<tcalculada<2.0301.

El cálculo de la estadística de prueba es:

21(1600)  14(1225) (120  96)  0 24


Sp 2= =1450 t= = =1.88
21  14 1450 1450 12.75

15 22

Decisión: No es posible rechazar H0 porque -2.0301<1.88<2.0301.

Conclusión: Es decir, 1.88 cae dentro de la región de aceptación. Con base a estos datos no es
posible concluir que las dos medias de la población son diferentes.
Autor: Esp. Rolón Esteban Eduardo , marzo 2019 . Página 9
Bioestadística y diseño experimental. (Taller 2019). Lic. en Genética (Plan 2017)
Facultad de Ciencias Exactas, Químicas y Naturales. UNaM

b) Contraste de medias no homocedáticas

Es un tipo de contraste que se aplica en el caso más problemático, es decir cuando sólo
conocemos de las dos poblaciones que su distribución es normal, y que sus varianzas no
son conocidas y significativamente diferentes. El contraste es:

En este caso el estadístico de contraste tendrá una ley de distribución muy particular. Consistirá
en una distribución t de Student, con un número de grados de libertad que en lugar de depender
de modo determinista de la muestra (a través de su tamaño), depende de un modo aleatorio
mediante las varianzas muestrales. Concretamente, el estadístico que nos interesa es

√( + )

donde f es el número de grados de libertad que se calcula mediante la fórmula de Welch

𝑆𝑃 𝑆𝑃
+
𝑛1 𝑛
𝑓 -2
1 𝑆𝑃 1 𝑠𝑝
+
𝑛1 −1 𝑛1 𝑛 −1 𝑛

No desarrollamos en detalle los cálculos a realizar, pues la técnica para efectuar los
contrastes es análoga a las vistas anteriormente cuando las varianzas son desconocidas
e iguales.

Nota: Si lo que pretendemos contrastar es si las medias poblacionales de dos muestras


independientes obtenidas de poblaciones normales son idénticas, esto se reduce a los
casos anteriores tomando , es decir, realizando el contraste:

3.3) Contrastes para la diferencia de medias apareadas

En el análisis de la diferencia de medias de dos poblaciones, se supone que las muestras


son independientes. Un método que se utiliza con frecuencia para averiguar la efectividad
de un tratamiento o procedimiento experimental es aquel que hace uso de observaciones
relacionadas que resultan de muestras no independientes. Una prueba de hipótesis que
se basa en este tipo de datos se conoce como prueba de comparaciones por parejas o
para muestras apareadas. Las muestras apareadas aparecen como distintas
observaciones realizadas sobre los mismos individuos. Un ejemplo de observaciones
apareadas consiste en considerar a un conjunto de n personas a las que se le aplica un

Autor: Esp. Rolón Esteban Eduardo , marzo 2019 . Página 10


Bioestadística y diseño experimental. (Taller 2019). Lic. en Genética (Plan 2017)
Facultad de Ciencias Exactas, Químicas y Naturales. UNaM

tratamiento médico y se mide por ejemplo el nivel de insulina en la sangre antes (X) y
después del mismo (Y). No es posible considerar a X e Y como variables independientes
ya que va a existir una dependencia clara entre las dos variables. Si queremos contrastar
el que los pacientes han experimentado o no una mejoría con el tratamiento, llamemos di
a la diferencia entre las observaciones antes y después del tratamiento : di = xi-yi

El objetivo de la prueba de comparaciones por pares es eliminar al máximo las fuentes de


variación por medio de la formación de parejas similares respecto a tantas variables como sea
posible. En estos casos, en lugar de llevar a cabo el análisis con observaciones individuales, se
puede utilizar como variable de interés la diferencia entre los pares individuales de observación.

Supongamos que la v.a. que define la diferencia entre el antes y después del tratamiento es una
v.a. d que se distribuye normalmente, pero cuyas media y varianza son desconocidas.

Si queremos contrastar la hipótesis de que el tratamiento ha producido cierto efecto

En el caso en que H0 fuese cierta tendríamos que el estadístico de contraste que nos
conviene es:

Donde es la media muestral de las diferencias di y Ŝ d es la cuasivarianza muestral


( o S2 : varianza muestral) de las mismas. El tipo de contraste sería entonces del mismo tipo que
el realizado para la media con varianza desconocida.

Cuando H0 es verdadera la estadística de prueba sigue una distribución t de Student con n-1
grados de libertad.

1. Contraste bilateral: Consideramos el contraste de tipo

Entonces se define

y se rechaza la hipótesis nula cuando:

ó .

Autor: Esp. Rolón Esteban Eduardo , marzo 2019 . Página 11


Bioestadística y diseño experimental. (Taller 2019). Lic. en Genética (Plan 2017)
Facultad de Ciencias Exactas, Químicas y Naturales. UNaM

Diferencia de proporciones

Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse


utilizando proporciones o porcentajes.

Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos


proporciones muestrales, la distribución muestral de diferencia de proporciones es
aproximadamente normal para tamaños de muestra grande (n 1p1 5, n1q1 5, n2p2 5 y
n2q2 5).

Entonces p1 y p2 tienen distribuciones muestrales aproximadamente normales, así que su


diferencia p1-p2 también tiene una distribución muestral aproximadamente normal.
Cuando se estudió la distribución muestral de proporciones se comprobó que  p̂ = p y

que  p̂ =
pq
por lo que se puede deducir que:
n

 p̂ 1 - p̂ 2 =∆ p1-p2 y que .

La fórmula que se utilizará para el cálculo de probabilidad del estadístico de diferencia de


proporciones es:

Ejemplo: Los hombres y mujeres adultos de una ciudad grande en sus opiniones sobre la
promulgación de la pena de muerte para personas culpables de asesinato. Se cree que el
12% de los hombres adultos están a favor de la pena de muerte, mientras que sólo 10%
de las mujeres adultas lo están. Si se pregunta a dos muestras aleatorias de 100 hombres
y 100 mujeres su opinión sobre la promulgación de la pena de muerte, determine la
probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de
las mujeres.

Solución: Datos: PH = 0.12 , PM = 0.10 , nH = 100 , nM = 100 y p(pH-pM 0.03) = ?

Hay que tener en cuanta que se mejoira un poco al incluir el factor de corrección de 0,30
- 0.5/100 por ser una distribución binomial y que se está utilizando la distribución normal.

Autor: Esp. Rolón Esteban Eduardo , marzo 2019 . Página 12


Bioestadística y diseño experimental. (Taller 2019). Lic. en Genética (Plan 2017)
Facultad de Ciencias Exactas, Químicas y Naturales. UNaM

Se concluye que la probabilidad de que


el porcentaje de hombres a favor de la
pena de muerte, al menos 3% mayor
que el de mujeres es de 0.4562.

Estimación de la Diferencia de dos Proporciones

Muchas veces se tiene interés en conocer la magnitud de la diferencia entre dos poblaciones,
podemos comparar por ejemplo, entre hombres y mujeres, dos grupos de edades, dos grupos
socioeconómicos.

Un estimador puntual insesgado de la diferencia de proporciones de las poblaciones se obtiene al


calcular las diferencias de las proporciones de las muestras p̂ 1 - p̂ 2. Cuando n1 y n2 son de gran
tamaño y las proporciones de la población no están muy cerca de 0 o de 1, es posible aplicar el
teorema del límite central y utilizar la teoría de la distribución normal para obtener los intervalos de
confianza.

Vamos a considerar que tenemos dos poblaciones de modo que en cada una de ellas estudiamos
una v.a. dicotómica (Bernoulli) de parámetros respectivos p1 y p2. De cada población vamos a
extraer muestras de tamaño n1 y n2

Si las muestras son suficientemente grandes ocurre que

Anteriormente, se vio el tema de la generación de las distribuciones muestrales, en donde se tenía


el valor de los parámetros, se seleccionaban dos muestras y podíamos calcular la probabilidad del
comportamiento de los estadísticos. Para este caso en particular se utilizará la distribución
muestral de diferencia de proporciones para la estimación de la misma. Recordando la formula:

Despejando P1-P2 de esta ecuación obtenemos un intervalo de confianza del 100(1 -  )


para P1-P2 :

Donde Z se obtiene de la tabla de distribución normal al nivel 1-α/2.

Autor: Esp. Rolón Esteban Eduardo , marzo 2019 . Página 13


Bioestadística y diseño experimental. (Taller 2019). Lic. en Genética (Plan 2017)
Facultad de Ciencias Exactas, Químicas y Naturales. UNaM

Aquí se tiene el mismo caso que en la estimación de una proporción, ya que al hacer el despeje
nos queda las dos proporciones poblacionales y es precisamente lo que queremos estimar, por lo
que se utilizarán las proporciones de la muestra como estimadores puntuales:

Ejemplo: Un artículo relacionado con la salud, reporta los siguientes datos sobre la incidencia de
disfunciones importantes entre recién nacidos con madres fumadoras de marihuana y de madres
que no la fumaban:

Usuario No Usuaria

Tamaño Muestral 1246 11178

Número de disfunciones 42 294

Proporción muestral 0.0337 0.0263

Encuentre el intervalo de confianza del 99% para la diferencia de proporciones.

Solución: Representemos P1 la proporción de nacimientos donde aparecen disfunciones


entre todas las madres que fuman marihuana y definamos P2, de manera similar, para las
no fumadoras. El valor de z para un 99% de confianza es de 2.58.

IC(99%)= -0.0064<P1-P2<0.0212

Contrastes sobre la diferencia de proporciones

Si X1 y X2 contabilizan en cada caso el número de éxitos en cada muestra se tiene que cada una
de ellas se distribuye como una variable aleatoria binomial,de modo que los estimadores de las
proporciones en cada población tienen distribuciones que de un modo aproximado son normales
(cuando n1 y n2 son bastante grandes)

El contraste que nos interesa realizar es el de si la diferencia entre las proporciones en cada

población es una cantidad conocida

Autor: Esp. Rolón Esteban Eduardo , marzo 2019 . Página 14


Bioestadística y diseño experimental. (Taller 2019). Lic. en Genética (Plan 2017)
Facultad de Ciencias Exactas, Químicas y Naturales. UNaM

Si H0 fuese cierta se tendría que:

Desafortunadamente ni p1 ni p2 son conocidos de antemano y utilizamos sus estimadores,


lo que da lugar a un error que es pequeño cuando los tamaños muestrales son
importantes:

La prueba que se utiliza con más frecuencia con relación a la diferencia entre las proporciones de
dos poblaciones es aquella en la que su diferencia es cero. Sin embargo, es posible probar que
dicha diferencia es igual a algún otro valor. Se pueden hacer pruebas unilaterales y bilaterales.

Siempre que la hipótesis nula sea p1-p2=0, se supone que las proporciones de las dos poblaciones
son iguales. Esto permite combinar los resultados de las dos muestras y obtener una estimación
ponderada de la proporción común supuesta:

p = x1+x2 / n1+n2

Donde x1 y x2 son el número de la primera y segunda muestra que poseen la característica de


interés. Esta estimación ponderada se utiliza para calcular el error estándar estimado para el
estimador como sigue:

p(1  p) p(1  p)
ˆ  
n n

Ejemplo: En un estudio para comparar un nuevo tratamiento para la migraña con el


tratamiento habitual, 78 de los 100 individuos que recibieron el tratamiento habitual
respondieron favorablemente. De los 100 individuos que recibieron el nuevo tratamiento,
90 respondieron satisfactoriamente. ¿Proporcionan estos datos la evidencia suficiente
para afirmar que el nuevo tratamiento es más efectivo que el habitual?

Solución: Se calculan: p̂ 1= 78/100=0.78 p̂ 2=90/100=0.90

90  78
p= =0.84
100  100

Las hipótesis son: H0=p2-p1  0

Autor: Esp. Rolón Esteban Eduardo , marzo 2019 . Página 15


Bioestadística y diseño experimental. (Taller 2019). Lic. en Genética (Plan 2017)
Facultad de Ciencias Exactas, Químicas y Naturales. UNaM

H1= p2-p1>0

Sea  =0.05. El valor crítico de z es 1.645. Se rechaza H0 si el valor de z es mayor que 1.645.

(0.90  0.78) 0.12


El cálculo del estadístico de prueba es: z=  =2.32
(0.84)(0.16) (0.84)(0.16) 0.0518

100 100

Como 2.32>1-645, se rechaza H0. Estos datos sugieren que el tratamiento es más efectivo
que el habitual.

BIBLIOGRAFÍAS DE REFERENCIA

 Francisca Ruiz Días , Francisco Javier Barón Lopez, otros. Bioestadística: Métodos
y Diseños :link :
[Link]

 Wayne W Daniel Bioestadística Base Para El Analisis Ciencias Salud

Autor: Esp. Rolón Esteban Eduardo , marzo 2019 . Página 16

También podría gustarte