0% encontró este documento útil (1 voto)
484 vistas49 páginas

Guía Completa sobre Pruebas de Hipótesis

Este documento presenta los conceptos y pasos clave para realizar pruebas de hipótesis. Define una prueba de hipótesis como un procedimiento para determinar si una hipótesis nula debe ser rechazada o aceptada. Explica los pasos como formular las hipótesis nula y alternativa, seleccionar un nivel de significancia, identificar el estadístico de prueba, definir una regla de decisión, tomar una muestra y llegar a una conclusión sobre si rechazar o no la hipótesis nula. También dist
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPT, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (1 voto)
484 vistas49 páginas

Guía Completa sobre Pruebas de Hipótesis

Este documento presenta los conceptos y pasos clave para realizar pruebas de hipótesis. Define una prueba de hipótesis como un procedimiento para determinar si una hipótesis nula debe ser rechazada o aceptada. Explica los pasos como formular las hipótesis nula y alternativa, seleccionar un nivel de significancia, identificar el estadístico de prueba, definir una regla de decisión, tomar una muestra y llegar a una conclusión sobre si rechazar o no la hipótesis nula. También dist
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPT, PDF, TXT o lee en línea desde Scribd

Región aceptación H0 Región rechazo H0

Pruebas de hipótesis
ALBERTO BOADA RODRÍGUEZ. PH.D
Fuente: Diferentes autores y presentaciones
1
AGENDA
1. Contexto
2. Definiciones pruebas de hipótesis
3. Pasos en las pruebas de hipótesis
4. Ejemplo

2
1. Contexto

Puntual
Estimación de
Parámetros
Intervalos de Confianza

Inferencia

Paramétricas

Prueba de Hipótesis
No paramétricas
2. Contexto

Introducción

Definir prueba de hipótesis.

Describir el procedimiento para las prueba de hipótesis.

Distinguir entre una prueba de hipótesis de una y dos colas.

Realizar pruebas de hipótesis para una y dos muestras.


Definir los errores de Tipo I y de Tipo II.
Calcular la probabilidad de un error de Tipo I y II.
¿Qué es una hipótesis?
Hipótesis:
Enunciado acerca de una población elaborada con el
propósito de ponerse a prueba.
Verificar la validez de una conjetura que un investigador
realiza sobre una población
Representa un elemento fundamental en el proceso de
investigación. Luego de formular un problema, el investigador
enuncia la hipótesis, que orientará el proceso y permitirá
llegar a conclusiones concretas del proyecto que recién
comienza
¿Qué es una prueba de hipótesis?
La experiencia sobre el comportamiento de algún índice de un proceso, o la
exigencia del cumplimiento de alguna norma nos lleva a realizar proposiciones
sobre el valor de algún parámetro estadístico.

Las proposiciones se deben contrastar con la realidad (mediante el muestreo


de datos) para tomar una decisión entre aceptar o rechazar la proposición

Estas proposiciones se denominan Hipótesis y el procedimiento para


decidir si se aceptan o se rechazan se denomina Prueba de Hipótesis

Una prueba de hipótesis es una herramienta de análisis de datos que


puede en general formar parte de un experimento comparativo más
completo

6
¿Qué es una prueba de hipótesis?

Prueba de hipótesis:
Procedimiento basado en la evidencia muestral y en la
teoría de probabilidad, que se emplea para determinar si la
hipótesis es un enunciado razonable y no debe rechazarse
o si no es razonable y debe ser rechazado.

Una hipótesis Estadística es un proposición sobre los


parámetros de una población o sobre la distribución de
probabilidad de una variable aleatoria
Definiciones

Hipótesis nula H0: afirmación acerca del valor


de un parámetro poblacional.
Hipótesis alterna H1: afirmación que se
aceptará si los datos muestrales proporcionan
evidencia de que la hipótesis nula es falsa.
Nivel de significancia: probabilidad de
rechazar la hipótesis nula cuando es verdadera.
Error Tipo I: rechazar la hipótesis nula cuando
en realidad es verdadera.
9-7

Definiciones

Error Tipo II: aceptar la hipótesis nula


cuando en realidad es falsa.
Estadístico de prueba: valor obtenido a
partir de la información muestral, se
utiliza para determinar si se rechaza o no
la hipótesis.
Valor crítico: el punto que divide la región
de aceptación y la región de rechazo de la
hipótesis nula.
Ejemplos de hipótesis estadísticas
Ejemplos de hipótesis acerca de un parámetro de población
son:

◦ El gasto promedio mensual de una familia colombiana de


cuatro personas es de $1.350.000 (DANE, 6-06-2017)

◦ El 51% de la población mayor de 18 años, no esta de


acuerdo con las decisiones del actual Ministro de
Hacienda.

◦ ¿El género es una variable significativa para el análisis


y la comprensión de los procesos de exclusión social?.
Prueba de hipótesis…. pasos
Paso 1: plantear las hipótesis nula y alterna

Calcular estadísticos
Determinar n, α Paso 2: seleccionar un nivel de significancia
, S,

Zc, tc , X²c, Fc Paso 3: identificar el valor estadístico de prueba

Paso 4: formular una regla de decisión


Identificar región
crítica – valor tabla
Existen evidencias
Tomar una
Paso 5: tomar una muestra, decisión
llegar a una decisión Calculo P-value
con un 1 – α, para:

No rechazar la Rechazar la hipótesis nula


hipótesis nula y aceptar la alterna

Paso 6. Comprobar el resultado Calcular intervalos de confianza


Ejemplo pruebas de hipótesis:

1. Paso Formular la hipótesis


Suponga que se quiere evaluar la contaminación por ruido en Bogotá

Secretaría del medio ambiente Expertos internacional JICA Ecólogos – Independiente

Hipo. Nula Ho : µ = 70 db (≥) Hipo. Nula Ho : µ = 70 db (≤ ) Hipo. Nula Ho: µ = 70 db (=)

Hip. Alterna H1: µ < 70 db Hip. Alterna H1: µ > 70 db Hip. Alterna H1: µ # 70 db

2. Paso: determinar tamaño de muestra n encontrar la media aritmética muestral , la


varianza muestral S² o proporción muestral.

Definir el nivel de significancia α =


de 10% o del 5% o del 1%
α = Error de tipo I, probabilidad de rechazar una Ho verdadera
В = Error de tipo II, probabilidad de aceptar una Ho falsa
1 – α = Nivel de confianza 1 – B = Potencia de laprueba
12
Ejemplo 2. Hay un Acusado que va ser juzgado por un delito. En
el juicio intervienen Acusado, la defensa, Fiscal y un Juez (toma
decisión). Cada parte presenta evidencias
H0: Es Inocente

H1: Culpable
Tabla de decisión
Condición real
Decisión Ho VERDADERA Ho FALSA
ACUSADO
INOCENTE CULPABLE
JUEZ

Declarar INOCENTE CORRECTA ERROR TIPO II


1-α β

Declarar CULPABLE ERROR TIPO I CORRECTA


α 1-β

13
Tabla de decisión

Alfa = p (rechazar H0|H0 cierta)


Beta = p (aceptar H0|H0 falsa)
Potencia =1- beta = p (rechazar H0|H0 falsa)

Detalles a tener en cuenta:


Alfa y Beta están inversamente relacionadas.
Sólo pueden disminuirse las dos, aumentando n.

14
α: Nivel de significancia o Error de tipo I es la
probabilidad de rechazar una hipótesis nula
cuando es verdadera

Β: Error de tipo II o probabilidad de aceptar una


hipótesis nula cuando es falsa

1 – α : Nivel de confianza 90%, 95% , 99%

1 – Β : Potencia de la prueba estadística

15
Paso 1. Definición Prueba de hipótesis
(a una cola - unilateral)
Una prueba de hipótesis es de una cola cuando la hipótesis alterna, H1,
establece una dirección, como:

◦ H0 : El gasto medio mensual de las familias colombianas


compuestas por 4 personas es de $1.350.000 mensuales.
◦ Ho : µ = $1.350.000

◦ H1 : El gasto medio mensual de las familias colombianas


compuestas por 4 personas es mayor a $1.350.000
mensuales.
◦ H1: µ > $1.350.000
Prueba de significancia de dos colas
Una prueba de hipótesis es de dos colas
cuando no se establece una dirección
específica de la hipótesis alterna H1, como:
H0 : El ingreso medio de las mujeres es igual al
ingreso medio de los hombres.
Ho : µm = µ h
H1 : El ingreso medio de las mujeres es diferente
al ingreso medio de los hombres.

H1 : µm # µh
·Otra forma de enunciar la hipótesis nula es:
·H0 : No existen diferencias significativas entre los
ingresos de los hombres y las mujeres
Paso 2. Definición Nivel de significancia (valores tabla
distribución normal muestra los Z/2 más usados).

Dos colas Valores Z a una


Nivel de sola cola
Z/2
Confianza (1 – ά) Z1-α/2

1.28
90% 1.645
95% 1.96 1.64

2.53
99% 2.58

18
19
Paso 3. Definir modelo matemático - formula
Prueba para la media poblacional: muestra grande, desviación
estándar poblacional conocida

Cuando se hace una prueba para la media poblacional de una muestra grande
y se conoce la desviación estándar, el estadístico de prueba está dado por:

X 
z
/ n
Paso 4. Definir la región Critica
Paso 4. Definir la región Critica

22
Paso 5. Tomar decisión

Si:

Zcalculado ≥ Ztabla

tcalculado ≥ ttabla
EXISTEN EVIDENCIAS
PARA RECHAZAR LA
X²calculado ≥ X²tabla HIPÓTESIS NULA H0

Si el P-Value ≤ α

23
Paso 6. Calculo Intervalo de confianza
(comprobar decisión)
Intervalo de confianza para la media (varianza conocida o n ≥ 30 datos:
__ __

xz α/2 σ/ n  μ  x  z α/2σ/ n


Intervalo de confianza para la media (varianza des conocida o n < 30 datos:

__ __

xt α/2 S/ n  μ  x  t α/2S/ n

¿Para la proporción, para la varianza, diferencia de


medias, de proporciones, de varianzas?... Investigar

24
EJEMPLO 1
Los fabricantes de Salsa de tomate ........... indican en su
etiqueta que el contenido de la botella es de 16 onzas.

Cada hora se toma una muestra de 36 botellas y se pesa el


contenido.

La muestra de la última hora tiene un peso medio de 16.12


onzas con una desviación estándar de 0.5 onzas.

¿Está el proceso fuera de control para un nivel de significancia


de .05?

Formular la respectiva hipótesis y probarla (no omitir ningún


paso)
EJEMPLO 1 …….continuación
Paso 1: Establezca la hipótesis nula y alterna

H 0 :   16 H1 :  #16
Paso 2: n = 36 ; = 16.12 ; σ = 0.5 ; α = 5%
Paso 3: Calcule el valor del estadístico de prueba:

X 
z  z  [16.12  16] /[ 0.5 / 36 ]  1.44
 / n

Paso 4: Establezca la regla de decisión


H0 se rechaza si z <- 1.96 o z > 1.96
Paso 5: Tomar Decisión sobre H0:
No se rechaza H0 porque 1.44 es menor que el valor
crítico 1.96
r a l i t r b u i o n :  = 0 , 2 = 1

Distribución de muestreo para el valor estadístico z, prueba de


dos colas, nivel de significancia de 0.05
0 . 4

0 . 3

.95 probabilidad

2 .025 regiones
0 . 2

de rechazo
Región o punto crítico
f ( x

0 . 1
Valor
1 – α 0.95 crítico
No rechace z = 1.96
. 0

α/2 = 0.025 H0 α/2 = 0.025


- 5

-4 -3 -2 -1 0 1 2 3 4
-1.96 1.96
Z calculado = 1.44
Valor p Value – p en la prueba de hipótesis
Valor p: es la probabilidad de observar un valor
muestral tan extremo o más que el valor observado,
dado que la hipótesis nula es verdadera.

Si el valor p o P –Value es menor que el nivel de


significancia α (0.10; 0.05; 0.01), H0 se rechaza.

Si el valor p es mayor que el nivel de significancia α,


H no se rechaza: no hay evidencias para rechazar la
0

prueba de hipótesis nula.


Cálculo del valor p
Prueba de una cola: valor p = P { z ≥ el valor absoluto del estadístico de
prueba calculado}

Prueba de dos colas: valor p = 2P { z ≥ el valor absoluto del estadístico de


prueba calculado}

Para el EJEMPLO 1: z = 1.44, y para una prueba de dos colas,


el valor p = 2P { z ≥ 1.44} = 2 (1-.0.92507) = .1498.

Como .1498 > .05, no se rechaza H0.


Prueba para la media poblacional: muestra, desviación
estándar poblacional desconocida

Aquí  es desconocida, así que se estimará


con la desviación estándar de la muestra s.
Siempre que el tamaño de muestra n < 30,
z puede aproximarse con:

X 
z
s/ n
EJEMPLO 2
Un banco emite su propia tarjeta de crédito. Zoila Peréz Sosa, la
gerente de crédito, quiere encontrar si la media mensual de
saldos no pagados es mayor que $400 (miles de pesos)

El nivel de significancia es de .05.

Una revisión al azar de 172 saldos reveló que la media muestral es


$407 y la desviación estándar muestral es $38.
¿Debe Zoila concluir que la población media es mayor que $400, o
es razonable suponer que la diferencia de $7 ($407-$400) se
debe al azar?
EJEMPLO 2 continuación
Paso 1: H0 :   400 H1:   400

Paso 2: H0 se rechaza si z > 1.645


z  [407  400] / [38 / 172 ]  2.42
Paso 3:

Paso 4: H0 se rechaza. Zoila Peréz Sosa puede


concluir que la media de saldos no pagados es
mayor que $400.
Prueba de hipótesis: dos medias poblacionales
Suponga que los parámetros para dos poblaciones son:
Para muestras grandes el estadístico de prueba es:

1 , 2 ,  1 y  2

X1  X 2
z
1  2
2 2

n1 n2
Prueba de hipótesis: dos medias poblacionales

Cuando  1 y  2 no se conocen pero el tamaño de


muestra n1 y n2 es mayor o igual que 30, el
estadístico de prueba es

X1  X 2 25.6  30.4
Z *c  2 2
  6.77
s1 s2 2.9² 3.6²
 
n1 n2 40 45
EJEMPLO 3

Se realizó un estudio para comparar los años promedio


de servicio de quienes se retiraron en 2006 con los que
se retiraron el año anterior en la Universidad. Con un
nivel de significancia de .01 = 1%
¿Podemos concluir que los estudiantes que se retiraron
el año pasado estudiaron más años según la siguiente
muestra?

Característica 2006 Año anterior


Media de la muestra 25.6 30.4
Desviación estándar 2.9 3.6
de la muestra
Tamaño de la muestra 40 45
EJEMPLO 3 continuación

Paso 1: H 0 : 2  1 H1 : 2  1

Paso 2: Rechace H0 si z > 2.33

30.4  25.6
Paso 3: z 2 2
 6.80
3.6 2.9

45 40

Paso 4: Como z = 6.80 > 2.33, H0 se rechaza. Los que se retiraron el año anterior
tenían más años de estudio.
Pruebas respecto a relaciones proporcionales

Relación proporcional: parte fraccional o porcentaje que


indica la parte de la población o muestra que tiene un
atributo particular de interés.
La relación proporcional muestral se representa por p
donde:

número de éxitos en la muestra


p=
número muestreado
Estadístico de prueba para ensayos con una sola
relación proporcional de población

pP
z
P (1  P )
n

P: relación proporcional poblacional = X/N


P: relación proporcional muestral = x/n
EJEMPLO 4
En el pasado, 15% de la propaganda por correo para donativos dio como
resultado contribuciones. Se mandó una nueva carta a una muestra de 200
personas y 45 enviaron un donativo. Para .05 de significancia, ¿se puede
concluir que la nueva carta fue más efectiva?

1. Ho: P = 0.15 VS H1: P > 0.15


2. n= α = 0.05 = 5% p = x/n = 45/200 = 0.225
3.
p P 0.225  0.15
z    2.97
P (1  P ) 0.15 * 0.85
n 200

4. Valor tabla 1.64

5. Dado que Z calculado es mayor al Ztabla entonces con una confianza del 95%
existen evidencias para rechazar la p.h. Ho
EJEMPLO 4 continuación
Paso 1: H0 : p .15 H1: p .15

Paso 2: H0 se rechaza si z > 1.645


45
.15
z 200  2.97
Paso 3: (.15)(.85)
200

Paso 4: como z = 2.97 >1.645, H0 se rechaza. La nueva carta


es más efectiva.
Prueba donde interviene la diferencia entre dos relaciones
proporcionales de población

El estadístico de prueba en este caso es:

p1  p2
z
pc (1  pc ) pc (1  pc )

n1 n2
Prueba donde interviene la diferencia entre dos relaciones
proporcionales de población continuación

pc es la media ponderada de las dos relaciones proporcionales, calculadas por:

número total de éxitos X1 + X 2


pc = =
número total de muestras n1 + n2
EJEMPLO 5
¿Es más probable que los trabajadores solteros
falten más que los trabajadores casados? Una
muestra de 250 trabajadores casados indicó que
22 faltaron más de 5 días el año pasado,
mientras que una muestra de 300 trabajadores
solteros indicó que 35 faltaron más de 5 días.
Utilice .05 de nivel de significancia. Nota: sea
población #1 = trabajadores solteros.
p2 = 22/250 = 0.088 ;p1 = 0.12
p1  p2
z
EJEMPLO 5 continuación pc (1  pc ) pc (1  pc )

n1 n2
Paso 1: H0 : p2  p1 H1: p2  p1
Paso 2: H0 se rechaza si z > 1.645

22  35
p3:
Paso  .1036
250  300
.1167  .0880
z  1.099
.1036(1  .1036) .1036(1  .1036)

300 250

p2 = 22/250 = 0.088 ;p1 = 0.12


EJEMPLO 5 continuación
Paso 4:

H0 no se rechaza. No existe diferencia entre la proporción de trabajadores


casados y solteros que faltan más de 5 días al trabajo.

El valor p = P{ z > 1.1} = .1357


¿Como probar hipótesis de igualdad de varianzas de dos poblaciones?

Muchas veces existe interés en conocer si la varianza de dos poblaciones difieren. En


estos casos, se debe hacer una prueba estadística de igualdad de varianzas.

La hipótesis a plantear es:

H0 : σ²1 = σ²2

Asumiendo que la hipótesis nula es cierta la estadística de prueba

F = S²1 / S²2

Sigue una distribución F con n1 − 1 grados de libertad en el numerador


y n2 − 1 grados de libertad en el denominador.

Además S²1 es la varianza muestral mayor.

46
Características de una variable aleatoria F
1. Hay infinidad de variables F, cada una identificada por dos parámetros m y n
llamados grados de libertad. Estos parámetros son siempre enteros positivos. La
notación F m,n representa una variable aleatoria F con m y n grados de libertad.
2. La variable F no toma valores negativos.
3. La curva de densidad es asimétrica positiva, pero a medida que m y n crecen se
vuelve menos asimétrica

47
Ejemplos:

Sea F 15,20 la variable aleatoria F con 15 y 20 grados de libertad.

a). Hallar P F 15,20 ≤ 2.20


Se busca una tabla F en donde la intersección de la columna con grados
de libertad 15 y la fila con grados de libertad 20 sea 2.20 y el valor de la
probabilidad buscada será el que aparece como título de la tabla F.

Así: P F 15,20 ≤ 2.20 = 0.95

b). Hallar P F 15,20 ≥ 2.46


Ahora se busca la probabilidad que dá la tabla F donde la intersección de
la columna con 15 grados de libertad en el numerador y la fila con 20
grados de libertad en el denominador sea 2.46, la cual corresponde a la
tabla con probabilidad 0.975, es decir:

P F 15,20 < 2.46 = 0.975 luego la probabilidad buscada es 0.025.

48
¿Preguntas?

Gracias por su atención

Alberto. [email protected]

49

También podría gustarte