Inferencia Estadística
Estimación y prueba de
hipótesis
Obtener medidas
Estimación de parámetros
aproximadas de la población
INFERENCIA
ESTADISTICA
Prueba de hipótesis Con la información de la muestra se
evalua la validez de supuestos
(hipótesis) referidos a la población
Estimador
Muestra: x1, x2, …., xn
n x
xi p ; p E ( p) P;
x 1 n
n P (1 P ) N n
p V ( p)
2
x E( x) n N 1
2
x2 V ( x )
n
; =V()= x
n
X
x
X es Normal X es Normal con x ; x
n
Z es N (0,1)
Y es (2k )
Z
T es t( k )
Y
k
distribución t Student con g .l . k
E( X ) 0 ;
k
2 V ( X )
k2
para k 2
T
-t 0 t
2
Sea X una población Normal N(, )
Muestra n: x1, x2, ….., xn
X es Normal X es Normal con x ; x
n
x
Z es N ( 0,1)
/ n x
x
/ n
T es t
( n 1) T es t( n1)
2 ( n 1) S ² S/ n
( n 1) S 2 ( n 1)
2
X es (2n1)
2
Intervalo de confianza para la media
poblacional
2
A) Si la varianza poblacional ( ) es conocida
Para todo tamaño de muestra de población normal o X es Normal con x ; x
Para muestra grande (n 30) de cualquier población
n
x
Z
/ n 2
1-
2
0
Z
La función cantidad Pivotal para Z 1 / 2 Z 1 / 2
x
Z1 / 2 Z1 / 2 x Z1 / 2 x Z1 / 2
/ n n n
L x Z 1 / 2
Luego los límites son:
n
Intervalo de confianza para la media
poblacional
2
c) Si la varianza poblacional ( ) es desconocida X es Normal con x ; x
n
muestra pequeña (n<30) de población normal
x
T es t( n1)
S/ n
1-
2 2
La función cantidad Pivotal para
t1 / 2 0
t1 / 2
T
x S S
t1 / 2 t1 / 2 x t1 / 2 x t1 / 2
S/ n n n
S
Luego los límites son: L x t1 / 2
n
Error de muestreo y tamaño de muestra
e x error de estimación puntual
E Z 1 / 2
n
0.95
precisión o máximo error de estimación puntual con
E probabilidad o confianza (1- )
x
E x 1.96 x
e
P ( x 1.96 x ) 0.95
Z 12 / 2 2
Tamaño de muestra n
E2
El administrador de un hospital desea estimar el peso de los bebés nacidos en su hospital, ¿cuán grande
debe tomarse una muestra de los registros de nacimientos si el administrador desea que el error máximo
sea de 100 gr. con una confianza de 99%?. La desviación estándar de los pesos se ha estimado en 200 gr.
E= 100gr confianza:1-=0.99 entonces =0.01 Z0.995 = 2.576
S=200 gr
Z 2
2
n 1 / 2
2
E
Muestreo C/R o Muestreo S/R (población grande Muestreo S/R (población finita
x E( x) x E( x)
2 2 N n
x
2
V ( x) x2 V ( x )
n n N 1
E Z1 / 2 x
2 N n
2 2 E 2 Z12 / 2
E Z12 / 2 n N 1
n
n0
Z 2
2 n Z12 / 2 S 2
n 1 / 2
1
n0 n0
E 2
N E2
P ( 0.11 OD
2
0.78 ) 0.95
P ( 0.33 OD 0.89 ) 0.95
Para muestra grande de población finita, la proporción muestral se aproxima con la Normal
P es aprox Normal
p P
P (1 P ) N n Z ; Pˆ P
E ( p) P y 2 Pˆ (1 Pˆ ) N n
p
n N 1 n N 1
1-
p P
P ( Z1 / 2 Z Z1 / 2 ) 1 2 2
ˆ ˆ
P (1 P ) N n 0
Z
Z 1 / 2 Z 1 / 2
n N 1
p(1 p ) N n p(1 p)
L p Z 1 / 2
n N 1 L p Z 1 / 2
n
2. Una muestra de tamaño 400 seleccionada de entre los 2000 alumnos que habían consultado el servicio de salud de una universidad el año pasado
indicó que 80 tenían enfermedad de naturaleza psicosomática.
a) ¿Obtenga una estimación interválica con 95% de confianza para el porcentaje de alumnos que tenían enfermedad psicosomática.
b) Proporcione una estimación, con 95% de confianza, para el número de alumnos que consultaron el servicio de salud y tenían enfermedad
psicosomática.
POBLACIÓN: N= 2000 n/N > 0.10, asumimos población finita
MUESTRA n=400
p(1 p ) N n
X= 80 con enf. Psicosomática L p Z 1 / 2
p =80/400=0.20
n N 1
IC 95% Z0.975=1.96
p(1 p ) N n
L (T ) N ( p Z1 / 2 )
T NP Tˆ NPˆ Np n N 1
L(T ) N L( P )
Para muestra grande de población finita, la proporción muestral se aproxima con la Normal
P es aprox Normal
p P
P (1 P ) N n Z ; Pˆ P
E ( p) P y 2 Pˆ (1 Pˆ ) N n
p
n N 1 n N 1
e p P Población grande
1-
P (1 P
E Z 1 / 2
E n
p
p
P-E P P+E
e
Z 12 / 2 P (1 P )
Z 1 / 2 n
E2
E Z1 / 2 p Máximo error de estimación puntual con confianza 1-
Tamaño de muestra
Población grande Población finita
P (1 P ) P (1 P ) N n
2p 2p
n n N 1
P (1 P P (1 P ) N n
E Z 1 / 2 E Z1 / 2
n n N 1
2
n
n0 Z1 / 2P (1 P )
n
Z 12 / 2 P (1 P )
n n0 2
E2 1 0 E
N
1. Seleccionar una muestra preliminar o piloto con la cual se estima el valor P
2. Considerar la opinión de expertos
3. Utilizar el “P” de poblaciones similares a las que estamos investigando
4. Utilizar el “P” en investigaciones previas
5. Cuando no se tiene información alguna sobre P, se asume P=0.50
considerando que el tamaño de muestra para una confianza y error
establecido es función cuadrática de P, con lo cual la muestra más grande se
determina cuando P=0.50 n
Z 2
P (1 P )
n 1 / 2
2
E
P
0.50
1. El Director de Asuntos Estudiantiles de una Universidad está considerando una nueva política en relación
con las residencias estudiantiles. Antes de tomar su decisión final, desea seleccionar una muestra
aleatoria de estudiantes para estimar la proporción de los que están a favor de la nueva política. ¿qué
tamaño muestral se requiere para asegurar que el riesgo de sobrepasar un error de 0,10 es sólo 0,05?.
La universidad tiene 8 000 estudiantes.
Hipótesis
Sobre Parámetros Relaciones entre
Distribución de dos o más
probabilidad variables
Parámetros:
Promedio
Varianza
Proporción poblacional
H 0 : 14 H1 : P 10%
H1 : 14 H 0 : P 10%
H 0 : 14
Muestra n: x1, x2, ….., xn
X es Normal X es Normal con x ; x
H1 : 14 n
H 0 : 14
H0: = 0
Muestra n=36 a) H0: = 0 H1: 0
x1, x2, …, xn b) H0: 0 H1: 0
x 11; S 2 x 11
x c) H0: 0 H1: 0
x 13.8 14 x 18
Z
x 0 R.C. R.C.
S/ n
H 0 : 14
H1 : 14 14 o 14
x 0 1.96 x
P ( x 0 ) P ( Z ) 0.27 E
s/ n
H 0 : 14
H 0 : 14 H 0 : 14
x x
x 12.5 x 13.8 14 x 18 x 11 x 13.8 14 x 18
R.C. Estadística R.C.
x 0
H 0 : 14 Z H 0 : 14
H1 : 14 S/ n H1 : 14
x 12.5; S 2
x 13.8; S 2
Z 4 .5 ;
6 Z 0. 6 ;
p ( Z 4.5) 3.4 * 10 0.001
p ( Z 0.6) 0.27 0.05
El objetivo del presente estudio fue determinar el desarrollo visomotor y el
rendimiento escolar en hijos de madres adolescentes y compararlos con los
observados en hijos de madres adultas.
En conclusión, los hijos de madres adolescentes tienen un retardo en el
desarrollo visomotor y un menor rendimiento escolar que los hijos de madres
adultas
Hipótesis de la investigación
Los hijos de madres adolescentes tienen un retardo en el desarrollo visomotor
y un menor rendimiento escolar que los hijos de madres adultas
Hipótesis de la investigación
Los hijos de madres adolescentes tienen un retardo en el desarrollo visomotor
y un menor rendimiento escolar que los hijos de madres adultas
Población 1: Los hijos de madres adolescentes
Población 2: Los hijos de madres adultas
Variable Variable indicadora Tipo de var. Indicador
DVM P.Bender n° de errores
cuantitativa
RE Resultado año escolar categórica P
A D
Hipótesis de la investigación
Los hijos de madres adolescentes tienen un retardo en el desarrollo visomotor
y un menor rendimiento escolar que los hijos de madres adultas
Hipótesis estadísticas Los h. m. adol. no tienen un
Los h.m.adol. no tienen en retardo en el DVM respecto de
H 0 : 1 2 promedio más errores que los de
m. adul.
los h.m. adul.
1)
Los h.m.adol. tienen en Los h. m. adol. tienen un
H1 : 1 2 promedio más errores que los retardo en el DVM respecto de
los h.m. adul.
de m. adul.
Los h.m.adol. no tienen mayor Los h.m.adol. no tienen menor
H 0 : P1 P2 porcentaje de desap. que los RE que los h.m.adult.
h.m.adul.
2)
Los h.m.adol. tienen mayor Los h.m.adol. tienen menor RE
H1 : P1 P2 porcentaje de desap. que los que los h.m.adul.
h.m.adult.
H 0 : 1 2 POBLACION 1: X POBLACION 2: X
1 21 2 22
H1 : 1 2
MUESTRA: n1 MUESTRA: n2
Si n1 30, x1 normal Si n2 30, x 2 normal
12 22
con x 1 y x2 con x 2 y x22
1 1
n1
2
n2
Luego x 1 x 2 es aprox . normal , con
12 22
x x2 1 2 y x2 x2 x1 x 2
1 1
n1 n2 1 2
12 22 ( X 1 X 2 ) ( 1 2 )
X 1 X 2 es N ( 1 2 , ) entonces Z
n1 n2 12 22
n1 n2
H 0 : 1 2 H 0 : 1 2 0 X 1 X 2 es N ( 1 2 ,
12
22
) entonces Z
( X 1 X 2 ) ( 1 2 )
n1 n2 12 22
H1 : 1 2 H1 : 1 2 0 n1
n2
= P[Rechazar H0 cuando es verdadera]
p = P[rechazar H0 con los resultados de la
Ho muestra asumiendo que H0 es verdad]
Estadística de la prueba
= 0.05
x1 x 2 ( x1 x 2 )
0 c Z es N(0,1), sí Ho es verdadera
2 2
R.A. R.C. 1 2
n1 n 2
= 0.05
0 Z0.95 = 1.65
Z Si se asume el nivel de Se determina la región de
R.C. significancia =0.05 rechazo para Z > 1.65
R.A.
rechazar H0 a favor de H1
S ES: Error estándar de la media o
H 0 : 1 2 H 0 : 1 2 0 SX desviación estándar de la media m.
n
H1 : 1 2 H1 : 1 2 0
Estadística de la prueba Población Muestra (ni) S
Xi SX
n
1. H.m.adol. 59 6.34 0.38
( x1 x 2 )
Z 2. H.m.adul. 73 4.75 0.24
S 12 S 22 Diferencia 1.59
n1 n2
Operando los datos de la muestra obtenemos el valor
calculado para la estadística Z
Z= 3.53 p = P(Z > 3.53) = 0.0002 < 0.001
Concluimos: Los h. m.adol. tienen un
Los h.m.adol. tienen en retardo en el DVM
rechazar H0 a
promedio más errores que los respecto de los h.m. adul.
favor de H1
de m. adul. (p<0.0001)
2) H 0 : P1 P2 H1 : P1 P2
POBLACIÓN 1 POBLACIÓN 2
P1 P2
p1 p2
MUESTRA: n1 MUESTRA: n2 P1 P2
Si n1 30, P1 normal Si n2 30, P2 normal
P1 (1 P1 ) P2 (1 P2 )
con p P1 y 2p con p P2 y 2p
1 1
n1 2 2
n2
Luego p1 p2 es aprox . normal , con ( p1 p2 ) ( P1 P2 )
Z
P1 (1 P1 ) P2 (1 P2 )
p p P1 P2 y
1 2
n1 n2
P1 (1 P1 ) P (1 P2 )
2p p 2
1 2
n1 n2
H 0 : P1 P2 H 0 : P1 P2 0 H1 : P1 P2 H1 : P1 P2 0
P1 (1 P1 ) P2 (1 P2 )
p1 p2 N ( p p P1 P2 , 2
p1 p2 )
p1 p2 1 2
n1 n2
P1 P2
Estadística de la prueba Si Ho es V, entonces P1 = P2 = P
Ho ( p1 p2 )
Z es N(0,1), sí Ho es verdadera
1 1
= 0.05
P (1 P ) X1 X 2
p1 p2 n1 n2 n n1 n2 p
n1 n2
0
c
R.A. R.C.
n1 n2 X2
X p2
X1 p1 1 X2 n2
Nivel de significancia n1
desap
= P[Rechazar H0 cuando es verdadera] desap
Los h.m.adol. no tienen mayor porcentaje Los h.m.adol. no tienen menor RE que
H 0 : P1 P2 H 0 : P1 P2 0 de desap. que los h.m.adul. los h.m.adult.
Los h.m.adol. tienen mayor porcentaje de Los h.m.adol. tienen menor
H1 : P1 P2 H1 : P1 P2 0 desap. que los h.m.adult. RE que los h.m.adul.
Ho
Estadística de la prueba
( p1 p2 )
Z p1 p2
1 1 0 c
P (1 P ) R.A. R.C.
n1 n2 Ho
p = 0.0245 < 0.05
Z 1.967 Z
0 Z=1.97
R.A. R.C.
Los h.m.adol. tienen mayor Los h.m.adol. tienen menor
Conclusión: Se rechaza porcentaje de desap. que los
la Ho a favor de H1
RE que los h.m.adul.
h.m.adult. (p < 0.05)