III.
ESTADÍSTICA INFERENCIAL Y
MODELOS EXPERIMENTALES
Dr. Jorge Luis Melendez Rosales
Email.
[email protected] Cel. 973216510
Estadística Inferencial
Población:
μ,σ,P
• Estimación
• Pruebas de hipótesis
Muestra:
,S,p
Prueba de hipótesis
• Hipótesis; • Tipos de Hipótesis:
Es un supuesto, conjetura acerca de algo Hipótesis nula: Ho
que no conocemos. Es lo que deseamos probar, los datos de la
muestra pueden denegarla o refutarla.
• Hipótesis Estadística: Ejemplo,
Supuesto , conjetura que se hace para los : La edad media de los trabajadores de Tottus
es 35 años
parámetros de las poblaciones
Hipótesis. Alternativa: H1
• Prueba de Hipótesis :
Niega a H0 ,Los datos muestrales pueden
Es un procedimiento, con el que se busca mostrar evidencia a favor.
tomar una decisión sobre una hipótesis Ejemplo,
estadística; basado en la evidencia de la
muestra se puede aceptar o rechazarla : La edad media de los trabajadores de
Tottus no es 35 años.
Nivel de significación: α
La prueba de hipótesis para la inferencia estadística reconoce dos tipos de errores
Error Tipo I:
Es el error que se comete al rechazar la hipótesis nula siendo verdadera.
α: Es la probabilidad de cometer el error tipo I
ejemplo, 0.01, 0.05, 0.10 etc.
Error Tipo II:
El error que se comete al aceptar la hipótesis nula siendo falsa
β: Es la probabilidad de cometer el error tipo II
El compleneto de la probabilidad de cometer elerror tipo II, se llama potencia de la prueba y se denota como : 1-β
Tipos de contrastes: Bilateral, Unilateral
: θ= b) :θ ≤ c) : θ≥
:θ≠ : θ> : θ<
La posición de la región de rechazo depende de
a) b) c)
1. Establecer las Hipótesis Nula H0 y alternativa H1
2. Seleccionar un nivel de significancia a
3. Establecer un estadístico de prueba adecuado
4. Establecer una región de rechazo y aceptación para Ho
5. Calcular todas las cantidades muestrales necesarias para el estadístico
6. Decisión si se rechaza o se acepta H0
Prueba de hipótesis sobre la media : µ
varianza conocida
I. Hipótesis:
A. H0: m = m0 B. H0: m ≥ m0 C. Ho: m≤ m0
H 1: m ≠ m 0 H 1: m < m 0 H 1: m > m 0
__
μ0
Z X
σ/ n
II. Usar el estadístico de prueba Z
III. Región critica
A. B. C
RA RA RA
RR RR RR
RR
-za/2 z1-α/2 -za z1-α
Prueba de Hipótesis sobre la media ,
varianza desconocida
I. Hipótesis:
A. H0: m = m0 B. H0: m ≥ m0 C. Ho: m≤ m0
H 1: m ≠ m 0 H 1: m < m 0 H 1: m > m 0
II. Usar el estadístico de prueba T con n-1 de libertad __
μ0
T X
S/ n
III. Región critica
A B C
RA RA
RA
RR RR RR
-ta/2 t1-α/2
-ta t1-α
Ejemplo
Un combustible sólido para sistemas de escape de aeronaves esta a prueba en este caso se conoce s=2
cm/seg, se desea probar si la media m es de 50 cm/seg. Se selecciona una muestra aleatoria de tamaño
n=25, obteniendo =51.3 cm/seg. Se especifica un nivel de significancia a=0.05 ¿A qué conclusiones se
debe llegar?
Solución :
1) Hipótesis
H0: m = 50 cm/seg _
H1: m 50 cm/seg
2)Nivel de significancia. a = 0.05
3) Estadístico de prueba
__
Z X μ0
σ/ N
51.3 50
4)Calculo del estadístico Z
2/ 25
3.25
5) Decisión: como z = 3.25 > 1.96, se rechaza H0: m = 50 cm/seg con un nivel de significancia a = 0.05
6) Se concluye que en base a una muestra de 25 mediciones la rapidez promedio de combustión es
UMSNH -
Valores P
En el caso de la distribución normal para la prueba sobre la media es fácil calcular el
valor P. Si z0 fue el valor calculado del estadístico de prueba, entonces:
2 [ 1- F(|z0|) ] Prueba de dos colas: H0:m=m0, H1:m m0
P= 1- F(z0) Prueba de cola superior: H0:m=m0, H1:m > m0
F(z0) Prueba de cola inferior: H0:m=m0, H1:m < m0
Donde F(z) = P(Zz) (Función de distribución normal N(0,1))
Para el ejemplo z0= 3.25, entonces P=2(1-F(3.25))=0.0012. Es decir, H0
será rechazada con cualquier nivel de significancia a 0.0012
Prueba de hipótesis sobre la proporción : P
I. Hipótesis:
A. H0: P=P0 B. H0: P≥ P0 C. Ho: P≤ P0
H 1: P ≠ P 0 H1: P< P0 H1: P> P0
II. Usar el estadístico de prueba Z
III. Región critica
A. B. C,
RA RA RA
RR RR RR
RR
-za/2 z1-α/2 -za z1-α
Ejemplo,
Janet et al en 1991, en un articulo científico se explicaba la
asociación existente entre el embarazo tubo ovárico y las
duchas vaginales. A partir de la evidencia previa, ella y su equipo
sostienen que el riesgo de embarazo tubo ovárico es mayor en
mujeres que practica dos o más duchas vaginales por año, que
entre las que no lo hacen.
Hipótesis:
H0: “el riesgo es el mismo” --- P1=P2
•H1: “los riesgos son diferentes” --- P1≠P2
Análisis de varianza: ANOVA
• El análisis de varianza es una técnica que se puede utilizar para
decidir si las medias de dos o más poblaciones no son iguales.
• El análisis de varianza sirven para determinar si las diferencias entre
las medias muestrales revelan las verdaderas diferencias entre los
valores medios de cada una de las poblaciones.
Análisis con un factor de variación
•Se tienen p poblaciones independientes de las que se extraen p muestras aleatorias
de tamaños no necesariamente iguales y representados por n1, n2, . . . , np.
•En el análisis de varianza se emplea normalmente el término tratamiento para
hablar de la característica que diferencia a las p poblaciones.
Ejemplo, (tratamientos)
•Dosis de abono (en agricultura),
• Diferentes Medicamentos(en medicina)
Los valores de la variable aleatoria obtenidos en el muestreo se
pueden representar entonces en una tabla de la siguiente forma:
Para poder aplicar correctamente el análisis de varianza es
necesario que las p poblaciones de partida cumplan las
siguientes condiciones:
• Las p poblaciones de partida han de seguir una
distribución normal.
• La varianza poblacional σ2 de las p poblaciones ha de ser
la misma.
• Las p muestras han de ser elegidas aleatoriamente.
Hipótesis del ANOVA
Se trata de probar si los efectos producidos por los
tratamientos son significativamente diferentes entre si o no
Fuentes de variaciones
a) Variación dentro de los tratamientos (VDT),
•Es decir variaciones entre los elementos de cada columna. Estas variaciones
se suponen debidas al azar, es decir intrínsecas al proceso aleatorio de
elección de la muestra.
b) Variación entre los tratamientos (VET)
•Estas serán debidas, por una parte a efectos aleatorios, y podrán incluir
posibles variaciones sistemáticas entre las medias poblacionales de cada
tratamiento.
c)Varianza Total (VT):
Tabla ANOVA
ME, llamado cuadrado medio del azar, ya que representa la varianza esperada
únicamente por los efectos aleatorios
MT, llamado cuadrado medio de los tratamientos, representando la varianza
esperada tanto por efectos aleatorios como por posibles diferencias entre las medias
de cada tratamiento.