INFERENCIA ESTADÍSTICA
• Licenciatura en Enfermería
Ing. Sergio Fonteñez
I N F E R E NC I A E S TA D Í S T I CA
Conjunto de métodos que permiten
determinar algún aspecto de una
población a partir de los datos de una
muestra.
I N F E R E NC I A E S TA D Í S T I CA
?
POBLACIÓN
(situación general)
MUESTRA
(situación
Pero…¿será así? particular)
La inferencia trae aparejada
incertidumbre
I N F E R E NC I A E S TA D Í S T I CA
¿Qué tan confiables son las generalizaciones?
Si los resultados de una muestra se pueden relacionar con
algún modelo probabilístico medir la incertidumbre en
términos de probabilidad
¿Cuánto error podemos cometer al decidir?
¿Cuánta confianza depositamos en nuestras decisiones?
I N F E R E NC I A E S TA D Í S T I CA
Que tipos de inferencia podemos hacer:
Estimar cuál es el porcentaje de deserción en las
carreras de la UNSa
Probar si la variable peso de niños al nacer tiene
una distribución aproximadamente normal
Probar si el número de hijos que tiene una mujer
depende de la edad
Probar si el porcentaje de hombres es la misma en
dos poblaciones de pacientes
I N F E R E NC I A E S TA D Í S T I CA
Estimar
Dos parámetros
propósitos Probar
hipótesis
E S T I M AC I Ó N D E PA R Á M E T RO S
Estimar consiste en calcular medidas descriptivas que
representen a los parámetros desconocidos utilizando los
datos de una muestra.
ESTIMACIÓN
PUNTUAL
Dos tipos de
estimación
ESTIMACIÓN
POR INTERVALO
DE CONFIANZA
E S T I M AC I Ó N D E PA R Á M E T RO S
ESTIMACIÓN PUNTUAL
Asigna un valor numérico único al parámetro
No tiene asociado una medida de la incertidumbre
ESTIMACIÓN POR INTERVALOS DE CONFIANZA
Encuentra dos valores numéricos que limitan un
intervalo que puede contener al parámetro
Tiene asociado un grado de incertidumbre
E S T I M AC I Ó N D E PA R Á M E T RO S
Quiero conocer la edad promedio de la población de los
estudiantes de la UNSa
Tomo una muestra al azar
calculo media muestral = 21 años
ESTIMACIÓN PUNTUAL
= 21 años
ESTIMACIÓN POR INTERVALO DE CONFIANZA
P (19.5 < < 22.5) = 0.90
E S T I M AC I Ó N P U N T UA L
La estimación puntual estimadores o estadísticos
regla para calcular la estimación del
parámetro a partir de los datos de la muestra
función de las observaciones muestrales = fórmula
Ejemplo: x
x i
n
E S T I M AC I Ó N P U N T UA L
Estimador Parámetro
ˆ
x , Me
p
x
S
E S T I M AC I Ó N P U N T UA L
Población
X: longitud
= 162 cm
= 2,8 cm
estimación de
X 1 = 164 cm
= 164 cm
E S T I M AC I Ó N P U N T UA L
Población
X: longitud
= 162 cm
= 2,8 cm
estimación de
X 1 = 159 cm
= 159 cm
E S T I M AC I Ó N P U N T UA L
Población
X: longitud
= 162 cm
= 2,8 cm
estimación de
X 1 = 161 cm
= 161 cm
E S T I M AC I Ó N P U N T UA L
Estimar es como tirar la blanco BLANCO = PARÁMETRO
TIROS = ESTIMACIÓN
= 161 cm
= 159 cm
= 160 cm
= 164 cm
= 159 cm
= 162 cm
E S T I M AC I Ó N P U N T UA L
Estimar es como tirar la blanco BLANCO = PARÁMETRO
TIROS = ESTIMACIÓN
habrá buenos y malos tiradores
E S T I M AC I Ó N P U N T UA L
Los estimadores son números que varían
podemos construir una distribución de frecuencias
¿Cómo se distribuyen alrededor del parámetro?
Propiedades de un buen estimador
E S T I M AC I Ó N P U N T UA L
Propiedades de un buen estimador
INSESGABILIDAD
EFICIENCIA
CONSISTENCIA
SUFICIENCIA
DISTRIBUCIÓN ASINTÓTICAMENTE NORMAL
Propiedades de un buen estimador
INSESGABILIDAD
El valor esperado del estimador es igual al parámetro
E( ˆ ) =
Si por el contrario E( ˆ ) = + k
k es la magnitud del sesgo
0.28 0.28
0.21 0.21
0.14 0.14
0.07 0.07
0.00 0.00
4 5 6 7 8 10 11 12 13 14 15 4 5 7 8 9 11 12 13 14 16 17
valores del estimador valores del estimador
Propiedades de un buen estimador
INSESGABILIDAD
El valor esperado del estimador es igual al parámetro
E( ˆ ) =
Es mejor el tirador que hace tiros centrados el blanco
insesgado sesgado
Propiedades de un buen estimador
EFICIENCIA
Si E (ˆ 1) = E( ˆ 2) = (estimadores insesgados)
y si V(ˆ 1) < V(ˆ 2)
entonces ˆ 1 es más eficiente que ˆ 2
Distribución de ˆ 1
0.40
0.30
0.20 Distribución de ˆ 2
0.10
0.00
-5.00 -2.50 0.00 2.50 5.00
Propiedades de un buen estimador
EFICIENCIA
Entre dos estimadores insesgados es más eficiente el que
tiene menor varianza
eficiencia precisión
más preciso menos preciso
Propiedades de un buen estimador
CONSISTENCIA
Cuando se concentra en una zona más estrecha alrededor del
parámetro a medida que aumenta n.
Cuando tiene menor error de estimación a medida que aumenta n.
error de estimación = (estimador menos parámetro) 𝛆 −𝜽
= 𝜽
n su sesgo y su varianza 0
Propiedades de un buen estimador
SUFICIENCIA
Cuando el estimador usa toda la información que la muestra
contiene para estimar al parámetro de interés.
Cuando no existe otro estimador que pueda dar más información
acerca del parámetro.
Ejemplo: la media tiene más información que la mediana
Propiedades de un buen estimador
DISTRIBUCIÓN ASINTÓTICAMENTE NORMAL
Se dice que un estimador es asintóticamente normal si,
además de ser insesgado y consistente, tiene distribución
normal al aumentar el tamaño de la muestra.
P R E C I S I Ó N D E L E S T I M A D O R P U N T UA L
se mide por el error estándar = error típico = ˆ
menor es el error típico más precisa es la estimación
2 2
ˆ E ˆ E (ˆ) E ˆ
si es un estimador insesgado
Al calcular un estimador puntual, siempre acompañar la
estimación con una medida de su error estándar.
E s t i m a c i ó n p o r I N T E RVA L O D E C O N F I A N Z A
A partir de la estimación puntual se construye un intervalo
con límites (a;b), tal que:
P(a b) = (1- )
límite inferior límite superior
El intervalo (a;b) tiene una probabilidad (1 - ) de
contener al parámetro estimado
(1 - ) = coeficiente de confianza = nivel de confianza
E s t i m a c i ó n p o r I N T E RVA L O D E C O N F I A N Z A
2 De cada muestra
POBLACIÓN puedo calcular el
estimador que va
3
a variar
... 5 variable
distribución muestral
I n t e r va l o d e c o n f i a n z a p a ra l a
M E D I A P O B L AC I O NA L
La media muestral es una variable con distribución
aproximadamente normal
Sus parámetros son y x
n
Densidad
.
I n t e r va l o d e c o n f i a n z a p a ra l a
M E D I A P O B L AC I O NA L
Queremos definir un intervalo de valores de que contenga un
área determinada de la curva = (1 – α)
Función de densidad
Normal (0,1): p(evento)=0,9500
0,40
0,30
Densidad
0,20
0,10
0,00
-5,00 -2,50 0,00 2,50 5,00
Variable
1) qué valor corresponde a esa área en la distribución Z
2) des-estandarizamos a Z /2
I n t e r va l o d e c o n f i a n z a p a ra l a
M E D I A P O B L AC I O NA L
Queremos definir un intervalo de valores de que contenga un área
Función de densidad
Normal (0,1): p(evento)=0,9500
0,40
determinada de la curva = (1 – α) 0,30
Densidad
0,20
0,10
0,00
-5,00 -2,50 0,00 2,50 5,00
Variable
1) qué valor corresponde a esa área en la distribución Z
Zα/2 al valor de la distribución Z que separa esa área
Ejemplo: si (1 - α) = 0,95 α/2 = 0,025
Z0,025 = 1,96
I n t e r va l o d e c o n f i a n z a p a ra l a
M E D I A P O B L AC I O NA L
Queremos definir un intervalo de valores de que contenga un área
determinada de la curva (1 – α)
1) qué valor corresponde a esa área en la distribución Z
Función de densidad
Normal (0,1): p(evento)=0,9500
0,40
0,30
Densidad
0,20
0,10
0,00
-5,00 -2,50 0,00 2,50 5,00
Variable
- 1,96 1,96
2) des-estandarizamos a Z /2
x
Z x Z . x
2 x 2
I n t e r va l o d e c o n f i a n z a p a ra l a
M E D I A P O B L AC I O NA L
x
Z x Z . x Función de densidad
x
Normal(0,1): p(evento)=0,9500
0,40
2 2
0,30
Densidad
0,20
0,10
0,00
-5,00 -2,50 0,00 2,50 5,00
Variable
límite inferior límite superior
P ( - 1,96 . x + 1,96 . x ) = 0,95
I n t e r va l o d e c o n f i a n z a p a ra l a
M E D I A P O B L AC I O NA L
Si de una población saco una muestra y calculo x
a partir de cada estimación
intervalo de confianza
repetimos el cálculo para cada muestra
posible de tamaño n
el 95% de esos intervalos tendrán centros que caen
dentro del intervalo 1.96
cada uno de esos intervalos contendrá al valor
- cada segmento representa un intervalo de confianza
-los segmentos rojos no incluyen a (5%)
-los segmentos negros si incluyen a (95%)
I n t e r va l o d e c o n f i a n z a p a ra l a
M E D I A P O B L AC I O NA L
P( x - z /2 . x x + z /2 . x ) = 1 -
INTERPRETACIÓN
La probabilidad de que el intervalo contenga al
parámetro estimado es (1 - )
I n t e r va l o d e c o n f i a n z a p a ra l a
M E D I A P O B L AC I O NA L
P( x - z /2 . x x + z /2 . x ) = 1 -
El error típico de la media se calculará de acuerdo al caso:
- Si conocemos la varianza poblacional 2
población infinita: x
n
2 ( N n)
población finita (aplicando el FCPF): x
n ( N 1)
I n t e r va l o d e c o n f i a n z a p a ra l a
M E D I A P O B L AC I O NA L
P( x - z /2 . x x + z /2 . x ) = 1 -
El error típico de la media se calculará de acuerdo al caso:
- Si no conocemos la varianza poblacional 2 usamos su estimador S
población infinita: S
x
n
población finita: S 2 ( N n)
x
n ( N 1)
I n t e r va l o d e c o n f i a n z a G E N E R A L
P ( k . k . ) 1
: nivel de significación
k : multiplicador de confianza (depende de la distribución
que tiene ˆ )
ˆ - k . ˆ : es el límite inferior del intervalo
ˆ - k . ˆ : es el límite superior del intervalo
ˆ : es el error típico del estimador
P R E C I S I Ó N D E L N T E RVA L O D E
CONFIANZA
Precisión = Ls - Li
ES MÁS PRECISO SI:
es menos amplio
el tamaño de la muestra es mayor
la desviación estándar de la variable es menor
el coeficiente de confianza es menor
I n t e r va l o d e c o n f i a n z a p a ra l a
M E D I A P O B L AC I O NA L
Ejemplo 1:
Un centro de salud realiza un estudio para evaluar cual es el peso
promedio de los pacientes mayores de 50 años con trastornos
alimenticios, para ello seleccionó una muestra al azar de 36 pacientes.
Al momento de analizar los datos obtienen un promedio de 90 kg, con
una desviación típica de 12 kg.
a) Calcular el intervalo de confianza del 95% para el peso promedio de
los pacientes.
b) Calcular el intervalo de confianza del 99% para el peso medio de los
pacientes.
c) Calcular el intervalo de confianza del 95% utilizando los mismos
datos pero suponiendo que provienen de una muestra de 50 pacientes.
I n t e r va l o d e c o n f i a n z a p a ra l a
M E D I A P O B L AC I O NA L
Datos: = 90 kg S = 12 kg n = 36 x = 12 / 36 = 2 kg
a) Calcular el intervalo de confianza del 95% para el peso
promedio de los pacientes.
P( x - z (/2) x x + z (/2) ) = 1 -
x
P (90 - 1,96 . (12 / 36 90 + 1,96 . 2) = 0,95
P (90 - 3,92 90 + 3,92) = 0,95
P (86,08 93,92) = 0,95
86,08; 93,92 95%
Precisión = 93,92 - 86,08 = 7,844
I n t e r va l o d e c o n f i a n z a p a ra l a
M E D I A P O B L AC I O NA L
b) Calcular el intervalo de confianza del 99% para el peso
medio de los pacientes.
P (90 - 2,58 . 12 / 36 90 + 2,58 . 2) = 0,99
P (90 - 5,16 90 + 5,16) = 0,99
84,84; 95,16 99%
Precisión = 95,16 - 84,84 = 10,32
I n t e r va l o d e c o n f i a n z a p a ra l a
M E D I A P O B L AC I O NA L
c) Calcular el intervalo de confianza del 95% utilizando los
mismos datos pero suponiendo que provienen de una
muestra de 50 pacientes.
P (90 - 1,96 . (12 / 50 90 + 1,96 . 1,70) = 0,95
P (90 - 3,33 90 + 3,33) = 0,95
86,67; 93,33 95%
Precisión = 93,33 - 86,67 = 6,66
I n t e r va l o d e c o n f i a n z a p a ra l a
M E D I A P O B L AC I O NA L
a) 86,08; 93,92 95%
Precisión = 93,92 - 86,08 = 7,84
b) 84,84; 95,16 99%
a) es más Precisión = 95,16 - 84,84 = 10,32
preciso que c) es más
b) porque la preciso que
confianza es c) 86,67; 93,33 95% a) porque n
menor es mayor
Precisión = 93,33 - 86,67 = 6,66
a
b
c
Kg de rendimiento
I n t e r va l o d e c o n f i a n z a p a r a l a
P RO P O RC I Ó N P O B L AC I O NA L
p tiene distribución aproximadamente normal si n es grande,
los parámetros de esta distribución son:
(1 )
( p) ...... p
E(p)E=
n
I de C para
P ( p - Z (/2) p p + Z (/2) p) = 1-
I n t e r va l o d e c o n f i a n z a p a r a l a
P RO P O RC I Ó N P O B L AC I O NA L
Ejemplo 2:
Para establecer el porcentaje de mujeres que fueron atendidas por hipertensión, un centro de salud
tomó una muestra de 120 personas. Una vez concluida la recolección de la información, obtuvo un
valor de 83% de los pacientes fueron mujeres. Construya el intervalo de confianza del 95% para el
porcentaje de mujeres.
p(1 p) 0,83.0,17
p 0,0343
n 120
P (p - z (/2) p p + z (/2) p ) = 1 -
P (0,83 - 1,96 . 0,0343 0,83 + 1,96 .0,0343) = 0,95
P (0,83 - 0,067 0,83 + 0,067) = 0,95
0,763; 0,897 95%
BIBLIOGRAFÍA
ARMITAGE, P, BERRY G.(1997). Estadística para la investigación biomédica. Ed.
Doyma, 3ra. Edición. España.
MARTINEZ GONZALEZ M. A., SANCHEZ VILLEGAS A., FAULIN FAJARDO
J. (2006) Bioestadística Amigable. Ed. Díaz de Santos. 2ª Edición. España.
MILTON J. Susan. (2007) Estadística para la Biología y Ciencias de la Salud. Mc
Graw Hill-Interamericana. 3ª Edición ampliada. España.
POLIT D. F., HUNGLER B. P. (2000) Investigación Científica en Ciencias de la
Salud.. Ed. Mc Graw Hill. 6ª Ed. México.
SENTIS, J.ET AL. Manual de Bioestadística (2009). 3ra. Ed. Reimpresa. Masson
S.A. España.
STEEL R. G. D., TORRIE J. H. (1986). Bioestadística: Principios y Procedimientos.
Mc Graw-Hill de México S. A.
Di Rienzo J.A., CasanovesF., Gonzalez L., Tablada M., Robledo C.W., Balzarini
M.G. 2005. Estadística para las Ciencias Agropecuarias. Editorial Brujas.