La Inferencia Estadística esta basada en la estimación.
La estimación sirve para hacer inferencias de las características de las
2 poblaciones a partir de la información obtenidas por las muestras.
Tipos de estimaciones
Estimación puntual cuando se utiliza un solo número que se utiliza para estimar
un parámetro de una población desconocida.
Estimación por intervalo cuando existe un rango de valores que se utiliza para
estimar un parámetro de la población.
Estimación Puntual y por Estimador y estimaciones
Un estimador es un estadístico de la muestra utilizado para estimar un parámetro
Intervalos poblacional.
Una estimación es un valor específico observado de un estadístico.
Ejemplo:
La media de la muestra puede ser un estimador de la media población .
La proporción de la muestra puede ser el estimador de la proporción de la
población.
Mónica Mite León FCMF- VIFAP
Criterios para seleccionar un estimador
3 4 Estimación puntual de población
Insesgado: la media de la muestra es un estimador no sesgado
de una media de la población cuando la media de la La media de la muestra es el mejor estimador de la
distribución muestral tomadas de la misma población es igual a la media de la población . Debido que cumple los
media de la población. cuatro criterios.
Eficiencia se refiere al tamaño del error estándar del estadístico.
Consistencia. Una estadística es un estimador consistente de un
parámetro de población si al aumentar el tamaño de la muestra,
se tiene casi la certeza de que el valor de la estadística se La varianza y la desviación estándar de la población
aproxima bastante al valor del parámetro poblacional.
Suficiencia. Un estimador es suficiente si utiliza tanta información
de la muestra que ningún otro estimador puede extraer
Proporción de la población, es el estimador de p
información adicional acerca del parámetro de población que
se esta estimando.
Mónica Mite León FCMF- VIFAP Mónica Mite León FCMF- VIFAP
Estimación por intervalo
5 6
Un estimador de intervalo es una regla para calcular dos
números, por ejemplo, a y b, para crear un intervalo que
contiene el parámetro de interés.
Medimos esta probabilidad usando el coeficiente de
confianza, designado por
El área total bajo la curva es 1, el área restante en las dos colas es y cada cola
contiene un área /2.
El área entre - z /2 y z /2 es el coeficiente de confianza (1 - ).
Genera dos valores: limite inferior de confianza (LCL) y limite superior de confianza
(UCL)
Mónica Mite León FCMF- VIFAP Mónica Mite León FCMF- VIFAP
Intervalo de confianza para la media de una
7 Interpretación del Intervalo de Confianza 8
Decir que el intervalo de confianza es del 95%, nos indica
que el valor de la media poblacional se encuentra en Con media Cero y desviación estándar
ese intervalo.
La confianza en el intervalo estimado proviene del Los cuantiles de la distribución es:
hecho que cuando se calculan intervalos repetidos, 95%
de estos intervalos contendrán a la media poblacional.
Cuanto más angosto es un intervalo, más exactamente
se habrá localizado el parámetro estimado
Para aumentar la confianza sin aumentar el ancho del
intervalo es necesario aumentar el tamaño muestral, n. El intervalo de confianza calculado es:
Mónica Mite León FCMF- VIFAP Mónica Mite León FCMF- VIFAP
Intervalo de confianza para la media de una
9 10
Ejemplos
Si no es conocida, puede aproximarse a la desviación estándar
Ejercicio 1 de la muestra s, cuando el tamaño de la muestra sea grande.
. De una cierta población se ha extraído una
muestra de 64 individuos, cuyo valor medio es
1012. Se sabe por otras experiencias del mismo Ejercicio 2
tipo, que la desviación típica vale 25. Hallar Un científico interesado en vigilar contaminantes químicos en
alimentos y, por lo tanto, la acumulación de contaminantes en la
intervalos de confianza para el valor medio de dieta humana seleccionó una muestra aleatoria de n = 50 adultos
la población a los niveles de confianza del 0.95 hombres. Se encontró que el promedio de ingesta diaria de
productos lácteos fué de = 756 gramos por día, con una
y 0.99. desviación estándar de s =35 gramos por día. Use esta información
muestral para construir un intervalo de confianza de 95% para la
ingesta diaria media de productos lácteos para hombres.
Mónica Mite León FCMF- VIFAP Mónica Mite León FCMF- VIFAP
Intervalo de confianza para la media en una
11 12 La función de R [Link] calcula intervalos de confianza:
[Link](x, [Link] = 0.95). Los cuantiles en la distribución qt(p, df, ncp,
Distribución T-student [Link] = T)
Para calcular un intervalo de confianza, en este caso, partimos Existe una distribución t para cada tamaño de la muestra, por lo que
de la variable aleatoria, que sigue una distribución t de Student
con n-1 grados de libertad. Los grados de libertad son el numero de valores elegidos libremente.
Ejercicio 3
En una muestra de 9 preparados de jugo de tomate se ha obtenido
una media de 21 mg/100 cc y una desviación típica de 2.45 mg/100
cc. Supuesto que el contenido de vitamina C del jugo de tomate se
distribuye según una distribución Normal de varianza desconocida. Se
pide:
El intervalo de confianza que buscamos es: a) Estimar el contenido medio de vitamina C del jugo de tomate
b) Calcular el intervalo de confianza al 98 %
Mónica Mite León FCMF- VIFAP Mónica Mite León FCMF- VIFAP
Intervalo de confianza para la proporción
13 14 Dada una variable
Ejercicio 4 determinar un intervalo de confianza para el parámetro
Determinar el intervalo de confianza al 99% para el tiempo una muestra aleatoria X1, X2 Xn de tamaño n de de dicha distribución.
medio requerido para desarrollar una prueba de Sea p la proporción muestral. Entonces, se sabe que el estadístico
aleatoria X con distribución de probabilidad binomial de parámetros n y
estadística. Para ello se eligió una muestra aleatoria de 16
estudiantes, la que produce una media de 13 y una
desviación estándar de 5.6 minutos.
El intervalo de confianza para la proporción consiste en obtener los cuantiles
Ejercicio 5 de la distribución normal tales que:
El contenido de siete contenedores similares de ácido
sulfúrico son 9.8, 10.2, 10.4,9.8, 10.0, 10.2 y 9.6 litros.
Encuentre un intervalo de confianza del 95% para la media
de todos los contenedores si se supone una distribución
El intervalo de confianza es
aproximadamente normal.
Mónica Mite León FCMF- VIFAP Mónica Mite León FCMF- VIFAP
Intervalo de confianza para la diferencia de medias en
La función que calcula este intervalo de confianza en R es [Link].
15
Sus argumentos son los siguientes: [Link](x, n, [Link] = 0.95)
16 dos poblaciones normales independientes
Donde
x: Valor numérico que indica el número de elementos del grupo que Sean las medias de dos muestras aleatorias de
presentan la característica de interés. tamaño (n1 y n2) de dos poblaciones X1 y X2, con medias
n: Valor numérico que indica el número total de elementos del grupo. poblacionales y y varianzas
[Link]: Valor numérico que indica el nivel de confianza, en tanto por
uno, al que se construirá el intervalo. Si omitimos este parámetro en la
llamada a la función, los intervalos de confianza se calculan a un nivel de
confianza del 95%.
La distribución muestral de diferencias de medias es
Ejercicio 6
aproximadamente una distribución normal
En una muestra de 900 personas con pelo oscuro se encontró que 150 con Variable aleatoria Z N(0,1)
de ellas tenían los ojos azules. Construir un intervalo de confianza al 95%
para la proporción de individuos que teniendo el pelo oscuro posee los
ajos azules. ¿Son compatibles estos resultados con la suposición de
que dicha proporción vale 1/4?
Mónica Mite León FCMF- VIFAP Mónica Mite León FCMF- VIFAP
Distribución F
En R, la función [Link] se encarga de calcular este intervalo. Sus parámetros
17 Previo al cálculo de este intervalo, debemos determinar si las 18 son los siguientes:
varianzas de ambas distribuciones aun siendo desconocidas, [Link](x, y, [Link] = 0.95)
pueden asumirse iguales o no.
Siendo:
Para decidir si las varianzas de las dos distribuciones pueden
x : Vector numérico con los datos de la variable de interés en el primer grupo o
asumirse iguales o no, construimos un intervalo de confianza para muestra
el cociente de ambos valores, esto es, para 21 22
y : Vector numérico con los datos de la variable de interés en el segundo grupo o
muestra
[Link]: Valor numérico que indica el nivel de confianza, en tanto por uno, al
La variable aleatoria que sigue una distribución F de Snedecor que se construirá el intervalo. Si omitimos este parámetro en la llamada a la
con n1-1 grados de libertad en el numerador y n2 1 grados de función, los intervalos de confianza se calculan a un nivel de confianza del 95%.
libertad en el denominador. Los valores S21 y S22, son las varianzas Una vez calculado el intervalo de confianza, si el valor 1 está incluido en dicho
de las muestras. intervalo, podremos afirmar que las varianzas de ambas distribuciones pueden
considerarse iguales. Si el 1 queda fuera del intervalo obtenido, las varianzas
de las dos distribuciones se considerarán diferentes.
Mónica Mite León FCMF- VIFAP Mónica Mite León FCMF- VIFAP
a) Si las varianzas son desconocidas pero supuestos iguales, se
19 20 parte de la variable aleatoria
Ejercicio 7
La siguiente tabla proporciona datos sobre la precipitación total
registrada en 11 estaciones meteorológicas de dos provincias.
Suponiendo independencia y normalidad. Calcular un intervalo
de confianza a un nivel de confianza del 80% para el cociente Se distribuye según una t de Student con n1+n2-2 grados de libertad.
de varianzas en ambas poblaciones. ¿Puede asumirse que
ambas varianzas son iguales? Obtención del cuantil.
ProvA 100 89 84 120 130 105 60 70 90 108 130
ProvB 120 115 96 115 140 120 75 90 108 130 135
Mónica Mite León FCMF- VIFAP Mónica Mite León FCMF- VIFAP
Intervalo de confianza para diferencias de medias
21 22 b) Si las varianzas de las poblaciones son desconocidas y, además, distintas y
(varianzas iguales) tamaños muestras grandes, se sigue un procedimiento similar al que
acabamos de describir en el caso de igualdad de varianzas para la
obtención del intervalo de confianza, partiendo de una variable aleatoria.
El intervalo de confianza
Mónica Mite León FCMF- VIFAP Mónica Mite León FCMF- VIFAP
En R, la función [Link] proporcionar intervalos de confianza para la diferencia
23 de medias, tanto si las varianzas de la variable son iguales en los dos grupos 24
como si no. Los parámetros de [Link] presentan algunos cambios cuando la
función se utiliza en un contexto de dos poblaciones:
Ejercicio 8
[Link] (x, y, [Link] = FALSE, [Link] = 0.95) En vista de los resultados obtenidos en el ejercicio 7, y
En este caso: suponiendo que las precipitaciones registradas en 11
x: Vector numérico que incluye los valores de la variable de interés en el
primer grupo o muestra estaciones meteorológicas de dos provincias se
y: Vector numérico que incluye los datos de la variable de interés en el distribuyen de acuerdo a variables normales de
segundo grupo o muestra
medias y varianzas desconocidas. Obtener un
[Link]: Es un argumento lógico que indica si las varianzas de la variable
en los dos grupos o muestras puede suponerse igual o no. Para establecer el intervalo de confianza al 80% para la diferencia del
valor de este parámetro nos basamos en la interpretación del intervalo de
confianza que proporciona la función [Link]. Por defecto, la función número medio de precipitaciones entre las dos
considera que las varianzas en los dos grupos son distintas. provincias. ¿Puede suponerse que el número medio
La interpretación del intervalo de confianza resultante permitirá determinar si de precipitaciones de las dos provincias es igual?
las medias poblacionales de las dos distribuciones pueden suponerse iguales o
no. Así, si el intervalo contiene al valor 0, dichas medias podrán asumirse
iguales. En cualquier otro caso, concluiremos que las medias son distintas en
ambas distribuciones. FCMF- VIFAP
Mónica Mite León Mónica Mite León FCMF- VIFAP
Intervalo de confianza para la diferencia de medias Intervalo de confianza para la diferencia de dos
25 en dos poblaciones normales relacionadas 26 proporciones
Consideremos dos muestras aleatorias X1, X2 Xn e Y1, Y2 Yn de
Sean X1, X2 Xn e Y1, Y2 Yn dos muestras aleatorias de tamaño n y tamaño n1 y n2, independientes entre sí, extraídas de poblaciones con
relacionadas o o apareadas, de tal forma que la primera procede de una
distribuciones binomiales B(1, 1) y B(1, 2), respectivamente.
1, 1 2 2) .
El intervalo de confianza para la diferencia de proporciones:
Se usa la función [Link] para la obtención de intervalos de confianza, pero se ha
de indicar que los datos que reciben como parámetros provienen de muestras
relacionadas incluyendo en la llamada a la función el argumento
lógico paired, cuyo valor debe establecerse a TRUE.
Ejercicio 9
p1 y p2 son las proporciones de individuos que presentan la característica de
Se desea comprobar el efecto de un fertilizante sobre la producción de los interés en la primera y la segunda muestra, respectivamente.
árboles frutales. Para ello se seleccionan aleatoriamente un grupo de 10 árboles y
Obtención del cuantil
se toman los datos de la producción antes y después de tratar a los árboles con el
fertilizante. Obtener un intervalo de confianza al 99% de confianza para la
diferencia de medias de la producción antes y después.
ANTES 25 20 25 28 30 30 26 15 18 22
Mónica Mite León DESPUES 30
FCMF- VIFAP 25 28 29 30 31 24 22 25 27 Mónica Mite León FCMF- VIFAP
Intervalo de confianza Ejercicio 10
Se realiza un estudio sobre en un grupo de personas de las que se les anota el
27 28 número de Km en una caminata, el sexo y si hacen o no deporte. Para realizar
dicho estudio se toma una muestra de 55 personas. Calcular un intervalo de
confianza al 92% para la diferencia entre la proporción de hombres y de mujeres
que practican deporte ¿Puede considerarse que ambas proporciones son
R utiliza de la función [Link] iguales? Los datos correspondientes están en el fichero [Link]
[Link](x, n, [Link] = 0.95) Ejercicio 11
donde: La concentración media de dióxido de carbono en el aire en una cierta zona no
es habitualmente mayor que 335 ppmv (partes por millón en volumen).
x: Vector de dimensión 2 que indica el número de elementos en cada grupo que presentan Se sospecha que esta concentración es mayor en la capa de aire más próxima
la característica de interés. a la superficie. Se ha analizado el aire en 20 puntos elegidos aleatoriamente a
una misma altura cerca del suelo, resultando los siguientes datos: 332, 320, 312,
n: Vector numérico de dimensión 2 que indica el número total de elementos del grupo. 270, 330, 354, 356, 310, 341, 313, 223, 224, 305, 321, 325, 333, 332, 345, 312, 331.
[Link]: Valor numérico que indica el nivel de confianza, en tanto por uno, al que se Construir un intervalo de confianza al 95% y 98% de confianza:
construirá el intervalo. Si omitimos este parámetro en la llamada a la función, los intervalos a) Si la concentración de dióxido de carbono se distribuye según una Normal
de confianza se calculan a un nivel de confianza del 95%. de desviación típica ppmv
Si el intervalo de confianza resultante incluye al 0 entre sus posibles valores, la diferencia b) Si la concentración de dióxido de carbono se distribuye según una Normal
entre ambas proporciones poblaciones podrá considerarse nula lo que equivale a decir de desviación típica desconocida.
que ambas proporciones son iguales.
Mónica Mite León FCMF- VIFAP Mónica Mite León FCMF- VIFAP
Ejercicio 12
Ejercicio 14
Con el fin de estudiar el efecto de los rayos X sobre la viabilidad huevo-larva en
29 Tribolium casteneum, se irradiaron 1000 huevos de los que resultaron 572 larvas. 30 Unos estudios sobre las ranas tigres en dos regiones de Méjico tienen como
Calcular un intervalo de confianza para la proporción de larvas en huevos objetivo comparar las proporciones de dichas ranas en cada una de las
irradiados al nivel de confianza del 95%. regiones. Para ello se toma una muestra al azar de 100 ranas observando que
5 son ranas tigres en la zona A, mientras que de una muestra de 150 ranas en
Ejercicio 13 la zona B, 9 son ranas tigres. Construir un intervalo de confianza al 95% y al
98% para la diferencia entre las verdaderas proporciones de ranas tigres en
Para realizar un estudio de la concentración de una hormona en una solución las dos regiones. ¿Puede suponerse que la proporción de ranas tigres es igual
vamos a utilizar dos métodos. Disponemos de 10 dosis preparadas en el en ambas regiones?
laboratorio y medimos la concentración de cada una con los dos métodos. Se
obtienen los siguientes resultados: Ejercicio 15
Para estudiar la audiencia de un programa de televisión, se ha medido el
Suponiendo normalidad e independencia. Se pide: número de personas que ven el programa en diferentes días. Los datos del
a) Calcular un intervalo de confianza al nivel 0.9 para el cociente de varianzas número de personas (en miles) son los siguientes: 521, 742, 593, 635, 788, 717,
606, 639, 666, 624. Suponiendo normalidad. Se pide:
b) Calcular un intervalo de confianza al nivel 0.9 para la diferencia de
concentraciones medias. a) Obtener estimaciones puntuales de la audiencia media y de la varianza
Dosis 1 2 3 4 5 6 7 8 9 10 b) Construir un intervalo de confianza al 98% para la audiencia media
Método A 10.7 11.2 15.3 14.9 13.9 15.0 15.6 15.7 14.3 10.8 .
Método B 11.1 11.4 15.0 15.1 14.3 15.4 15.4 16.0 14.3 11.2
Mónica Mite León FCMF- VIFAP Mónica Mite León FCMF- VIFAP
Ejercicio 16
31 Se diseñó un programa de ejercicios regulares, moderadamente activos, para
someter a individuos que habían sufrido previamente un infarto, para
comprobar si el programa podría beneficiar a estos pacientes. Se eligieron al
azar once individuos que habían sufrido previamente un infarto. A estos
individuos se les determinó, antes de empezar el programa, la capacidad de
trabajo de cada uno midiendo el tiempo que tardó en alcanzar una
frecuencia de 160 latidos por minuto mientras caminaba sobre una cinta sin
fin. Después de 25 semanas de ejercicio controlado, se repitieron las medidas
a los mismos individuos en la cinta sin fin y se registró el tiempo para cada
sujeto. En la siguiente tabla se muestra el tiempo que tarda cada individuo
antes y después del experimento
Obtener un intervalo de confianza al 98% para la diferencia de los tiempos
medios que tardan los sujetos sobre la cinta sin fin antes y después del
experimento.
Mónica Mite León FCMF- VIFAP