ESTADÍSTICA PARA INGENIERÍA
Clase 3: Introducción a la inferencia estadística
Contenido
1. Introducción a los elementos de inferencia
estadística.
2. Distribuciones muestrales.
3. Estimación puntual de parámetros.
Resultado de aprendizaje
1. Conoce los objetivos, campos de acción y usos de las
distribuciones muestrales en distintas situaciones del
área ingenieril.
2. Estima los principales estimadores puntuales de las
características poblacionales de interés y sus
propiedades a partir de muestras simples.
Introducción a la inferencia estadística
Introducción
“La inferencia estadística o estadística inductiva:
parte de la ciencia estadística que, con base en
los resultados obtenidos del análisis de una
muestra de la población, infiere, induce o
establece las leyes de comportamiento de la
población a la cual pertenece; es también un
buen instrumento para aceptar o rechazar las
hipótesis que se hayan hecho sobre las
características del colectivo del problema” Fuente: [Link]
(Fuenlabrada, 2008, p. 158).
Introducción a la inferencia estadística
Introducción a los elementos de inferencia estadística
Muestras aleatorias
La confiabilidad que se tenga de las conclusiones
que se obtengan acerca de una población
depende de que la muestra se haya elegido de
manera adecuada, o sea, que represente lo mejor
posible a la población. Por esta razón, elegir una
muestra representativa es uno de los
procedimientos de mayor importancia en la
inferencia estadística.
Fuente: [Link]
Introducción a la inferencia estadística
Introducción a los elementos de inferencia estadística
Parámetros poblacionales
Cuando se habla de parámetro estadístico se refiere
a una medida de la población.
Para que una población se considere conocida, se
necesita conocer cuál es la distribución de
probabilidad de la variable aleatoria que se esté Fuente: [Link]
estudiando.
“Si por ejemplo, X está distribuida de manera normal, se dice que la población está distribuida
normalmente o que se tiene una población normal. De manera similar, si X tiene una distribución
binomial, se dice que la población está distribuida binomialmente o que se tiene una población binomial”
(Spiegel, 2013, p. 154).
Introducción a la inferencia estadística
Introducción a los elementos de inferencia estadística
Estadísticos muestrales
“Toda cantidad que se obtiene de una muestra
con el propósito de estimar un parámetro
poblacional se llama estadístico muestral o
sólo estadístico” (Spiegel, 2013, p. 154).
Fuente: [Link]
La diferencia entre estimador y parámetro es que este último es una cantidad numérica calculada de la
población y el estimador es de la muestra.
El estimador, al ser calculado con datos muestrales, proporciona información sobre el valor del parámetro
poblacional. Por ejemplo, la media muestral es un estimador de la media de la población.
Introducción a la inferencia estadística
Métodos de inferencia
Existen dos métodos de inferencia:
• La estimación.
Inferencia
• El contraste de hipótesis.
estadística
Pruebas de En el caso de la estimación, esta se
Estimación
hipótesis puede realizar de manera puntual o por
intervalos de confianza.
Puntual Intervalar
En ambos métodos se necesita conocer
Fuente: Elaboración propia. la distribución del estadístico.
“La diferencia entre el contraste de hipótesis y la estimación por intervalo consiste en que en la primera
se establece una hipótesis acerca del parámetro antes de realizar el estudio; con fundamento en el
resultado del estadístico muestral, se rechaza o no dicha hipótesis. En cambio, en la estimación por
intervalo se consideran todos los posibles valores del parámetro” (Elorza, 2008, p. 308).
Introducción a la inferencia estadística
Distribuciones muestrales
La distribución de la población.
La distribución
muestral de un El tamaño muestral.
estadístico depende
El método en que se seleccionó
de:
la muestra.
Fuente: [Link]
Distribución muestral de la media
“Sea a distribución de probabilidad de alguna población dada, de la que se toma una muestra de
tamaño Entonces, es natural preguntarse por la distribución muestral de la media muestral o distribución
muestral de medias” (Spiegel, 2013, p. 155).
Distribuciones muestrales
Estas medias se
convierten elementos
que serán muestreados.
De allí que se pueden
obtener muestras a las
cuales se les puede
sacar media y varianza
[Link]
Introducción a la inferencia estadística
Distribuciones muestrales
Teoremas
La media de la distribución muestral de medias, que se denota está dada por:
1 como donde: es la media de la población.
Si una población es infinita y el muestreo es aleatorio o si la población es finita y el muestreo se
2 hace con reemplazo, entonces la varianza de la distribución muestral de la media que se denota
es la varianza de la población.
está dada por:
Si el tamaño de la población es , el muestreo se hace sin reemplazo, sin
3 devolución y el tamaño de la muestra es , entonces se utiliza:
Introducción a la inferencia estadística
Distribuciones muestrales
Teoremas
Si la distribución de la que se toman las muestras está distribuida normalmente con media y
4 varianza , entonces la media muestral está distribuida de manera normal, con media μ y
varianza
Teorema del límite central: Si es la media de la muestra aleatoria de tamaño n, tomada de una
5 población con media y varianza finita
está dada por:
, entonces la variable estandarizada correspondiente
“La aproximación normal para ,por lo general, será buena si , siempre
y cuando la distribución de la población no sea muy asimétrica.
Si, la aproximación será buena sólo si la población no es muy diferente
de una distribución normal” (Walpole, Myers, Myers, Ye, 2012, p. 234).
Fuente: [Link]
Introducción a la inferencia estadística
Distribuciones muestrales
Ejemplo:
Una empresa de productos eléctricos fábrica ampolletas cuya duración se distribuye aproximadamente
normal con media 700 horas y desviación estándar de 50 horas. Determine la probabilidad de que tomando
una muestra aleatoria de 25 ampolletas, tenga una vida promedio menor a 680 horas.
La probabilidad pedida:
Fuente: Elaboración propia.
Introducción a la inferencia estadística
Distribuciones muestrales
Distribución muestral de la diferencia de medias
Si se extraen al azar muestras independientes de tamaños
de dos poblaciones, discretas o continuas, con
medias y varianzas , respectivamente,
entonces la distribución muestral de las diferencias de las
medias, , es:
Fuente: Walpole, Myers, Myers, Ye, 2012, p. 238). Fuente: [Link]
Introducción a la inferencia estadística
Distribuciones muestrales
Ejemplo:
Dos laboratorios químicos desarrollan un mismo medicamento con
dos técnicas diferentes. El tiempo que demora dicha sustancia química
en decaer en el organismo producida por el laboratorio A es de 7,2
horas, con una desviación estándar de 0,8 horas.
El medicamento producido por el laboratorio B demora 6,7 horas con
una desviación estándar de 0,7 horas. Encontrar la probabilidad de
que una muestra aleatoria de 34 pacientes que ingirieron el
medicamento del laboratorio A tenga un tiempo de decaimiento
promedio de al menos 1 hora más que la de una muestra de 40
pacientes que ingirieron el medicamento del laboratorio B. Fuente: [Link]
Introducción a la inferencia estadística
Distribuciones muestrales
Ejemplo:
Se pide calcular la probabilidad
Desarrollo:
Datos
Fuente: Elaboración propia.
Introducción a la inferencia estadística
Distribuciones muestrales
Distribución muestral de proporciones
En muchas ocasiones, hay estudios donde es interesante investigar
en relación a la proporción y no a la media de una variable.
En estos casos se utiliza una distribución muestral de
proporciones, cuya media y su desviación estándar son:
Fuente: [Link] Para muestras de tamaños grandes de , la distribución
binomial se aproxima a una normal:
Introducción a la inferencia estadística
Distribuciones muestrales
El estadístico de la proporción muestra es:
Fuente: [Link]
Ejemplo: una fábrica de piezas de acero, encuentra que en su producción habitual, un 3% de las piezas es
defectuosa. Se le vende a un cliente 500 de estas piezas. ¿Cuál es la probabilidad de que encuentre más de
un 5% de piezas defectuosas?
Fuente: Elaboración propia.
Introducción a la inferencia estadística
Distribuciones muestrales
Distribución muestral de diferencia de proporciones
Aplicación del teorema central del límite para diferencia de proporciones.
Sean dos muestras aleatorias independientes tomadas de dos poblaciones con distribución
Bernoulli y parámetros . Por otro lado, son las proporciones respectivas; entonces, la forma
límite de la distribución de la variable:
Tiene una distribución normal estándar cuando se hacen
infinitas. Fuente: [Link]
Introducción a la inferencia estadística
Distribuciones muestrales
Ejemplo: un fabricante de insecticidas en presentación de aerosol
desea comparar dos nuevos productos. En el experimento se
emplean dos habitaciones del mismo tamaño, cada una con una
muestra de 1000 moscas. En una habitación se rocía el insecticida
A y en la otra el insecticida B en igual cantidad. Se supone que los
insecticidas son efectivos en 85% y 76%, respectivamente.
¿Cuál es la probabilidad de que la proporción de moscas muertas
de la muestra con el insecticida A sea mayor a la proporción de
las moscas muertas en la muestra con el insecticida B al menos
en 14%?
(Gutiérrez, Vladimirovna, 2016, p. 103).
Introducción a la inferencia estadística
Distribuciones muestrales
Desarrollo:
proporción de moscas muertas con el insecticida A de la población.
proporción de moscas muertas con el insecticida B de la población.
proporción de moscas muertas con el insecticida A de la muestra.
proporción de moscas muertas con el insecticida B de la muestra.
Fuente: [Link]
Introducción a la inferencia estadística
Estimación puntual de parámetros
Existen parámetros que son de gran interés en ciertos estudios como la media μ.
La estimación puntual busca calcular un número que se aproxime al verdadero valor del parámetro, utilizando
una muestra.
“La estimación estadística es el proceso mediante el cual intentamos
determinar el valor de un parámetro de la población, sin hacer un censo
y a partir de la información de la muestra. Una estimación, en concreto,
es el valor numérico que asignamos a un parámetro y el estimador es el
estadístico de la muestra utilizado para hacer la estimación” (Llinás,
2017, p. 79).
“Un estimador puntual de un parámetro poblacional es una función de
la muestra que da como resultado un único valor. Un valor particular de
Fuente: [Link]
un estimador puntual se llama estimación puntual del parámetro”
(Llinás, 2017, p. 80).
Introducción a la inferencia estadística
Estimación puntual de parámetros
Para ser el mejor estimador, este debe cumplir con las siguientes propiedades:
Insesgado: un estimador debiese estar “cerca” del valor real del parámetro desconocido.
1 El estimador puntual es un estimador insesgado del parámetro .
Si el estimador no es insesgado, la diferencia se llama sesgo del estimador .
Eficiente: se preferirá el estimador cuya varianza sea la mínima con respecto de otros estimadores
2 del mismo parámetro.
Sean dos estimadores insesgados de obtenidos en muestras del mismo tamaño. Entonces,
a) Se dice que es más eficiente que , si la varianza de la distribución muestral de es menor
que la de la distribución muestral de . Es decir, si .
b) La eficiencia relativa de , con respecto a , es cociente de sus varianzas.
Introducción a la inferencia estadística
Estimación puntual de parámetros
Suficiente: se dice que un estimador es suficiente con relación a un parámetro, si utiliza toda la
3 información relevante de la muestra para calcularlo.
Consistente: cuando al ir aumentando el tamaño de la muestra el estimador se acerca cada vez más
4 al parámetro.
El procedimiento usual para obtener un estimador puntual es el siguiente:
a) Se selecciona la muestra de una población. La técnica adecuada de muestreo repercutirá en
minimizar el error (la diferencia entre el valor del parámetro y el estadístico).
b) Se calcula el estadístico muestral correspondiente al parámetro poblacional que se estimará.
c) Se utiliza este estadístico como una estimación del parámetro poblacional y se verifican las
propiedades anteriores.
(Elorza, 2008, p. 310).
Introducción a la inferencia estadística
Métodos de estimación puntual
Se consideran dos métodos para obtener un estimador puntual: el método de los momentos y el de máxima
verosimilitud.
1 Método de los momentos
Sean una muestra aleatoria de tamaño cualquier variable aleatoria.
a) El k-ésimo momento poblacional de se define como la esperanza
b) El k-ésimo momento muestral de , denotado por , se define:
Introducción a la inferencia estadística
Métodos de estimación puntual
Sea una muestra aleatoria de tamaño Supongamos que cada tiene la
misma distribución de probabilidad con parámetros desconocidos . Entonces,
los estimadores de momento se obtienen al igualar los primeros m momentos
muestrales con los correspondientes primeros momentos poblacionales y despejar
Fuente: Elaboración propia.
Ejemplo: un agricultor dedicado al cultivo de lechugas hidropónicas, está probando un
nuevo sistema de cultivo de estas donde mejora las condiciones de luz y nutrientes para
acelerar los días de la cosecha. Este nuevo sistema lo utiliza en 6 hileras de 25 lechugas
hidropónicas, donde las somete a estas nuevas condiciones. Si al realizar el experimento
se obtienen:
El número de lechugas hidropónicas en la i-ésima hilera que acelera los días de cosecha
con estas nuevas condiciones. Halle una estimación puntual de p , relativo a la
Fuente: [Link]
proporción de lechugas hidropónicas por hilera que acelera los días de cosecha,
usando el método de los momentos.
Introducción a la inferencia estadística
Métodos de estimación puntual
Solución: la variable que se estudia es , entendida como el número de lechugas hidropónicas por hilera
que acelera los días de cosecha bajo las nuevas condiciones de cultivo.
de una distribución binomial con parámetros desconocida.
Por lo tanto, la estimación de con el método de los momentos es: Fuente: [Link]
Introducción a la inferencia estadística
Métodos de estimación puntual
2 Método de máxima verosimilitud
Uno de los mejores métodos para obtener un estimador puntual de un parámetro es el
método de máxima verosimilitud. Como su nombre lo indica, consiste en maximizar la
función de verosimilitud. Este método lo usó Gauss hace más de 170 años y fue formalizado
por Fisher a comienzos del siglo XX.
Definición:
Sea X una variable aleatoria con distribución de probabilidad donde es un solo
parámetro desconocido. Sean los valores observados de una muestra de tamaño
n. La función de verosimilitud de la muestra es:
L(θ)=f(x_1;θ)∙f(x_2;θ)∙…∙f(x_n;θ) Fuente: [Link]
Notar que la función de verosimilitud es una función del parámetro . El estimador de
máxima verosimilitud de es el que maximiza
Introducción a la inferencia estadística
Métodos de estimación puntual
La función de verosimilitud , para el caso de variables discretas, es simplemente la probabilidad:
es la probabilidad de obtener los valores muestrales , así el método maximiza la probabilidad
de ocurrencia de los valores muestrales.
El método de máxima verosimilitud proporciona buenos estimadores que
generalmente poseen todas o algunas de las propiedades vistas.
Este método trata de encontrar el valor del parámetro para el cual sea máxima la
probabilidad de haber obtenido los valores muestrales encontrados.
Introducción a la inferencia estadística
Métodos de estimación puntual
Sea una variable aleatoria Bernoulli.
Donde es el parámetro a estimar. La función de verosimilitud de una muestra de tamaño
Introducción a la inferencia estadística
Métodos de estimación puntual
Si maximiza a entonces también maximiza a así:
Al igualar a cero
El estimador de máxima verosimilitud de es:
Introducción a la inferencia estadística
Bibliografía
Elorza, H. (2008). Estadística para las Ciencias Sociales, del comportamiento y de la salud (3a. Ed.). México: Cengage
Learning.
Fuenlabrada, S. (2012). Probabilidad y Estadística (3a. Ed.). México: McGraw-Hill.
Gutiérrez. E., Vladimirovna, O. (2016). Estadística Inferencial 1 para ingeniería y ciencias. México: Grupo Editorial
Patria.
Llinás, H. (2017). Estadística Inferencial (9a. Ed.). Colombia: Editorial Universidad del Norte.
Spiegel, M. (2013). Probabilidad y Estadística (4ta Ed.). México: McGraw-Hill.
Walpole, R., Myers, R., Myers, S. & Ye, K. (2012). Probabilidad y estadística para ingeniería y ciencias (9a . Ed.).
México: Pearson Educación.