DISTRIBUCIONES MUESTREALES
Profesor: Osvaldo Miranda Eldan
2020
Estadística
Distribuciones muestrales:
El objetivo es efectuar una generalización de los resultados de la
muestra a la población. Inferir o adivinar el comportamiento de la
población a partir del conocimiento de una muestra.
Una estadística muestral proveniente de una muestra aleatoria
simple tiene un patrón de comportamiento (predecible) en
repetidas muestras. Este patrón es llamado la distribución
muestral de la estadística.
Si conocemos la distribución muestral podemos hacer
inferencia.
Estadística
Estadística
Estadística
Las distribuciones
muestréales adoptan
diferentes formas
según las estadísticas
investigadas y las
características de la
población estudiada
A partir de las
muestras • De cuyo análisis se
seleccionadas de una desprenden interesantes
población pueden propiedades estadísticas.
construirse variables
aleatorias alternativas
Las dos formas más • Las distribuciones
comunes de estas muestréales de las
variables medias y de las
corresponden proporciones.
Estadística
Dada una
población
constituida por Pueden formarse Para cada una de
un número n de n2 muestras con estas muestras
Distribución elementos, reemplazamiento es posible
Muestreal de cuya media distintas, una media
Medias aritmética es m y formadas por dos muestreal, que
donde elementos de la denotaremos con
la desviación población el símbolo
típica viene
dada s
Estadística
Un ejemplo de la tabla de muestras de tamaño 2, tomada
de la población {1, 3, 5}, con sus medias aritméticas
reflejadas, sería:
A partir de la variable estadística original x de la población se
puede construir una nueva variable estadística que tendría
como valores las medias de las muestras tomadas de la
,
. población. La media aritmética de esta distribución muestral
de las medias se denota por y su desviación típica
como
Estadística
Distribución muestreal de las medias de tamaño n:
En una distribución muestreal de las medias, la variable
aleatoria media muestreal sigue una ley normal descrita como
N
Estadística
Estadística
Ejemplo:
Los pesos de 1500 rodamientos se distribuyen normalmente , con
media 22,4 kg y desviación típica de 0,048 kg. Si se extraen 300
muestras de tamaño 36 de esta población, determine la media
esperada y la desv. Típica de la distribución muestreal de medias
si:
a) El muestreo se realiza con remplazamiento.
b) El muestreo se realiza sin reemplazamiento
Estadística
La distribución
muestreal de
proporciones es la
adecuada para dar
• Existen ocasiones en las • p=x/n en donde
respuesta
cuales no estamos "x" es el número
interesados en la media • Esta de éxitos u
de la muestra distribución se observaciones
genera de igual de interés
• Queremos investigar, por
ejemplo, la proporción de manera que la • "n" el tamaño de
distribución la muestra) en
artículos defectuosos o lugar del
la proporción de alumnos muestreal de estadístico
reprobados en la muestra medias media.
• se calcula el
Distribución estadístico
muestreal de proporción
Proporciones
Estadística
Una población binomial está estrechamente relacionada con la
distribución muestreal de proporciones; una población binomial es una
colección de éxitos y fracasos, mientras que
Una distribución muestreal de proporciones contiene las posibilidades o
proporciones de todos los números posibles de éxitos en un experimento binomial,
y como consecuencia de esta relación, las afirmaciones probabilísticas referentes a
la proporción muestreal pueden evaluarse usando la aproximación normal a la
binomial, siempre que np ≥ 5 y n(1-p)≥ 5
Estadística
•Para calcular la media de la distribución muestreal de
proporciones:
= N*p
•Para calcular la desviación típica de la distribución muestreal
de proporciones:
: N*p*q
Estadística
Para calcular la probabilidad hay que tipificar
Z= -/
Ejemplo 1:
Se ha determinado que 60% de los estudiantes de una
universidad grande fuman cigarrillos. Se toma una muestra
aleatoria de 800 estudiantes. Calcule la probabilidad de que la
proporción de la muestra de la gente que fuma cigarrillos sea
menor que 0.55.
Estadística
Datos:
n=800 estudiantes
p=0.60
x= (.55)(800) = 440 estudiantes
p(x< 440) = ?
Media= np= (800)(0.60)= 480
Se debe de tomar en cuenta el factor de corrección de, ya que estamos
hablando de una proporción.
Estadística
p(x< 440) = 0.0017. Este valor significa que existe una
probabilidad del 0.17% de que al extraer una muestra de 800
estudiantes, menos de 440 fuman cigarrillos.
Estadística
Ejemplo 2:
Un medicamento para malestar estomacal tiene la advertencia de que
algunos usuarios pueden presentar una reacción adversa a él, más aún, se
piensa que alrededor del 3% de los usuarios tienen tal reacción. Si una
muestra aleatoria de 150 personas con malestar estomacal usa el
medicamento, encuentre la probabilidad de que la proporción de la muestra
de los usuarios que realmente presentan una reacción adversa, exceda el
4%.
Datos:
n=150 personas
p=0.03
x= (0.04)(150) = 6 personas
p(x>6) = ?
Media = np= (150)(0.03)= 4.5
Estadística
Estadística
p(x>6) = 0.1685. Este valor significa que existe una probabilidad del 17% de
que al extraer una muestra de 150 personas, mas de 6 presentarán una
reacción adversa.
Estadística
Distribución Muestral de Diferencia de Medias:
Suponga que se tienen dos poblaciones distintas, la primera con media m1
y desviación estándar s1, y la segunda con media m2 y desviación
estándar s2. Más aún, se elige una muestra aleatoria de tamaño n1 de la
primera población y una muestra independiente aleatoria de tamaño n2 de
la segunda población; se calcula la media muestreal para cada muestra y
la diferencia entre dichas medias.
La colección de todas esas diferencias se llama distribución muestreal de las
diferencias entre medias o la distribución muestreal del estadístico
Estadística
La distribución es aproximadamente normal para n1 ≥ 30 y n2 ≥30. Si
las poblaciones son normales, entonces la distribución muestreal de
medias es normal sin importar los tamaños de las muestras.
Estadística
se había demostrado que:
que no es difícil deducir que
La fórmula que se utilizará para el calculo de probabilidad del estadístico
de diferencia de medias es:
Estadística
EJEMPLO 1:
En un estudio para comparar los pesos promedio de niños y niñas de
sexto grado en una escuela primaria se usará una muestra aleatoria de 20
niños y otra de 25 niñas. Se sabe que tanto para niños como para niñas
los pesos siguen una distribución normal. El promedio de los pesos de
todos los niños de sexto grado de esa escuela es de 100 libras y su
desviación estándar es de 14.142, mientras que el promedio de los pesos
de todas las niñas del sexto grado de esa escuela es de 85 libras y su
desviación estándar es de 12.247 libras. Si 1x representa el promedio de
los pesos de 20 niños y 2x es el promedio de los pesos de una muestra de
25 niñas, encuentre la probabilidad de que el promedio de los pesos de
los 20 niños sea al menos 20 libras más grande que el de las 25 niñas.
Estadística
Solución:
Datos:
m1 = 100 libras
m2 = 85 libras
s1 = 14.142 libras
s2 = 12.247 libras
n1 = 20 niños
n2 = 25 niñas
Estadística
Por lo tanto, la probabilidad de que el promedio de los
pesos de la muestra de niños sea al menos 20 libras más
grande que el de la muestra de las niñas es 0,1056.
EJEMPLO 2:
Uno de los principales fabricantes de televisores compra los tubos de rayos
catódicos a dos compañías. Los tubos de la compañía A tienen una vida
media de 7.2 años con una desviación estándar de 0.8 años, mientras que
los de la B tienen una vida media de 6.7 años con una desviación estándar
de 0.7. Determine la probabilidad de que una muestra aleatoria de 34 tubos
de la compañía A tenga una vida promedio de al menos un año más que la
de una muestra aleatoria de 40 tubos de la compañía B.
Estadística
Solución:
Datos:
mA = 7.2 años
mB = 6.7 años
sA = 0.8 años
sB = 0.7 años
nA = 34 tubos
nB = 40 tubos
Estadística
EJEMPLO 3:
Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrándose
una desviación estándar de 1.23km/L para la primera gasolina y una
desviación estándar de 1.37km/L para la segunda gasolina; se prueba la
primera gasolina en 35 autos y la segunda en 42 autos.
a) ¿Cuál es la probabilidad de que la primera gasolina de un rendimiento
promedio mayor de 0.45km/L que la segunda gasolina?
b) ¿Cuál es la probabilidad de que la diferencia en rendimientos
promedio se encuentre entre 0.65 y 0.83km/L a favor de la gasolina 1?.
Solución:
En este ejercicio no se cuenta con los parámetros de las medias en ninguna
de las dos poblaciones, por lo que se supondrán que son iguales.
Estadística
Datos:
s1 = 1.23 Km/L
s2 = 1.37 Km/L
n1 = 35 autos
n2 = 42 autos
Estadística
La probabilidad de que la diferencia en rendimientos promedio en las
muestras se encuentre entre 0.65 y 0.83 Km/L a favor de la gasolina 1
es de 0.0117.
Estadística
ESTIMACION
El objetivo principal de la estadística inferencial es la estimación
Mediante el estudio de una muestra de
una población se quiere generalizar las
conclusiones al total de la misma.
Los estadísticos varían mucho dentro de sus
distribuciones muestrales, y mientras menor sea el
error estándar de un estadístico, más cercanos
serán unos de otros sus valores.
Estadística
Estimación
Por intervalo Puntual
Es un rango, de ancho Un único valor
finito, donde se espera estadístico, se
que contenga el estima un parámetro
parámetro (estimador)
Estadística
La inferencia estadística está casi siempre concentrada en
obtener algún tipo de conclusión acerca de uno o más
parámetros (características poblacionales). Para hacerlo,
se requiere que un investigador obtenga datos muestrales
de cada una de las poblaciones en estudio. Entonces, las
conclusiones pueden estar basadas en los valores
calculados de varias cantidades muestrales .
Estadística
Si σ² es la varianza de
Por ejemplo,
Estimación representamos con µ
las muestras, el valor de
la varianza muestral s2
Puntual (parámetro) el verdadero
promedio muestral
se podría utilizar pra
inferir algo acerca de σ2.
Estadística
Estimación por Intervalos:
Si damos un único punto como
Estimación Presenta un estimación del parámetro, esa
puntual problema estimación difícilmente acertará
al valor exacto del parámetro
Lo anterior no nos importara demasiado; porque lo que
buscamos es que el verdadero valor del parámetro,
quede cerca de nuestra estimación.
Estadística
Un estimado puntual, por ser un sólo número, no
proporciona por sí mismo información alguna sobre la
precisión y confiabilidad de la estimación
Debido a la variabilidad de la muestra, nunca se tendrá
el caso de que
El estimado puntual nada dice sobre lo cercano que esta
de µ.
Estadística
Una alternativa para reportar un solo valor del parámetro
que se esté estimando es calcular e informar todo un
intervalo de valores factibles, un estimado de intervalo o
intervalo de confianza (IC)
Un intervalo de confianza: Se calcula siempre seleccionando
primero un nivel de confianza, que es una medida de el grado de
fiabilidad en el intervalo.
Un nivel de confianza de 95% implica que 95% de todas las
muestras daría lugar a un intervalo que incluye µ o cualquier
otro parámetro que se esté estimando, y sólo 5% de las
muestras producirá un intervalo erróneo. Cuanto mayor sea
el nivel de confianza podremos creer que el valor del
parámetro que se estima está dentro del intervalo.
Estadística
Una interpretación correcta de la “confianza de 95%” radica en la
interpretación frecuente de probabilidad a largo plazo: decir que un
evento A tiene una probabilidad de 0.95, es decir que si el experimento
donde A está definido se realiza una y otra vez, a largo plazo A ocurrirá
95% de las veces. Para este caso el 95% de los intervalos de confianza
calculados contendrán a µ.
Esta es una construcción repetida de intervalos
de confianza de 95% y se puede observar que de
los 11 intervalos calculados sólo el tercero y el
último no contienen el valor de m.
De acuerdo con esta interpretación, el nivel de
confianza de 95% no es tanto un enunciado
sobre cualquier intervalo en particular, más
bien se refiere a lo que sucedería si se tuvieran
que construir un gran número de intervalos
semejantes.
Estadística
Encontrar z a partir de un nivel de confianza:
En esta sección se realizará un ejemplo para encontrar el valor
de z utilizando la tabla de distribución normal
Ejemplo 1: Encuentre el valor de z para un nivel de confianza
del 95%.
La tabla que tiene el área bajo la curva de -∞ hasta z. Si lo vemos
gráficamente sería:
Estadística
Estadística
Estadística
Estimación para la Media:
En base a la distribución muestral de medias que se
generó en el tema anterior, la formula para el calculo de
probabilidad es la siguiente:
Como en este caso no conocemos el parámetro y lo queremos estimar
por medio de la media de la muestra, sólo se despejará µ de la formula
anterior, quedando lo siguiente:
Estadística
De esta formula se puede observar que tanto el tamaño
de la muestra como el valor de z se conocerán. Z se
puede obtener de la tabla de la distribución normal a
partir del nivel de confianza establecido
Pero en ocasiones se desconoce σ por lo
que en esos casos lo correcto es utilizar
otra distribución llamada “t” de student
si la población de donde provienen los
datos es normal.
Estadística
Ejemplos 1: Se encuentra que la concentración promedio de zinc que se saca del agua a
partir de una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por
mililitro. Suponga que la desviación estándar de la población es 0.3.
Encuentre los intervalos de confianza de 95% y 99% para la concentración media de zinc
en el río
Solución:
La estimación puntual de m es x = 2.6. El valor de z para un nivel de confianza del 95% es
1.96, por lo tanto:
Estadística
Para un nivel de confianza de 99% el valor de z es de 2.575 por lo que el intervalo será
más amplio:
Ejemplo 2: Una empresa eléctrica fabrica focos que tienen una duración aproximadamente
distribuida de forma normal con una desviación estándar de 40 horas. Si una muestra de 30
focos tiene una duración promedio de 780 horas, encuentre un intervalos de confianza de
96% para la media de la población de todos los focos que produce esta empresa.
Estadística
Con un nivel de confianza del 96% se sabe que la duración
media de los focos que produce la empresa está entre 765 y 795
horas.
Estadística
Estimación de una Proporción:
Un estimador puntual de la proporción P en un experimento
binomial está dado por la estadística P=X/N, donde x
representa el número de éxitos en n pruebas.
Por tanto, la proporción de la muestra p =x/n se utilizará como
estimador puntual del parámetro P.
Si no se espera que la proporción P desconocida esté demasiado cerca de
0 ó de 1, se puede establecer un intervalo de confianza para P al
considerar la distribución muestral de proporciones.
Estadística
Al despejar P de esta ecuación nos queda:
Cuando n es pequeña y la proporción desconocida P se considera cercana a 0 ó
a 1, el procedimiento del intervalo de confianza que se establece aquí no es
confiable, por tanto, no se debe utilizar. Para estar seguro, se debe requerir que
np ó nq sea mayor o igual a 5.
Estadística
Ejemplos 1: Un fabricante de reproductores de discos compactos utiliza un conjunto de
pruebas amplias para evaluar la función eléctrica de su producto. Todos los reproductores
de discos compactos deben pasar todas las pruebas antes de venderse. Una muestra
aleatoria de 500 reproductores tiene como resultado 15 que fallan en una o más pruebas.
Encuentre un intervalo de confianza de 90% para la proporción de los reproductores de
discos compactos de la población que no pasan todas las pruebas.
Solución:
n=500
p = 15/500 = 0.03
z(0.90) = 1.645
Se sabe con un nivel de confianza del 90% que la proporción de discos defectuosos
que no pasan la prueba en esa población esta entre 0.0237 y 0.0376.
Estadística
Mínimo tamaño muestreal:
Un problema muy relacionado con la construcción de intervalos de
confianza es el de determinar el mínimo tamaño muestreal que
necesitamos para que nuestra estimación tenga una determinada
precisión
Es decir, cuántos elementos tenemos que observar para que el error
cometido con la estimación no supere una cierta cantidad.
Estadística