ESTADISTICA INFERENCIAL
DISTRIBUCIÓN MUESTRAL
SESION N°3
Inicio (10min)
• Actividad: Los estudiantes comparten con el docente las dudas que hubieran
existido en la segunda sesión.
• El estudiante responde las siguientes preguntas:
1.- Que conoce o ha escuchado sobre distribución
muestral? 2.- Y para que sirve la Distribución
Muestral?
La distribución muestral es un concepto
estadístico que describe la probabilidad de que
una estadística tome un valor determinado al
extraer muestras de una población
Inici
o
SABERES PREVIOS
LA ESTADISTICA INFERENCIAL
Que conozco de Distribucion Muestral?
Para que sirve?
LOGRO DE SESION
El estudiante conocerá los principales conceptos y cálculos
referidos a la distribución muestral, teorema del límite central,
distribución muestral de la media con varianza conocida y
desconocida a fin de poder aplicarlos en el campo de la ciencia e
ingeniería.
TRANSFORMACIÓN (30 min)
Principio pedagógico: Aprendizaje autónomo y Aprendizaje colaborativo.
• Actividad: A continuación el estudiante va revisar los conceptos
básicos correspondientes a Distribución Muestral y se van a
plantear ejercicios para poder desarrollar los conceptos revisados
en clase.
Transformació
n
DISTRIBUCIÓN MUESTRAL
La teoría del muestreo estudia las relaciones entre una
población y las muestras
extraídas de la misma.
Permite estimar cantidades desconocidas de la población como la media
poblacional, la varianza, etc., frecuentemente llamadas parámetros
poblacionales a partir de las correspondientes cantidades muestrales
como son la media, la varianza, y otros estadísticos muéstrales o
brevemente llamados estadísticos.
La teoría de muestreo es útil para determinar por ejemplo: el aplicar un
nuevo suero para el tratamiento de una enfermedad, o decidir si un proceso
de producción es mejor que otro. estas decisiones envuelven a los
llamados ensayos e hipótesis de significación.
Engeneral, a todo lo mencionado anteriormente se
le conoce como inferencia
DISTRIBUCIÓN MUESTRAL
DISTRIBUCIONES MUESTRALES Población
Consideremos todas las muestras de tamaño n que
Muestra
pueden extraerse de una población . (con o sin
reemplazo).
Si obtenemos estadísticos , tales como la media X
(𝑿ഥ), la proporción p, la desviación típica (desviación
MUESTREO
S2
estándar) s, etc., que varían de una muestra a otra. 2
distribución muestral.
Formaremos una distribución del estadístico deseado, p
Si, el estadístico es la media muestral ( 𝑿ഥ )
lo que se conoce como n
N
, la distribución se conoce como distribución
muestral de la medias.
Si, el estadístico es la proporción muestral
p, la distribución se conoce como distribución
muestral de la proporción.
DISTRIBUCIÓN MUESTRAL
supóngase que son extraídas de una población Infinita todas las posibles
muestras sin remplazo de tamaño n. si se denota:
La media (µ) y la desviación típica () de la población
La media (𝝁 ) y la desviación típica ( 𝝈) de la distribución muestral
La distribución muestral de las medias cumplen la siguiente
igualdad:
𝜇
ANTES Esta variable AHORA ya no NOTA:
aleatoria se distribuye de hablamos de variable Si el muestreo es sin
=𝜇
manera normal con media sino del estadígrafo reemplaz
de un población
𝜎= 𝜇 =𝜇
𝜎�
mu y varianza sigma al promedio, la media finita
cuadrado se distribuye de
𝜎 𝑁
manera normal y será
𝜎= −𝑛
� del promedio y
DESVIACIÓN ESTANDAR O
𝑛
varianza también
𝑁−
TÍPICA POBLACIONAL
TAMAÑO DE MUESTRA
será del promedio
1
¿Estas muestras aleatorias a que tipo de distribución se ajustan?
DISTRIBUCIÓN MUESTRAL
𝑿~𝑁
𝜇, 𝜎2
Caso 1: Población con distribución normal:
Si la muestra aleatoria 𝑋1, … , 𝑋𝑛 Tiene distribución normal con media µ y
desviación
típica :
Para cualquier tamaño de muestra (n):
𝜇= 𝜇también 𝜎= �𝑛
�
La media
media muestral y desviación Típica:
tiene una distribución normal con
Notación Si: 𝑿~𝑁 𝜇, 𝜎2 𝑛
Estadística → 𝑿~𝑁 𝜇, 𝜎
𝑿~? ? 𝜇, 𝜎
Caso 2: Población con distribución no normal: Teorema del limite central
2
Si la muestra seleccionada tiene un tamaño mayor o igual a 30, sea
cual sea la forma de la distribución de la población (sea normal o no),
las medias de todas las muestras seleccionadas de la población
PRUEBA DE NORMALIDAD
Se aplica para comprobar si la distribución de datos de una muestra se
ajusta a una Distribución Normal Teórica.
Existen diversas pruebas para comprobar si una distribución de datos se
ajusta a una
distribución normal, para nuestro análisis Esa técnica estadística KS me
aplicaremos la Prueba de Kolgomorov
permite comprobar si mis datos
Smirnov: son normales, para eso termino
planeando una hipótesis
Prueba de Kolgomorov Smirnov
Prueba de Kolgomorov Smirnov(KS): Es una prueba no paramétrica que
determina la bondad de ajuste de un conjunto de datos con una
distribución especifica. Se deben realizar los siguientes pasos:
1.- Ho: Los datos analizados siguen una distribución normal
estándar H1: Los datos Nivel de significancia es el error que vamos a
analizados no siguen una distribución
cometer para contrastar esa hipótesis
PRUEBAS DE NORMALIDAD
3.- Estadístico de Prueba:
En este caso lo llamamos D al
Donde: estadístico d prueba
Xi: es el i-esimo valor observado en la muestra( Cuyos valores se han ordenado previamente
de mayor a menor)
Fn( Xi): es un estimador de la probabilidad de observar valores menores o iguales que Xi
Fo( Xi): es la probabilidad de observar valores menores o iguales que Xi cuando Ho es cierta
Así pues D es la mayor diferencia absoluta entre la frecuencia acumulada observada Fn(Xi) y
la frecuencia
𝐷−
acumulada teórica Fo(x) obtenida a partir de la probabilidad que se especifica como Hipótesis
𝐷+ =
Para efectos prácticos
Nula.
=
Por tanto a partir de estos
Valores
PRUEBAS DE NORMALIDAD
4.- Por tanto el criterio para rechazar o aceptar la prueba de
hipótesis es:
Donde Dα
=
Cα podrá tomar los siguientes
valores:
K(n) podrá tomar los siguientes
valores:
Ejemplo Nª1
Se tienenlos ingresos de un grupo de 10 ingenieros egresado
de la UTP, los cuales se presentan a continuación( en miles):
6.0, 2.3, 4.8, 5.6, 4.5, 3.4, 3.3, 1.9, 4.8, 4.5
Probar que los sueldos se ajustan a una distribución normal con
un nivel de significación de α= 0.05
H0 planteo la hipótesis H1
planteo la hipótesis alterna
Solución:
. Ho: Los Sueldos siguen una distribución normal estándar
H1: Los Sueldos no siguen una distribución normal estándar
α = 0.05
A partir de la definición se construye la siguiente tabla: donde X=
4.1, S= 1.34
1/10
0.091 – 0.1= - 0.009
2/10
Los cálculos para la primera fila
será: Z = Y1 – x = 1.9 – 4.1 = - Conclusión:
Tabla
1.628S
estandarizando 1.34 =
0.216 Como D < Dα, se
Fo = P( Z=- 1.628) = puede concluir que los
0.051 sueldos de los
D1+ = 0.1- 0.051 = ingenieros de la UTP se
0.049 ajustan a una
D1- = 0.051 – 0 = distribucion Normal
DISTRIBUCION MUESTRAL DE MEDIAS CON
VARIANZA CONOCIDA
Sabemos que si de una muestra aleatoria (x1, x2 , . . . . . , xn)de tamaño n,
procedente de una población normal N μ,σ2 ; entonces la Para distribución de
estandarizaar Antes tenia a la
la media muestral tendrá una distribución normal para cualquier
variable perotamaño.
ahora tengo a mi
estadígrafo, (MEDIA)
Si: 𝑿~𝑁 𝜇, σ2
Estadígrafo
Cuando no tengo la distribución pro os
𝑛
Resumen: dato son mayores que 30 termina siendo
→ 𝑋ത~𝑁 𝜇, 𝜎
distribución normal
Cuando tenemos una
variable u y sigma al
𝑺𝒊: 𝑿~? ? 𝜇, σ2 𝑻𝑳𝑪
cuadrado NO PUEDO
𝜎
𝒔𝒊 𝒏 ≥ 𝟑𝟎 → 𝑋ത~𝑁 𝜇,
LLEVALO A LA TABLA, para
poder buscar en mi tabla debo
𝑛
convertirlo en 0,1, ALLI ENTRA
LA ESTANDARIZACIÓN
𝑋ത −
→ 𝑍 𝜇 ~𝑁(0,
Emplearemos tabla Z PROMEDIO O
= 𝜎 1)
PROBABILIDAD
cuando: DEL VALOR QUE
QUIERES
a. n ≥ 30 y σ2 conocida HALLAR
𝑬𝒔𝒕𝒂𝒏𝒅𝒂𝒓𝒊𝒛𝒂
Tamaño
PROMEDIO
b. n < 30 y σ2 conocida. de
n
𝒄𝒊ó𝒏
POBLACIONAL
muestra
DESVIACIÓN
ESTANDAR
PRACTICA Nª1( 15 Minutos)
El valor nominal de la resistencia de una lámina
de un metal compuesto es de 8500 psi. Por
estudios pasados se conoce que la desviación
estándar de esta resistencia es 1950 psi. Se tiene
una muestra de 100 láminas. ¿Cuál es la
probabilidad de que la media de esa muestra:
a) Sea mayor a 8900 psi?
b) Sea menor a 8000 psi?
SOLUCION Nª
A DATOS DEL PROBLEMA:
=8500 Recordando
=1950
ത
𝑍 𝑋−𝜇
~𝑁(0,
(conocida)
= 1)
𝜎
𝑛
n=100
Variable: X resistencia de una
a. Media mayor que 8900 (𝑥ҧ >
lámina P(Z a) 1 P(Z
8900)
a)
𝑷(𝒙ഥ > 𝟖𝟗𝟎𝟎) = 1 − 𝑃(𝑥−≤
8900
1 − 𝑃 𝑍 8500
8900) 195 = 1 − 𝑃(𝑍 ≤ 2.05)
≤
Estandarizando
010 𝑇𝑎𝑏𝑙𝑎 𝑧
0
∴ 𝑃(𝑥ҧ > 8900) = 1 − 𝟎. 𝟗𝟕𝟗𝟖𝟐 =
SOLUCION Nª B
DATOS DEL PROBLEMA:
=8500
=1950
(conocida)
n=100
Variable: X resistencia de una
a. Media menor que 8000 (𝑥ҧ <
lámina
8000)
𝑃(𝑥ҧ < 8000) = 𝑃 8000 −
𝑍 𝟖𝟓𝟎𝟎 = 𝑃(𝑍 < −2.56) =
195
< 0.00523
010
𝑇𝑎𝑏𝑙𝑎
0
DISTRIBUCION MUESTRAL DE MEDIAS CON
VARIANZA DESCONOCIDA
DISTRIBUCIÓN T- STUDENT
Muestra menor a
Condiciones: 30 y varianza
Se utiliza en muestras pequeñas de menos de 30
desconocida SE
elementos. USA T STUDENT
La desviación estándar de la población (𝝈) no se
conoce. . GRADOS DE
Características:
Distribución Población tiene que ser normal LIBERTAD:
Es simétrica, cada curva t tiene forma de campana con centro en 0.de
tamaño
muestra - 1
Las áreas de los extremos las cuales son más amplias que la
distribución normal, como consecuencia de que usualmente se
trabaja con muestras pequeñas
Tienegrados de libertad (g.l) : V = n – 1 , cuando V → ∞ la
curva T se
aproxima a la Normal
Recordando
ത
𝑍 ~𝑁(0,
𝑋−
𝜇
= 𝜎 1)
𝑛
P(Z a) 1 P(Z
a)
Grados
de
Valores
Libertad!
T
=
Varianza poblacional
PRACTICA Nª2 ( 15 minutos)
Varianza muestal
PROBLEMA Nª2
Una máquina produce piezas con un tamaño que se
ajusta a una distribución normal cuyo valor medio
es de 14 cm.
¿Cuál es la probabilidad de que la media de una
muestra de tamaño 20 sea menor que 14.58 cm.,
sabiendo que la varianza muestral ha sido de 9
cm2 ?
Desconocida
USO T
Tamaño de muestra
menor a 30
SOLUCION Nª 2
DATOS DEL PROBLEMA:
=14CM
S2=9 cm2 (σ2
desconocida) n=20
ത −
𝑇 ~
𝑋
𝜇 𝑛−
Variable: X:Tamaño de la pieza en
= 𝑆 𝑇 1
Recordando:
cm
Si: 𝑋~𝑁 𝜇, ? ?
� n
𝑛
𝑋ത~𝑁 ഥ 𝜇, 3
�
Entonces: 𝑋~𝑁 2
𝐶𝑜𝑚𝑜 𝜎14,
0
2 𝑛 <
𝑑𝑒𝑠𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑎
𝑃𝑖𝑑𝑒𝑛: 𝑃 𝑥ҧ < 30
14.58 14.58 −
14 → 𝑃 𝑡1 < ≅
=𝑃
𝑛−
𝑡1 < 3
0.8646 0.80
Estandarizando:
9
2 𝑇𝑎𝑏𝑙𝑎 𝑇
CIERRE (15 min)
Principio pedagógico: Aprendizaje
autónomo.
Actividad:
• Lluvia de Ideas: El estudiante responde 4 principales
preguntas del docente sobre su aprendizaje en la clase
de hoy.
Cierr
e
¿QUÉ HEMOS APRENDIDO?
1. ¿Qué es la distribución muestral de
medias?
2. ¿Cuándo se aplica el teorema del límite
central?
3. ¿Cuándo se aplica la distribución Z?
4. ¿Cuándo se aplica la distribución T-
Student?