Estadística
Tema: Distribuciones de probabilidad
Objetivos:
! Reconocer y aplicar el modelo Normal.
! Diferenciar un parámetro de un estadístico.
! Interpretar un intervalo de confianza.
Guión:
! Distribución Normal
! Parámetros, Estadísticos y Estimadores.
! Intervalos de confianza
PROBABILIDADES PARA VARIABLE CONTINUA
La variable continua es aquella que puede tomar cualquier valor dentro de un
intervalo especificado de valores de asumidos por la variable, existiendo un
número infinito de valores.
Para entender mejor la naturaleza de la distribución de una variable
aleatoria continua, consideremos que construimos un histograma, en que
los intervalos de clase están representando el ancho de la barra y la altura
da el número de valores de la variable que caen entre los dos puntos
especificados.
Distribución Normal!
Esta es una de las distribuciones más importantes de la estadística. Fue
publicada por primera vez por el matemático Abraham De Moivre
(1667-1754), de ahí en adelante fue investigada por muchos matemáticos
entre los que destacan Carl Friedrich Gauss (1777-1855), por cuyo
nombre también se le conoce a esta distribución.
Es la piedra angular en la aplicación de la inferencia estadística en el
análisis de datos, puesto que las distribuciones de muchas estadísticas
muestrales tienden hacia la distribución normal conforme crece el tamaño
de la muestra.
Diremos que una v.a. tiene una distribución Normal de parámetros µ y σ2 (X~N(µ,σ2))
si la f.d.p. es:
( x − µ )2
1 −
2σ 2
f ( x) = e , x ∈ R , µ ∈ R, σ > 0
2π σ
El gráfico de esta curva es tal que:
"Es simétrica respecto a la vertical x=µ
" Tiene puntos de inflexión en x=µ - σ y x=µ +σ
"Tiene un máximo en x=µ
Se aproxima asintóticamente al eje X, lo que se refleja en la relación:
1
f ( µ − 3σ ) = f ( µ + 3σ ) = f (µ )
100
Si X~N(µ,σ2) entonces:
E( X ) = µ
2
V (X ) = σ
Dado que los valores de µ y σ varían de una distribución normal a otra, es
que se usa una sola curva normal llamada distribución normal estándar, la
cual se caracteriza por tener µ=0 y σ = 1. Es decir, para cada punto x de
una distribución normal se puede usar la transformación :
x−µ
z=
σ
para obtener un valor z cuya distribución es normal estándar o
simbólicamente N(0,1).
Función de densidad de
probabilidad
de una distribución normal con
0.5 media
0 y varianza 1
0.4
0.3
0.2
0.1
σ σ
σ
0.0
-3.0 -2.5 -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 2.5 3.0
µ
Cálculo de áreas
Se sabe que los niveles de glucosa sanguínea en mg por 100 ml de sangre
tiene una distribución normal con media de 83 y desviación estándar de 4, si
encontramos a un paciente con un valor de 90 ¿Cuál es la probabilidad de
encontrar valores superiores o iguales a 90?
Debemos transformar la variable :
90 − 83 7 esto es que 90 se encuentra a 1.75
z= = =1.75 desviaciones estándar de la media.
4 4
Si z = +1.75, y vemos la tabla en la intersección entre +1.70 y 0.05 es
0.0401 o 0.9599 dependiendo de la forma de la tabla, luego hay una
probabilidad del 4.01% de encontar valores iguales o superiores a 90 mg/
100 ml de sangre.
Cuando se transforman los valores de x en valores de z, la distancia del valor
de z de interés a partir de su media, 0, es igual a la distancia del valor
correspondiente de x a partir de su media, µ , en unidades de desviación
estándar.
Parámetros y estimadores
! Parámetro: Es una cantidad numérica calculada sobre una
población
# La altura media de los individuos de un país
# La idea es resumir toda la información que hay en la población en
unos pocos números (parámetros).
! Estadístico: Es una cantidad numérica calculada sobre una
muestra
# La altura media de los que estamos en este aula.
! Somos una muestra (¿representativa?) de la población.
# Si un estadístico se usa para aproximar un parámetro también se le
suele llamar estimador.
Normalmente nos interesa conocer un parámetro, pero por la dificultad que
conlleva estudiar a *TODA* la población, calculamos un estimador
sobre una muestra y confiamos en que sean próximos.
LA INFERENCIA ESTADÍSTICA PUEDE SEPARARSE EN 2 ÁREAS :
Intervalos de Confianza
(1) Estimación de Parámetros.
(2) Dócima de Hipótesis.
(1) Estimación de Parámetros
Existe 2 métodos para realizar la estimación de un Parámetro.
A) Estimación Puntual
B) Estimación por intervalos de confianza.
(A) Estimación Puntual
Un procedimiento de estimación puntual utiliza la información de la muestra para
llegar a un sólo número o punto que estima el valor del parámetro de interés.
Tiene una escasa confiabilidad puesto que no considera el error asociado a la
estimación.
(B) Estimación por intervalo de confianza.
Consiste en Construir un intervalo basándose en la distribución de probabilidades del
estimador respectivo, con una probabilidad asociada llamada nivel de confianza que el
valor del parámetro se encuentre al interior del intervalo.
Intervalo de confianza para estimar la media de una población
(1.1) Cuando se conoce la varianza poblacional σ2
Con una muestra aleatoria de tamaño n, se obtiene la media muestralx y con un
nivel de confianza (1 - α
). 100 % el intervalo es:
x−z · σ <µ< x+z · σ
(1 − α /2) n (1 − α /2) n
(1.2.) Cuando no se conoce σ2
2
De la muestra aleatoria de tamaño n , además de calcular x , se calcula S (varianza
muestral) y con el nivel de confianza dado, tenemos el intervalo:
S S
x−t
(1 − α /2)
· <µ< x+t
(1 − α /2)
·
n n
Ejemplo (1):
La salida computacional muestra el intervalo de confianza construido para la media de la
vari able edad usando α
= 0,05.
. ci edad
Variable ¦ Obs Mean Std. Err. [95% Cong. Interval]
----------- ¦----------------------------------------------------------------------------------------------
edad ¦ 50 57.9 1.391299 55.10408 60.69592
Tamaño de muestra para estimar µ
Si la media muestral x se usa como estimador µ . El tamaño de muestra que permite
realizar la estimación con un nivel de confianza del (1α- µ
) · 100% y un error d =x| - |está
dada por:
2
' z(1−α/2) · σ $
n=% "
% d "
& #
.- Intervalo de confianza para estimar una proporción poblacional P
En una muestra de tamaño n de variables dicotómicas.
1 si posee el atributo
xi =
0 si no posee el atributo
n
∧ ∑ xi
La proporción muestral con el atributo es: p =
i=1
n
α
Luego con un nivel de confianza de ( 1 - ) · 100% tenemos el intervalo.
* ∧∧ ∧∧ '
( ∧ p q ∧ p q %
P ( p− z
(1 − α/2)
· < P < p+ z
(1 − α/2)
· % = 1 −α
( n n %
( %
) &
:
Ejemplo (3):
Estime con un 95% de confianza la proporción de personas menores de 50 años en la
muestra.
Solución:
1 si es menor de 50 años
xi =
0 si no es menor de 50 años
n
∧ ∑ xi
11
p= = = 0,22
n 50
z(0,975) = 1,96
* ∧∧ ∧∧ '
( ∧ pq ∧ pq %
P ( p− z · < P < p+ z · % = 1 −α
( n n %
( %
) &
0,22 0,78 0,22 0,78
0,22 – 1,96 < P < 0,22+ 1,96
50 50
0,105 < P < 0,334