1
Teorema Central del Límite y Ley de los Grandes Números.
Ley de los Grandes Números:
Establece que si X1, X2, X3, ... es una sucesión infinita de variables aleatorias independientes que tienen el mismo valor
esperado y varianza , entonces el promedio : converge, en
probabilidad, al valor esperado de la distribución subyacente de X (μ). En otras palabras, para cualquier
número positivo ε se tiene:
Teorema Central del Límite:
Sea , , ..., un conjunto de variables aleatorias, independientes e idénticamente distribuidas de
una distribución con media μ y varianza σ2≠0. Entonces, si n es suficientemente grande, la variable
aleatoria
, tiene aproximadamente una distribución Normal con
media y varianza .
Es muy común encontrarlo con la variable estandarizada Zn en función de la Media Muestral , .
Una de las grandes importancias de T.C.L, para el cálculo, es que nos permite determinar las probabilidades acumulativas
de la suma o promedio de un gran número de variables aleatorias.
El diagrama
de flujo
resume las
decisiones
que deben
tomarse
cuando se
calcula el
valor del
error
estándar:
rof: Frendy Pedroza
2
Parámetro Estimador Estandarización Expresiones de La Esperanza y
(θ) ̂
(𝜃) Desviación Estándar
Valor que está Valor que está Zc = 𝜽̂−𝐄( 𝜽̂) E( 𝜽̂) = θ
en función de ̂
𝝈𝜽
en función de
la población la muestra
E (𝒙̅)=μ
𝐱̅ − 𝛍 𝝈
μ 𝐱̅ 𝜎𝑥̅ = 𝑛, Si no se conoce 𝝈, se estima con s,
√
𝛔𝐱̅ 𝑺
Media Media entonces: 𝜎
̂𝑥̅ = ,
√𝑛
Poblacional Muestral
∆μ ̅
∆𝒙 ̅ ) = ∆μ
E (∆𝒙
Diferencia de Diferencia de
𝝈𝟐 𝝈𝟐
medias medias 𝝈∆𝒙̅ = √ 𝟏 + 𝟐
Poblacionales Muéstrales 𝒏𝟏 𝒏𝟐
∆μ = μ2 – μ1 ∆𝐱̅ − ∆𝛍 Si no se conoce 𝝈𝟐𝟏 ni 𝝈𝟐𝟐 ,
ó ∆𝒙 ̅𝟐 - 𝐗
̅=𝐗 ̅𝟏 𝛔∆𝐱̅ se estiman con 𝒔𝟐𝟏 y 𝒔𝟐𝟐 , entonces:
∆μ = μ1 – μ2
Ó 𝑺𝟐 𝑺𝟐
𝝈̂̅ = √𝒏 + 𝒏
𝟏 𝟐
∆𝒙
𝟏 𝟐
̅𝟏 - 𝐗
∆𝐱̅ = 𝐗 ̅𝟐
𝛑 p
Proporción Proporción 𝐩 − 𝐄(𝐩) 𝐄( 𝒑) = 𝝅
Poblacional Muestral 𝛔𝐩 𝛑 ∗ (𝟏 − 𝛑)
(𝝅 = K/N) (p = x/n) 𝛔𝐩 = √
K: Número de x: Número de 𝐧
=
elementos de elementos de S i no se conoce 𝛑 se estima con “p”,
una población una muestra 𝐩−𝛑 entonces:
con una cierta con una cierta 𝒑∗(𝟏−𝒑)
característica característica 𝛔𝐩 ∆𝒑 = √
𝝈̂ 𝒏
N: Tamaño de n: Tamaño de
la población la Muestra
∆𝝅 ∆p
Diferencia de ∆𝐩 − 𝐄(∆𝐩) 𝛔∆𝐩
Proporciones ∆p = p1 – p2 𝛔∆𝐩
Poblacionales 𝛑𝟏 ∗ (𝟏 − 𝛑𝟏 ) 𝛑𝟐 ∗ (𝟏 − 𝛑𝟐 )
ó = =√ +
∆ 𝝅 = 𝝅𝟏 -𝝅𝟐 ∆p = p2- p1 𝐧𝟏 𝐧𝟐
ó ∆𝐩 − ∆ 𝝅 Si no se conocen 𝝅1 ni 𝝅2 se
∆ 𝝅 = 𝝅𝟐 -𝝅𝟏
𝛔∆𝐩 estiman con “p1” y “p2”
𝒑𝟏 ∗(𝟏−𝒑𝟏 ) 𝒑𝟐 ∗(𝟏−𝒑𝟐 )
𝝈̂̅ =√
∆𝒑 +
𝒏𝟏 𝒏𝟐
3
Estimación: Intervalos de confianza y Prueba o Contraste de Hipótesis
La teoría clásica de la inferencia Estadística, trata de los métodos mediante los cuales se toma
una muestra de una población, y a partir del estudio o análisis de esta muestra:
1) Se observa o estima el valor de un parámetro desconocido, θ: Estimación de un
parámetro
2) Se estima si θ es o no igual, mayor o menor que cierto valor preconcebido θ 0: Prueba
de Hipótesis de un parámetro.
La estimación es un instrumento básico para las Investigaciones Científicas, para la
formulación de políticas Públicas y para la Toma de Decisiones en los Negocios.
Características de un buen estimador.
1) Insesgabilidad: Se dice que un estimador es insesgado, si el valor esperado de éste
es igual a su respectivo parámetro E( 𝜽̂) = θ
2) Consistencia: Un estimador es consistente, si a medida que aumenta el tamaño de la
̂, se aproxima al verdadero valor del parámetro θ.
muestra(n), el valor del estimador 𝛉
3) Eficiencia: Se dice que un estimador 𝛉 ̂1 es más eficiente que otro estimador 𝛉
̂2, si la
varianza del primero es menor que la del segundo: V( 𝜽 ̂ 1 ) < V (𝜽
̂ 2 ).
4) Suficiencia: Un estimador es suficiente, si una muestra de éste transmite tanta
información como sea posible, acerca del parámetro.
Estimación de un Parámetro: Se tienen dos tipos de estimación:
1.- Estimación Puntual: Cuando se determina a partir de una muestra, un solo valor de
̅ = 100, estima el valor de μ.
estimación Ej.: 𝒙
2.- Estimación por Intervalos: Consiste en construir intervalos cuyos límites son función
de las observaciones muéstrales y donde se espera, con una cierta confianza, que el verdadero
valor del parámetro, se encuentre dentro de estos límites, esto es: P (Li < θ < Ls) = 1 - α,
donde (1 – α) representa la confianza, es decir, la probabilidad de que el verdadero valor
del parámetro esté dentro del intervalo.
Estimación por Intervalos: La estimación por intervalos de confianza se obtendrá a partir
de la siguiente desigualdad:
̂ | ≤ k σ𝛉̂ ) = (1 – α), al desarrollar el valor absoluto la expresión queda finalmente
P (| θ – 𝜽
como:
̂ – k 𝛔𝛉̂ ≤ θ ≤ 𝜽
P( 𝜽 ̂ + k 𝝈𝜽 ̂ ) = 1 – α, donde :
̂ – k σ𝛉̂ = Li y 𝜽
𝜽 ̂ + k σ𝛉̂ = Ls y ”k”, se le llama multiplicador de confianza.
Cuando la distribución por muestreo del estimador 𝜃̂, sigue una distribución normal, el
multiplicador de confianza k = | Z α/2 |, es el valor absoluto de una normal estándar.
Entonces la expresión queda:
(*) ̂ – | Z α/2 |*𝛔𝛉̂ ≤ θ ≤ 𝜽
P( 𝜽 ̂ + | Z α/2 |* 𝛔𝛉̂ ) = 1 – α
4
Una confianza del 90% (1 – α = 0,90).
Significa que, si se toman, por ejemplo 100 muestras del mismo tamaño de una población y
se determina un intervalo de confianza para cada muestra: 90 de estos intervalos
contendrán al verdadero valor del parámetro, mientras que 10 no lo contendrán. En la
práctica, cuando sólo determinamos un intervalo de confianza, éste podrá contener o no el
verdadero valor del parámetro poblacional, por eso es importante mencionar con que
confianza o probabilidad, se afirma tal decisión.
Es importante resaltar algunos aspectos fundamentales:
a.- La expresión (*), representa un intervalo simétrico que puede ser utilizado para realizar
inferencia de estimadores cuya distribución sea simétrica y también para aquellos que se
comportan asimétricamente.
b.- La ley de Los Grandes Números y El Teorema Central del Límite, justifican, con el hecho
de tener un tamaño de muestra(n), suficientemente grande, el considerar que los estimadores
para valores Numéricos 𝜃̂: 𝒙
̅ (Media Muestral, cuando se analiza una sola población) y ∆𝒙 ̅
(Diferencia de Medias, cuando se comparan dos poblaciones), así como los estimadores
para valores No Numéricos 𝜃̂: 𝑝 (proporción Muestral, cuando se analiza una sola
población) y ∆𝒑 (diferencia de proporciones, cuando se comparan dos poblaciones);
siguen una Distribución Normal, por este motivo, este contenido estará referido a realizar
Inferencia: Intervalos de Confianza y Contraste de Hipótesis, utilizando la Distribución
Normal. Otras Distribuciones son utilizadas en el campo estadístico, cuando otras son las
condiciones existentes o según la naturaleza del análisis que se desea realizar sobre conjuntos
de datos.
c.- El intervalo de confianza para un parámetro o valor poblacional, se pude representar así:
̂ – | Z α/2 |* σ𝛉̂ ≤ θ ≤ 𝜽
𝜽 ̂ + | Z α/2 |* σ𝛉̂ ó así:
̂ ± | Z α/2 |* 𝛔𝛉̂ .
θ= 𝜽
Significa que debemos identificar en cada ejercicio:
1.- De que parámetro o valor poblacional se está hablando: θ : μ, ∆μ, 𝝅 o ∆𝝅 y
su correspondiente estimador 𝜽̂ : 𝒙
̅, ∆𝒙
̅, p o ∆𝒑.
2.- A partir de la confianza dada 1 – α, determinar el Correspondiente valor | Z α/2 |,
en la tabla Normal Estándar.
3.- Calcular la desviación estándar del estimador 𝛔𝛉̂ , explicando la no existencia de
valores poblacionales involucrados en la expresión.
4.- Escribir el intervalo, anteponiendo la confianza dada (probabilidad de que el
verdadero valor del parámetro, se encuentre dentro de este), y explicando los resultados
de acuerdo a la naturaleza del problema.
5
Determinación del Tamaño de la Muestra (n).
El tamaño de la muestra en la construcción de un intervalo para un parámetro poblacional
depende de dos factores:
a.- El grado de precisión con que se desea realizar el estudio y
b.- La confianza de que de que el error en la estimación, no exceda el error máximo
permisible. Ambos aspectos están implicados en la expresión:
|θ–𝜽 ̂ | ≤ | Z α/2 |*σ𝜽
̂ . La diferencia, en valor absoluto, del valor de estimación y el
parámetro, es el error de estimación, cuyo valor máximo es | Z α/2 |*σ𝜽 ̂.
El siguiente cuadro muestra la determinación del tamaño de la muestra, según el parámetro
involucrado en el estudio:
Parámetro Estimador Expresión del Máximo Tamaño de Muestra
(θ) ̂)
(𝛉 Error permisible
(n)
∈Max = | Z α/2 |*σ𝜽̂.
𝝈 𝝈
μ 𝑥̅ ∈Max = | Z α/2 |*| 𝑛 n = [Z α/2 *∈𝐌𝐚𝐱]2
√
Haciendo n1 = n2 = n
∆μ ̅
∆𝒙 𝐙 𝛂/𝟐
∈Max = |Zα/2| *√𝒏 + 𝒏
𝝈𝟐𝟏 𝝈𝟐𝟐 n = [ ∈𝐌𝐚𝐱 ]2 * (𝝈𝟐𝟏 + 𝝈𝟐𝟐 )
𝟏 𝟐
o S12 y S22
𝜋 p ∈Max = 𝐙 𝛂/𝟐
n = [ ∈𝐌𝐚𝐱 ]2 *[ 𝜋.( 1 - 𝜋 )]
𝜋∗(1−𝜋)
| Z α/2 |*√ 𝑛
Se toma p por 𝝅, un
valor de estudios
recientes ó 𝝅 = 0,5
∆𝜋 ∆p ∈Max = | Z α/2| Haciendo
𝜋1 ∗(1−𝜋1 ) 𝜋2 ∗(1−𝜋2 )
*√ + n1 = n2 = n =
𝑛1 𝑛2
𝐙 𝛂/𝟐 2
[ ] [𝝅𝟏 . (𝟏-𝝅𝟏 )+𝝅𝟐 . (𝟏-𝝅𝟐 ]
∈𝐌𝐚𝐱
Ejercicios:
1.- Se sospecha que, en una gran editorial, más del 40% de los vendedores no alcanzan un
límite de ventas mínimo establecido por la dirección. El Gerente General, preocupado por tal
situación, ordena la realización de un estudio. Se toma una muestra de 300 vendedores y se
encuentra que 105 no han conseguido llegar al límite de ventas mínimo establecido. Con
una confianza del 88 %. Que podemos decirle al Gerente general.
6
Solución:
Datos: Procedimiento a seguir
n = 300 Se trata de un problema de proporción
x = 105 poblacional con una sola población.
1 – α = 0,88 Se construirá un intervalo de confianza del 88%.
θ = 𝜋 y 𝜃̂ = p Para la verdadera proporción de vendedores que
Se sospecha que más del 40 % de los vendedores de la están por debajo del límite de ventas.
editorial, están por debajo del límite mínimo de ventas
( es decir que 𝝅 > 0,40)
P ( p – | Z α/2 |*σp ≤ 𝛑 ≤ p+ | Z α/2 |* σp) = 0,88
1 – α = 0,88 α = 1 – 0,88 = 0,12 α = 0,12 α/2 = 0,06 | Z 0,06| = 1,555
p = x/ n = 105 / 300 p = 0,35
𝜋∗(1−𝜋)
𝜎𝑝 = √ , como no se conoce 𝛑 (lógicamente, porque es el parámetro que se está
𝑛
infiriendo), se estima con el valor Muestral( p). Entonces:
𝑝∗(1−𝑝) 0,35∗(1−0,35)
̂𝑝 = √
𝜎 =√ =0,028 𝝅 = 0,35 ± 1,555* 0,028 = 0,35 ± 0,044
𝑛 300
0,32 ≤ 𝛑 ≤ 0,39
Conclusión: Con una confianza del 88 %, podemos afirmar que la verdadera proporción de los
vendedores de la editorial que están por debajo del límite de ventas, se ubica entre 32 y 39 %, y
aunque dicha proporción no está por encima del 40 %, como se sospechaba, si debe ser un
motivo de preocupación para el gerente general, el hecho de que el límite superior de este
intervalo, si se encuentra rosando el 40 %.
Con La finalidad de tener una mayor precisión, el Gerente desearía repetir el estudio,
aumentando la confianza al 99 %, ¿Cuál debería ser el tamaño de la muestra?
Buscamos el nuevo valor de Z α/2. 1 – α = 0,99 α = 0,01 α/2 = 0,005
Z0,005 = -2,575. Calculamos el nuevo valor de n, que, lógicamente, debe ser mayor al
𝐙 𝛂/𝟐
tamaño de la muestra original (300): n = [ 𝐄𝐌𝐚𝐱 ]2 *[ 𝝅.( 1 - 𝝅 )], tomaremos 𝝅 = 0,5, ya que
no se tiene información de estudios anteriores. 𝐄𝐌𝐚𝐱 = 0,044, sustituyendo en la fórmula:
𝐙 𝛂/𝟐 𝟐,𝟓𝟕𝟓
n = [ 𝐄𝐌𝐚𝐱 ]2 *[ 𝝅.( 1 - 𝝅 )] = n = [ 𝟎,𝟎𝟒𝟒 ]2 *[ 𝟎, 𝟓.( 0,5 )] = 856,23.
Si se desea aumentar la confianza al 99 %, se debe tomar una muestra de 856 vendedores.
2.- Con la finalidad de analizar el mejor rendimiento promedio entre los estudiantes de
dos universidades, Se realizó un estudio. Una muestra de 150 estudiantes de la Universidad
A, arrojó un promedio de 14,8 puntos, con una varianza de 25 puntos2, mientras que a 200
de la universidad B, se les encontró un promedio de 13,6 puntos con una desviación estándar
de 8 puntos. Con una confianza del 96 %. ¿Muestran los resultados de las muestras una
diferencia significativa a favor de la universidad A?
7
Solución:
Datos: Procedimiento a seguir
Universidad A Universidad B Se trata de un problema de diferencia de medias
entre dos poblaciones.
nA =150 NB =200
Se construirá un intervalo de confianza del 96%.
𝐱̅A = 14,8 𝐱̅B = 13,6 Para la verdadera diferencia entre los
SA2= 25 SB2 = 82 = 64 rendimientos promedios de las universidades.
1 – α = 0,96
θ = ∆μ y ̅
𝜃̂ = ∆𝒙
̅ – |𝐙𝛂/𝟐| 𝜎∆𝑥̅ ≤ ∆μ ≤ ∆𝒙
P ( ∆𝒙 ̅ + |𝐙𝛂/𝟐| 𝜎∆𝑥̅ ) = 0,96 , 1 – α = 0,96 α = 0,04
α/2 = 0,02 | Z 0,02| = 2,05
̅ = ̅̅̅̅
∆𝒙 𝑿𝑨 − ̅̅̅̅
𝑿𝑩 = 14,8 – 13,6 = 1,2
𝝈𝟐 𝝈𝟐
𝝈∆𝒙̅ = √𝒏𝟏 + 𝒏𝟐 , como no se conocen 𝝈𝟐𝟏 ni 𝝈𝟐𝟐 , las estimamos con 𝒔𝟐𝟏 y 𝒔𝟐𝟐 , entonces:
𝟏 𝟐
𝑺𝟐𝟏 𝑺𝟐𝟐 𝟐𝟓 𝟔𝟒
𝜎̂̅ = √𝒏 + 𝒏
∆𝒙 =√𝟏𝟓𝟎 + 𝟐𝟎𝟎 = 0,7 ̅ ± |𝐙𝛂/𝟐| 𝜎̂
∆μ = ∆𝒙 ̅
∆𝒙
𝟏 𝟐
∆μ = 1,2 ± 2,05* 0,7 = 1,2 ± 1,435
- 0,24 ≤ ∆𝛍 ≤ 2,64
Conclusión: Con una confianza del 96 %, podemos observar que la verdadera diferencia entre
los rendimientos promedios de las dos universidades, se ubica entre – 0,24 y 2,64 puntos. La
parte negativa del intervalo habla de una diferencia a favor de la universidad B, y una
inclusión del valor cero que podría significar un resultado que predice una igualdad de
rendimientos promedio entre ambas universidades, pero el límite superior del intervalo es
considerablemente mayor, por lo que se evidencia en el estudio, una diferencia bastante
significativa a favor de la universidad A. Todo esto basados en la confianza del 96 % de la
ocurrencia de este hecho.
3.- La efectividad de dos fertilizantes están siendo probadas para lanzar al mercado,
alguno de los dos o ambos, en caso de que no exista una diferencia significativa entre
estos. El fertilizante “X”, es probado en 500 plantas y 240 dieron un resultado positivo,
mientras el Fertilizante “Y”, se probó en 400 plantas y 168 respondieron
satisfactoriamente. Con una confianza del 94,66 %. ¿Qué fertilizante recomendaría
usted para salir al mercado?
4.- Una empresa grande que utiliza cierto tipo de Fluorescentes, esta interesada en
comprar un gran lote, siempre y cuando la vida media de estos supere las 1.000 horas.
Una empresa dice cumplir con este requisito. Entonces se toma una muestra de 150
8
lámparas y arrojaron una vida promedio de 990 horas con una desviación estándar de
20 horas. Realice: a.- Con una confianza del 92 %. ¿Apoyaría usted la compra de las
lámparas?, b.- Si se disminuye el error en un 17,45 %. ¿Cuantas lámparas habría que probar?
c.- Cual sería el efecto sobre la muestra si aparte de la pregunta (b), se aumenta la confían al
97,36 %?