0% encontró este documento útil (0 votos)
301 vistas90 páginas

Estimación Puntual y por Intervalos en Ingeniería

Este documento trata sobre la estimación puntual y por intervalos en el análisis de datos de ingeniería. Explica que la estimación puntual usa un único valor para estimar un parámetro, mientras que la estimación por intervalos determina un rango probable que contenga el valor verdadero. También cubre conceptos como estimadores insesgados, eficientes y consistentes, así como métodos como los momentos y la máxima verosimilitud.

Cargado por

kike Cordova
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
301 vistas90 páginas

Estimación Puntual y por Intervalos en Ingeniería

Este documento trata sobre la estimación puntual y por intervalos en el análisis de datos de ingeniería. Explica que la estimación puntual usa un único valor para estimar un parámetro, mientras que la estimación por intervalos determina un rango probable que contenga el valor verdadero. También cubre conceptos como estimadores insesgados, eficientes y consistentes, así como métodos como los momentos y la máxima verosimilitud.

Cargado por

kike Cordova
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd

UNIDAD 2:

ESTIMACIÓN
PUNTUAL Y POR
INTERVALOS
ANÁLISIS
D E D AT O S
EN
INGENIERIA
ESTIMACIÓN

Estimación • Se busca un estimador, que con base a los datos


muestrales dé origen a un valor puntual que
puntual utilizamos como estimación del parámetro.

Estimación • Se determina un intervalo aleatorio que, de forma

por probable, contiene el verdadero valor del


parámetro. Este intervalo recibe el nombre de

intervalos intervalo de confianza.


EJEMPLO
• Sea X una variable aleatoria, que estudia el grosor del tronco de un arbusto. Se conoce
que dicha variable es normal con desviación típica de 1 pero no se conoce la media.
x  N(μ,1) ; μ Ɛ R (5.7 , 6)
El parámetro a estimar es μ (estimación puntual: media, var, desv std, proporción
(prob) y la cuasi varianza)

N = población = 100

n = muestra = 10
ESTIMACIÓN PUNTUAL

Una estimación puntual de un


parámetro poblacional es cuando se
utiliza un único valor para estimar ese
parámetro, es decir se usa un punto en
concreto de la muestra para estimar el
valor deseado.
PROPIEDADES DESEABLES DE UN
ESTIMADOR
• Un estimador es insesgado cuando la esperanza matemática de este es

Insesgadez igual al parámetro que se desea estimar. Por tanto la diferencia entre el
parámetro a estimar y la esperanza de nuestro estimador tendría que ser
0.

Eficiente
• Un estimador es más eficiente o tiene la capacidad de estimar de forma
precisa cuando su varianza es reducida. Por lo tanto ante 2 estimadores,
siempre elegiremos el que tenga una varianza menor.

Consistenci • Un estimador consistente es aquel que a medida que la muestra crece se


aproxima cada vez más al valor real del parámetro. Por lo tanto, cuantos

a
más y valores entran en la muestra, el parámetro estimado será mas
preciso.
EJEMPLOS DE ESTIMACIONES
PUNTUALES
• Para obtener una estimación puntual se usa un estadístico que recibe el nombre de
estimador o función de decisión, algunos ejemplos son:
• La media muestral que sirve como estimador puntual de la media poblacional

• La desviación típica muestral que sirve de estimación para la desviación típica de la población
• S=
• La varianza muestran que sirve de estimación de la varianza poblacional.

• La proporción muestral, para estimar una proporción

• La cuasivarianza muestral corresponde a la varianza de la muestra, pero dividiendo por n-1-


EJEMPLOS
• Calculo de la media muestral tomando la muestra fija (x1,x2,x3) = (2,7,1)
• = 3.33333.
ESTIMACIÓN PUNTUAL. PROPIEDADES
DESEABLES DE LOS ESTIMADORES.

• Sea X1, …, Xn una muestra aleatoria


simple con función de densidad f(x; )
• Sea un estadístico T = u (X1, …, Xn)
• El problema es encontrar una función u que
proporcione el mejor estimador de .
• El estimador T, del parámetro debe tener
una distribución concentrada alrededor de
y la varianza debe ser lo menor posible.
ERROR CUADRÁTICO MEDIO

• Para estudiar la variabilidad del estimador


alrededor de parámetro se hace uso de una
cantidad llamada error cuadrático medio.
• T estimador de
• ECM (T) = E[(T-)2] = Var[T] +
EJEMPLO
• Sea X1, .. Xn, una muestra aleatoria simple de una población X de la que se
sabe que E[X] = μ y Var[X] = σ2
• Sea T = un estimador de μ
• Hallar el error cuadrático medio que se comete.
SOLUCIÓN
• ECM(() + (μ – E[])2
• Calculamos en primer lugar la esperanza del estimador
•  E(x) = μ
• Por lo tanto el ECM es:
• ECM(
• ECM(x) =
ESTIMADORES INSESGADOS
• Definición Sesgo de un estimador
• Sea T el estimador del parámetro . Se define el sesgo del estimador como:
• .
• Definición Estimador Insesgado
• T es un estimador insesgado de si y solo si
• E[T] = para todo

• NOTA: En este caso ECM(T) = Var[T]


EJEMPLO
• Sea X1, …Xn una muestra aleatoria simple de una población X de la que se
sabe que E[X] = μ y Var[X] = σ2
1. Demostrar que es un estimador insesgado de μ
2. Demostrar que la cuasivarianza S2 es un estimador insesgado de σ2
SOLUCIÓN
1. Demostrado en el ejemplo
anterior
2. Solución en la imagen
MÉTODOS DE CONSTRUCCIÓN DE
ESTIMADORES

Método de los • Se basa en igualar los momentos muestrales con


momentos los momentos poblacionales

Método de • Se basa en maximizar la función de verosimilitud


MV ( que mide lo verosimil o creíble que resulta
máxima cada valor de cuando se ha obtenido una muestra
verosimilitud concreta)
MÉTODO DE MÁXIMA
VEROSIMILITUD
• La función de verosimilitud L(se define como:
•  distribuciones discretas
•  distribuciones continuas.
• L() es función de , para unos ciertos valores fijos de la muestra (x1, ….Xn).
No es una variable aleatoria.
• Por comodidad, se usa su logaritmo ln L()  función soporte
PROPIEDADES DE LOS ESTIMADORES
DE MÁXIMA VEROSIMILITUD
• El EMV siempre está dentro del espacio paramétrico
• El EMV bajo condiciones generales, se distribuye asintóticamente (cuando el
tamaño muestral tiende a infinito) según una normal.
• El EMV es un estimador consistente (en el límite, para muestras grandes,
tiende a tener el valor del parámetro)
• El EMV es asintóticamente insesgado (tiende a ser insesgado)
• El EMV es asintóticamente eficiente (tiende a tener mínima varianza)
• Calcular la varianza (m y p) y si es pequeña también es adecuado
EJERCICIOS
1. La media semanal de horas de asistencia a una biblioteca de cuatro
personas de una familia es de 3,7,5, y 4 respectivamente. ¿Cuál puede
considerarse la media semanal de asistencia a la biblioteca de una familia?
2. En una ciudad se toma una muestra de 160 personas, de las cuales 49
practican deporte. Determina y calcula un estimador puntual para la
proporción de personas que practican deporte en la ciudad.
3. Se ha realizado un estudio estadístico sobre el peso, en kg, y el sexo de los recién nacidos durante seis meses en
un hospital. El peso de 15 de ellos es:
• 3.215
• 3.315
• 2.987
• 2.853
• 3.054
• 2.900
• 2.873
• 3.108
• 3.115
• 2.799
• 2.869
• 3.008
• 3.106
• 3.115
• 2.875
• Además, 7 de esos bebes son niños. Determinar un estimador puntual para:
• El peso medio de la población 
• La proporción de niños nacidos 
• Dados X1, x2, …X7, una muestra aleatoria de una población que tiene
media μ y varianza σ2 . Considere los siguientes estimadores de μ:
(
(
¿Algunos de los estimadores es insesgado? ¿Cual de los estimadores es mejor?
¿En qué sentido es el mejor?
1. E(T) = Ǿ E(x) = μ E(s^2) = σ^2 E(s^2 n-1) = σ^2 E(s) = σ E(
• Supongase que son estimadores del parámetro . Sabemos que E() = , E( )
= /2, V() = 10 y V( ) = 4, ¿Cuál es el mejor estimador? ¿En qué sentido es el
mejor?
• Calcula el margen de error al estimar una media poblacional μ para estos
valores:
1. n=30,
s= = 0.447  1.96( SE
2. n=30,
SE =
3. n=30,
4. SE = 0.44
1. Libro de Montgomery capitulo 10 estimadores (p286) estimadores
puntuales
• Supongase que son estimadores del parámetro . Sabemos que E() = , E( )
= /2, V() = 10 y V( ) = 4, ¿Cuál es el mejor estimador? ¿En qué sentido es el
mejor?
1. E(x) = μ

2. E(x) = μ/2
3. ¿Cuál es el mejor estimador?
¿CÓMO ESTIMO UNA MEDIA O
PROPORCIÓN POBLACIONAL?
• Para estimar la media poblacional μ para una población cuantitativa, el
estimador puntual es insesgado con el error estándar estimado como:

• El 95% de margen de error cuando n >= 30 se estima como:

• Para estimar la población p para una población binomial, el estimador puntual


= x/n es insesgado, con un error estándar estimado como

Suposiciones: n
EJEMPLO
• Un ambientalista está realizando un estudio del oso polar, especie que se
encuentra en el océano Ártico y sus alrededores. Su zona de distribución está
limitada por la existencia de hielo en el mar, que usan como plataforma para
cazar focas, principal sostén de los osos. La destrucción de su hábitat en el
hielo del Ártico, que se ha atribuido al calentamiento global, amenaza la
supervivencia de los osos como especie; puede extinguirse antes de un siglo.
• Una muestra aleatoria de n 50 osos polares produjo un peso promedio de
980 libras con una desviación estándar de 105 libras. Use esta información
para estimar el peso promedio de todos los osos polares del Ártico.
SOLUCIÓN
• La variable aleatoria medida es el peso, una variable aleatoria cuantitativa
mejor descrita por su media μ. La estimación puntual de μ, es el peso
promedio de todos los osos polares del ártico, es . El margen de error se
estima como:

• Se puede tener la confianza en que la estimación muestral de 980 libras está a


nomas de libras de la media poblacional.
ESTIMACIÓN POR INTERVALOS

Un estimador de intervalo es una regla para calcular dos números, por


ejemplo a y b, para crear un intervalo del estemos seguros que contiene el
parámetro de interés.
El concepto de “seguros” significa “con gran probabilidad”. La probabilidad
se mide usando el coeficiente de varianza, designado por 1 – α.

La probabilidad de que un intervalo de confianza contenga el parámetro


estimado se denomina coeficiente de varianza.
Es frecuente escuchar que se utiliza
el 95% del intervalo de confianza,
lo cual significa que la probabilidad
de que el intervalo contenga el
parámetro buscado sea de 0.95. por
lo general se utilizan valores como:
0.90, 0.95, 0.98 y 0.99.
CONSTRUCCIÓN DE UN INTERVALO
DE CONFIANZA
• Cuando la distribución muestral de un estimador puntual es
aproximadamente normal. Se puede construir un estimador de intervalo o
intervalo de confianza mediante el siguiente razonamiento.
• Sabemos que todos los valores posibles del estimador que podríamos
seleccionar, 95% de ellos están en el intervalo.
• Parámetro
• Como el valor del parámetro es desconocido, considere construir un intervalo
estimador de que tiene el mismo ancho que el primer intervalo, pero tiene un
centro variable.
• Entonces, ¿Con qué frecuencia este intervalo funcionará en forma correcta y
encerrará el parámetro de interés?
• Si se desea cambiar el coeficiente
de varianza de 1 – α= 0.95 a otro
nivel de confianza se debe
cambiar el valor z= 1.96, que
localiza el área de 0.95 dentro de
la curva normal estándar, a un
valor de z que localice el área de
1 –α en el centro de la curva.
• Como el área total bajo la curca
es 1, el área restante de las dos
colas es α y cada cola contiene un
área de α/2.
• El valor de z que tiene el área de
cola α/2 a su derecha se denomina
y el área entre y es el
coeficiente de varianza (1-α).
Intervalo de confianza de muestra grande
(1 -α) 100%

Donde es el valor z con un área


de en la cola derecha de una
* Valor positivo (UCL) (11.5) distribución normal estándar.
Esta formula genera dos valores:
* Valor negativo (LCL) (7.5) el limite inferior de confianza
(LCL) y el límite superior de
confianza (UCL).
VALORES DE “Z” QUE COMÚNMENTE SE USAN
PARA INTERVALOS DE CONFIANZA
Coeficiente de α α/2
confianza (1-α)
0.90 0.10 0.05 1.645 -90%
0.95 0.05 0.025 1.96 -95%
0.98 0.02 0.01 2.33 -98%
0.99 0.01 0.005 2.58 -99%
Intervalo de confianza de muestra grande para una media
poblacional μ
• Cuando el tamaño de muestra n es grande, la media muestral es el mejor
estimador puntual para media poblacional . Como su distribución muestral es
aproximadamente normal puede usarse para construir un intervalo de
confianza de acuerdo con el método general.

• Donde es el valor z correspondiente a un área en la cola superior de una distribución z


normal estándar y
• n = tamaño muestral
• σ = desviación estándar de la población muestreada
• Si es desconocida, puede ser aproximada por la desviación estándar muestral
s cuando el tamaño de muestra sea grande (n >= 30) y el intervalo
aproximado de confianza es
• Otra forma de hallar el intervalo de confianza de muestra grande para una
media poblacional es empezar con la estadística que tiene una distribución
normal estándar.

• Si escribimos como el valor de z con área a su derecha, entonces se puede


escribir:
) = 1-α
• Esta desigualdad se puede reescribir como:
) = 1-α
EJEMPLO
• Un científico interesado en vigilar contaminantes químicos en
alimentos y, por lo tanto, la acumulación de contaminantes en la
dieta humana, seleccionó una muestra aleatoria de n= 50 adultos
hombres. Se encontró que el promedio de ingesta diaria de
productos lácteos fue de por día, con una desviación estándar de
s= 35 gramos por día. Usa esta información muestral para
construir un intervalo de confianza del 95% para la ingesta diaria
de productos lácteos para hombres.
SOLUCIÓN
• n= 50 tamaño de muestra grande.
• La distribución de la media muestra está distribuida normalmente
en forma aproximada con media y error estándar estimado por .
El intervalo de confianza aproximado de 95% es:
7569.70
• Por lo tanto el intervalo de confianza de 95% para μ es de 746.30
a 765.70 gr por día.
• NC del 90% 747.85 – 764.14 gr/dia
• Es tan angosto como es posible. Cuanto
Un buen más angosto sea el intervalo, más
intervalo de exactamente se habrá localizado el
parámetro estimado.
confianza • Tiene un coeficiente de confianza grande,
contiene dos cercano a 1. cuanto mayor sea el
característic coeficiente de varianza, es más probable
que el intervalo contenga el parámetro
as deseables estimado.
EJERCICIO

• Con el ejemplo anterior construir un intervalo de confianza de 99% para la


ingesta diaria media de productos lácteos para los hombres adultos.
• NC del 99% 743.23 – 768.77 gr/día (49.5)
• NC del 95% 746.30 a 765.70 gr por día. (47.5)
• NC del 90%  747.85 – 764.14 gr/día (45)
• Análisis:
• Entre mayor sea el NC es mayor el intervalo y se descartan menos datos, es decir, hay menor
error.
Intervalo de confianza de muestra grande para una
proporción poblacional p

• Cuando el tamaño muestral es grande, la


proporción muestral es el mejor estimador puntual
para la proporción poblacional p. como su
distribución muestral es aproximadamente normal,
con media p y error estándar SE= , puede usarse
para construir un intervalo de confianza.
Un intervalo de confianza de muestra grande (1-α)
para una proporción poblacional p

Donde es el valor z correspondiente a un área de en la cola derecha de una


distribución normal z. Como p y q son incógnitas, se estiman con el uso de los
mejores estimadores puntuales: . El tamaño muestral se considera grande
cuando la aproximación normal a la distribución binomio es adecuada, es decir
cuando .
N >= 30 (Grande)
EJEMPLO (P = 0-1)
• Una muestra aleatoria de 985 probables electores, ósea los que
probablemente voten en la próxima elección, fueron encuestados
durante un maratón telefónico realizado por un partido político.
De ellos 592 indicaron que tenían la intención de votar por la
candidata republicana. Construir un intervalo de confianza de
90% para p, la proporción de electores probables de la población
tiene la intención de votar por la candidata republicana. Con base
a esta información, ¿se puede concluir que la candidata ganará la
elección?
SOLUCIÓN
• La estimación puntual para p es:
0.601 q=1-0.601 = 0.399
y el error estándar es:
valor de z para un intervalo de confianza de 90% es el valor que tiene el área de α/2= 0.05 en la cola
superior de la distribución z, o el intervalo de confianza del 90% para p es entonces:

LIC = 0.601-0.026 = 0.575 LSC= 0.601+0.026= 0.627


• O sea 0.575 < p < 0.627. se estima que el porcentaje de probables electores que tienen la intención
de votar por la candidata republicana es de 57.5% y 62.7%. ¿La candidata ganará la elección?
Suponiendo que ella necesita más del 50% de votos para ganars superior e inferior de confianza
exceden este valor mínimo , puede decir que con el 90% de confianza la candidata ganará
• NC del 90%  57.5% - 62.7%
• NC del 95% 56.9% - 63.2%
• NC del 99% 56% - 64.2%
• Análisis:
• Entre mas alto el NC es mayor el caso de éxito (p)
EJERCICIOS
1. Encuentra e interpreta un intervalo de confianza de 95% para una media
poblacional μ de los siguientes valores:
1. n = 36, ,  s=
13.1  12.49 -- 13.70
2. n = 64, 2.73, 0.1047 s=0.3235 2.73 2.651 - 2.809
2. Una muestra aleatoria de n=300 observaciones de una población binomial
produjo x= 263 éxitos, encuentra un intervalo de confianza de 90% para p e
interpreta el intervalo. p = 263/300= 0.87 SE= z=1.645
0.87 0.8380 -0.9019
3. Encuentra el IC de 90% para una media poblacional para los siguientes valores:
1. n= 125  0.813 – 0.86 0.79 – 0.88
2. n= 125  21.62 – 22.17
4. Encuentra el IC (1-α) 100% para una media poblacional μ de los siguientes valores:
1. α=0.01, n = 38,  33.99 – 34.005 32.55 – 35.44
2. α=0.10, n = 65, 1047.54 – 1050.45
3. α=0.05, n = 89, 2.48 65.98 – 66.62

5. Suponga que el número de éxitos observado en n 500 intentos de un experimento binomial


es 27. Encuentre un intervalo de confianza de 95% para p. Interpretar los resultados.
N=500
X= 27
P=x/n  27/500 = 0.054
Q= 1- p = 1-0.054 = 0.946
IC  0.054+0.0198 = 0.0738 0.054-0.0198=0.0342
6. La lluvia, causada por la reacción de ciertos contaminantes del aire con el agua de lluvia, parece ser
un problema creciente en la región noreste de Estados Unidos. (La lluvia ácida afecta al suelo y causa
corrosión en superficies metálicas expuestas). La lluvia pura que cae en aire limpio registra un valor
de pH de 5.7 (el pH es una medida de la acidez: 0 es ácido; 14 es alcalino). Suponga que muestras de
agua de 40 lluvias se analizan para el contenido de pH y son iguales a 3.7 y 0.5 respectivamente.
Encuentre un intervalo de confianza de 99% para el pH medio en agua de lluvia e interprete el
intervalo. ¿Qué suposición debe hacerse para que el intervalo de confianza sea válido?
N= 40
X= 3.7
S=0.5
NC=99%
IC= 3.7 + 0.2039 = 3.9039
3.7 – 0.2039 = 3.4961
ESTIMACIÓN DE LA DIFERENCIA
ENTRE DOS MEDIAS POBLACIONALES
• En estos casos hay dos poblaciones, la primera con media
y varianza y la segunda con media y varianza . Una
muestra aleatoria de mediciones se saca de la población 1
y una segunda muestra de tamaño de se saca de manera
independiente de la población 2. por último las
estimaciones de los parámetros poblacionales se calculan
a partir de los datos muestrales de los estimadores .
Intuitivamente la
diferencia entre dos
medias muestrales daría
la máxima información
acerca de la diferencia
real entre dos medias
poblacionales y éste es
de hecho el caso.
PROPIEDADES DE LA DISTRIBUCIÓN MUESTRAL DE
(LA DIFERENCIA ENTRE DOS MEDIAS MUESTRALES
• Cuando las muestras aleatorias independientes de n1 y n2 observaciones han
sido seleccionadas de entre poblaciones con medias y varianzas ,
respectivamente la distribución muestral de la diferencia (tiene las siguientes
propiedades_
1. La media de (es 
El error estándar es:
2. Si las poblaciones muestreadas están distribuidas
normalmente, entonces la distribución muestral está
distribuida normalmente exactamente, cualquiera que sea
el tamaño muestral.
3. Si las poblaciones muestreadas no están distribuidas
normalmente, entonces la distribución muestral está
distribuida normalmente aproximadamente cuando n1 y
n2 son ambas de 30 o más.
ESTIMACIÓN PUNTUAL DE (DE
MUESTRA GRANDE.
• Estimador puntual (
Intervalo de confianza de muestra grande de (1-α) al
100% para (

• Ejemplo
• Las resistencias al desgaste de dos tipos de llantas para automóvil se compararon en
muestras de prueba en camino de n1 = n2 = 100 llantas para cada tipo. El número de
millas hasta el completo desgaste se definió como una cantidad específica de desgaste
de la llanta. Los resultados de la prueba se muestra en la siguiente. Estime ((, la
diferencia en la media de millas hasta el completo desgaste, usando un intervalo de
confianza de 99%. ¿Hay diferencia en el promedio de calidad de desgaste para los dos
tipos llanta? Z=2.58

Llanta 1 Llanta 2
SOLUCIÓN
• La estimación puntual de (, es:
• (
• Y el error estándar se estima como:
• SE= =
• El intervalo de confianza de 99% se calcula como:
• (
• O sea 824.2 < ( < 1775.8. la diferencia en el promedio de millas hasta el
completo desgaste para los dos tipos de llantas se estima que está entre el
LIC = 824.2 y el LSC=1775.8 millas de desgaste.
INTERPRETACIÓN
• Con base al NC ¿se puede concluir que hay una diferencia en el promedio
de millas hasta el completo desgaste para los dos tipos de llantas?
• Si no hubiera diferencia en las dos medias poblacionales, entonces (,
serían iguales a cero. Si observamos el intervalo de confianza construido,
se verá que 0 no es uno de los posibles valores para (Por tanto no es
probable que las medias sean iguales. Se puede concluir que hay una
diferencia en el promedio de millas hasta el completo desgaste para los
dos tipos de llantas. El intervalo de confianza ha permitido tomar una
decisión acerca de la igualdad de las dos medias poblacionales.
CRITERIOS PARA CONCLUIR
• (x1-x2) = 0  las medias son iguales ó
• -5  5 las medias son iguales

• (x1-x2) = 4 ó
• -5  5 = las medias son iguales

• (x1-x2) = 4
• 5  8  las medias no son iguales, son diferentes.
EJERCICIO
• El científico del ejercicio anterior se preguntaba si había diferencia en el
promedio de ingesta diaria de productos lácteos entre hombres y mujeres. El
tomo una muestra n= 50 de mujeres adultas y registro sus ingestas diarias de
productos lácteos en gramos por día. Hizo lo mismo con hombres adultos. En
la tabla se muestra un resumen de sus resultados muestrales. Construir un
intervalo del confianza del 95% para la diferencia en el promedio de ingestas
diarias de productos lácteos para hombres y mujeres. ¿se puede concluir que
hay una diferencia en el promedio de ingestas diarias para hombres y
mujeres?
SOLUCIÓN
• (x1 – x2) = 756 – 762 = -6
• SE=
• IC
• -6  -6
• -18.77  6.77
• Conclusión
• Con un nivel de confianza del 95% se obtiene un intervalo de confianza de -18.77 <
( < 6.77, lo cual significa NO hay diferencia entre las medias, lo cual significa que la
ingesta diaria de productos lácteos es igual para hombres y mujeres.
EJERCICIO
1. Muestra aleatorias independientes se seleccionaron de las poblaciones 1 y
2. los tamaños muestrales, medias y varianzas son como sigue:

12.7-7.4 =

Población
1 2
Tamaño muestra 35 49
Media muestral 12.7 7.4
Varianza muestra 1.38 4.14
1. Encuentra un intervalo de confianza del 95% para estimar la diferencia de
las medias poblacionales.
(x1-x2)=5.3
Ic: 4.61 – 5.98
2. Con base al intervalo de confianza del punto 1, ¿se puede concluir que hay
una diferencia en las medias para las dos poblaciones? Justifica
Con un nc del 95% existe diferencia de medias de la población 1 y la población
2.
EJERCICIO
• Se realizó un estudio para comparar los números medios de llamadas
de emergencia a la policía por turno de 8 horas en dos distritos de
una gran ciudad. Muestras de 100 turnos de 8 horas se seleccionaron
al azar de entre los registros policiales para cada una de las dos
regiones y el número de llamadas de emergencia se registró para cada
turno. Las estadísticas muestrales se indican a continuación.
• Encuentra un intervalo de confianza del 90% para la diferencia en los
números medios de llamadas de emergencia a la policía por turno
entre los dos distritos de la ciudad. Interpreta el intervalo.
Región
1 2
Tamaño muestral 100 100
Media muestral 2.4 3.1
Varianza muestral 1.44 2.64

1. Intervalo de confianza al 90% (1.645)


(x1-x2)=-0.7
IC:-1.03 - -0.36

2. Conclusión
Con un nc 90% se concluye que hay una diferencia de medias entre el promedio de llamadas de la región 1
y región 2.
ESTIMACIÓN DE LA DIFERENCIA ENTRE DOS
PROPORCIONES BINOMIALES
• Estosintervalos suelen hacerse con la diferencia de
(p1-p2) entre dos proporciones binomiales p1 y p2.
muestras aleatorias independientes formadas por n1
y n2 intentos se sacan de las poblaciones 1 y 2,
respectivamente, y se calculan las estimaciones
muestrales El estimador insesgado de la diferencia
de (p1 – p2) es la diferencia muestral de (
Propiedades de la distribución muestral de la diferencia
( entre dos proporciones muestrales
• Suponga que las muestras aleatorias independientes de las observaciones n1
y n2, han sido seleccionadas de poblaciones binomiales con parámetros p1 y
p2, respectivamente. La distribución normal de la diferencia entre
proporciones muestrales: tiene estas propiedades:
1. La media de es: p1-p2
El error estándar es:

Que se estima como:


2. La distribución normal de puede ser aproximada por
una distribución normal cuando n1 y n2 son grandes.
Aun cuando el margen de una proporción individual es de
0 a 1 , la diferencia entre dos proporciones va de -1 a 1.
Para usar una distribución normal para aproximar la
distribución de ( ), deben ser aproximadamente normales,
esto es 𝑛𝑝 ̂>5 𝑦 𝑛𝑞 ̂>5, para ambas poblaciones.
Intervalo de confianza de muestra grande
(1-α) 100% para (p1-p2)

Ejemplo:
La propuesta de un bono para la construcción de una escuela será enviada a los
votantes en la siguiente elección municipal. Una parte importante del dinero
derivado de esta emisión de bonos se empleará en construir escuelas en una
zona de rápido desarrollo de la ciudad y lo demás se usará para renovar y
actualizar los edificios escolares del resto de ésta. Para evaluar la viabilidad de
la propuesta de un bono, una muestra de n1=50 residentes de la zona de rápido
desarrollo y n2=100 de las otras partes de la ciudad, se les preguntó si piensan
votar por la propuesta. Los resultados se muestran en la siguiente tabla:
P= X/N = 38/50
Sección de desarrollo Resto de la ciudad
Tamaño muestral 50 100
Número a favor de propuesta x 38 65
Proporción a favor de propuesta 0.76 0.65
p

1. Estima la diferencia en las proporciones verdaderas a favor de la propuesta de bono con un nivel de confianza del 90%
2. Si ambas muestras se agrupan en una muestra de tamaño n=150, con 103 a favor de la propuesta, de una estimación
Puntual de la proporción de residentes de la ciudad que votarán para la propuesta del bono. ¿Cuál es el margen de error?
SOLUCIÓN
1. La mejor estimación puntual de la diferencia (p1-p2) está dada por:

• El error estándar se estima como: q= 1-p

• Para un intervalo de confianza del 99%, y el intervalo se encuentra entre:


• 0.11 (-15.5 --- 5.20)
• O sea (-0.809  0.309). Como este intervalo contiene el valor (p1-p2) = 0 es
posible que p1=p2, lo cual implica que puede no haber diferencia en las
proporciones a favor del asunto del bono en las dos secciones de la ciudad.
2. Si no hay diferencia en las dos proporciones, entonces las dos muestras no
son realmente diferentes y podrían bien combinarse para obtener una
estimación total de la proporción de los residentes de la ciudad que votarán por
el asunto del bono. Si ambas muestras se agrupan, entonces n=150 y
Por tanto, la estimación puntual del valor total de p es 0.69, con un margen de
error dado por:
Observar que 0.69 produce un intervalo de 0.62 a 0.76, que incluye solo
proporciones mayores a 0.5. por tanto, si las actitudes de votantes no cambian
de manera adversa antes de la elección, la propuesta del bono debe aprobarse
por una mayoría razonable.
EJERCICIOS
1. Muestras aleatorias independientes de n1=500 y n2=500 observaciones se
seleccionaron de entre las poblaciones binomiales 1 y 2 y se observaron
x1=120 y x2= 147 éxitos. Nc=95% z=1.96
1. ¿Cuál es el mejor estimador puntual para la diferencia (p1-p2) en las dos proporciones
binomiales? Resp (p1-p2) = -0.054 p1=0.24 y p2= 0.294
2. Calcule el error estándar aproximado para la estadística empleada en el punto anterior.
Resp SE = 0.0547
3. ¿cuál es el margen de error para esta estimación puntual? Resp IC -0.108 -– 0.00073
conclusión con un nc del 95% se obtiene que las proporciones son iguales para ambas
poblaciones.
2. M&M’s, ¿La compañía Mars Incorporate, usa la misma proporción de
dulces rojos en sus variedades sencilla y de cacahuate? Una muestra
aleatoria de 56 M&M’s sencillos contenía 12 dulces rojos y otra muestra
aleatoria de 32 M&M’s de cacahuate contenía 8 dulces rojos.
1. Construye un intervalo de confianza de 95% para la diferencia de proporciones de
dulces rojos para las variedades sencillas y de cacahuate.
(pi-p2) = -0.036
IC = -0.22  0.15
2. Con base en el intervalo de confianza ¿se puede concluir que hay una diferencia en
las proporciones de dulces rojos para las variedades sencilla y de cacahuate? Justifica
tu respuesta
Con un nivel de confianza del 95% se afirma que la proporción de dulces rojos en la
presentación sencilla y con cacahuate de M&M’s es la misma.
LIMITES DE CONFIANZA A UNA COLA

En ocasiones solo es necesario estudiar


solo un superior o inferior para el
parámetro de interés. Se puede
construir un límite de confianza de
una cola para el paramétro de interés,
por ejm, μ, p, o
Un limite inferior de confianza (1-α) 100%
o LCB (cola izquierda)

(Estimador puntual) -
*(Error estándar del
estimador)
Un límite superior de confianza (1-α)
100% o UCB (derecha)

(Estimador puntual) +
*(Error estándar del
estimador)
• (x1-x2) – z(SE)  Limite de confianza de cola izquierda
• (x1-x2)+ z(SE)  Limite de confianza de cola derecha
• El valor de z para un límite de confianza de
una cola (1-α) 100%, localiza un área α en
una sola cola de la distribución normal.
EJEMPLO
• Una corporación planea emitir documentos a corto plazo y espera que
el interés que tendrá que pagar no rebasará el 11.5%. Para obtener
alguna información acerca de este problema, la corporación vendió 40
documentos, uno a través de cada una de las 40 empresas de corretaje
de acciones. La media y desviación estándar para las 40 tasas de
interés fueron 10.3% y 0.31% respectivamente. Como la corporación
está interesada en solo un limite superior en las tasas de interés,
encuentre un límite superior de confianza de 95% para la tasa media
de interés que la corporación tendrá que pagar por los documentos.
SOLUCIÓN
• Como el parámetro de interés es , el estimador puntual es con error estándar
de SE El coeficiente de confianza es de 0.95 de modo que y 96. Por lo tanto,
el límite superior de confianza de 95% es:
396
Conclusión
• Se puede estimar que la tasa media de interés que la corporación tendrá que pagar sobre
sus documentos será menos al 10.396%. La corporación no debe preocuparse por sus
tasas de interés que rebasen el 11.5%.
SELECCIÓN DEL TAMAÑO MUESTRAL
• La cantidad total de información relevante es una muestra es controlada por dos
factores:
• El plan muestral o diseño experimental: el procedimiento para recolectar la información
• El tamaño muestral n: la cantidad de información recolectada.
• Se puede aumentar la cantidad de información recolectada al aumentar el tamaño
muestras o quizá cambiar el tipo de plan muestral o diseño experimental que se
utilice.
• En un problema de estimación estadística, la precisión de la estimación es medida
por el margen de error o el ancho del intervalo de confianza. Como estas dos
mediciones son una función del tamaño muestral, especificar la precisión determina
el tamaño muestral necesario.
• Ejemplo:
• Suponer que se desea estimar el promedio de producción diaria μ de un
proceso químico y se necesita que el margen de error sea menor a 4
toneladas. Esto significa que aproximadamente 95% del tiempo de muestreo
repetido, la distancia entre la media muestral y la media poblacional será
menor a 1.96SE. Se desea que esta cantidad sea menor a 4. esto es:

Despejando n:
• Si se conoce , la desviación estándar poblacional, se puede
sustituir su valor en la formula y despejar n. Si es desconocida, se
puede usar la mejor aproximación posible:
• Una estimación s se obtiene de una muestra previa
• Una estimación del rango basada en el conocimiento de las mediciones
máximas y mínimas posibles:
• Rango = dato mayor – dato menor
• Siguiendo el ejemplo anterior, suponga que un estudio previo del
proceso químico produjo una desviación muestral estándar de s=
0.21 toneladas. Entonces:

• Esto significa que el tamaño de muestra n= 106 o mayor, puede
ser razonable.
• En ocasiones se necesita un nivel de confianza diferente al 95% de confianza
especificado por el margen de error. En este caso la mitad del ancho del
intervalo de confianza da la medida precisa para su estimación; esto es, el
límite B en el error de su estimación es:

1.645
¿CÓMO SELECCIONO EL TAMAÑO
MUESTRAL?
Determine el
parámetro y 1. Escoger B, el límite en el error de su estimación y un
coeficiente de confianza (1-
el error 2. Para un problema de una muestra, de esta ecuación

estándar a despejar el tamaño muestral n:


1. , donde es el valor de z que tiene un área de a su
estimarse de derecha.
3. Para un problema de dos muestras, hacer n1=n2= n y
su estimador resolver la ecuación del paso 2.

puntual:
FORMULAS
PARA EL
TAMAÑO
MUESTRAL
EJERCICIO
• Llenar los espacios es en blanco de la siguiente tabla y encuentra los tamaños
muestrales necesarios.
Tipo de datos Una o Margen de error Po Límite B Resolver la Tamaño
dos desigualdad muestral
muestr
as
Binomio 1 P = 0.4 0.1 n
(proporción)
Cuantitativo 1 1.96 1 1.96 n139
(media)
Cuantitativo 2 2 <=2 N1=n2 >=70

Binomio 2 P1 = p2= 0.4 0.5 <=0.05| n1=n2 >8


n1=n2 >=
1. P = 0.4 B= 0.1 nc = 95% z= 1.96
n >= *(0.4*0.6) / 92.1984
n>= 93
• P=0.4 b=0.1 nc= 90% z= 1.645
n>= 65 .
2. B=1 σ=6 z=1.96
N>=
3. B=2 σ1=σ2=6 z=1.96 nc=95%
N>= 70
4. B=0.5 p1=p2=0.4 z=1.96
N>=
EJERCICIO 2
• Los productores de tubo de plástico de polivinilo desean tener un suministro de
tubos suficiente para satisfacer las necesidades de mercado. Desean encuestar
mayoristas que compren tubos de polivinilo para estimar la proporción que
planea aumentar sus compras el año próximo. ¿Qué tamaño muestral se requiere
si desean que su estimación se centre a mas de 0.04 de la proporción real con
probabilidad igual a 0.90?
• Proporción  binomio 1 población
• B = 0.04
• Z=1.645
• N>=423
EJERCICIO 3
• Un director de personal desea comparar la efectividad de dos métodos de capacitar empleados
industriales a realizar cierta operación de ensamble. Un número de empleados se ha de dividir en
dos grupos iguales: el primero recibiendo capacitación del método 1, y el segundo, el método de
capacitación 2. cada uno efectuará la operación de ensamble y el tiempo de ensamblado se
registrará. Se espera que las mediciones para ambos grupos tendrán una variación de alrededor de
8 minutos. Para que la estimación de la diferencia en tiempos medios de ensamble sea correcta a
nomás de 1 minuto de variación, con una probabilidad igual a 0.95. ¿Cuántos trabajadores deben
estar incluidos en cada grupo de capacitación?
• Media  Cuantitativo  2 poblaciones
• B = 1 =8 z=1.96
• N>=
• N1=n2=62
• IC 
• Limite de Confianza
• Inferior - (cola izquierda)
• Superior + (cola derecha)
• Error Estándar SE

• Margen de Error ME

•  ME

ME
0.0036 SE

También podría gustarte