0% encontró este documento útil (0 votos)
81 vistas8 páginas

ESTIMACIÓN

Este documento presenta conceptos sobre estimación estadística, incluyendo: 1) Estimaciones puntuales y por intervalos, donde las estimaciones puntuales proporcionan un solo valor y las estimaciones por intervalos dan un rango de valores posibles. 2) Cómo calcular intervalos de confianza para estimar parámetros de una población normal, usando la distribución Z cuando la varianza es conocida o el tamaño muestral es grande. 3) Cómo estimar intervalos de confianza cuando la varianza de la población no se conoce, us
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
81 vistas8 páginas

ESTIMACIÓN

Este documento presenta conceptos sobre estimación estadística, incluyendo: 1) Estimaciones puntuales y por intervalos, donde las estimaciones puntuales proporcionan un solo valor y las estimaciones por intervalos dan un rango de valores posibles. 2) Cómo calcular intervalos de confianza para estimar parámetros de una población normal, usando la distribución Z cuando la varianza es conocida o el tamaño muestral es grande. 3) Cómo estimar intervalos de confianza cuando la varianza de la población no se conoce, us
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

INFERENCIA ESTADÍSTICA

ESTIMACIÓN

PROFESOR: JORGE ALTAMIRA


ALUMNA: SANTILLÁN BARRERA ALINE SOFÍA
GRUPO 2413
2. ESTIMACIÓN
2.1 Introducción.
Todo el mundo hace estimaciones. Cuando está por cruzar una calle, hace una estimación de la velocidad del
automóvil que se acerca, de la distancia que hay entre usted y el auto y de su propia velocidad. Habiendo hecho
rápidamente todas estas estimaciones, usted decide si espera, camina o corre. En este capítulo introducimos
métodos que nos permiten estimar con precisión razonable la proporción de la población (la fracción de la
población que posee una característica dada) y la media de la población. Como tomadores de decisiones, nos
veremos forzados, en ocasiones, a confiar en nuestros presentimientos. Sin embargo, en otras situaciones, en las
que dispongamos de información y podamos aplicar los conceptos de estadística, tendremos mejores resultados.
2.2. Estimación puntual y por intervalos.
Estimaciones puntuales: La media de la muestra x es el mejor estimador de la media de la población. Es
insesgada, consistente, el estimador más eficiente y, siempre y cuando la muestra sea suficientemente grande, su
distribución muestral puede ser aproximada por medio de la distribución normal. Si conocemos la distribución
muestral de x , podemos obtener conclusiones respecto a cualquier estimación que podamos hacer a partir de la
información muestral. Considere el caso de una compañía de suministros clínicos que produce jeringas
desechables. Cada jeringa está cubierta por una envoltura estéril que a su vez se empaca en grandes cajas de
cartón corrugado. Debido al proceso de empaque, las cajas de cartón contienen distintas cantidades de jeringas.
Como las jeringas se venden por pieza, la compañía necesita una estimación del número de piezas que hay por
caja, para propósitos de facturación. Tomamos una muestra aleatoria de 35 cajas y registramos el número de
jeringas contenidas en cada caja. Utilizando los conceptos del capítulo 3, podemos obtener la media de la
muestra, x, sumando todos los resultados, x, y dividiendo esta suma entre n, el número de cajas muestreadas: x
[3-2] Utilizando esta ecuación para resolver el problema, tenemos: x x 102 jeringas Así, al usar la media de la
muestra, x como estimador, la estimación puntual de la media de la población, , es 102 jeringas por caja. El
precio de fabricación de cada jeringa hipodérmica desechable es bastante bajo (alrededor de 25 centavos), de
modo que tanto el comprador como el vendedor aceptarían esta estimación puntual como base para la
facturación, y el fabricante puede ahorrarse el tiempo y el gasto de contar las jeringas contenidas en las cajas.
Estimaciones por intervalos: El propósito de tomar muestras es conocer más acerca de una población.
Podemos calcular esta información a partir de las muestras como estimaciones puntuales, que acabamos de
analizar, o como estimaciones de intervalo, que son el tema del resto de este capítulo. Una estimación de
intervalo describe un rango de valores dentro del cual es posible que esté un parámetro de la población.
Suponga que el director de estudios de mercado de una fábrica de refacciones automotrices necesita hacer una
estimación de la vida promedio de las baterías para automóvil que produce su compañía. Seleccionamos una
muestra aleatoria de 200 baterías, registramos el nombre y dirección de los propietarios de los automóviles,
como están en los registros de ventas, y entrevistamos a estas personas con respecto a la duración de la batería
de su automóvil. Nuestra muestra de 200 usuarios tiene una vida media de las baterías de 36 meses. Si
utilizamos la estimación puntual de la media de la muestra x como el mejor estimador de la media de la
población, informaríamos que la vida media de las baterías de la empresa es 36 meses. Pero el director también
pide una conclusión acerca de la incertidumbre que acompañará a esta estimación; es decir, una afirmación
acerca del intervalo dentro del cual es probable que esté la media de la población desconocida. Para
proporcionar tal afirmación, necesitamos encontrar el error estándar de la media. En el capítulo 6 aprendimos
que, si seleccionamos y graficamos un número grande de medias de muestras de una población, la distribución
de estas medias se aproximará a la curva normal. Además, la media de las medias muestrales será la misma que
la media de la población. Nuestro tamaño de muestra de 200 baterías es suficientemente grande para poder
aplicar el teorema central del límite; como se hizo de manera gráfica en la figura 7-1. Para medir la extensión, o
dispersión, de nuestra distribución de medias muestrales, podemos utilizar la siguiente fórmula* y calcular el
error estándar de la media:

Suponga que ya se estimó la desviación estándar de la población de baterías y se informó que es 10 meses. Con
esta desviación estándar y la primera ecuación del capítulo 6, podemos calcular el error estándar de la media:

Ahora, podemos informar al director que nuestra estimación de la vida útil de las baterías de la compañía es 36
meses y que el error estándar que acompaña a esta estimación es 0.707. En otras palabras, la vida útil real para
todas las baterías puede estar en alguna parte de la estimación de intervalo comprendida entre 35.293 y 36.707
meses. Esto es útil pero no es suficiente información para el director. Necesitamos calcular la posibilidad de que
la duración real de las baterías esté en este intervalo o en otros intervalos de diferentes anchos que podamos
escoger, 2 (2 0.707), 3(3 0.707), y así sucesivamente.
2.3. Intervalos de confianza para la medida de una población normal.
En estadística, la probabilidad que asociamos con una estimación de intervalo se conoce como nivel de
confianza. El intervalo de confianza es el rango de la estimación que estamos haciendo.
2.3.1. Varianza conocida o tamaño muestral grande. (Distribución Z).
Un mayorista de refacciones automotrices necesita una estimación de la vida media que puede esperar de los
limpiadores de parabrisas en condiciones normales de manejo. La administración de la empresa ya ha
determinado que la desviación estándar de la vida útil de la población es 6 meses. Suponga que seleccionamos
una sola muestra aleatoria de 100 limpiadores, tomamos los datos referentes a su vida útil y obtenemos los
siguientes resultados: n 100 ← Tamaño de la muestra x 21 meses ← Media de la muestra 6 meses ←
Desviación estándar de la población Como el distribuidor utiliza decenas de miles de limpiadores al año, nos
pide que encontremos una estimación de intervalo con un nivel de confianza del 95%. El tamaño de la muestra
es mayor que 30, de modo que el teorema central del límite nos permite usar la distribución normal como
distribución de muestreo, aun cuando nuestra población no tenga distribución normal. Calculamos el error
estándar de la media con la ecuación 6-1:

A continuación, consideraremos el nivel de confianza con el cual estamos trabajando. Como un nivel del 95%
de confianza incluirá el 47.5% del área que se encuentra a ambos lados de la media de la distribución de
muestreo, podemos buscar en el cuerpo de la tabla 1 del apéndice el valor correspondiente a 0.475.
Descubrimos que 0.475 del área bajo la curva normal está contenida entre la media y un punto situado a 1.96
errores estándar a la derecha de la media. Por consiguiente, sabemos que (2)(0.475) 0.95 del área está
localizada entre 1.96 errores estándar de la media y que nuestros límites de confianza son:
x 1.96 x ← Límite superior de confianza x 1.96 x ← Límite inferior de confianza
Luego sustituimos valores numéricos en estas dos expresiones: x 1.96x 21 meses 1.96(0.6 meses) 21 1.18
meses 22.18 meses ← Límite superior de confianza x 1.96 x 21 meses 1.96(0.6 meses) 21 1.18 meses 19.82
meses ← Límite inferior de confianza
Ahora podemos informar que estimamos la vida media de la población de limpiadores de parabrisas entre 19.82
y 22.18 meses con un 95% de confianza.
Cuando no se conoce la desviación estándar de la población Un problema más complejo de estimación de
intervalo proviene del departamento de servicio social de una dependencia gubernamental local. El
departamento está interesado en estimar el ingreso medio anual de 700 familias que viven en una sección de
cuatro manzanas de una comunidad. Tomamos una muestra aleatoria simple y encontramos los siguientes
resultados: n 50 ← Tamaño de muestra x $11,800 ← Media de la muestra s $950 ← Desviación estándar de la
muestra El departamento nos pide que calculemos una estimación de intervalo del ingreso anual medio de las
700 familias, de modo que pueda tener el 90% de confianza de que la media de la población se encuentra dentro
de ese intervalo. El tamaño de la muestra es mayor que 30, de manera que, de nuevo, el teorema central del
límite nos permite utilizar la distribución normal como la distribución de muestreo. Observe que una parte de
este problema es diferente de los ejemplos anteriores; no conocemos la desviación estándar de la población y,
por tanto, utilizaremos la desviación estándar de la muestra para estimar la desviación estándar de la población:

El valor de $950.00 es nuestra estimación de la desviación estándar de la población. El símbolo para representar
este valor estimado es ˆ, que se conoce como sigma gorro. Ahora podemos estimar el error estándar de la media.
Como tenemos un tamaño de población finito y nuestra muestra constituye más del 5% de la población,
utilizaremos la fórmula para derivar el error estándar de la media de poblaciones finitas:

En seguida consideramos el nivel de confianza del 90%, que incluiría el 45% del área que se encuentra a ambos
lados de la media de la distribución de muestreo. Si observamos la tabla 1 del apéndice y buscamos el valor
correspondiente a 0.45, encontramos que aproximadamente 0.45 del área bajo la curva normal está localizada
entre la media y un punto alejado de ésta 1.64 errores estándar. En consecuencia, el 90% del área está localizada
entre 1.64 errores estándar de la media, y nuestros límites de confianza son:
El informe que podríamos dar al departamento de servicio social sería: “Con una confianza del 90%, estimamos
que el ingreso anual promedio de las 700 familias que viven en una sección de cuatro manzanas se encuentra
entre $11,587.50 y $12,012.50.”

2.3.2. Varianza desconocida y tamaño muestral pequeño. (Distribución


t de student).
El uso de la distribución t para hacer estimaciones se requiere siempre que el tamaño de la muestra sea menor o
igual que 30 y la desviación estándar de la población no se conozca. Además, al utilizar la distribución t,
suponemos que la población es normal o aproximadamente normal.
Una distribución t es menor en la media y mayor en las colas que una distribución normal.
Grados de libertad Se afirmó que existe una distribución t diferente para cada tamaño de muestra. En un
lenguaje estadístico apropiado, diríamos: “existe una distribución t distinta para cada uno de los grados de
libertad posibles”. ¿Qué son los grados de libertad? Podemos definirlos como el número de valores que
podemos escoger libremente.

Suponga que se manejan dos valores de muestra, a y b, y sabemos que tienen una media de 18. En símbolos, la
situación es:

¿Cómo podemos encontrar los valores que a y b pueden tomar en esta situación? La respuesta es que a y b
pueden ser cualesquiera dos valores cuya suma sea 36, ya que 36
2 18. Suponga que sabemos que el valor de a es 10. Ahora b ya no es libre de tomar cualquier valor, sino que
debe ser 26, ya que:
Este ejemplo nos muestra que cuando hay dos elementos en una muestra y conocemos la media muestral de
esos dos elementos, entonces somos libres de especificar sólo uno de los elementos, porque el otro estará
determinado por el hecho de que los dos elementos suman el doble de la media de la muestra. En un lenguaje
estadístico decimos que “tenemos un grado de libertad”. Veamos otro ejemplo. Existen siete elementos en
nuestra muestra y sabemos que la media de estos elementos es 16. En símbolos tenemos la siguiente situación:

En este caso, los grados de libertad o el número de variables que podemos especificar libremente es 7 1 6.
Tenemos la libertad de asignar valores a seis variables, y luego ya no tenemos libertad de especificar el valor de
la séptima variable; ésta queda determinada automáticamente. Con dos valores de muestra tenemos un grado de
libertad (2 1 1), y con siete valores de muestra tenemos seis grados de libertad (7 1 6). Entonces, en cada uno
de estos dos ejemplos tenemos n 1 grados de libertad, si n es el tamaño de la muestra. Similarmente, una
muestra de 23 elementos nos daría 22 grados de libertad. Utilizaremos los grados de libertad cuando elijamos
una distribución t para estimar una media de población, y utilizaremos n 1 grados de libertad, cuando n es igual
al tamaño de la muestra. Por ejemplo, si utilizamos una muestra de 20 para estimar una media de población,
usaremos 19 grados de libertad para elegir la distribución t apropiada.
2.4. Determinación del tamaño de muestra adecuado.
En todos los análisis hechos hasta ahora, hemos utilizado el símbolo n en lugar de un número específico. Ahora
necesitamos saber cómo determinar el número que se debe usar. ¿Qué tan grande deberá ser la muestra? Si ésta
es muy pequeña, podemos fallar en el logro de los objetivos de nuestro análisis; si es demasiado grande,
desperdiciamos recursos al tomar la muestra. Se presentará cierto grado de error de muestreo por no estudiar a
la población completa. Siempre que tomamos una muestra, perdemos algo de información útil de la población.
Si queremos tener un alto nivel de precisión (esto es, si deseamos estar bastante seguros de nuestra estimación),
debemos muestrear la población lo suficiente para asegurarnos que obtuvimos la información requerida. El error
de muestreo se puede controlar si seleccionamos una muestra con el tamaño adecuado. En general, cuanta más
precisión se quiera, más grande será el tamaño necesario de la muestra. Examinemos algunos métodos útiles en
la determinación del tamaño necesario de muestra para cualquier nivel específico de precisión.
2.4.1. Poblaciones finitas e infinitas.

2.5. Intervalos de confianza para la proporción.


Los procedimientos utilizados para determinar los tamaños de muestra para estimar una proporción de la
población son parecidos a los que se utilizan para estimar una media de población. Suponga que deseamos
encuestar a estudiantes de una universidad grande. Deseamos determinar qué proporción de éstos está a favor de
un nuevo sistema de evaluación. Nos gustaría contar con un tamaño de muestra que nos permita tener una
certeza del 90% de que estamos estimando la proporción verdadera de la población de 40,000 estudiantes a
favor del nuevo sistema de evaluación, más menos 0.02.
Empezamos a resolver este problema buscando en la tabla 1 del apéndice un valor de z correspondiente a un
nivel de confianza del 90%. Tal valor es 1.64 errores estándar a partir de la media. Queremos que nuestra
estimación esté dentro de 0.02, de modo que podemos simbolizar el proceso paso a paso de la siguiente manera:

Para hallar n, todavía necesitamos una estimación de los parámetros p y q de la población. Si tenemos una
buena idea de la proporción real de estudiantes que están a favor del nuevo sistema, podemos utilizarla como
nuestra mejor estimación para calcular n. Pero si no tenemos idea del valor de p, entonces nuestra mejor
estrategia es darle un valor de manera tal que escogemos n en forma conservadora (es decir, de modo que el
tamaño de la muestra sea lo suficientemente grande para darnos, al menos, la precisión que necesitamos sin
importar el verdadero valor de p). En este punto del problema, n es igual al producto de p y q dividido entre
0.00014884. La manera de obtener la n más grande es generando el numerador más grande posible de esa
expresión, lo cual sucede cuando elegimos p 0.5 y q 0.5. Entonces n se convierte en:

Como respuesta, para tener una seguridad del 90% de que estimamos la proporción verdadera dentro de 0.02,
debemos escoger una muestra aleatoria simple de 1,680 estudiantes para entrevistar. En el problema que
acabamos de resolver, hemos tomado un valor para p que representó la estrategia más conservadora; el valor de
0.5 generó la muestra más grande posible. Habríamos utilizado otro valor de p si hubiéramos podido estimar
uno o si hubiésemos tenido una buena idea de su valor. Siempre que estas dos últimas soluciones estén ausentes,
tome el valor más conservador posible de p, a saber, p 0.5.
2.6. Solución de problemas en computadoras. (SPSS o MINITAB).
Fondo de Ingeniería en Berkeley* Establecido en 1979, el Fondo de Ingeniería en Berkeley solicita
contribuciones para apoyar al Colegio de Ingenieros de la Universidad de California, en Berkeley. Los
administradores utilizan la información disponible acerca del número de donaciones, regalos y contribuciones
en efectivo como entrada de un modelo matemático que predice las contribuciones al mes y al final del año. De
acuerdo con la información obtenida ajustan los esfuerzos de obtención de fondos. El modelo utiliza una
distribución binomial para la cantidad de donaciones y regalos, y una distribución de Poisson compuesta para la
cantidad de dinero donada. Desde 1982, han registrado los datos de las cuentas de los donadores, periodicidad
de las donaciones, tamaño de las donaciones, y la información equivalente de los regalos que hacen padres de
familia, exalumnos, académicos y los amigos del Colegio. Estimación de parámetros Los pronósticos están
basadas en datos tomados de campañas anteriores. Como desde 1982 a 1984 se usó la misma correspondencia,
las proporciones mensuales de las donaciones totales han sido estables de año en año. Para cada fecha de envío
postal, los encargados de pronósticos determinan distribuciones para el número de donaciones de cada uno de
los cuatro subgrupos, así como las estimaciones de la media y la varianza de las cantidades donadas. Evaluación
del modelo Los datos sobre los padres de familia, de 1982-1983 y 1983-1984 se utilizaron para probar la
suposición de Poisson sobre la que se basa el modelo. Utilizando tanto las tablas de Poisson como una
aproximación normal, se calcularon intervalos de confianza del 95% para el número de donaciones hechas por
padres de familia. Las figuras MR7-1 y MR7-2 muestran estos intervalos para 1982-1983 y 1983-1984. Sólo en
septiembre de ambos años las cuentas reales de los donadores cayeron fuera de los intervalos de confianza del
95%. Esto apoya la suposición de que se trata de una distribución de Poisson. Resultados El modelo funcionó
bien para pronosticar totales de fin de año, pero su desempeño fue un poco menor para los pronósticos
mensuales. Las predicciones de las cuentas de donadores y de donaciones totales fueron más precisas para los
padres, académicos y grupos de amigos que en el caso de los exalumnos. Los administradores pudieron
entender mejor los efectos de los contactos personales y de los envíos por correo. Debido a que el modelo
proporcionó una manera de predecir los efectos de los cambios en las técnicas de recaudación de fondos, los
administradores se animaron a diseñar estrategias dirigidas a los grupos específicos.

También podría gustarte