Esta
Esta
APLICADA
TEMA 1:
ESTIMACIONES
[Link]
Estimaciones puntuales e intervalos de confianza
5
Estimaciones puntuales e intervalos de confianza
6
Estimaciones puntuales e intervalos de confianza
7
Estimaciones puntuales e intervalos de confianza
8
Estimaciones puntuales e intervalos de confianza
• Para resumir:
• “La media de la población se puede estimar puntualmente
mediante la media de la muestra: x =̅ μ.
• La proporción de la población se puede estimar
puntualmente mediante la proporción de la muestra: p =̂ p
• La desviación típica de la población se puede estimar
puntualmente mediante la desviación típica de la muestra:
δ=σ.” (Johnson, 2012)
9
Estimaciones puntuales e intervalos de confianza
Ejemplo 1:
• Una empresa necesita conocer el salario medio de los
agentes de la industria retail. La selección aleatoria de una
muestra de 250 CEOs muestra una media de $ 40 210. La
desviación estándar de la muestra es de $ 2 300. La
empresa necesita conocer la media de la población.
10
Estimaciones puntuales e intervalos de confianza
Ejemplo 1 (solución):
• Dado que no se dispone de la información de la población,
se procede con la mejor estimación para la población y
que corresponde al estadístico de la muestra del ejemplo.
Por ende, la media de la muestra de $40 210.
11
Intervalos de confianza (media poblacional)
12
Intervalos de confianza (media poblacional)
14
Intervalos de confianza (media poblacional)
X z
n
15
Intervalos de confianza (media poblacional)
Error estándar de la media muestral.
• La desviación estándar de la distribución de las medias
muestrales se calcula con la fórmula que está a continuación y
que a su vez representa el error estándar de la media muestral:
x =
n
16
Intervalos de confianza (media poblacional)
Error estándar de la media muestral.
• La fórmula para la desviación estándar cuando se desconoce la
desviación poblacional y la muestra es grande (mayor o igual
que 30) es:
s
sx =
n
17
Intervalos de confianza (media poblacional)
s
X t
n
18
Intervalos de confianza (media poblacional)
EJERCICIO:
• En un estudio se dispone de una muestra de 49 elementos
donde su media es de 24 unidades y con desviación de 4
unidades. Se necesita conocer la media de la población y
construya un intervalo de confianza del 95%.
19
Intervalos de confianza (media poblacional)
EJERCICIO (solución):
• El valor de la media de la población no es conocido. Nuestra
mejor estimación de este valor es la muestra media de 24.0
unidades. Este valor es llamado estimación puntual.
• Ahora se procede a construir el intervalo de confianza con el
95% para la media de la población.
s 4
X 1.96 = 24.00 1.96
n 49
= 24.00 1.12
20
Intervalo de confianza para la proporción de la
población
• El intervalo de confianza para la proporción
de la población se estima como:
p (1 − p )
IC = p z / 2
n
21
Factor de corrección de la población-finita
• La población que ha sido establecida en líneas anteriores se dice que es
finita.
• Para una población finita, donde el número total de objetos es N y la
magnitud de la muestra es n, el siguiente arreglo está hecho para los errores
estándar de la media muestral y la proporción:
• Error estándar de la media muestral:
N − n
x =
n N −1
22
Factor de corrección de la población-finita
◼ Error estándar de las proporciones de la muestra:
p(1 − p) N − n
p =
n N −1
• Este arreglo es llamado factor de corrección de
la población-finita.
• Si n/N < .05,el factor de corrección de la
población-finita se ignora.
23
Elección del tamaño de muestra
apropiado
• Existen 3 factores que determinan
el tamaño de la muestra, ninguno
de los cuales tiene relación con el
tamaño de la población. Éstos son:
24
Variación en la población
◼ Para encontrar el tamaño de la muestra para
una variable:
2
z•s
n=
E
• Donde: E es el error permisible, z es el valor-z
correspondiente al nivel de confianza
seleccionado, y s es la desviación de la
muestra del estudio piloto.
25
Ejemplo 6
• Un grupo de consumidores quiere estimar la
media del cargo mensual de energía de julio de
una casa común dentro de $5 utilizando 99% de
nivel de confianza. Basado en estudios similares,
la desviación estándar se estima debe ser $20.00.
¿Cuántas muestras son requeridas?
2
( 2.58)( 20)
n= = 107
5
26
Tamaño de la muestra
para proporciones
• La fórmula para determinar el tamaño de la
muestra en el caso de una proporción es:
2
Z
n = p(1 − p)
E
Donde: p es la proporción estimada, basada en
la experiencia anterior o de un estudio piloto, z
es valor-z asociado con el grado de confianza
seleccionado; E es el máximo error permisible
que el investigador tolerará.
27
Ejemplo 7
• Un club quiere estimar la proporción de niños
que tiene un perro como mascota. Si el club
quisiera estimarlo dentro del 3% de la
proporción de la población, ¿cuántos niños
necesitarían contactar? Asuma 95% de nivel
de confianza y que el club estima que un 30%
de los niños tienen un perro como mascota.
2
1.96
n = (.30)(.70) = 897
.03
28
ACTIVIDAD DE CIERRE
32
33
ESTADÍSTICA
APLICADA
PRUEBAS DE HIPÓTESIS
TEMA 1:
NOCIONES GENERALES
[Link]
¿Qué es una hipótesis?
• Una hipótesis es una declaración sobre el valor de un
parámetro de la población desarrollado con el fin de poner a
prueba.
• Ejemplos de hipótesis que se hicieron sobre un parámetro de
la población:
– El ingreso mensual para los analistas de sistemas es $3.625
– Veinte por ciento de todos los clientes de La Majada regresan para
otra comida dentro de un mes.
5
¿Qué es una prueba de hipótesis?
• La prueba de hipótesis es un
procedimiento basado en la evidencia
de la muestra y la teoría de las
probabilidades, usadas para determinar
si la hipótesis es una declaración
razonable y no debe ser rechazada, o es
irrazonable y debe ser rechazada.
6
Prueba de hipótesis
Paso 1: Se plantean las
hipótesis nula y alternativa
Paso 3: Se identifica el
estadístico de prueba
7
Definiciones
• Hipótesis nula H0: Una declaración
sobre el valor de un parámetro de la
población.
• Hipótesis alternativa H1: Una
declaración que se acepta si los datos de
la muestra proporcionan evidencia de
que la hipótesis nula es falsa.
• Nivel de significancia: La probabilidad
de rechazar la hipótesis nula cuando es
verdadera.
• Error tipo I: Rechazar la hipótesis nula
cuando es verdadera.
8
Definiciones
9
10
Pruebas de significancia de una cola
11
Distribución muestral para el estadístico z para la prueba
de una cola, con el .05 de nivel de significancia
.95 de probabilidad
.05 región de rechazo
Valor crítico
Z = 1.645
0 1 2 3
12
13
Pruebas de significancia de dos colas
14
Distribución muestral para el estadístico z para la
prueba de dos colas, con el .05 de nivel de significancia
.95 de probabilidad
.025 región de rechazo
Valor crítico
Z = 1.96,-1.96
-2 -1 0 1 2
16
Prueba para la media de la población: muestra grande,
desviación estándar de la población conocida
17
Ejemplo1
Los procesadores de la salsa de tomate de los fritos indican en la
etiqueta que la botella contiene 16 onzas de la salsa de tomate. La
desviación estándar del proceso es 0.5 onza. Una muestra de 36
botellas de la producción de la hora anterior reveló un peso promedio
de 16.12 onzas por botella. ¿En un nivel de significancia del .05 el
proceso está fuera de control? ¿Es decir, podemos concluir que la
cantidad por botella es diferente a 16 onzas?
18
19
20
Ejemplo 1 (Continuación)
• Paso 1: Indique las hipótesis nulas y
alternativas:
21
Ejemplo 1 (Continuación)
X 16.12 16.00
z 1.44
n 0.5 36
No rechazamos la hipótesis nula. No podemos concluir
que la media sea diferente a 16 onzas.
22
Valor-p en la prueba de la hipótesis
23
Cálculo del Valor-p
24
Prueba para la media de la población: muestra grande,
desviación estándar poblacional desconocida
X
z
s/ n
25
Ejemplo 2
La cadena de almacenes de descuento de Roder emite su propia tarjeta de
crédito. Lisa, la gerente de crédito, desea descubrir si el promedio sin pagar
mensual es más de $400. El nivel de significancia se fija en .05. Una verificación
al azar de 172 balances sin pagar reveló que la media de la muestra fue $407 y
la desviación estándar de la muestra fue $38. ¿Debe Lisa concluir que el medio
de la población es mayor de $400, o es razonable asumir que la diferencia de
$7 ($407-$400) es debido al azar?
26
Ejemplo 2 (Continuación)
27
Prueba para la media de la población: muestra pequeña,
desviación estándar poblacional desconocida
• El estadístico de la prueba es la distribución t.
• El estadístico de la prueba para el caso de una
muestra es:
X
t
s/ n
28
Ejemplo 3
La tasa de producción de los fusibles de 5 amperios en Neary Co. eléctrico es
250 por hora. Se ha comprado e instalado una máquina nueva que, según el
proveedor, aumentará la tarifa de la producción. Una muestra de 10 horas
seleccionadas al azar a partir del mes pasado reveló que la producción cada
hora en la máquina nueva era 256 unidades, con una desviación estándar de
6 por hora. ¿En el nivel de significancia del .05. Neary puede concluir que la
máquina nueva es más rápida?
29
Ejemplo 3 (Continuación)
30
Ejemplo 3 (Continuación)
31
32
Pruebas respecto a proporciones
• Una proporción es la fracción o el
porcentaje que indican la parte de la
población o de la muestra que tiene un
rasgo particular de interés.
• La proporción de la muestra es denotada
por p y calculada con:
p = número de éxitos en la muestra /
tamaño de la muestra
33
Prueba estadística para la proporción de la población
p
z
(1 )
n
La proporción de la muestra es p y es la
proporción de la población.
34
Ejemplo 4
35
Ejemplo 4 (Continuación)
36
Ejemplo 4 (Continuación)
37
38
ACTIVIDAD DE CIERRE
PRUEBAS DE HIPÓTESIS
TEMA 1:
PRUEBAS DE HIPÓTESIS
[Link]
Comparar dos poblaciones
5
Comparar dos poblaciones
X1 X 2
z
s12 s22
n1 n2
6
7
Ejemplo 1
8
Ejemplo 1
9
Ejemplo 1 (Continuación)
Paso 4: Formular una regla de decisión.
Se rechaza la hipótesis nula si z es mayor
que 2.33.
Paso 5: Calcule el valor de z y tome una
decisión.
$38,000 $35,000
z 1.98
($6,000) 2 ($7,000) 2
40 35
10
Ejemplo 1 (Continuación)
El valor-p es:
11
Comparación de poblaciones con muestras pequeñas
14
Ejemplo 2 (Continuación)
15
Ejemplo 2 (Continuación)
16
Ejemplo 2 (Continuación)
• Calculamos el valor de t como sigue.
X1 X 2
t
1 1
s 2p
n1 n2
33.7 35.7
1.640
1 1
8.312
15 12
17
Prueba de Hipótesis implicando observaciones
apareadas
• Las muestras independientes son las
muestras que no se relacionan de ninguna
manera.
• Las muestras dependientes son las muestras
que se aparean o se relacionan de una
cierta manera. Por ejemplo:
• Si usted deseara comprar un coche usted
vería el mismo coche en dos (o más)
distribuidoras y compararía los precios.
• Si usted deseara medir la eficacia de una
nueva dieta usted pesaría a la persona
sometida a la dieta en el comienzo y en el
final del programa.
18
Prueba de hipótesis implicando observaciones
apareadas
Utilice la prueba siguiente cuando las muestras
son dependientes:
d
t
sd / n
• donde des la media de las diferencias.
• sd es la desviación estándar de las diferencias
• n es el número de los pares de observaciones.
19
Ejemplo 3
20
Ejemplo 3 (Continuación)
21
Ejemplo 3 (Continuación)
Paso 1:
H0: d 0 H1: d 0
Paso 2: H0 es rechazado si t < -2.365 o
t > 2.365.
Utilizamos la distribución de t con 7
grados de libertad
Ejemplo 3 (Continuación)
d 8.0
d 1.00
n 8
d 2
d 2
78
82
sd n 8 3.1623
n 1 8 1
d 1.00
t 0.894
sd n 3.1623 8
24
Ejemplo 3 (Continuación)
25
Pruebas para proporciones
• Investigamos si dos muestras provienen de
poblaciones con una proporción igual de
éxitos.
• Las dos muestras se combinan usando la
fórmula siguiente.
X1 X 2
pc
n1 n2
26
Pruebas para proporciones (Continuación)
p1 p2
z
pc (1 pc ) pc (1 pc )
n1 n2
27
Ejemplo 4
¿Es más probable que los trabajadores solteros estén ausentes del
trabajo que los trabajadores casados? Una muestra de 250
trabajadores casados mostró que 22 faltaron más de 5 días el año
pasado, mientras que una muestra de 300 trabajadores solteros mostró
que 35 faltaron más de cinco días. Utilice un nivel de significancia del
.05.
28
Ejemplo 4 (Continuación)
29
Ejemplo 4 (Continuación)
• La proporción combinada es
35 22
pc
300 250
• El valor del estadístico de prueba es
35 22
z 300 250 1.10
.1036(1 .1036) .1036(1 .1036)
300 250
30
Ejemplo 4 (Continuación)
31
ACTIVIDAD DE CIERRE
UNIDAD 4
Modelos de correlación y modelos de regresión
simple
TEMA 2:
ANALISIS DE VARIANZA
» Calcular ji-Cuadrada
/
(78 − 79 )
.5/ = 6
79
» Construir las áreas de aceptación y
rechazo
: :;/ = ://
: :;/ ≠ ://
9
Comparación de dos
varianzas poblacionales
» Para realizar la prueba, se
selecciona una muestra aleatoria de
n1 observaciones de una población
y una muestra aleatoria de n2
observaciones de la segunda
población.
» El estadístico de prueba se define
como sigue.
=;/
= /
=/
10
Ejercicios de aplicación
» Una agencia de publicidad desea saber si
el género de los consumidores es
independiente de sus preferencias de
cuatro marcas de café. La respuesta
determinará si se deben diseñar
diferentes anuncios dirigidos a los
hombres y otros diferentes para las
mujeres. Realice la prueba con un nivel
de significancia del 5%. Los resultados
obtenidos de la encuesta realizada a 139
personas fueron:
11
marca hombres mujeres
A 18 32
B 25 15
C 15 10
D 12 12
mujeres 32 15 10 12 69
fe 24,82 19,86 12,41 11,91
Total 50 40 25 24 139
12
Calculo de los grados de libertad
α=0.05 *. ". = 2 − 1 4 − 1 = @
El valor crítico del estadístico AB según la tabla
es igual a 7,815
13
Plantear las hipótesis:
.5/ = U, V @
14
Construcción de las áreas de
aceptación y rechazo
Formular hipótesis
: :;/ = ://
: :;/ ≠ ://
17
Obtener el valor crítico del estadístico F dado
α=0.10
18
19
Calcular el estadístico de prueba F
=;/ (Z, [[)/
= /= = V, B@
=/ (V, @Z) /
Toma de decisión.
La decisión es rechazar la hipótesis nula,
debido a que el valor F calculado (4.23) es
mayor que el valor crítico (3.87). Se
concluye que hay una diferencia entre las
variaciones de los tiempos de recorrido por
las dos rutas.
20
Actividad Final:
Preguntas y Respuestas
BIBLIOGRAFÍA
UNIDAD 4
Modelos de correlación, regresión y análisis de
varianza
TEMA 1:
REGRESIÓN SIMPLE Y CORRELACIÓN
SUBTEMAS
σ(𝑥 − 𝑥)(𝑦
ҧ − 𝑦)
ത
𝑟=
(𝑛 − 1)𝑆𝑥 𝑆𝑦
6
Características del
Coeficiente de correlación
» Varía de -1 hasta +1, inclusive.
» Un valor cercano a 0 indica que hay
poca asociación entre las variables.
» Un valor cercano a 1 indica una
asociación directa o positiva entre
las variables.
» Un valor cercano a -1 indica una
asociación inversa o negativa entre
las variables.
7
Correlación negativa perfecta
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
8
Correlación positiva perfecta
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
9
Correlación cero
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
10
Correlación positiva fuerte
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
11
Coeficiente de Determinación
12
Modelo de regresión lineal
simple
Un análisis de la relación entre Y y X
requiere el planteamiento de un modelo
estadístico. La respuesta Y se relaciona con
la variable independiente X a través de la
ecuación matemática representada de la
siguiente manera:
Y = α + β𝑥 + ε
Donde, por supuesto, α es la intersección, β es la
pendiente y ε es la varianza del error o varianza
residual.
La recta de regresión ajustada
σ𝑛𝑖=1 𝑦𝑖 − 𝑏 σ𝑛𝑖=1 𝑥𝑖
𝒂= = 𝑦ത − 𝑏𝑥ҧ
𝑛
16
Ejercicios de aplicación
» Suponga que el gerente de ventas de
Copiadora de ventas de América, que tiene
una fuerza de ventas muy grande en Estados
Unidos y Canadá, desea determinar si hay
alguna relación entre el número de llamadas
de ventas en un mes y el número de
copiadoras que se vendieron en él. El gerente
selecciona una muestra aleatoria de 10
representantes de ventas y determina el
número de llamadas de ventas que cada uno
hizo el mes pasado y el número de copiadoras
que vendió.
17
Representante de Ventas Número de Llamadas Número de copiadoras vendidas
Tom Keller 20 30
Jeff Hall 40 60
Brian Virost 20 40
Greg Fish 30 60
Susan Welch 10 30
Carlos Ramírez 10 40
Rich Niles 20 40
Mike Kiel 20 50
Mark Reynolds 20 30
Soni Jones 30 70
media 22 45
desv. Estándar 9,1894 14,3372
σ(𝑥 − 𝑥)(𝑦
ҧ − 𝑦)
ത 900
𝑟= =
(𝑛 − 1)𝑆𝑥 𝑆𝑦 10 − 1 9,1894 ∗ 14,3372
= 𝟎, 𝟕𝟓𝟗𝟎
19
Estimación de los coeficientes
de regresión
𝑺𝒚 𝟏𝟒, 𝟑𝟑𝟕𝟐
𝒃 = 𝒓 = 𝟎, 𝟕𝟓𝟗𝟎 ∗ = 𝟏, 𝟏𝟖𝟒𝟐
𝑺𝒙 𝟗, 𝟏𝟖𝟗𝟒
ഥ − 𝒃ഥ
𝒂=𝒚 𝒙 = 𝟒𝟓 − 𝟏, 𝟏𝟖𝟒 ∗ 𝟐𝟐 = 𝟏𝟖, 𝟗𝟒
= 18,94 + 1,1842𝒙
𝒀
20
Estimación de los coeficientes
de regresión
En conclusión, El valor b de 1.1842
significa que por cada llamada de
ventas adicional, el vendedor debería
aumentar el número de copiadoras
vendidas en aproximadamente 1.2.
En otras palabras, cinco llamadas de
ventas adicionales en un mes
generarán más o menos seis
copiadoras más vendidas, número
determinado reemplazando
1,1842(5) = 5,921.
21
Actividad Final:
Preguntas y Respuestas
BIBLIOGRAFÍA
• Lind, Marchal, Wathen (2012).
Estadística Aplicada a los Negocios y la
Economia. México: McGraw-Hill/Irwin
• Mendenhall, Beaver, Beaver (2004).
Introduccion a la Probabilidad y
Estadística. Mexico: Cengage Learning.
• Taylor, R. A. (2012). Probabilidad y
Estadística para Ingenieros. México:
Pearson Educación.