Semana 12
Semana 12
ESTADÍSTICA
SEMANA Nº 12
Docente:
DUDAS DE LA CLASE ANTERIOR
Prueba t de Student
Prueba paramétrica para comparar dos medias en muestras relativamente
pequeñas (n<30), requiere verificación de la normalidad de datos cuantitativos.
Prueba T de Student
𝑍𝛼 𝑍1− 𝛼 𝛼 𝑍1−𝛼
2 2
Donde:
Estadístico de prueba t : estadístico calculado
X : media muestral
u : media poblacional
𝑥ҧ − 𝜇0 n : tamaño de la muestra
𝑡𝑐 = ~𝑡𝑛−1 S : varianza muestral
𝑆Τ 𝑛 g.l: Grados de libertad = n-1
Prueba de hipótesis para una media
Suposiciones
a. Muestra aleatoria simple
b. Población normal o muestra grande
c. 𝜎es desconocido
1. Planteamiento de la hipótesis nula (Ho) y la hipótesis alterna (Ha)
Ho:
H1:
2. Nivel de significancia (α)
α = 0,05
3. Determinar el estadístico de prueba y P-valor
P-valor (p) =
4. Establecer criterio de decisión
Si P-valor (Sig) <= 0,05; Se rechaza Ho y se acepta la hipótesis alterna
Si P-valor (Sig) > 0,05; Se acepta la hipótesis nula
5. Conclusión
Ejercicio Aplicativo 1 ASU
Un quahog es una almeja masticable del Atlántico de
caparazón duro con una concha de color gris azulado. Los
Quahogs tienen diferentes nombres, según el tamaño; por
ejemplo, el ancho de una almeja de cuello pequeño es de
menos de cinco centímetros (a lo largo del caparazón). El
ancho medio histórico de un cuello pequeño es de 4,75 cm.
Después de un reciente derrame de petróleo frente a la
costa de Maine, se obtuvo una muestra aleatoria de 46
pequeños cuellos y se registró el ancho de cada uno. La
media muestral fue 4,66 cm y la desviación estándar
muestral fue 0,25 cm. ¿Existe alguna evidencia que sugiera
que el ancho medio de los cuellos pequeños haya
disminuido? Suponga que la población de anchos de cuello
pequeño es normal y utilice α=0,01.
Solución: Muestra Población
Variable X: 1. SUPUESTOS n= 46 µ = 4,75 cm
media = 4,66 cm : Desconocido
2. PRUEBA T
S = 0,25 cm
1. Planteamiento de la hipótesis nula (Ho) y la hipótesis alterna (Ha)
Ho: 𝜇 ≥ 4.75
H1: 𝜇 < 4.75
2. Nivel de significancia (α): α = 0,01
𝑹𝒆𝒄𝒉𝒂𝒛𝒂 𝑯𝟎
3. Determinar el estadístico de prueba y P-valor 1−𝛼
ത ℎ𝑖𝑝
𝑋−𝜇 4.66−4.75 𝛼 = 0.01
𝑡𝑐 = 𝑠 = 0.25 = -2.4416 𝑵𝒐 𝑹𝒆𝒄𝒉𝒂𝒛𝒂 𝑯𝟎
𝑛 46 𝑇𝛼
Ttab (α;n-1) =
4. Establecer criterio de decisión
Si P-valor (Sig) <= 0,01; Se rechaza la hipótesis nula y se acepta la hipótesis alterna
Si P-valor (Sig) > 0,01; Se acepta la hipótesis nula
5. Conclusión
1. Prueba T para una muestra
Procedimiento con SPSS
Ejercicio 1
Paciente/Alzh Presión
Un equipo de cardiólogos tiene interés en estudiar la eimer arterial
1 155
presión arterial en personas con diagnóstico de Alzheimer
2 118
que toman un fármaco en fase de pruebas. Estos enfermos 3 149
suelen tener una presión arterial media de 160 mm Hg en 4 140
5 165
condiciones normales, es decir, sin el uso del nuevo
6 143
fármaco en prueba. Con el objetivo de valorar si el nuevo 7 157
fármaco consigue disminuir la presión arterial de estos 8 125
9 145
enfermos, se toma la presión arterial de 15 personas con
10 140
esta enfermedad que toman el nuevo fármaco. Con un 11 139
nivel de significancia α = 0,05 ¿Puede concluirse a partir 12 127
13 154
de los datos, que los enfermos con Alzheimer que toman
14 163
el nuevo fármaco tienen una presión arterial media 15 149
menor que 160 mm Hg?
Hipótesis:
La presión arterial promedio de los pacientes que se medicaron con el nuevo fármaco es menor a 160 mm Hg
Muestra Población Hipótesis
Solución: n=15 µ = 160 Ho : ≥ 160
Variable X: Presión arterial media =144.6 : Desconocido H1 : < 160
S =13.684
1. PRUEBA DE NORMALIDAD
Plantemiento de hipótesis
Ho: La distribución de datos de la variable aleatoria presión arterial si tiene distribución normal
H1: La distribución de datos de la variable aleatoria presión arterial no tiene distribución normal
Nivel de significancia: α = 0,05
Estadístico de prueba: Shapiro Wilk
Conclusión: Como el P-valor = 0,717 de Shapiro Wilk es mayor al nivel de significancia de 0,05. permite concluir que la
variable aleatoria presión arterial si tiene una distribución normal, por tanto se utilizará la prueba paramétrica
t de Student para una muestra.
Solución:
2. PRUEBA T
Plantemiento de hipótesis
Ho: Los pacientes medicados con el nuevo fármaco tienen una presión arterial promedio no es menor a 160 mm Hg
H1: Los pacientes medicados con el nuevo fármaco tienen una presión arterial promedio menor a 160 mm Hg
Conclusión: Como el P-valor = 0,0003 de T de Student es menor a la significancia de 0,05. Existe evidencia estadística
suficiente para afirmar que la presión arterial promedio (µ=144,6) de los pacientes medicados con el
nuevo fármaco es menor de 160 mm Hg.
Ejercicio 2 Nadador hematocrito %
1 38
2 49
Un proyecto de investigación pretende, 3 44
4 47
entre sus objetivos, determinar si los datos 5 43
6 48
presentan suficiente evidencia para indicar 7 40
8 39
que nivel medio de hematocrito en hombres 9 49
10 44
nadadores es menor de 44,5% en una 11 38
12 43
muestra de 29 sujetos de esta población. 13 48
14 42
Para cumplir este objetivo se debe probar 15 47
16 38
con un nivel de significancia de 5%. 17 48
18 40
19 40
20 43
21 47
Hipótesis 22 44
23 45
Hipótesis: Ho : ≥ 44.5 24 38
El promedio de hematocrito de los nadadores es menor a 44,5% H1 : < 44.5 25 41
26 45
27 43
28 49
29 46
Solución:
Variable X: Recuento de hematocrito
1. PRUEBA DE NORMALIDAD
Rechazar Ho
Rechazar Ho
1-α 1-α
Zona de Región crítica 1-α Región crítica Zona de
Aceptación De tamaño α/2/2
De tamaño α/2 Zona de Aceptación
para Ho Aceptación para Ho
para Ho
- Z
Z−
a1
- Z/2 Z/2 b1
-t1-, n1+n2-2 t1-, n1+n2-2
-t1-/2,n1+n2-2 t1-/2, n1+n2-2
[Prueba unilateral de cola izquierda] [Prueba bilateral] [Prueba unilateral o de cola derecha]
◼ Elegir el estadístico de prueba t apropiado
Caso A: Prueba t para dos muestras con varianzas desconocidas pero iguales
𝑋ത1 − 𝑋ത2 − ( µ1 − µ2 )
𝑡= ~ 𝑡 (𝒏𝟏 + 𝒏𝟐 − 2)
𝒏𝟏 − 𝟏 𝑺𝟐𝟏 + (𝒏𝟐 − 𝟏)𝑺𝟐𝟐 𝟏 𝟏
. +
𝒏𝟏 + 𝒏𝟐 − 𝟐 𝒏𝟏 𝒏𝟐
Caso B: Prueba t para dos muestras con varianzas desconocidas pero diferentes
𝑆12 𝑆22 2
𝑋ത1 − 𝑋ത2 − ( µ1 − µ2 ) ( + )
𝒏𝟏 𝒏𝟐
𝑇= ~𝑡(𝑔) 𝑔= −2
𝑆12 𝑆22 𝑆12 2 𝑆22 2
+ ( ) ( )
𝒏𝟏 𝒏𝟐 𝒏𝟏 𝒏𝟐
+
𝒏𝟏 + 1 𝒏𝟐 + 1
Prueba de hipótesis para dos medias independientes
1. Planteamiento de la hipótesis nula (Ho) y la hipótesis alterna (Ha)
Ho:
H1:
2. Nivel de significancia (α)
α = 0,05
3. Determinar el estadístico de prueba y p-valor
P-valor (p) =
4. Establecer criterio de decisión
Si P-valor (Sig) >= 0,05; Se acepta la hipótesis nula
Si P-valor (Sig) < 0,05; Se acepta la hipótesis alterna
5. Conclusión
Procedimiento en SPSS para dos muestras :
Analizar / Comparar medias / Prueba T para muestras independientes / Variables para contrastar; Variable de agrupación
/Definir grupos
Ejercicio 4
Se estudia la capacidad antioxidante de la leche materna
comparado con leche de fórmula. El ensayo se basa en la
cuantificación de la capacidad de los antioxidantes en la muestra
por inhibición de la oxidación del radical ABTS + y comparación
con la del Trolox, un análogo del tocoferol soluble en agua, y se
cuantifica como milimoles equivalentes de Trolox. El estudio se
realizó en un grupo de 22 niños que recibió leche materna
normal durante sus primeros 3 meses de vida. Otro grupo de 14
niños, que no pudieron ser amamantados por su madre, fueron
alimentados mediante una leche con una fórmula especial. A los
tres meses de vida se mide la capacidad antioxidante (mmoles)
desarrollada en estos niños. Compare las medias de la capacidad
antioxidante considerando un nivel de significancia α= 0,05.
¿Hay diferencia significativa entre la capacidad antioxidante de
la leche materna y la leche de fórmula?
Ejercicio 4
Leche Leche por
Se estudia la capacidad antioxidante de la leche materna comparado con leche de materna formula
95.25 55.98
fórmula. El ensayo se basa en la cuantificación de la capacidad de los antioxidantes en 75.70 76.61
la muestra por inhibición de la oxidación del radical ABTS + y comparación con la del 72.71 85.09
Trolox, un análogo del tocoferol soluble en agua, y se cuantifica como milimoles 79.07 74.75
equivalentes de Trolox. El estudio se realizó en un grupo de 22 niños que recibió leche 85.60 67.82
75.61 62.26
materna normal durante sus primeros 3 meses de vida. Otro grupo de 14 niños, que no
88.03 64.13
pudieron ser amamantados por su madre, fueron alimentados mediante una leche con 77.98 75.71
una fórmula especial. A los tres meses de vida se mide la capacidad antioxidante 82.03 95.20
(mmoles) desarrollada en estos niños. Compare las medias de la capacidad 89.33 88.61
antioxidante considerando un nivel de significancia α= 0,05. ¿Hay diferencia 77.20 63.07
93.83 64.20
significativa entre la capacidad antioxidante de la leche materna y la leche de 69.31 71.90
fórmula? 67.75 75.29
Solución 64.57
X: Capacidad antioxidante de la leche 82.57
81.33
80.99
Se pide probar la hipótesis: 79.38
H1: La capacidad antioxidante de la leche materna es diferente a la leche de fórmula 84.18
90.29
80.82
En primer lugar se debe probar si los datos provienen de una distribución normal y luego probar
si la capacidad antioxidante de la leche materna es diferente a la fórmula (Ho: µ1≠ µ2).
Solución
1. PRUEBA DE NORMALIDAD
Plantemiento de hipótesis
Ho: La variable aleatoria capacidad antioxidante de la leche materna y de fórmula si tiene una distribución normal
H1: La variable aleatoria capacidad antioxidante de la leche materna y de fórmula no tiene una distribución normal
Nivel de significancia: α = 0,05
Estadístico de prueba: Shapiro Wilk
Decisión: La significancia calculada con un P-valor = 0,960 para el grupo leche materna, P-valor = 0,611 para el grupo leche
de fórmula son mayores a =0,05, por lo que se rechaza la hipótesis nula.
Conclusión: Los resultados de la prueba de normalidad de Shapiro Wilk, se encontró en ambos grupos una significancia
(p>0.05). Se concluye que los datos de la capacidad antioxidante de ambos grupos provienen de poblaciones
con distribución aproximadamente normal, por tanto se utilizará la prueba t para muestras independientes.
Solución
2. PRUEBA T PARA MUESTRAS INDEPENDIENTES
Plantemiento de hipótesis
Ho: La capacidad antioxidante media de la leche materna es igual a la capacidad antioxidante media de la fórmula
H1: La capacidad antioxidante media de la leche materna es diferente a la capacidad antioxidante media de la fórmula
Nivel de significancia: α = 0,05
Homogeneidad de varianzas
Conclusión: Con una confianza de 95% y un P-valor= 0,021 asociado al estadístico t, se encontró que hay diferencias
significativas entre los promedios de la capacidad antioxidante de leche materna con la leche de fórmula.
Ejecicio 2 aplicativo de ASU
AirTran Airways y Southwest Airlines se encontraban entre
los líderes en llegadas a tiempo. En un estudio, el 88% de
sus vuelos llegaban a tiempo. El conjunto de datos S11
Ejemplo aplicativo ASU [Link] tiene una muestra de
vuelos de llegada tardía de ambas aerolíneas. Los datos
muestran cuántos minutos se retrasaron los vuelos.
Construye una hipótesis para probar si las llegadas a
tiempo son aproximadamente las mismas. Utiliza el
conjunto de datos S11 Ejemplo aplicativo ASU
[Link] e informa el valor crítico cuando α = 0,05, el
error estándar, la estadística de prueba y su conclusión.
Tomado de: Arizona State University (Enero, 2023). ECN221: Estadística para los negocios. Módulo 6: Prueba de hipótesis que
involucran dos poblaciones (Cap. 10). [Link]
ACTIVIDAD 1
Hipótesis:
El consumo promedio de gasolina del auto con neumáticos radiales es menor al de neumáticos comunes
Sesión 12 Prueba T de Student
ASU: ECN 221 - Estadística para los Negocios. Módulo 6:
Cap. 9 – Introducción a la probabilidad
Participante 1 2 3 4 5 6 7 8 9 10
Antes 28 22 55 45 32 35 40 25 37 20
Después 39 45 67 61 46 58 51 34 48 30
A un nivel de significancia de 5% probar que el tiempo promedio antes es menor que el tiempo promedio
después de consumir alcohol.
Solución
X1: Tiempo que demora para hacer la tarea antes de consumir alcohol
X2: Tiempo que demora para hacer la tarea después de consumir alcohol
H1: Hay diferencia en el tiempo promedio para hacer la tarea antes y después de consumir alcohol
Solución
1. PRUEBA DE NORMALIDAD
Formulación de la hipótesis
Ho: La distribución de los tiempos para hacer la tarea si tiene una distribución normal
H1: La distribución de los tiempos para hacer la tarea no tiene una distribución normal
Decisión: Como P-valor = 0.822 , P-valor =0.952 en ambos grupos es mayor que 0,05 entonces no se rechaza la hipótesis nula
Conclusión:
Los resultados de la prueba de normalidad de Shapiro Wilk, se encontró en ambos grupos una significancia
(p>0.05). Se concluye que los datos del tiempo para hacer la tarea en ambos grupos provienen de poblaciones
con distribución aproximadamente normal, por tanto se utilizará la prueba t para muestras relacionadas
Solución
2. PRUEBA T DE STUDENT
Formulación de la hipótesis
Ho: No hay diferencia en el tiempo promedio para hacer la tarea antes y después de consumir alcohol
H1: Hay diferencia en el tiempo promedio para hacer la tarea antes y después de consumir alcohol
1. Ingreso variables:
Variable1: Tiempo antes de
consumir alcohol
Variable2: Tiempo después de
consumir alcohol
3. En variable 1:
medición del tiempo
antes de consumir
alcohol
En variable 2:
medición del tiempo
después de consumir
alcohol
4. Resultados 5. Interpretación
Hipótesis:
El consumo promedio de oxígeno de los sujetos es menor cuando escucha música que cuando escucha
historias de aventura
Solución
El test estadístico apropiado para resolver la hipótesis es el test t para muestras pareadas:
d 0,2833
t= =
sd / n 0,3312 6
0,2833
t= = 2,096 aprox. 2,1 ~ t (5)
0,1352
El valor p será el área que está a la derecha (por la hipótesis alternativa, unilateral de cola superior) de 2,1 de una
distribución t con 5 grados de libertad.
Miramos en la tabla t entre qué percentiles está el 2,1 de una distribución t con 5 grados de libertad:
2,1 se encuentra entre el percentil 95 y el 97,5, por lo tanto el valor p se encuentra entre 0,025 y
0,05, ese valor es menor que alfa = 0,05 por lo que rechazamos Ho.
Conclusión: Con un nivel del 5%, podemos decir que el consumo de oxígeno es
significativamente menor cuando escuchan música.
Compare el resultado con la salida SPSS:
Estadísticos de muestras relacionadas
Diferencias relacionadas
95% Intervalo de
confianza para la
Desviación Error típ. de diferencia
Media típ. la media Inferior Superior t gl Sig. (bilateral)
Par 1 HISTORIA - MUSICA .283 .3312 .1352 -.064 .631 2.096 5 .090
El valor p de la salida corresponde al de un test bilateral, por lo tanto el que nos interesa será: 0,09/2=0,045
Ejercicio 3 aplicativo de ASU
N° maletas N° maletas
Pasajero
En el estudio se quiere probar si después antes después
del aumento de precio los pasajeros 1 6 5
registraron menos maletas después del 2 6 4
3 7 7
aumento de precio. Con una significancia 4 4 3
de 5%, los datos del número de maletas de 5 3 5
6 9 8
los pasajeros dan evidencia para la 7 7 5
afirmación. 8 6 6
Tomado de: Arizona State University (Enero, 2023). ECN221: Estadística para los negocios. Módulo 6: Prueba de hipótesis que
involucran dos poblaciones (Cap. 10). [Link]
TRABAJO EN SALA
Resolver en equipos
colaborativos el ejercicio 2 y 3
de la semana 11.
TRABAJO
COLABORATIVO
• Trabajando en equipo
resolver los ejercicios
propuestos.
• TAS3
Ejercicio 1.
Un psicólogo educativo, cree que el recuerdo de imágenes es Número de Número de
superior al recuerdo de palabras. Para verificar la hipótesis, el imágenes palabras
psicólogo realiza un experimento, en el cual los estudiantes son recordadas recordadas
agrupados en dos grupos. Ocho estudiantes elegido al azar ven 30 18 12
transparencias, con sustantivos impresos en ellas, y otro grupo de 21 9
ocho estudiantes seleccionado al azar miran 30 transparencias con 14 21
25 17
imágenes reales de los mismos sustantivos. Con una confianza del
23 16
95% ¿El número de imágenes recordadas es superior al número de 19 10
palabras recordadas del tema tratado por el psicólogo?. Después 26 19
de realizado el experimento se obtuvo las siguientes mediciones: 15 22
Ejercicio 2.
Hipótesis:
El nivel de autoestima de los pacientes ha cambiado antes y después del taller de terapia
CONCLUSIONES