Estadística I
Sesión 9
Distribución normal y T student
Las distribuciones son herramientas fundamentales en estadística para entender cómo se
comportan los datos. Nos ayudan a hacer inferencias y tomar decisiones basadas en muestras
Normal T student
Tiene una forma de campana simétrica. Similar a la normal, pero con colas más
largas.
Media, mediana y moda son iguales.
Se usa con muestras pequeñas.
El 68% datos, dentro de 1
Toma en cuenta la incertidumbre de la
Utiliza cuando hay grandes cantidades de desviación estándar.
datos.
Depende de los grados de libertad (n-1)
Normal T student
Contexto: Estaturas de adultos en un país. Contexto: Eficacia de un nuevo
medicamento.
Muestra: 10,000 personas.
Muestra: 15 pacientes.
Resultados: La mayoría de las estaturas
están cerca del promedio. Resultados: Mayor incertidumbre sobre la
eficacia real.
Distribución Normal: ejemplo de uso
Se desea conocer si en una empresa de producción de
tornillos la longitud de los mismos siguen un estándar.
Según las especificaciones de calidad, la longitud de los
Análisis de la diferencia entre
tornillos debe ser de 50 mm.
la media muestral y la media
poblacional para determinar
Se sabe que la longitud de los tornillos producidos sigue
si es significativa
una distribución normal con una desviación estándar de
2 mm.
Se toma una muestra de 100 tornillos y se obtiene una
media muestral de 49.8 mm.
Distribución Normal: ejemplo de uso
Datos
Pasos μ: 50 mm σ: 2 mm n: 100 tornillos x: 49.8 mm
1. Formular hipótesis
- Hipótesis nula (Ho): La media de la longitud de los tornillos es 50 mm (μ=50).
- Hipótesis alternativa (Ha): La media de la longitud de los tornillos no es 50 mm (μ≠50)
2. Calcular el estadístico z
3. Determinar valor crítico
Para un nivel de significancia (𝛼) del 5% en una prueba de dos colas, el valor
crítico de z es ±1.96.
Distribución Normal: ejemplo de uso
-3 -2 -1 0 1 2 3
El valor de z=−1 no está en la región de rechazo (−1.96<z<1.96) No se rechaza la hipótesis nula
La diferencia observada entre x (49.8 mm) y μ (50 mm) no es significativa. La longitud
promedio de los tornillos está dentro del rango aceptable según las especificaciones.
Distribución T student: ejemplo de uso
Un investigador que quiere comparar la efectividad de dos
tipos de medicamentos para reducir la presión arterial. Análisis de la diferencia entre
2 medicamentos para
Debido a limitaciones, solo puedes obtener una muestra de determinar si es significativa
12 y 10 pacientes para un medicamento.
La primera muestra arrojó una media de 8 mmHg con una
desviación estándar de 2 mmHg
Por otra parte la segunda muestra arrojó una media de 6
mmHg con una desviación estándar de 2,5 mmHg
Distribución T student: ejemplo de uso
Pasos Datos
1. Formular hipótesis x A: 8 mmHg SA: 2 mmHg x B: 6 mmHg SB: 2,5 mmHg
- Hipótesis nula (Ho): No hay diferencia en la reducción de la presión arterial entre los
dos medicamentos ( μA = μB ).
- Hipótesis alternativa (Ha): Hay una diferencia en la reducción de la presión arterial
entre los dos medicamentos ( μA ≠ μB ).
2. Calcular el estadístico t
Distribución T student: ejemplo de uso
Pasos
3. Determinar los grados de libertad
4. Comparar el valor crítico
Para un nivel de significancia (α) del 5% en una prueba de dos colas y df≈19df el
valor crítico t es aproximadamente ±2.093.
Distribución T student: ejemplo de uso
-5 -4 -3 -2 -1 1 2 3 4 5
El valor de t=2.04 es menor que el valor crítico (±2.093) No se rechaza la hipótesis nula
No hay suficiente evidencia para concluir que los dos medicamentos difieren
significativamente en su efectividad.
Distribución F y Chi cuadrado
Son distribuciones de probabilidad utilizadas en pruebas de hipótesis y están
relacionadas con la comparación de varianzas o dispersiones
2 F de Fisher
Chi
Ambas distribuciones tienen forma de campana asimétrica sesgada a la derecha, no negativa.
Dependen de los grados de libertad (n-1)
Se utiliza principalmente para evaluar la Se utiliza para evaluar si varias muestras
varianza de una muestra en relación con tienen varianzas iguales.
una varianza teórica esperada.
Análisis de Varianza (ANOVA), determinar
Es especialmente útil en pruebas de diferencias significativas en las medias de
independencia en tablas de contingencia. varios grupos.
2 F de Fisher
Chi
Contexto: nivel educativo vs sitio de Contexto: estudiar la efectividad de tres
trabajo. métodos de estudio diferentes.
Prueba de hipótesis para determinar si Evaluar la relación entre las medias de
estas variables se relacionan. muestras de cada grupo.
Resultados: confirmar o descartar a través Resultados: evaluar la efectividad de
de estadísticos dicha relación. diferentes tratamientos o condiciones a
través de ANOVA.
2
Chi : ejemplo de uso
Se quiere analizar si existe una relación entre el tipo de
dispositivo utilizado por los empleados (laptop, escritorio,
tablet) y su satisfacción laboral (alta, media, baja).
Se obtienen los siguientes datos aleatorios:
Determinar si el dispositivo
Dispositivo [Link] Media Baja Total
usado influye en la satisfacción
Portatil 37 22 19 78 laboral (prueba de
PC 28 33 18 79 independencia de variables)
Tablet 15 11 8 34
Total 80 66 45 191
2
Chi : ejemplo de uso
Pasos
1. Formular hipótesis
- Hipótesis nula (Ho): No existe relación entre el dispositivo y la satisfacción laboral.
- Hipótesis alternativa (Ha): Existe una relación entre el dispositivo y la satisfacción laboral.
2. Construir tabla de contingencia
3. Calcular la Tabla de Contingencia Esperada Dispositivo [Link] Media Baja Total
Portatil 32.67 26.95 18.38 78
Total Fila * Total columna PC 33.09 27.30 18.61 79
Valor Esperado =
Total General Tablet 14.24 11.75 8.01 34
Total 80 66 45 191
2
Chi : ejemplo de uso
4. Calcular el Chi cuadrado
2
(37 - 32.67) Se suman todos = 3.59
= 0.57
32.67
5. Determinar los grados de libertad df = (# filas -1) * (# columnas - 1) = 4
2
6. Comparar el valor de X con el valor crítico
2
Hallar el valor crítico de X para 4 grados de libertad y el nivel de significancia
(generalmente 0.05 es decir se acepta una probabilidad del 5% de error Tipo I).
=CHIINV(0.05, 4) = 9.49 3.59 < 9.49 no se rechaza la hipótesis nula.
No hay suficiente evidencia para afirmar que existe una relación significativa entre el tipo de
dispositivo utilizado y la satisfacción laboral. Esto sugiere que, al menos en esta muestra, la
satisfacción laboral no depende del dispositivo que los empleados utilizan.
Distribución F: ejemplo de uso
Se desea comparar la efectividad de tres métodos de
estudio diferentes (A, B, y C) sobre el rendimiento de los
estudiantes en un examen.
Para ello, se seleccionan aleatoriamente a estudiantes y se Determinar si hay diferencias
dividen en tres grupos, uno por cada método de estudio. significativas en las medias
de las puntuaciones entre los
Grupo Puntuación tres métodos de estudio.
A 85, 90, 78, 92, 88
B 75, 80, 70, 85, 78
C 90, 85, 95, 88, 92
Distribución F: ejemplo de uso
Pasos
1. Formular hipótesis
- Hipótesis nula (Ho): No hay diferencias significativas entre las medias de las
puntuaciones de los tres grupos (todas las medias son iguales).
- Hipótesis alternativa (Ha): Al menos una de las medias es significativamente diferente.
2. Calcular la media de cada grupo y la media global
xA= 86,6 xB= 77,6 xC= 90 x = 84,73
3. Calcular la Suma de Cuadrados entre grupos (SSB)
= 410,7
Distribución F: ejemplo de uso
4. Calcular la Suma de Cuadrados dentro de los grupos (SSW) A= 121,2
B=125,2
C=58
=304,4
5. Calcular los grados de libertad
Entre grupos (dfbetween) 3-1= 2 Dentro de los grupos (dfwithin) 15-3=12
6. Calcular los cuadrados medios (MS)
Entre grupos (MSbetween) Dentro de los grupos (MSwithin)
= 205,35 = 25,37
Distribución F: ejemplo de uso
7. Calcular el estadístico F
= 8,09
8. Comparar el valor de F con el valor crítico de F
Hallar el valor crítico de F en una tabla de distribución F con dfbetween = 2 y
un dfwithin = 12 para un nivel de significancia de 0.05.
=FINV(0,05;2;12) = 3.89 Dado que 8.09 > 3.89, se rechaza la hipótesis nula.
Hay suficiente evidencia para afirmar que al menos uno de los métodos de estudio
tiene un impacto significativamente diferente en las puntuaciones del examen. Esto
sugiere que los métodos de estudio no son igualmente efectivos.
Interpretación distribuciones
Zona Zona
Distribución Uso Hipótesis Nula aceptación rechazo
No se rechaza Ho Se rechaza Ho
Determina si μ y x son x es igual a un x y μ son muy Significativamente
Normal
significativamente diferentes valor específico μ cercanas ≈ iguales diferentes
Probar si 2 muestras son No hay diferencia xA y xB son xA y xB son
T Student
iguales entre xA y xB ≈ iguales diferentes
2
Establecer independencia entre No hay relación A y B NO se A y B SI se
X variables (no hay relación) entre A y B relacionan relacionan
F (ANOVA) Plantear que todas las medias No hay diferencias Los grupos son Los grupos
de los grupos son iguales entre x de los grupos ≈ iguales son diferentes