Prueba de McNemar para datos
apareados
Derly D. Ortiz Romero, M.Sc.
Competencias de aprendizaje
Identifica conteos de frecuencias que resultan de
datos apareados.
Utiliza la prueba de McNemar para datos apareados.
Emplea la distribución chi cuadrada para la prueba de
hipótesis.
Definición
Prueba de Utiliza conteos de frecuencias de datos apareados
McNemar nominales de dos categorías, para probar la 𝑯𝟎 , las
frecuencias 𝒃 y 𝒄 ocurren en la misma proporción.
Los pares discordantes de resultados provienen de
pares de categorías en las que ambas categorías son
diferentes.
Modelo de tabla
Requisitos
Los datos muestrales se eligieron al azar.
Los datos muestrales consisten en datos apareados o conteos de frecuencias.
Los datos tienen un nivel de medición nominal y cada observación se puede clasificar
de dos maneras.
Las frecuencias son tales que 𝑏 + 𝑐 ≥ 10.
Estadístico de prueba
2
𝑏−𝑐 −1
𝜒2 = La región crítica se localiza
𝑏+𝑐 únicamente en la cola derecha.
Los valores críticos se encuentran en
la tabla A-4, utilizando: 𝐠𝐥 = 𝟏.
Casos de estudio
Comparación de TEP TC con IRM. En el artículo “Whole-Body Dual-Modality PET TC and Whole
Body MRI for Tumor Staging in Oncology” (Antoch et al., Journal of the American Medical
Association, vol. 290, núm. 24), los autores citan la importancia de identificar con exactitud la
etapa de un tumor, ya que esto es crucial para determinar la terapia adecuada. El artículo analiza
un estudio que compara la exactitud de la tomografía por emisión de positrones (TEP) y la
tomografía computarizada (TC) con la imagen por resonancia magnética (IRM). Utilice los datos
de la tabla sobre 50 tumores analizados con ambas tecnologías. Al parecer, ¿Hay una diferencia
en la exactitud? ¿Alguna de las tecnologías parece ser mejor?
TEP/TC
Correcto Incorrecto
Correcto 36 1
IRM
Incorrecto 11 2
Casos de estudio
Prueba de un tratamiento. En el artículo “Eradication of Small Intestinal Bacterial Overgrowth
Reduces Symptoms of Irritable Bowel Syndrome” (Pimentel, Chow, Lin, American Journal of
Gastroenterology, vol. 95, núm. 12), los autores analizan si el tratamiento antibiótico del
crecimiento excesivo de bacterias reduce las molestias intestinales. Se utilizó una prueba de
McNemar para analizar los resultados de los sujetos con erradicación del crecimiento bacterial
excesivo. Utilice los datos de la siguiente tabla. Al parecer, ¿el tratamiento es efectivo para el
dolor abdominal?
¿Dolor abdominal antes del
tratamiento?
Sí No
¿Dolor abdominal Sí 11 1
después del
tratamiento? No 14 3
Referencias
Triola, M. F. (2019). Estadística (Decimosegunda ed.). México: Pearson.
Prueba de rango con signo de
Wilcoxon para datos apareados
Derly D. Ortiz Romero, M.Sc.
Competencias de aprendizaje
Aplica la prueba de rangos con signo de Wilcoxon
para datos apareados.
Calcula el estadístico de prueba para la prueba de
rangos con signo de Wilcoxon.
Compara la prueba del signo con la prueba de rangos
con signo de Wilcoxon.
Definición
Es una prueba no paramétrica que utiliza rangos ordenados
de datos muestrales que consisten en datos apareados.
𝑯𝟎 : Los datos apareados tienen diferencias que provienen de una
población con una mediana igual a cero.
𝑯𝟏 : Los datos apareados tienen diferencias que provienen de una
población con una mediana diferente de cero.
Requisitos
Los datos consisten en datos
apareados que se seleccionaron
aleatoriamente.
La población de las diferencias
tiene una distribución
aproximadamente simétrica.
Notación
𝑇 = 𝑙𝑎 𝑚á𝑠 𝑝𝑒𝑞𝑢𝑒ñ𝑎 𝑑𝑒 𝑙𝑎𝑠 𝑑𝑜𝑠 𝑠𝑖𝑔𝑢𝑖𝑒𝑛𝑡𝑒𝑠 𝑠𝑢𝑚𝑎𝑠:
1. La suma de los rangos positivos de las diferencias 𝑑 que no sean cero.
2. El valor absoluto de la suma de los rangos negativos de las diferencias 𝑑 que no
sean cero.
Estadístico de prueba
𝑛 ≤ 30 •𝑇
𝑛 𝑛+1
𝑇− 4
𝑛 > 30 •𝑧=
𝑛 𝑛+1 2𝑛+1
24
Caso de estudio
¿El tipo de semilla afecta el crecimiento del maíz? En 1908 William Gosset público al
artículo “The Probable Error of a Mean”, bajo el seudónimo de “Student” (Biometrika,
vol. 6, núm. 1). Él incluyó los datos de la tabla continua para dos tipos diferentes de
semillas de maíz (normales y secadas en horno), que se utilizaron en parcelas de tierra
adyacentes. Los valores corresponden a las cosechas de cabezas de maíz (o mazorcas) en
libras por acre. Utilice la prueba de rangos con signos de Wilcoxon, con un nivel de
significancia de 0.05 para probar la aseveración que no hay diferencia entre las cosechas
de las semillas normales y de las semillas secadas al horno.
Normales 1903 1935 1910 2496 2108 1961 2060 1444 1612 1316 1511
Secadas al
2009 1915 2011 2463 2180 1925 2122 1482 1542 1443 1535
horno
Referencias
Triola, M. F. (2019). Estadística (Decimosegunda ed.). México: Pearson.
Prueba del signo
Derly D. Ortiz Romero, M.Sc.
Competencias de aprendizaje
Aplica el procedimiento de la prueba del signo.
Convierte valores de datos en signos positivos y
negativos.
Identifica las ventajas y desventajas de la prueba del
signo.
Definición
La prueba del signo utiliza
signos positivos y negativos
para probar diferentes
aseveraciones:
Aseveraciones que implican Aseveraciones acerca de la
Aseveraciones que implican
datos muestrales mediana de una sola
datos nominales.
apareados. población.
Requisitos
No existe el requisito de que los
Los datos muestrales se datos muestrales provengan de
seleccionaron aleatoriamente. una población con una
distribución particular.
Notación:
𝑥 = número de veces que ocurre el signo 𝒎𝒆𝒏𝒐𝒔 𝒇𝒓𝒆𝒄𝒖𝒆𝒏𝒕𝒆.
𝑛 = número total de signos positivos y negativos combinados.
Estadístico de prueba
𝒏 ≤ 𝟐𝟓
𝑥(el número de veces que ocurre el signo menos frecuente)
𝒏 > 𝟐𝟓
𝑛
𝑥 + 0,5 − 2
𝑧=
𝑛
2
Aseveraciones que implican datos apareados
Restamos cada valor de la
segunda variable del valor
correspondiente de la
primera variable.
Registramos sólo el signo
de la diferencia
encontrada en el paso 1.
Excluimos los empates.
Casos de estudio
Prueba de semillas de maíz. En 1908 William Gosset público al artículo “The
Probable Error of a Mean”, bajo el seudónimo de “Student” (Biometrika, vol. 6,
núm. 1). Él incluyó la lista que parece abajo, acerca de las cosechas de dos tipos
diferentes de semillas (normales y secadas en horno), que se utilizaron en
parcelas de tierra adyacentes. Los valores listados son las cosechas de paja en cwt
por acre, donde cwt representa 100 libras. Utilice un nivel de significancia de 0,05
y pruebe la aseveración de que no hay diferencia entre las cosechas de los dos
tipos de semillas. ¿Parece que alguna de las semillas es mejor?
Normales 19,25 22,75 23 23 22,5 19,75 24,5 15,5 18 14,25 17
Secadas al
25 24 24 28 22,5 19,5 22,25 16 17,25 15,75 17,25
horno
Aseveraciones que implican datos nominales
Podemos probar
La naturaleza de los datos aseveraciones acerca de
nominales limita los la proporción poblacional
cálculos posibles. p correspondiente.
Podemos identificar la
proporción de datos
muestrales que
pertenecen a una
categoría en particular.
Casos de estudio
Selección del género. El Genetics and IVF Institute realizó un ensayo clínico de
sus métodos de selección del género. Para cuando se escribía este libro, los
resultados incluían a 325 bebés nacidos de padres que utilizaron el método
XSORT para aumentar la probabilidad de concebir una niña, y 295 de esos bebés
fueron niñas. Utilice la prueba del signo con un nivel de significancia de 0,05 y
pruebe la aseveración de que este método de selección del género no tiene
ningún efecto.
Aseveraciones acerca de la mediana de una
sola población
Temperaturas corporales. El conjunto de datos 2 del apéndice B incluye
temperaturas corporales medidas en adultos. Utilice las 106 temperaturas
listadas para las 12:00 a.m. del día 2 con la prueba del signo para probar la
aseveración de que la mediana es menor que 98,6°F. El conjunto de datos tiene
106 sujetos, 68 sujetos con temperaturas por debajo de 98,6°F; 23 sujetos con
temperaturas por arriba de 98,6°F y 15 sujetos con temperaturas iguales a 98,6°F.
Referencias
Triola, M. F. (2019). Estadística (Decimosegunda ed.). México: Pearson.
Tablas de contingencia:
Independencia y homogeneidad
Derly D. Ortiz Romero, M.Sc.
Competencias de aprendizaje
Identifica tablas de contingencia o tablas de
frecuencias de dos factores.
Realiza cálculos para encontrar frecuencias esperadas.
Emplea la distribución chi cuadrada para la prueba de
hipótesis.
Definición
Es una tabla en la que las
frecuencias corresponden Tabla de
a dos variables. contingencia
Una variable para
Tabla de frecuencias
renglones y otra
de dos factores.
para columnas.
Prueba de independencia
Pone a prueba la 𝐻0
No existe asociación entre la variable de renglón y la variable columna.
𝐻0 : Las variables de renglón y de columna son independientes.
Requisitos
Los datos muestrales son seleccionados al azar y se representan como conteos
de frecuencias en una tabla de dos factores.
𝐻0 : Las variables de renglón y columna son independientes.
𝐻1 : Las variables de renglón y columna son dependientes.
Para cada celda de la tabla de contingencia, la frecuencia esperada 𝐸 es al
menos de 5.
Estadístico de prueba para una prueba de
independencia
𝑂−𝐸 2 𝑔𝑙 = 𝑟 − 1 𝑐 − 1
2
𝜒 =
𝐸 Dónde 𝒓 es el número de
renglones y 𝒄 el número de
columnas.
La región crítica se localiza sólo
en la cola derecha.
Frecuencia esperada para una tabla de
contingencia
𝒕𝒐𝒕𝒂𝒍 𝒅𝒆 𝒓𝒆𝒏𝒈𝒍ó𝒏 𝒕𝒐𝒕𝒂𝒍 𝒅𝒆 𝒄𝒐𝒍𝒖𝒎𝒏𝒂
𝑬=
𝒈𝒓𝒂𝒏 𝒕𝒐𝒕𝒂𝒍
Prueba de homogeneidad
Probamos la aseveración:
De que poblaciones diferentes tienen las
mismas proporciones de algunas
características.
Casos de estudio
No fumar. La tabla adjunta resume éxitos y fracasos de sujetos que utilizaron
diferentes métodos para tratar de dejar de fumar. Cinco meses después de
comenzar el tratamiento, se determinó si los sujetos fumaban o no fumaban; los
datos están basados en resultados de los Centros para el Control y Prevención de
Enfermedades. Utilice un nivel de significancia de 0,05 para probar la aseveración
de que el éxito es independiente del método utilizado. Si alguien quiere dejar de
fumar, ¿La elección del método provoca una diferencia?
Goma de mascar
Parche de nicotina
de nicotina
Fuman 191 263
No fuman 59 57
Casos de estudio
¿La vacuna es efectiva? En un artículo de USA Today, sobre una vacuna
experimental para niños, se publicó la siguiente aseveración: “En una prueba con
1602 niños, sólo 14 (el 1%) de los 1070 que recibieron la vacuna desarrollaron
gripe, comparados con 95 (el 18%) de los 532 que recibieron placebo”. Los datos
se incluyen en la siguiente tabla. Utilice un nivel de significancia de 0,05 para
hacer una prueba de independencia entre la variable de tratamiento (vacuna o
placebo) y la variable que representa la gripe (desarrolló gripe, no desarrolló
gripe). ¿Parece que la vacuna es efectiva?
Sí No
Tratamiento con vacuna 14 1056
Placebo 95 437
Referencias
Triola, M. F. (2019). Estadística (Decimosegunda ed.). México: Pearson.
Inferencia acerca de dos medias
Derly D. Ortiz Romero, M.Sc.
Competencias de aprendizaje
Prueba hipótesis acerca de parámetros poblacionales.
Identifica las pruebas para la igualdad de varianzas.
Distingue las pruebas con muestras independientes y
muestras dependientes.
Definiciones
Muestras Muestras
independientes dependientes
Si los valores muestrales (Consisten en datos
obtenidos de una apareados)si los
población no están miembros de una muestra
relacionados o apareados se pueden usar para
con los valores muestrales determinar los miembros
de otra población. de otra muestra.
Casos de estudio
❖Tratamiento del colesterol: Se trata un grupo de sujetos con el fármaco reductor del colesterol
Lipitor, mientras que a un segundo grupo separado de sujetos se les da un placebo.
❖Eficacia de una dieta: Se prueba la eficacia de una dieta utilizando los pesos de los sujetos
medidos antes y después de someterse a la dieta.
Muestras independientes
Derly D. Ortiz Romero, M.Sc.
Comparación de la variación en dos
muestras
Derly D. Ortiz Romero, M.Sc.
Prueba 𝑭 para comparar varianzas
Requisitos
Las dos poblaciones están
Las dos poblaciones son
distribuidas
independientes.
normalmente.
Propiedades de la distribución 𝑭
La distribución 𝐹 no es simétrica.
Los valores de la distribución 𝐹 no pueden ser negativos.
La forma de distribución exacta depende de los diferentes grados
de libertad.
Estadístico de prueba para pruebas de
hipótesis con dos varianzas
𝑠12
𝐹= 2
𝑠2
Donde:
𝑠12 > 𝑠22
Estadístico de prueba para pruebas de
hipótesis con dos varianzas
Valores críticos
𝐺𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 𝑑𝑒𝑙 𝑛𝑢𝑚𝑒𝑟𝑎𝑑𝑜𝑟 = 𝑛1 − 1
𝐺𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 𝑑𝑒𝑙 𝑑𝑒𝑛𝑜𝑚𝑖𝑛𝑎𝑑𝑜𝑟 = 𝑛2 − 1
Casos de estudio
❖Demanda química de oxígeno. Se comparo un método propuesto para la
determinación de la demanda química de oxígeno en aguas residuales con
otro método patrón (sales de mercurio). Los siguientes resultados fueron
obtenidos para una muestra de aguas residuales:
Desviación estándar
Media 𝐦𝐠 𝐦𝐋−𝟏
𝐦𝐠 𝐦𝐋−𝟏
Método patrón 72 3,31
Método propuesto 72 1,51
❖Para cada método se realizaron ocho determinaciones. ¿Es la precisión del
método propuesto significativamente más grande que la del método
estándar?.
Referencias
Miller, J. N., & Miller, J. C. (2010). Statistics and Chemometrics for
Analytical Chemistry (Sixth ed.). London: Pearson.
Triola, M. F. (2019). Estadística (Decimosegunda ed.). México: Pearson.
Inferencias acerca de dos medias
Derly D. Ortiz Romero, M.Sc.
Competencias de aprendizaje
Identifica las pruebas para la igualdad de varianzas.
Prueba hipótesis acerca de dos medias poblacionales.
Valora los elementos de la inferencia estadística y su
importancia en los diseños experimentales.
Comparación de dos medias
suponiendo varianzas iguales
Derly D. Ortiz Romero, M.Sc.
Requisitos
Se desconocen las dos desviaciones estándar poblacionales, pero se supone que son
iguales, 𝜎1 = 𝜎2 .
Las dos muestras son independientes.
Ambas muestras son aleatorias simples.
Las dos muestras provienen de poblaciones que tienen distribuciones normales.
Estadístico de prueba de hipótesis para dos medias:
𝟐 𝟐
𝝈𝟏 = 𝝈𝟐
𝑥ҧ1 − 𝑥ҧ2
𝑡= 𝑛1 − 1 𝑠12 + 𝑛2 − 1 𝑠22
𝑠𝑝2 𝑠𝑝2 𝑠𝑝2 =
𝑛1 − 1 + 𝑛2 − 1
𝑛1 + 𝑛2
𝑔𝑙 = 𝑛1 + 𝑛2 − 2
Comparación de dos medias
suponiendo varianzas desiguales
Derly D. Ortiz Romero, M.Sc.
Requisitos
𝜎1 y 𝜎2 se Las dos muestras
desconocen y no se provienen de
Las dos muestras son Ambas muestras son
hace una suposición poblaciones que
independientes. aleatorias simples.
de igualdad entre 𝜎12 tienen distribuciones
y 𝜎22 . normales.
Estadístico de prueba de hipótesis para dos medias:
𝟐 𝟐
𝝈𝟏 ≠ 𝝈𝟐
𝑥ҧ1 − 𝑥ҧ2 𝐴+𝐵 2
𝑡= 𝑔𝑙 =
𝑠12 𝑠22 𝐴2 𝐵2
+ 𝑛1 − 1 + 𝑛2 − 1
𝑛1 𝑛2
𝑠12 𝑠22
𝐴= 𝑦 𝐵=
𝑛1 𝑛2
Casos de estudio
❖Determinación de estaño. En una serie de experimentos para la
determinación de estaño en productos alimenticios, las muestras fueron
llevadas a ebullición con HCl a reflujo para diferentes tiempos, Los
resultados fueron:(Analytical Methods Committee, 1983. Analyst 108:109)
Tiempo
Estaño encontrado 𝐦𝐠 𝐤𝐠 −𝟏
𝐦𝐢𝐧
30 55 57 59 56 56 59
75 57 55 58 59 59 59
❖¿Es significativamente diferente la cantidad media de estaño encontrada
para los dos tiempos de ebullición?
Casos de estudio
❖Artritis reumatoide. Los datos de la siguiente tabla proporcionan la
concentración de tiol mM en el lisado sanguíneo de dos grupos de voluntarios,
siendo el primer grupo “normal” y el segundo sufriendo artritis
reumatoide.(Banford, J.C., Brown, D.H., McNeil, C.J., Smith, W.E., Hazelton, R.A.
and SturrocK, R.D. 1983. Analyst 107:195)
Normal 1,84 1,92 1,94 1,92 1,85 1,91 2,07
Reumatoide 2,81 4,06 3,62 3,27 3,27 3,76
❖La hipótesis nula adoptada es que la concentración media de tiol es la misma
para los dos grupos.
Inferencias a partir de datos
apareados
Derly D. Ortiz Romero, M.Sc.
Competencias de aprendizaje
Distingue las pruebas con muestras independientes y
muestras apareadas.
Estudia métodos para probar aseveraciones acerca de
la diferencia media de datos apareados.
Valora la importancia de trabajar con datos
muestrales apareados.
Muestras dependientes
Derly D. Ortiz Romero, M.Sc.
Requisitos
Los datos muestrales consisten en datos
apareados.
Las muestras son aleatorias simples.
Los pares de valores se toman de una población
con una distribución aproximadamente normal.
Estadístico de prueba para datos apareados
𝑑ҧ
𝑡= 𝑛
𝑠𝑑
𝑔𝑙 = 𝑛 − 1
Casos de estudio
❖Prueba de semillas de maíz. En 1908 William Gosset publicó el artículo “The Probable Error of a
Mean” bajo el seudónimo de “Student” (Biometrika, vol. 6, núm. 1). El artículo incluyó los datos
listados abajo para dos tipos diferentes de semillas de maíz (comunes y secadas al horno) que se
utilizaron en parcelas adyacentes. Los valores listados son las cosechas de cabezas de maíz o
mazorcas en libras por acre.
a) Utilice un nivel de significancia de 0,05 para poner a prueba la aseveración de que no existe
diferencia entre las cosechas de los dos tipos de semillas.
b)¿Parece que algún tipo de semilla es mejor?
Comunes 1903 1935 1910 2496 2108 1961 2060 1444 1612 1316 1511
Secadas al
2009 1915 2011 2463 2180 1925 2122 1482 1542 1443 1535
horno
Casos de estudio
❖Determinación de antimonio. Se comparó un nuevo método espectroscópico de absorción
atómica de llama para determinar antimonio en la atmósfera con el método colorimétrico
recomendado. Para muestras de atmósfera urbana, se obtuvieron los siguientes resultados:
Antimonio encontrado 𝐦𝐠/𝐦𝟑
Muestra N°
Método nuevo Método estándar
1 22,2 25,0
2 19,2 19,5
3 15,7 16,6
4 20,4 21,3
5 19,6 20,7
6 15,7 16,8
❖¿Difieren significativamente los resultados obtenidos por los dos métodos?
Referencias
Miller, J. N., & Miller, J. C. (2010). Statistics and Chemometrics for
Analytical Chemistry (Sixth ed.). London: Pearson.
Triola, M. F. (2019). Estadística (Decimosegunda ed.). México: Pearson.
Estadística no paramétrica
Derly D. Ortiz Romero, M.Sc.
Competencias de aprendizaje
Aplica métodos no paramétricos a una amplia
variedad de situaciones.
Compara las pruebas paramétricas y no paramétricas,
evaluando su eficiencia.
Valora las ventajas y desventajas de los métodos no
paramétricos.
Definiciones
Pruebas Pruebas no
paramétricas paramétricas
Tienen requisitos No requieren que las
acerca de la muestras provengan
naturaleza o forma de de poblaciones con
las poblaciones distribuciones
implicadas. normales.
Suelen llamarse
pruebas de
distribución libre.
Ventajas de los métodos no paramétricos
Los métodos no paramétricos no requieren de poblaciones
distribuidas normalmente.
Los métodos no paramétricos a menudo pueden aplicarse a
datos categóricos.
Por lo regular, implican cálculos más sencillos que los métodos
paramétricos correspondientes y, por lo tanto, son más fáciles de
comprender y aplicar.
Desventajas de los métodos no paramétricos
Los métodos no paramétricos tienden a desperdiciar
información porque los datos numéricos exactos
suelen reducirse a una forma cualitativa.
Las pruebas no paramétricas no son tan eficientes
como las pruebas paramétricas, de manera que con
una prueba no paramétrica generalmente
necesitamos evidencia más fuerte para rechazar una
hipótesis nula.
Métodos paramétricos versus métodos no
paramétricos
Rangos
Un rango es un número Al primer elemento se le
Los datos están ordenados asignado a un elemento asigna un rango de 1, al
cuando se acomodan de muestral individual de segundo elemento se le
acuerdo con algún criterio. acuerdo con su lugar en la asigna un rango de 2 y así
lista ordenada. sucesivamente.
Ejemplo
Manejo de rangos empatados: Si ocurre un empate en los
rangos, el procedimiento habitual es calcular la media de los
rangos implicados y luego asignar este rango medio a cada uno
de los elementos empatados.
Los números 4, 5, 5, 5, 10, 11, 12 y 12 tienen rangos dados de 1, 3,
3, 3, 5, 6, 7,5; y 7,5; respectivamente. Realice un manejo apropiado
de rangos empatados.
Referencias
Triola, M. F. (2019). Estadística (Decimosegunda ed.). México: Pearson.
Experimentos multinomiales:
Bondad de ajuste
Derly D. Ortiz Romero, M.Sc.
Competencias de aprendizaje
Identifica experimentos multinomiales.
Realiza cálculos para encontrar frecuencias esperadas.
Emplea la distribución chi cuadrada para la prueba de
hipótesis.
Experimento multinomial
Todos los resultados
de cada ensayo Las probabilidades
para las diferentes
El número de ensayos Los ensayos son deben clasificarse
categorías permanecen
es fijo. independientes. exactamente en una constantes en cada
de varias categorías ensayo.
diferentes.
Prueba de bondad de ajuste
Se utiliza para probar la hipótesis de que una
distribución de frecuencias se ajusta a (o coincide con)
alguna distribución aseverada.
𝒌 número de 𝒏 número
𝑶 frecuencia 𝑬 frecuencia
categorías total de
observada esperada
diferentes ensayos
Cálculo de frecuencias esperadas
Si todas las 𝐸 son Si las 𝐸 no son
iguales todas iguales
𝑛
𝐸= 𝐸 = 𝑛𝑝
𝑘
Requisitos
Los datos se seleccionan al azar.
Los datos muestrales consisten en conteos de frecuencias para
cada una de las diferentes categorías.
Para cada categoría 𝐸 es al menos de 5.
Estadístico de prueba para pruebas de bondad
de ajuste
2
𝑂−𝐸
𝜒2 = 𝑔𝑙 = 𝑘 − 1
𝐸
Dónde 𝑘 es el número de categorías.
Las pruebas de hipótesis por bondad de ajuste
siempre son de cola derecha.
Casos de estudio
Roturas en el material de vidrio. A continuación se muestra el número de roturas
en el material de vidrio de cuatro trabajadores de un laboratorio de microbiología
a lo largo de un periodo de tiempo. ¿Hay alguna evidencia de que los
trabajadores difieran en su habilidad?
Número de roturas 24 17 11 9
Casos de estudio
Experimento de color de ojos. Un investigador desarrolló un modelo teórico para
predecir el color de los ojos. Después de examinar una muestra aleatoria de
padres, predice el color de ojos de su primer hijo. La siguiente tabla lista el color
de ojos de descendientes. Con base en su teoría, el investigador predijo que el
87% de los descendientes tendrían ojos cafés, que el 8% tendría ojos azules y que
el 5% tendría ojos verdes. Utilice un nivel de significancia de 0,05 para probar la
aseveración de que las frecuencias reales corresponden a la distribución que
predijo.
Ojos cafés Ojos azules Ojos verdes
Frecuencia 132 17 0
Casos de estudio
Experimento de genética. Con base en los genotipos de los padres, se espera que sus
descendientes tengan genotipos distribuidos de tal forma que el 25% tenga genotipos denotados
por AA, que el 50% tenga genotipos denotados por Aa, y que el 25% tenga genotipos denotados
por aa. Cuando se seleccionan 145 descendientes, se descubre que 20 de ellos tienen genotipos
AA, 90 tienen genotipos Aa y 35 tienen genotipos aa. Ponga a prueba la aseveración de que las
frecuencias observadas de los genotipos de los descendientes coinciden con la distribución
esperada del 25% para AA, 50% para Aa y 25% para aa. Utilice un nivel de significancia de 0,05.
Referencias
Miller, J. N., & Miller, J. C. (2010). Statistics and Chemometrics for
Analytical Chemistry (Sixth ed.). London: Pearson.
Triola, M. F. (2019). Estadística (Decimosegunda ed.). México: Pearson.