Se realizó una encuesta entre los votantes de 4 distritos de Lima
para comparar las opinión de los votantes a favor del candidato A
para la alcaldía de Lima. Se tomó una muestra de 300 votantes en
cada uno de los 4 distritos, obteniéndose los resultados que se
muestran en la siguiente tabla:
Presentan estos datos suficiente evidencia para sostener que el porcentaje de
votantes que están a favor del candidato A en los cuatro distritos son iguales?
2
2019
CHI CUADRADO
3
LOGRO DE LA SESIÓN:
Al finalizar el estudiante reconoce y aplica las
prueba de homogeneidad e independencia
4
CHI CUADRADO
Prueba de Homogeneidad
Prueba de Independencia
5
PRUEBA 𝑿𝟐
Prueba no paramétrica para datos cualitativos.
Regla de Decisión
CARACTERÍSTICAS
1. El valor del estadístico se podrá aproximar a una distribución
Chi-Cuadrado (X2)cuando el tamaño muestral «n» sea grande (n >
30).
2. Las observaciones son obtenidas mediante muestreo aleatorio a
partir de una población particionada en categorías.
σ 𝒇𝒐 − 𝒇𝒆 𝟐
𝟐
𝑿 =
𝒇𝒆
PRUEBA DE BONDAD DE AJUSTE
Objetivo:
- Determinar si los datos de cierta muestra corresponden a cierta
distribución poblacional.
Características:
- 1 Variable
- Los valores de la variable debe estar dividido en clases de ocurrencia
- Se calculo grados de libertad.
O1 + O2 + O3 +O4 +O5 +6 ………….. = n
E1 + E2 + E3 +E4 +E5 +E6 ………… = n
E=nxp
Fórmula:
σ 𝒇𝒐 − 𝒇𝒆 𝟐
𝟐
𝑿 =
𝒇𝒆
gl= k – 1
Siendo:
k= categoría
EJEMPLO:
En cierta máquina Expendedora de Refrescos existen 4 canales que expiden el mismo tipo de bebida.
Estamos interesados en averiguar si la elección de cualquiera de estos canales se hace de forma
aleatoria o por el contrario existe algún tipo de preferencia en la selección de alguno por los
consumidores. La siguiente tabla muestra el número de bebidas vendidas en cada uno de los 4 canales
durante una semana. Contrastar la hipótesis de que los canales son seleccionados al azar a un nivel de
significación del 5%.
HO= f0=fe Canal Número de bebidas
HA= fo≠ fe consumidas
por este expendedor
Ei= n x p= 70* ¼ = 17.5 1 13
2 22
gl= 3
3 18
4 17
X2t =7.81
EJEMPLO:
El administrador de un hospital suponía que los ingresos al servicio de cirugía provenían
equivalentemente de tres fuentes: a) consulta externa, b) urgencias o c) traslados desde otros
hospitales.
Nivel de significancia= 0.05
Al estudiar el origen de los internamientos en cirugía en los últimos tres años, encontró lo
siguiente
¿Qué tan razonable era la suposición del administrador del hospital?
PRUEBA DE HOMOGENEIDAD
Objetivo:
- Determinar si los datos de cierta muestra provienen de la misma
población (igualdad)
Características:
- Se analizan 2 variables cualitativas
- Los valores de la variable debe estar dividido en clases de ocurrencia
o categorías.
- Se deberá construir tablas de contingencia.
- Se calcula los grados de libertad.
σ 𝒇𝒐 − 𝒇𝒆 𝟐 gl= (c-1)(f-1)
𝟐
𝑿 =
𝒇𝒆 Siendo:
c= columna
f= fila
EJEMPLO:
El Director de compras de una fábrica grande debe decidir por la compra de una de las cuatro marcas que hay en
el mercado. Para probar si existe diferencia significativa en la calidad de las máquinas, obtiene una muestra de la
producción de 150 artículos para cada una de ellas y observa el número de defectuosos. Los resultados se dan en
la siguiente tabla:
Solución:
M A Q U I N A S
CALIDAD A B C D Total
Defectuosos 21 12 15 18 66
Buenos 129 138 135 132 534
Total 150 150 150 150 600
H 0 : p A pB pC pD ( La proporción de defectuosos son las mismas en cada una de las máquinas)
H1 : Al menos en una de las máquinas la proporción de defectuosos no es la misma.
Nivel de significancia 0.05
( 21 16 .5 ) 2 (129 133 .5 ) 2 (132 133 .5 ) 2
2 .......... .......... .......... ...... 3.064
16 .5 133 .5 133 .5
Re gla de decisión: Re chazar H 0 si 2 Vt ( Valor hallado en la tabla 2 con 3 g..l
en este caso Vt 7.815 . Por lo tan to no rechazaremos H 0
Conclusión: La proporción de defectuosos sí es la misma.
EJEMPLO:
Estamos interesados en estudiar la fiabilidad de cierto componente informático con relación al distribuidor que
lo suministra. Para realizar esto, tomamos una muestra de los 3 distribuidores y se comparó los productos
defectuosos de cada lote. Nivel de significancia=0.05. La siguiente tabla muestra el número de defectuosos en
cada uno de los distribuidores
Componente Componente
defectuoso correcto
Distribuidor 1 16 84
Distribuidor 2 24 76
Distribuidor 3 19 81
PRUEBA DE INDEPENDENCIA
Objetivo:
- Determinar si los datos de cierta muestra están relacionados.
Características:
- Se analizan 2 variables cualitativas
- Los valores de la variable debe estar dividido en clases de ocurrencia
o categorías.
- Se deberá construir tablas de contingencia.
- Se calcula los grados de libertad.
gl= (c-1)(f-1)
σ 𝒇𝒐 − 𝒇𝒆 𝟐
𝟐
𝑿 = Siendo:
𝒇𝒆 c= columna
f= fila
Se tiene la siguiente información obtenida de una muestra de 5,000 fallecidos.
D I A G N Ó S T I C O
Muerte por cáncer Muerte por otras Total
de pulmón causas
Fumadores 348 3152 3,500
No Fumadores 82 1418 1,500
Total 430 4570 5,000
Se desea probar la hipótesis de que el fumar y la muerte por cáncer pulmonar son
independientes con α = 0.01
Solución:
H 0 : No existe relación entre el hábito de fumar y la muerte por cáncer pulmonar
H1 : Si existe relación entre el hábito de fumar y la muerte por cáncer pulmonar
Nivel de significancia 0.01
(348 301) 2 (3,152 3,199) 2 ( 82 129 ) 2 (1,418 1,371) 2
2
26.764
301 3,199 129 1,371
Re gla de decisión : Re chazar H 0 si 2 Vt ( Valor hallado en la tabla 2 con 1 g ..l
En este caso Vt 6.635 Por lo tan to rechazaremos H 0
Conclusión : Ambos factores están relacionados.
EJEMPLO:
Para estudiar la dependencia entre la práctica de algún deporte y la
depresión, se seleccionó una muestra aleatoria simple de 100 jóvenes, con
los siguientes resultados:
Deportista No deportista
Sin depresión 38 9
Con depresión 31 22
Determinar si existe independencia entre la actividad del sujeto y su
estado de ánimo. Nivel de significación (5%)
PRACTIQUEMOS!!
Se sostiene que una droga determinada es efectiva para la
curación del catarro común. En un experimento con 164 personas
con catarro, a la mitad de ellas se le suministró la droga y a la
otra mitad se le suministró píldoras azucaradas. Las reacciones
de los pacientes aparecen anotadas en la siguiente tabla:
Reaccciones
Mejorados Empeorados Efecto Nulo Total
Droga 52 10 20 82
26
Azúcar 44 12 82
46
Total 96 22 164
Nivel de significancia= 0.05
Una encuesta realizada en 378 hospitales por el Colegio de
Cirujanos Americanos produjo los datos de la tabla siguiente:
Proporcionan los datos evidencia suficiente para indicar una
dependencia entre el tipo de tumor y el uso de anticonceptivos
orales?. Use α = 0.05
Tipo de tumor Total
Benigno Maligno
Usan 138 49 187
anticonceptivos
No usan 39 41 80
No conocen su 35 76 111
uso
Total 212 166 378
Sobre una muestra de 500 niños de cierta escuela primaria se hizo un
estudio acerca de su estado de nutrición y el desempeño académico,
obteniéndose los siguientes resultados:
Existe relación entre el desempeño académico y el estado de nutrición. Use
α = 0.01
Desempeño Estado de Nutrición Total
Académico
Pobre Bueno
Malo 105 15 120
Satisfactorio 80 300 380
Total 185 315 500
¡¡TRABAJO EN EQUIPO!!
22
¿Qué hemos aprendido hoy?
23
BIBLIOGRAFÍA
Guía Práctica de Estadística General. 8° Edición 2019. UCSUR
Triola M. (2018). Estadística. 12ª ed. Editorial Pearson, México
Dawson-Saunders, B. y Trapp, R. (2002). Bioestadística Médica. 3ª Edición. México.
Manual Moderno.
Montgomery D. & Runger G.(2014) Probabilidades y Estadística aplicada a la
Ingeniería. 2da Edición. Editorial Limusa
Elaborado por: Sarita Bocanegra Gonzales
2019
MUCHAS GRACIAS
25