Maestría en Gerencia de Servicios de Salud
Maestría en Medicina
Curso: Estadística Aplicada
Módulo III: Medidas asociación entre variables
Sección: Materiales
Guía Seminario Estadística Aplicada Nº 3
SEMINARIO Nº 8
CORRELACION Y REGRESION
1. El editor en jefe de un importante periódico metropolitano ha intentado convencer al
dueño del periódico para que mejore las condiciones de trabajo en el taller de
prensas. Está convencido de que, cuando trabajan las prensas, el grado de ruido
crea niveles no saludables de tensión y ansiedad. Recientemente hizo que un
psicólogo realizara una prueba durante la cual los prensistas se situaron en cuartos
con niveles variables de ruido y luego se le hizo otra prueba para medir niveles de
humor y ansiedad. La siguiente tabla muestra el índice de su grado de ansiedad o
nerviosismo y el nivel de ruido al que se vieron expuestos. (1,0 es bajo y 10,0 es
alto).
Nivel de ruido 4 3 1 2 6 7 2 3
Grado de ansiedad 39 38 16 18 41 45 25 38
a) Represente gráficamente estos datos.
SOLUCIÓN:
ESTADISTICA APLICADA
b) Desarrolle una ecuación de estimación que describa los datos.
SOLUCIÓN:
y = 4.5667x + 16.517
c) Pronostique el grado de ansiedad que podríamos esperar cuando el nivel de
ruido es 5.
SOLUCIÓN:
y = 4.5667*(5) + 16.517 = 39.35
d) Calcule e interprete el coeficiente de correlación
SOLUCIÓN:
r = 84.80%
Interpretación: indica una relación lineal exacta positiva intensa (creciente) de
84.80%
e) Calcule e interprete el coeficiente de determinación
SOLUCIÓN:
R = 71.91%
Interpretación: la variación del grado de ansiedad quedará explicada en
71,91% por la ecuación de regresión que está en función del nivel de ruido.
2. El Gerente de una Clínica dispone de la siguiente información:
Año 2001 2002 2003 2004 2005 2006
Cirugías 120 143 150 170 162 158
a) Grafique y determine la ecuación de la tendencia lineal.
SOLUCIÓN:
b) Proyecte las cirugías al corazón para el año 2007
SOLUCIÓN:
y = 7.6286*(2007) – 15133 = 177.2
Interpretación: indica que para el año 2007 se proyectó 177 cirugías al corazón.
3. Se ha medido la variación de creatinina en pacientes tratados con Captopril (droga
antihipertensión) tras la suspensión del tratamiento con diálisis, resultando la
siguiente tabla:
ESTADISTICA APLICADA
Días tras la diálisis: X 1 5 10 15 20 25 35
Creatinina (mg/dl): Y 5.7 5.2 4.8 4.5 4.2 4 3.8
a) Calcule el modelo de regresión lineal
SOLUCIÓN:
Está dado por: y = -0.0552x + 5.475
b) Interprete el coeficiente de regresión.
SOLUCIÓN:
b= -0.0552, indica que por cada dia de suspensión del tratamiento con diálisis
que pase, la variación de creatinina disminuye en promedio en (-0.0552)
unidades.
c) Si un individuo presenta 8 días tras la suspensión del tratamiento con diálisis,
que sucede con la creatinina (mg/dl).
SOLUCIÓN:
y = -0.0552*(8) + 5.475 = 5.03
Interpretación: indica que si un individuo presenta 8 días tras la suspensión del
tratamiento con diálisis, la creatinina esta en 5.03 mg/dl.
4. Se efectúa un experimento médico para determinar el efecto de la droga efedrina
en las pulsaciones del corazón. Un paciente recibe diversas dosis diarias de la
droga durante seis días. La tabla que sigue resume los resultados del experimento.
Dosis diaria total Nº de
de efedrina pulsaciones
(granos) por minuto
3 70
2 60
1 50
3 80
5 100
4 90
Nota. 1 grano = 0.06 gramos
a) Grafique un diagrama de dispersión
SOLUCIÓN:
ESTADISTICA APLICADA
b) Determine la ecuación de regresión lineal. Interprete los coeficientes de
regresión lineal. Grafique sobre el diagrama de dispersión, la línea de
regresión.
SOLUCIÓN:
Está dado por: y = 13x + 36
Donde:
Y: es la variable dependiente, Nº de pulsaciones por minuto
X: es la variable independiente, Dosis diaria total de efedrina (granos)
Bo=36, cuando no se administra la dosis diaria total de efedrina (granos) se
estima que el número de pulsaciones por minuto es de 36.
B1=13, por cada grano de dosis diaria de efedrina que se aumente, el número
de pulsaciones por minuto será de 13.
c) Estímese el número de pulsaciones para una dosis diaria de 4 granos de
efedrina.
SOLUCIÓN:
y = 13*(4) + 36 = 88
d) Calcule e interprete el coeficiente de correlación.
SOLUCIÓN:
r = 98.27%
Interpretación: indica una relación lineal exacta positiva intensa (creciente) de
98.27%
e) Calcule e interprete el coeficiente de determinación
SOLUCIÓN:
R = 96.57%
Interpretación: indica la variación del número de pulsaciones por minuto
quedará explicada en 96,57% por la ecuación de regresión que está en función
de la Dosis diaria total de efedrina (granos).
ESTADISTICA APLICADA
SEMINARIO Nº 9
PRUEBA DE INDEPENDENCIA
1. Quinientos empleados de una empresa que fabrica cierto producto, sospechoso de estar
asociado con alteraciones respiratorias, se clasificaron en forma cruzada con base de grado de
exposición al producto y si tenían o no los síntomas de tales alteraciones respiratorias. Los
resultados se muestran en la siguiente tabla:
Nivel de Exposición
Síntomas presentes Alto Limitado Sin exposición conocida Total
Si 185 33 17 235
No 120 73 72 265
Total 305 106 89 500
¿Proporcionan estos datos la evidencia suficiente para indicar que, en un nivel de significación
de 0.05, existe una relación entre el grado de exposición y la presencia de los síntomas de las
alteraciones respiratorias?
SOLUCIÓN:
Hipótesis
Ho: No hay relacion entre variables
H1: Si existe relacion entre variables
Nivel de Significancia: 5%
Estadístico:
DECISION:
X2t= 5.991 Se rechaza la Hipótesis nula por estar en la zona de rechazo
CONCLUSION: Hay evidencia estadísticamente suficiente para concluir que las personas con
alteraciones respiratorias se deprimen.
2. A un grupo de 350 adultos que participaron en una encuesta de salud, se les preguntó si
llevaban a no una dieta. Las respuestas (por sexos) son las siguientes
Sexo
Masculino Femenino Total
A dieta 14 25 39
Sin dieta 159 152 311
Total 173 177 350
¿Sugieren estos datos que al estar a dieta depende del sexo? Sea = 0.05.
SOLUCIÓN:
ESTADISTICA APLICADA
Hipótesis
Ho: No hay relacion entre variables
H1: Existe relacion entre variables
Nivel de Significancia: 5%
Estadístico:
Decisión:
X2f= 3.841 No se rechaza la hipótesis alternativa
Conclusión: Hay evidencia estadísticamente suficiente para concluir que el estar a dieta
depende del
3. Una muestra de 500 estudiantes de bachillerato participó en un estudio diseñado con el fin de
evaluar el nivel de sus conocimientos respecto a un cierto grupo de enfermedades comunes.
La tabla siguiente presenta la clasificación de los estudiantes de acuerdo con su principal
campo de estudio y el nivel de conocimientos sobre el grupo de enfermedades
Conocimiento de las enfermedades
Área de estudio Bueno Malo Total
Medicina 31 91 122
Otra 19 359 378
Total 50 450 500
¿Sugieren estos datos que existe una relación entre el conocimiento del grupo de
enfermedades y el principal campo de estudio de los estudiantes de bachillerato de los cuales
se extrajo la muestra
SOLUCIÓN:
Hipótesis
Ho: No hay relacion entre variables
H1: Existe relacion entre variables
Nivel de Significancia: 5%
Estadístico:
Decisión:
X2f= 3.84 Se rechaza la Hipótesis nula.
Conclusión: Hay evidencia estadística para concluir que el conocimiento del grupo de
enfermedades depende del principal campo de estudios de los estudiantes de bachillerato.
ESTADISTICA APLICADA
PRUEBA DE HOMOGENEIDAD
1. En un estudio acerca de la contaminación atmosférica a realizado en dos comunidades, se
seleccionó una muestra aleatoria de 200 familias de cada una de dichas comunidades. Se le
preguntó a uno de los miembros de cada familia si algún miembro de la misma se sentía
afectado por la contaminación atmosférica. Las respuestas son las siguientes:
¿ Algún miembro de la familia ha sido afectado por la contaminación?
Comunidad Si No Total
I 43 157 200
II 81 119 200
Total 124 276 400
¿Pueden concluir los investigadores que las dos comunidades difieren con respecto a la
variable de interés? Sea = 0.05
SOLUCIÓN:
Hipótesis
Ho: Existe homogeneidad
H1: No existe homogeneidad
Nivel de significancia: 5%
Estadistico:
Decisión:
X2f= 3.841 Se rechaza la Hipótesis nula.
Conclusión: Hay evidencia estadística para concluir que las muestras no provienen de
poblaciones homogeneidad según si algún miembro de la familia ha sido afectado por la
contaminación.
2. En una muestra aleatoria simple de 250 trabajadores industriales con cáncer, losa
investigadores encontraron que 102 de ellos habían trabajado en puestos clasificados como
“altamente expuestos” a agentes causantes de cáncer,. Del resto, 84 habían trabajado en
puestos “de mediana exposición” y 64 no habían experimentado exposición en sus trabajos. En
una muestra aleatoria simple independiente de 250 trabajadores industriales de la misma área
que no tenían un diagnóstico de cáncer, 31 trabajaban en puestos “altamente expuestos”, 60 en
puestos “medianamente expuestos” y 159 trabajaban en puestos que no involucraban
exposición conocida a agentes causantes de cáncer. ¿ es posible deducir a partir de estos datos
que las personas que trabajaban en puestos que los exponen a agentes causantes de cáncer
poseen un mayor riesgo de contraer dicha enfermedad? Sea = 0.05
SOLUCIÓN:
Alta Mediana Sin
Exposición Exposición Exposición Total
Con Cáncer 102 84 64 250
Sin Cáncer 31 60 159 250
Total 133 144 223 500
Hipótesis
Ho: Existe homogeneidad
ESTADISTICA APLICADA
H1: No existe homogeneidad
Nivel de significancia: 5%
Estadistico:
Decisión:
X2f= 3.841 Se rechaza hipótesis nula, no existe homogeneidad entre las variables
Conclusión: existe diferencias.
3. A cada uno de los varones de una muestra de tamaño 250, extraída de una población que se
sospechaba sufría de alguna enfermedad de las articulaciones se les preguntó cuál de tres
síntomas lo molestaba mayormente. La misma pregunta se le hizo a una muestra de 300
mujeres que se sospechaba padecían la misma enfermedad. Los resultados fueron los
siguientes:
-------------------------------------------------------------------------------------
Síntoma más molesto Hombres Mujeres
------------------------------------------------------------------------------------
Rigidez matutina 111 102
Dolor por la noche 59 73
Hinchazón de las articulaciones 80 125
-------------------------------------------------------------------------------------
TOTAL 250 300
--------------------------------------------------------------------------------------
Proporcionan estos datos la suficiente evidencia para indicar que las dos poblaciones no son
homogéneas con respecto a los síntomas principales?. Sea = 0.05 ¿Cuál es el valor de p
para esta prueba?
SOLUCIÓN:
Hipótesis
Ho: Existe homogeneidad
H1: No existe homogeneidad
Nivel de significancia: 5%
Estadistico:
Decisión:
X2f= 3.841 Se rechaza hipótesis nula, no existe homogeneidad entre las variables
Conclusión: existe diferencias.
ESTADISTICA APLICADA
ESTADISTICA APLICADA
SEMINARIO Nº 10
1. Se tiene interés en evaluar si el uso de anticonceptivos orales es un factor de riesgo del infarto
miocárdico en mujeres casadas menores de 45 años de edad. Para tal efecto se realiza un
estudio comparativo tipo caso control y se obtienen los siguientes resultados:
Uso de anticonceptivos Pacientes con infarto Sin infarto
orales Miocárdico Miocárdico
(Casos) (Controles)
_________________________________________________________________
Si 23 34
Nunca 35 132
_________________________________________________________________
Total 58 166
Se pide calcular e interpretar el odds ratio (OR)
SOLUCIÓN:
Conclusión: El uso de anticonceptivos orales es un Factor de Riesgo del infarto miocárdio en
mujeres casadas menores de 45 años de edad.
2. Evaluar si niveles altos de colesterol sérico (>250) se considera factor de riesgo de un infarto
del miocárdio. Por consiguiente se realiza un estudio comparativo de cohortes y se obtiene los
siguientes resultados:
Niveles de colesterol Desarrolla IM No desarrolló IM Total
Sérico (mg%)
_________________________________________________________
>250 10 125 135
250 21 449 470
_________________________________________________________
Se pide calcular e interpretar el riesgo relativo
SOLUCIÓN:
Conclusión: Niveles altos de colesterol sérico (>250) se considera Factor de Riesgo de un
infarto del miocárdio.
3. Se desea evaluar si el consumo del tabaco es un factor de riesgo del cáncer de pulmón. Para
ESTADISTICA APLICADA
tal efecto se registraron 550 fumadores de los 649 casos con cáncer de pulmón, comparados
con los 300 no fumadores de los 640 controles
a. Mostrar una tabla 2x2 con los datos obtenidos.
SOLUCIÓN:
CANCER PULMÓN
(Casos) (Controles)
TABACO E E'
Si 550 340
No 99 300
Total 649 640
b. Calcular e interpretar el odds ratio asociado con el consumo de tabaco.
SOLUCIÓN:
Conclusión: El consumo del tabaco es un Factor de Riesgo del cáncer de pulmón.
4. Se realizó un estudio caso- control para encontrar si la vasectomía es un factor de riesgo del
cáncer de próstata. Los datos obtenidos se muestran en la tabla cruzada de abajo.
VASECTOMIA Casos Controles TOTAL
Si 70 80 154
No 105 178 279
TOTAL 175 258 433
Calcular el odss ratio. Interpretar los resultados
SOLUCIÓN:
Conclusión: La vasectomía es un Factor de Riesgo del cáncer de próstata.
5. Una investigación del riesgo asociado con un agente quimioterápico (Cytarabine) fue realizado
por Jolson y sus colaboradores (1992). Los pacientes recibieron una formulación de la droga
(grupo expuesto) o la formulación original (grupo no expuesto). El resultado era si el paciente
desarrolló toxicidad cerebelosa mientras se encontraba en terapia. Los resultados obtenidos
fueron los siguientes:
Enfermedad Total
Si No
____________________________________
Exposición Si 11 14 25
No 3 31 34
____________________________________
TOTAL 14 45 59
Calcular e interpretar el riesgo relativo
ESTADISTICA APLICADA
SOLUCIÓN:
Conclusión: El agente quimioterápico (Cytarabine) se considera Factor de Riesgo de toxicidad
cerebelosa mientras el paciente se encuentra en terapia.
ESTADISTICA APLICADA