0% encontró este documento útil (0 votos)
313 vistas10 páginas

Tarea Modulo III

Este documento presenta una tarea sobre estadística aplicada que incluye cuatro problemas relacionados con medidas de asociación entre variables. El primer problema pide establecer hipótesis nulas y alternas para cuatro situaciones. El segundo problema presenta datos sobre el número de cirugías realizadas cada año en una clínica y pide calcular medidas de asociación y proyectar valores futuros. El tercer problema evalúa la asociación entre grado de exposición a un producto y síntomas respiratorios usando una prueba de chi cuadrado. El
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
313 vistas10 páginas

Tarea Modulo III

Este documento presenta una tarea sobre estadística aplicada que incluye cuatro problemas relacionados con medidas de asociación entre variables. El primer problema pide establecer hipótesis nulas y alternas para cuatro situaciones. El segundo problema presenta datos sobre el número de cirugías realizadas cada año en una clínica y pide calcular medidas de asociación y proyectar valores futuros. El tercer problema evalúa la asociación entre grado de exposición a un producto y síntomas respiratorios usando una prueba de chi cuadrado. El
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Maestría en Gerencia de Servicios de Salud

Maestría en Medicina
Curso: Estadística Aplicada
Módulo III: Medidas asociación entre variables

TAREA Nº 3

1. Establezca la hipótesis nula y alterna en cada caso:


a. Las millas por galón (mpg) promedio de un nuevo modelo de
automóvil es 32.
b. Más del 65% de los empleados de un colegio aportan fondos a
AFP.
c. En promedio, los empleados de cierta compañía viven a no más de
15 millas de la misma.
d. Al menos un 60% de la población adulta de una comunidad votará
en las próximas elecciones municipales.

2. El Gerente de una Clínica dispone de la siguiente información:

Año 2015 2016 2017 2018 2019 2020


Cirugías 120 143 150 170 168 173
a) Construir diagrama de dispersión y la ecuación de estimación.
Diagrama de dispersión

Re l aci ó n DE C I RU G I A P O R A Ñ O
Linear ()
180
f(x) = 10.29 x − 20597.43
170 R² = 0.88
160
150
Talla

140
130
120
110
100
2014 2015 2016 2017 2018 2019 2020 2021
peso

Ecuación de estimación
y = 10.286x - 20597
R² = 0.8791

b) Calcule el coeficiente de correlación e interprete el resultado


X Y

X al
N Informacion Año N° Cirugías Y al cuadrado x*y
cuadrado

1 Información N°01 2015 120 4060225 14400 241800

2 Informacion N°02 2016 143 4064256 20449 288288

3 Informacion N°03 2017 150 4068289 22500 302550

4 Informacion N°04 2018 170 4072324 28900 343060

5 Informacion N°05 2019 168 4076361 28224 339192

6 Informacion N°06 2020 173 4080400 29929 349460

Sumatoria 12105 924 24421855 144402.00 1864350


Formula del coeficiente de correlación

r 0.937614462

r 0.938

Según el resultado obtenido del coeficiente, podemos mencionar que el


tipo de correlación es positiva muy fuerte.
De acuerdo a la tabla mostrada, el coeficiente de correlación de
Pearson es r = 0,938. Entonces el grado de correlación entre los años y
numero de cirugías en la clínica, según el cuadro de Sampieri es
correlación positiva muy fuerte, de acuerdo a los índices de correlación.
Conclusión: Se concluye que existe una relación muy fuerte entre los
años y numero de cirugías correspondiente en la clínica
c) Calcular coeficiente de determinación e interpretar resultado
El calculo de coeficiente de determinacion, por formula es igual a:
R² = r2
R² = 0.8791
Podemos interpretar que el porcentaje de variabilidad de los valores de
cirugía o la bondad del ajuste es del 87.91%

d) Proyecte las cirugías al corazón para el año 2023


De acuerdo a la ecuacion de estimation:
y = 10.286x – 20597
Reemplazamos el valor de x=2023, obteniendo un valor de y=211.578
Se puede proyectar que para el año 2023 tendran como minimo 211
cirugias.

3. Quinientos empleados de una empresa que fabrica cierto producto, sospechoso de


estar asociado con alteraciones respiratorias, se clasificaron en forma cruzada con
base de grado de exposición al producto y si tenían o no los síntomas de tales
alteraciones respiratorias. Los resultados se muestran en la siguiente tabla:

Nivel de Exposición
Síntomas presentes Alto Limitado Sin exposición conocida Total
Si 185 33 17 235
No 120 73 72 265
Total 305 106 89 500

¿Proporcionan estos datos la evidencia suficiente para indicar que, en un nivel de


significación de 0,05, existe una relación entre el grado de exposición y la
presencia de los síntomas de las alteraciones respiratorias?

Solución:
1. Verificamos que son variables cualitativas
2. Planteamiento de hipótesis
H0: Los síntomas de las alteraciones respiratorias es independiente al grado de
exposición de cierto producto
H1: Los síntomas de las alteraciones respiratorias está asociada al grado de
exposición de cierto producto
3. Determinación del nivel de significación a = 0.05
4. Cálculo de frecuencias esperadas y χ2

Nivel de Exposición
Síntomas presentes Alto Limitado Sin exposición conocida Total
Si 185 33 17 235
No 120 73 72 265
Total 305 106 89 500

E11 =
235 x 305
=143.35
500
E12 =
235 x 106
=49.82
500
E13 =
235 x 89
=41.83
500
E21 =
265 x 305
=161.65
500
E22 =
265 x 106
=56.18
500
E23 =
265 x 89
=47.17
500

2 =

(185−143.35)2 (33−49.82)2 (17−41.83)2 (120−161.65)2 (73−56.18)2 ( 72−47.17)2


+ + + + +
143.35 49.82 41.83 161.65 56.18 47.17

2 = 61.356445
Grado de libertad= (N°filas-1)(N°Columnas-1)=(2-1)(3-1)=2
Teniendo en cuenta g.l = 2 y con nivel de significación a=0.05
Siendo n-2=g.l = 2
2 calculado = 61.356445
2 teorico = 5.9915

5. Decisión y conclusión

Dado que el chi cuadrado calculado es mayor que el chi cuadrado teórico, por tal
motivo se rechaza la hipótesis nula.
Conclusión: las muestras no provienen de poblaciones homogéneas. Es decir, los
síntomas de las alteraciones respiratorias está asociada al grado de exposición de
cierto producto
4. En un estudio acerca de la contaminación atmosférica a realizado en dos
comunidades, se seleccionó una muestra aleatoria de 200 familias de cada una de
dichas comunidades. Se le preguntó a uno de los miembros de cada familia si
algún miembro de la misma se sentía afectado por la contaminación atmosférica.
Las respuestas son las siguientes:

¿Algún miembro de la familia ha sido afectado por la


contaminación?
Comunidad Si No Total
I 43 157 200
II 81 119 200
Total 124 276 400

¿Pueden concluir los investigadores que las dos comunidades difieren con
respecto a la variable de interés? Sea  = 0.05
Solución:
1. Verificamos que son variables cualitativas
2. Planteamiento de hipótesis
H0: Las muestras de afectación por la contaminación atmosférica provienen del
tipo de comunidades
H1: Las muestras de afectación por la contaminación atmosférica no provienen del
tipo de comunidades
3. Determinación del nivel de significación a = 0.05
4. Cálculo de frecuencias esperadas y χ2

¿Algún miembro de la familia ha sido afectado por la


contaminación?
Comunidad Si No Total
I 43 157 200
II 81 119 200
Total 124 276 400

E11 =
200 x 124
=62.00
400
E12 =
200 x 276
=138.00
400
E21 = 200 x 124
=62.00
400
E22 =
200 x 276
=138.00
400

(43−62)2 (157−138)2 (81−62)2 (119−138)2


2 = + + +
62 138 62 138

2 = 16.88
Grado de libertad= (N°filas-1)(N°Columnas-1)=(2-1)(2-1)=1

Teniendo en cuenta g.l = 1 y con nivel de significación a=0.05


Siendo n-2=g.l = 1
2 calculado = 16.88
2 teorico = 3.8415

5. Decisión y conclusión

Dado que el chi cuadrado calculado es mayor que el chi cuadrado teórico, por tal
motivo se rechaza la hipótesis nula.
Conclusión: las muestras no provienen de poblaciones homogéneas. Es decir, que las
muestras de afectación por la contaminación atmosférica no provienen del tipo de
comunidades.
5. Evaluar si niveles altos de colesterol sérico (>250) se considera factor de riesgo de
un infarto del miocardio. Por consiguiente, se realiza un estudio comparativo de
cohortes y se obtiene los siguientes resultados:

Niveles de colesterol Desarrolla IM No desarrolló IM Total


Sérico (mg%)
_________________________________________________________
>250 10 125 135
250 21 449 470

Se pide calcular e interpretar el riesgo relativo


Solución:
1. Verificamos que son variables cualitativas
2. Planteamiento de hipótesis
H0: El factor de riesgo de un infarto del miocardio es independiente a los niveles
de colesterol
H1: El factor de riesgo de un infarto del miocardio esta asociada a los niveles de
colesterol
3. Determinación del nivel de significación a = 0.05
4. Cálculo de frecuencias esperadas y χ2

Niveles de colesterol Desarrolla IM No desarrolló IM Total


Sérico (mg%)
_________________________________________________________
>250 10 125 135
250 21 449 470
total 31 574 605
_________________________________________________________

E11 =
31 x 135
=6.92
605
574 x 135
E12 =
=1 28.08
605
E21 = 31 x 470
=24.08
605
E22 =
574 x 470
=445.92
605
(10−6 .92)2 (125−128.08)2 (2 1−24.08)2 ( 44 9−445.92)2
2 = + + +
6 .92 1 28.08 24.08 445.92

2 = 1.86
Grado de libertad= (N°filas-1)(N°Columnas-1)=(2-1)(2-1)=1

Teniendo en cuenta g.l = 1 y con nivel de significación a=0.05


Siendo n-2=g.l = 1
2 calculado = 1.86
2 teorico = 3.8415

5. Decisión y conclusión

Dado que el chi cuadrado calculado es menor que el chi cuadrado teórico, por tal
motivo se rechaza la hipótesis alternativa.
Conclusión: las muestras provienen de poblaciones homogéneas. Es decir, que el
factor de riesgo de un infarto del miocardio está asociado a los niveles de colesterol

También podría gustarte