0% encontró este documento útil (0 votos)
136 vistas7 páginas

Correlación entre Fumar y Cáncer Pulmonar

Este documento presenta 4 estudios de toxicología que analizan la correlación entre diferentes variables. El primer estudio encuentra una correlación positiva entre el número de cigarrillos fumados diariamente y la probabilidad de cáncer pulmonar. El segundo estudio muestra una alta correlación entre la concentración de cromo en la entrada y salida de una planta de tratamiento. El tercer estudio analiza la correlación entre la concentración de cadmio atmosférico, la altura de muestreo y la distancia a la fuente. Finalmente, el cuarto est

Cargado por

bruce vega
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
136 vistas7 páginas

Correlación entre Fumar y Cáncer Pulmonar

Este documento presenta 4 estudios de toxicología que analizan la correlación entre diferentes variables. El primer estudio encuentra una correlación positiva entre el número de cigarrillos fumados diariamente y la probabilidad de cáncer pulmonar. El segundo estudio muestra una alta correlación entre la concentración de cromo en la entrada y salida de una planta de tratamiento. El tercer estudio analiza la correlación entre la concentración de cadmio atmosférico, la altura de muestreo y la distancia a la fuente. Finalmente, el cuarto est

Cargado por

bruce vega
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Ejercicios 11

1. En investigaciones de toxicología existen estudios que han demostrado que la


probabilidad de qué, un fumador de 40 años de edad, quien ha sido fumador los
últimos 10 años contraiga el cáncer pulmonar en los próximos 20 años es alta
(asumiendo que continúe fumando al mismo ritmo). Esta relación va en función del
número promedio de cigarrillos que fuma. Asumir un modelo de regresión lineal. La
tabla de abajo presenta los datos de esta investigación de toxicología.
Probabilidad
N° cigarrillos
de cáncer
fumados por día
pulmonar
5 0,1
10 0,113
20 0,225
30 0,3
40 0,45
50 0,54
60 0,7
80 0,86

(a) Identificar la variable dependiente y la variable independiente.


(b) Describir la ecuación de regresión que mejor encaje en los datos.
(c)Analizar e interpretar los componentes de la tabla de ANOVA como Fcalc.,
Fcrítica y el valor de p (Realizar la prueba de hipótesis).

a. Identificar el parámetro de interés.


Cantidad de cigarrillos de consumo por persona y la probabilidad de cancer
pulmonar
b. Establecer la Hipótesis Nula H0
H0: ρ=0
No existe correlación entre el índice de Cantidad de cigarrillos de consumo por
persona y la probabilidad de cáncer pulmonar

Especificar una Hipótesis alternativa adecuada H1


H1: ρ≠0
Existe correlación entre el índice de Cantidad de cigarrillos de consumo por
persona y la probabilidad de cáncer pulmonar
Seleccionar un nivel de significancia α
α= 0.05
e. Prueba estadística a utilizar
Prueba correlacional lineal múltiple.
e. Calculo usando SPSS

(a) Solución:
Variable dependiente: probabilidad de cáncer pulmonar

Variable independiente: número de cigarrillos

(b) Solución:

Utilizando las fórmulas de las ecuaciones normales a los datos


obtendremos los coeficientes de regresión o utilizando Regresión de
Análisis de datos, en SPSS podemos calcular los coeficientes de
regresión:

Por lo tanto, podemos construir la ecuación de regresión que buscamos:

Y =0.017+0.011 X 1

(c) Solución:

 tenemos que p=0,000<< 0,05, por tanto, rechazamos la hipótesis nula e


indicamos que si existe correlación entre el índice de Cantidad de
cigarrillos de consumo por persona y la probabilidad de cáncer pulmonar
2. Los metales pesados como el Hg, Cr, Pb, etc., pueden interferir con el tratamiento
biológico en las plantas municipales de aguas residuales domésticas. En este
estudio se hicieron mediciones mensuales en una planta modelo de tratamiento de
las concentraciones de cromo, Cr, en mg/L, tanto en el efluente como en la
entrada. Los resultados de las concentraciones de Cr se dan en la tabla de abajo.

Entrada (X) (ug/L) 250 290 270 100 300 410 110 130 1100
Efluente (Y) (ug/L) 19 10 17 11 70 60 18 30 180
Hacer los siguientes cálculos:
(a) Hacer un diagrama de dispersión.
(b) Identificar la prueba a utilizar.
(c) Realizar la prueba de hipótesis para identificar si existe correlación en
interpretar el valor de R.

a. Identificar el parámetro de interés.


Estudio de la interferencia de los metales pesados en las plantas de
tratamiento de aguas residuales domesticas
b. Establecer la Hipótesis Nula H0
H0: ρ=0
No existe correlación entre el Estudio de la interferencia de los metales
pesados en las plantas de tratamiento de aguas residuales domesticas

Especificar una Hipótesis alternativa adecuada H1


H1: ρ≠0
Existe correlación entre el Estudio de la interferencia de los metales pesados
en las plantas de tratamiento de aguas residuales domesticas
Seleccionar un nivel de significancia α
α= 0.05
f. Prueba estadística a utilizar
Prueba correlacional lineal múltiple.
f. Calculo usando SPSS

(a) Solución:
(b) Solución:

Prueba estadística a utilizar


Prueba correlacional lineal múltiple.

(c) Solución:

tenemos que p=0,000<< 0,05, por tanto, rechazamos la hipótesis nula e


indicamos que si existe correlación entre el índice de Estudio de la
interferencia de los metales pesados en las plantas de tratamiento de
aguas residuales domesticas

El valor de R= 0.942, Como podemos ver R es 0.942 que indica que existe
correlación muy alta.
3. Se hace un estudio sobre la concentración de cadmio atmosférico, en ppm, yi y su
relación con Xi = la altura de los muestreadores y X2 = distancia de la fuente
emisora.
y (Concentración de Cd) (ppm) 193 230 172 91 113 125
X1 (Altura del muestreador) (m) 1,6 15,5 22 43 33 40
X2 (Distancia) (m) 851 816 1058 1201 1357 1115

Hacer los siguientes cálculos:


(a) Ajustar el modelo de regresión que pueda ajustar a los datos del problema de la
concentración de Cd.
(b) Validar el modelo usando enfoques de diagnóstico de estadística de inferencia.
(c) Usar el modelo de regresión lineal múltiple para predecir la concentración de
cadmio, cuando la altura del muestreador es de X1 = 25 metros y la distancia de la
fuente emisora, es X2 = 851 metros.

c. Identificar el parámetro de interés.


Estudio sobre la concentración de cadmio atmosférico con relación a la altura
de los muestreadores y distancia de la fuente emisora
Establecer la Hipótesis Nula H0
H0: ρ=0
No existe correlación entre el Estudio sobre la concentración de cadmio
atmosférico con relación a la altura de los muestreadores y distancia de la
fuente emisora
Especificar una Hipótesis alternativa adecuada H1
H1: ρ≠0
Existe correlación entre el Estudio sobre la concentración de cadmio
atmosférico con relación a la altura de los muestreadores y distancia de la
fuente emisora
Seleccionar un nivel de significancia α
α= 0.05
g. Prueba estadística a utilizar
Prueba correlacional lineal múltiple.
g. Calculo usando SPSS
(a) Solución:

(b) Solución:

4. Se discute el diseño eficiente de ciertos incineradores de desperdicios municipales,


los cuales requieren de información acerca del contenido energético de los
desperdicios. Acordemente, a algunos estudios nos proporcionaron los siguientes
datos acerca de Y = contenido energético (Kcal/Kg.), en función de regresores %
de plásticos en peso, % de papel en peso, % de basura en peso y % de humedad
de peso.
Contenido
% Plástico % Papel % Basura %Humedad
Observación energético
(X1) (X2) (X3) (X4)
(Kcal/Kg) (Y)
1 18,69 15,65 45,01 58,21 947
2 19,43 23,51 39,69 43,61 1407
3 19,24 24,23 43,16 46,63 1452
4 22,64 22,2 35,76 45,85 1553
5 16,54 23,56 41,2 55,14 989
6 21,44 23,65 35,56 42,24 1162
7 19,53 24,45 40,18 47,2 1466
8 23,97 19,39 44,11 43,82 1656
9 21,45 23,84 35,41 51,01 1254
10 20,34 26,5 34,21 49,06 1336
11 17,03 23,46 32,45 53,23 1097
12 21,03 26,99 38,19 51,78 1266
13 20,49 19,87 41,35 46,69 1401
14 20,45 23,01 43,59 53,57 1223
15 18,81 22,62 42,2 52,98 1216
16 18,28 21,87 41,5 47,44 1334
17 21,41 20,47 41,2 54,68 1155
18 25,11 22,59 37,02 48,74 1453
19 21,04 26,27 38,66 53,22 1278
20 17,99 28,22 44,18 53,17 1153
21 18,73 29,39 34,77 51,06 1225
22 18,49 26,58 37,55 50,66 1237
23 22,08 24,88 37,07 50,72 1327
24 14,28 26,27 35,8 48,24 1229
25 17,74 23,61 37,36 49,92 1205
26 20,54 26,58 35,4 53,58 1221
27 18,25 13,77 51,32 51,38 1138
28 19,01 25,62 39,54 50,13 1295
29 21,25 20,63 40,72 48,67 1392
30 21,62 22,71 36,22 48,19 1372
Obtener el modelo de regresión y validarlo

Como podemos ver R es 0,851 que indica que existe correlación muy alta.
Además, tenemos que p=0,000<< 0,05, por tanto rechazamos la hipótesis nula e
indicamos que si existe correlación.

También podría gustarte