EJERCICIOS DE BIOESTADÍSTICA
UNIDAD III
Análisis de 2 variables en una muestra
1. Mencione las tres posibles combinaciones de análisis de datos bi-variados.
Cualitativa - Cualitativa: Ambas variables son cualitativas. Se pueden usar
tablas de contingencia, gráficos de barras apiladas o diagramas de mosaico
para visualizar la relación.
Cuantitativa - Cuantitativa: Ambas variables son cuantitativas. Se pueden
usar gráficos de dispersión, coeficiente de correlación o una línea de
regresión para analizar la relación.
Cualitativa - Cuantitativa: Una variable es cualitativa y la otra es
cuantitativa. Se pueden usar gráficos de caja, pruebas t para analizar la
relación.
2. Mencionar cuáles son los métodos de análisis para los siguientes casos:
a. Dos variables cuantitativas conjuntas.
Para este tipo de análisis, se pueden utilizar gráficos de dispersión para
visualizar la relación entre las dos variables. También se puede calcular el
coeficiente de correlación para cuantificar la fuerza y la dirección de la
relación. Además, se puede ajustar una línea de regresión para modelar la
relación.
b. Una variable cualitativa y la otra cuantitativa
En este caso, se pueden utilizar gráficos de caja para visualizar la
distribución de la variable cuantitativa dentro de cada categoría de la
variable cualitativa. También se pueden realizar pruebas t para comparar
las medias de dos grupos, o análisis de varianza para comparar las medias
de tres o más grupos.
c. Dos variables cualitativas
Para analizar la relación entre dos variables cualitativas, se pueden utilizar
tablas de contingencia para contar la frecuencia de cada combinación de
categorías. También se pueden utilizar gráficos de barras apiladas o
diagramas de mosaico para visualizar estas frecuencias.
3. Utilice el método de covarianza para establecer la relación de las variables peso y
altura con los siguientes datos:
INDIVIDUO 1 2 3 4 5 6 7 8 9 10 11 12
X 80 45 63 94 24 75 56 52 61 34 21 78
Y 174 152 160 183 102 183 148 152 166 140 98 160
Media de X (peso):
(80 + 45 + 63 + 94 + 24 + 75 + 56 + 52 + 61 + 34 + 21 + 78) / 12 = 58.33
Media de Y (altura):
(174 + 152 + 160 + 183 + 102 + 183 + 148 + 152 + 166 + 140 + 98 + 160) / 12 = 153.33
INDIVIDU (X - X̄)(Y -
X Y X - X̄ Y - Ȳ
O Ȳ)
1 80 174 21.67 20.67 447.37
2 45 152 -13.33 -1.33 17.69
3 63 160 4.67 6.67 31.37
4 94 183 35.67 29.67 1060.17
5 24 102 -34.33 -51.33 1769.21
6 75 183 16.67 29.67 497.37
7 56 148 -2.33 -5.33 12.37
8 52 152 -6.33 -1.33 8.29
9 61 166 2.67 12.67 33.71
10 34 140 -24.33 -13.33 320.29
11 21 98 -37.33 -55.33 2071.79
12 78 160 19.67 6.67 130.71
Covarianza = (447.37 + 17.69 + 31.37 + 1060.17 + 1769.21 + 497.37 + 12.37 + 8.29 + 33.71
+ 320.29 + 2071.79 + 130.71) / 12
Covarianza = 6843.82 / 12
Covarianza ≈ 570.32
4. Indique el tipo de correlación de las variables en los siguientes gráficos
Correlación positiva p > 0
Correlación nula p = 0
Correlación negativa p < 0
Correlación ideal positiva p = 1
Correlación ideal negativa p < -1
5. ¿En qué consiste el método de Pearson y cuando se utiliza?
El método de Pearson, también conocido como el coeficiente de correlación de
Pearson, es una medida estadística que evalúa la relación lineal entre dos variables
cuantitativas. Este coeficiente puede tomar un rango de valores de +1 a -1.
Si el coeficiente es igual a +1, significa que hay una correlación positiva
perfecta entre las dos variables. Es decir, a medida que aumenta el valor de
una variable, también lo hace el valor de la otra.
Si el coeficiente es igual a -1, significa que hay una correlación negativa
perfecta. Es decir, a medida que aumenta el valor de una variable, el valor
de la otra disminuye2.
Si el coeficiente es igual a 0, significa que no hay relación lineal entre las
variables. Sin embargo, puede haber algún otro tipo de relación.
El método de Pearson se utiliza cuando se desea conocer la intensidad y la
dirección de la relación entre dos variables cuantitativas. Por ejemplo, podría
usarse para analizar la relación entre el peso y la altura de un grupo de individuos.
6. ¿Cuándo se utiliza la correlación lineal de Spearman?
La correlación de Spearman se utiliza en las siguientes situaciones:
Cuando las variables son ordinales: Las variables ordinales son aquellas
que pueden ser ordenadas o clasificadas, pero la distancia entre los valores
no es necesariamente uniforme.
Cuando no se cumplen las suposiciones para la correlación de Pearson: La
correlación de Pearson requiere que los datos sean de nivel de intervalo o
ratio, tengan una relación lineal y estén bivariante distribuidos
Cuando se desea entender la relación de rangos: La correlación de
Spearman utiliza los rangos de los datos en lugar de los datos en sí, lo que
la hace útil cuando cada valor en sí no es tan importante como su situación
respecto a los restantes.
7. En que consiste el Método de regresión lineal y cuando se utiliza
El método de regresión lineal es una técnica estadística utilizada para estudiar la
relación entre variables cuantitativas. Consiste en ajustar una línea recta a un
conjunto de datos para describir cómo una variable de respuesta (dependiente)
cambia en función de una o más variables explicativas (independientes).
El método de regresión lineal se utiliza cuando se desea:
Predecir valores: Basándose en la relación entre las variables, se pueden hacer
predicciones sobre el valor de Y para ciertos valores de X.
Interpretar la relación entre variables: Se pueden interpretar los coeficientes
β para entender cómo afecta cada variable independiente a la variable
dependiente. Por ejemplo, 1β1 indica el cambio esperado en Y por cada unidad
de cambio en X.
8. Se tiene el siguiente planteamiento:
Cinco niños de 2, 3, 5, 7 y 8 años pesan respectivamente 14, 20, 32, 42 y 44 kilos.
a. Hallar la ecuación de la recta de regresión lineal sobre el peso y responder
¿Cuál sería el peso aproximado de un niño de seis años?
Edad media = (2 + 3 + 5 + 7 + 8) / 5 = 5 años
Peso medio = (14 + 20 + 32 + 42 + 44) / 5 = 30.4 kg
Edad Desviación en edad (x Desviación en peso (y
(años) Peso (kg) - x̄) - ȳ) (x - x̄)(y - ȳ)
2 14 -3 -16.4 49.24
3 20 -2 -10.4 20.8
5 32 0 1.6 0
7 42 2 11.6 23.2
8 44 3 13.6 39.6
Covarianza (x, y) = Σ[(x - x̄)(y - ȳ)] / n = (49.24 + 20.8 + 0 + 23.2 + 39.6) / 5 = 26.72 kg·años
Varianza (x) = Σ[(x - x̄)²] / n = (9 + 4 + 0 + 9 + 1) / 5 = 4.8 años²
β₁ = Covarianza (x, y) / Varianza (x) = 26.72 kg·años / 4.8 años² = 5.55 kg/año
β₀ = ȳ - β₁x̄ = 30.4 kg - (5.55 kg/año) * 5 años = 12.2 kg
Peso (y) = 5.55 kg/año * Edad (x) + 12.2 kg
Edad (x) = 6 años Peso (y) = 5.55 kg/año * 6 años + 12.2 kg = 39.3 kg
Respuesta: La ecuación de la recta de regresión lineal para el peso es:
Peso (kg) = 5.55 kg/año * Edad (años) + 12.2 kg
El peso aproximado de un niño de 6 años sería de 39.3 kg.
9. Se analiza una muestra de n=252 varones de mas de 40 años que son clasificados
en función de su ICC como:
a. Normales si su ICC ≤ 0.94
b. Con su cuerpo de manzana si ICC > 0.94.
Por otra parte, son también valorados medicamente distinguiendo entre sanos, diabéticos
y enfermos cardiovasculares.
Ambas clasificaciones se recogen de manera simultánea en la siguiente tabla de
contingencia:
Estado de salud
Tipo de 2x3 Sano Cardio Diabetes Total
ICC Normal 114 22 20 156
Manzana 52 28 16 96
Total 166 50 36 252
a. Indica la proporción de individuos de la muestra que estén sanos.
Proporción: (166/252)*100 = 65.8%
b. Indica la proporción de individuos de la muestra que tienen enfermedad
cardiaca
Proporción:(50/252)*100= 19.8%
c. Indica la proporción de individuos de la muestra que tienen diabetes
Proporción:(36/252)*100=14.2%
d. Indica la proporción de individuos de la muestra que tienen cuerpo normal
Proporción: (156/252)*100=61.9%
e. Indica la proporción de individuos de la muestra tienen cuerpo de manzana
Proporción: (96/252)*100= 38.0%