0% encontró este documento útil (0 votos)
33 vistas14 páginas

Sesión 7

El documento aborda las medidas de asociación y correlación en estadística, explicando conceptos como varianza, desviación estándar, covarianza y coeficiente de correlación de Pearson. Se detallan fórmulas para calcular estas medidas tanto para poblaciones como para muestras, y se enfatiza la diferencia entre asociación y correlación. Además, se incluyen ejemplos prácticos para ilustrar el cálculo de varianza, desviación estándar y correlación entre variables.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
33 vistas14 páginas

Sesión 7

El documento aborda las medidas de asociación y correlación en estadística, explicando conceptos como varianza, desviación estándar, covarianza y coeficiente de correlación de Pearson. Se detallan fórmulas para calcular estas medidas tanto para poblaciones como para muestras, y se enfatiza la diferencia entre asociación y correlación. Además, se incluyen ejemplos prácticos para ilustrar el cálculo de varianza, desviación estándar y correlación entre variables.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Villanueva Quispe Elvia Yomira

Educación Inicial

VIII D

MEDIDAS DE ASOCIACIÓN Y CORRELACIÓN ENTRE


VARIABLES

INTRODUCCIÓN

En estadística, entender la relación entre dos o más variables es fundamental


para el análisis de datos. Para esto, utilizamos las medidas de asociación y
correlación.

DEFINICIONES GENERALES

Medidas de Asociación: Indican si existe una relación o dependencia entre


dos variables. No necesariamente cuantifican la intensidad de la relación, pero
permiten saber si las variables están relacionadas.

Medidas de Correlación: Son una forma específica de asociación que indica


la intensidad y la dirección de la relación lineal entre dos variables
cuantitativas.

Diferencias:

La asociación puede referirse a relaciones no necesariamente lineales o


incluso cualitativas.

La correlación se centra en relaciones lineales entre variables numéricas.

1. Varianza

Definición: La varianza mide el grado de dispersión de un conjunto de datos alrededor


de su media. En otras palabras, nos dice qué tan lejos están los valores individuales, en
promedio, del valor central. Una varianza alta indica una mayor dispersión, mientras
que una varianza baja indica que los datos están más agrupados cerca de la media.

A. Fórmula para datos no agrupados:


Para una población:

Donde:

• σ2 es la varianza de la población.
• xi representa cada valor en la población.
• x es la media de la población.
• N es el número total de elementos en la población.
• ∑ denota la suma.

Para una muestra:

Donde:

• s2 es la varianza de la muestra.
• xi representa cada valor en la muestra.
• x es la media de la muestra.
• n es el número total de elementos en la muestra.
• El denominador n−1 se utiliza para obtener una estimación insesgada de la
varianza de la población.

B. Fórmula para datos agrupados:

fórmula para una población:

Donde:

• σ2 es la varianza de la población.
• fi es la frecuencia absoluta o número de datos de cada intervalo.
• xi representa cada valor en la población.
• x es la media de la población.
• N es el número total de elementos en la población.
• ∑ denota la suma

Para una muestra:

Donde:

• s2 es la varianza de la muestra.
• fi es la frecuencia absoluta o número de datos de cada intervalo.
• xi representa cada valor en la muestra.
• x es la media de la muestra.
• n es el número total de elementos en la muestra.
• El denominador n−1 se utiliza para obtener una estimación insesgada de la
varianza de la población.

NOTA: vamos a necesitar calcular la media o promedio:

2. Desviación Estándar

Definición: La desviación estándar es la medida de dispersión más común. Indica


cuánto se desvían los valores individuales de la media del conjunto de datos. Es la raíz
cuadrada de la varianza y se expresa en las mismas unidades que los datos originales, lo
que facilita su interpretación. Una desviación estándar pequeña sugiere que los datos
están agrupados cerca de la media, mientras que una desviación estándar grande indica
una mayor dispersión.

Fórmula:

Para una población:

Para una muestra:

3. Covarianza

Definición: La covarianza mide cómo dos variables cambian juntas. Indica la dirección
de la relación lineal entre las variables.

• Una covarianza positiva indica que cuando una variable aumenta, la otra tiende a
aumentar también.
• Una covarianza negativa indica que cuando una variable aumenta, la otra tiende
a disminuir.
• Una covarianza cercana a cero indica que no hay una relación lineal clara entre
las variables.

Sin embargo, la magnitud de la covarianza no está estandarizada, por lo que es difícil


interpretar la fuerza de la relación solo con su valor. Para eso, se utiliza el coeficiente de
correlación.
Fórmula:

Para una población:

Para una muestra: sxy = Cov (X, Y) = ∑ (xi − xˉ) (yi − yˉ)
n–1

La covarianza entre los datos de x con respecto a los valores de y. Un valor positivo
indica que tienden a moverse en la misma dirección.

4. Coeficiente de Correlación (de Pearson)

Definición: El coeficiente de correlación de Pearson mide la fuerza y la dirección de la


relación lineal entre dos variables cuantitativas. El valor del coeficiente de correlación,
denotado por r para una muestra y ρ para una población, siempre está entre -1 y +1.

• Un valor cercano a +1 indica una correlación positiva fuerte (a medida que una
variable aumenta, la otra también tiende 69363a aumentar).
• Un valor cercano a -1 indica una correlación negativa fuerte (a medida que una
variable aumenta, la otra tiende a disminuir).
• Un valor cercano a 0 indica una correlación lineal débil o nula.

Fórmula:

Para una muestra: r = ∑ (xi − xˉ) (yi − yˉ) = ∑ (xi − xˉ) (yi − yˉ)

(n−1) Sx Sy ∑ (xi − xˉ)2 ∑ (yi−yˉ)2

Donde:

• r es el coeficiente de correlación de la muestra.


• xi y yi son los valores correspondientes de las dos variables en la muestra.
• xˉ y yˉ son las medias de las variables x e y respectivamente.
• sx y sy son las desviaciones estándar de las variables x e y respectivamente.
• n es el número de pares de datos en la muestra.

El coeficiente de correlación es aproximadamente menos de 1, lo que indica una


correlación positiva muy fuerte entre el número de datos de x respecto a los datos de y.
5. Correlación

Definición: En un sentido general, la correlación se refiere a cualquier relación


estadística, ya sea causal o no, entre dos o más variables aleatorias o datos secuenciales.
Sin embargo, en estadística, el término "correlación" a menudo se utiliza de manera
intercambiable con el coeficiente de correlación de Pearson, que ya definimos en el
punto 3.

Es importante destacar que correlación no implica causalidad. El hecho de que dos


variables estén correlacionadas no significa que una cause la otra. Podría haber una
tercera variable subyacente que afecte a ambas, o la correlación podría ser simplemente
una coincidencia.

Fórmula:

La correlación se interpreta a través del valor de rrr, que va de -1 a +1.

• r>0r > 0r>0: correlación positiva


• r<0r < 0r<0: correlación negativa
• r=0r = 0r=0: no hay correlación

En resumen: La correlación es la medida de la relación lineal entre dos variables, y su


fuerza y dirección se cuantifican mediante el coeficiente de correlación.
PRACTICA SESION 7
1. Encontrar la varianza, desviación estándar o típica y el coeficiente de
variación en la siguiente tabla.
Número de estudiantes por grado de educación primaria
Grados xi xi – x (xi – x)2
1 15 -1.33 1.76
2 16 -0.33 0.10
3 14 -2.33 5.42
4 15 -1.33 1.76
5 20 3.67 13.46
6 18 1.67 2.78
Total 98 25.28

Desarrollo
Hallamos la media o promedio:

Media: X = 16.33

V2 = 25.28/ 6

a. V2 = 4.21 estudiantes.

b. Desviación estándar
= 4.21

= 2.05 estudiantes.

c. Coeficiente de variación
Cv = 2.05 / 16.33 x 100
Cv = 12.55 %

2. Encontrar la varianza, desviación estándar o típica y el coeficiente de


variación en la siguiente tabla.
Edades de los estudiantes de educación primaria
Edades xi fi Xi . fi (xi – x) (xi – x)2 (xi – x)2 . fi
5- 7 6 6 36 -3.65 13.32 79.92
7 -9 8 5 40 -1.65 2.72 13.6
9 - 11 10 4 40 0.35 0.12 0.48
11- 13 12 3 36 2.35 5.52 16.56
13 - 15 14 5 70 4.35 18.92 94.6
Total 23 222 205.16
media 9.65

Media = 222/23
M= 9.65

a. Varianza.

V2 = 205.16/ 23
V2 = 8.92 años.

b. Desviación estándar
Dv = 8.92
Dv =2.98 años

c. Coeficiente de variación
Cv=2.98/9.65.100
Cv= 30.880 %
3. Encontrar la covarianza y el coeficiente de correlación en la
siguiente tabla
Horas de estudio en relacion a calificaciones
i Horas Calific. (xi – x) (yi – y) (xi – x) (yi – y) (xi – x)2 (yi – y)2
x y
1 2 10 -4 -4.4 17.6 16 19.36
2 4 12 -2 -2.4 4.8 4 5.76
3 6 14 0 -0.4 0 0 0.16
4 8 16 2 1.6 3.2 4 2.56
5 10 20 4 5.6 22.4 16 31.36
Total 30 72 48 40 59.2
Media 6 14.4

correlación

a. Covarianza
Cov (x,y)= 48/5
Cov (x,y) = 9.6

b. Coeficiente de correlación
coeficiente de correlación

r= 48/ 40 . 59.2

r= 48/6.32. 7.69

r= 48/ 48.60

r=0.98

la correlación entre horas de estudio y calificaciones es directa y lineal


4. Encontrar la varianza, desviación estándar o típica y el coeficiente de
variación en la siguiente tabla.
Número de estudiantes por sección
Grados x xi – x (xi – x)2
a 20 -0.83 0.68
b 21 0.17 0.02
c 19 -1.83 3.34
d 22 1.17 1.36
e 23 2.17 4.70
f 20 -0.83 0.68
Total 125 10.78

Desarrollo
Hallamos la media o promedio:

Media: X = 20.83

V2 = 10.78/ 6

a. V2 = 1.79 estudiantes.

b. Desviación estándar

= 1.79
= 1.33 estudiantes.

c. Coeficiente de variación
Cv = 1.33 / 20.82 x 100
Cv = 6.388 %

5. Encontrar la varianza, desviación estándar o típica y el coeficiente de


variación en la siguiente tabla.
Número de estudiantes por sección
Grados x xi – x (xi – x)2
a 30 1.5 2.25
b 11 -17.5 1251,25
c 30 1.5 2.25
d 32 3.5 12.25
e 33 4.5 20.25
f 29 0.5 0.25
g 31 2.5 6.25
h 28 -0.5 0.25
i 27 -1.5 2.25
j 34 5.5 30.25
Total 285 1327.5

Desarrollo
Hallamos la media o promedio:

Media: X = 28.5

V2 = 1327,5/ 10

a. V2 = 132.75 estudiantes.

b. Desviación estándar

= 132.75

= 11.52 estudiantes.
c. Coeficiente de variación
Cv = 11.52 / 28.5 x 100
Cv = 40.42 %

6. Encontrar la varianza, desviación estándar o típica y el coeficiente de


variación en la siguiente tabla.
Edades de los estudiantes de educación secundaria
Edades Xi fi Xi . fi (xi – x) (xi – x)2 (xi – x)2 . fi
15-17 16 8 128 -4.22 17.80 321.6
17-19 18 10 180 -2.22 4.92 402
19-21 20 7 140 -0.22 0.04 281.4
21-23 22 9 198 1.78 3.16 361.8
23- 25 24 11 264 3.78 14.28 442.2
Total 45 910 40.2 1812

Media = 910/45
M= 20.22

d. Varianza.

V2 = 1812/ 45
V2 = 40.26 años.

e. Desviación estándar
Dv = 40.26
Dv = 6.34 años

f. Coeficiente de variación
Cv=6.34/20.22.100
Cv= 31.35 %
7. Encontrar la varianza, desviación estándar o típica y el coeficiente de
variación en la siguiente tabla.
Edades de los docentes del colegio san miguel
Edades Xi fi Xi . fi (xi – x) (xi – x)2 (xi – x)2 . fi
20-25 22.5 2 45 -36.95 1365.3025 2730.6
25-30 27.5 8 220 -31.95 1020.80 8166.4
30-35 32.5 10 325 -26.95 726.30 7263
35-40 37.5 7 262.5 -21.95 481.80 3372.6
45-50 47.5 9 427,5 -11.95 142.80 1285.2
55-60 57.5 11 632.5 -1.95 3.80 41.8
65-70 67.5 9 607.5 8.05 64.80 583.2
70-75 72.5 6 435 13.05 170.30 1021.8
80-85 82.5 7 577.5 23.05 531.30 3719.1
85-90 87.5 12 1050 28.05 786.80 9441.6
95-100 97.5 2 185 38.05 1447.80 2895.6
Total 73 4340 40521.1

Media = 4340/73
M= 59.45

g. Varianza.

V2 = 40521.1/ 73
V2 = 555.08

h. Desviación estándar
Dv = 555.08
Dv =23.56

i. Coeficiente de variación
Cv=23.56/59.45.100
Cv= 39.62 %
8. Encontrar la covarianza y el coeficiente de correlación en la
siguiente tabla
Horas en redes sociales en relacion a notas en el área de matemática
i Horas Notas mate..
x y
1 3 18
2 5 16
3 7 14
4 9 12
5 11 10
Total

Cov(X, Y) = Σ[(xi - x̄) * (yi - ȳ)] / N

Calcular las medias:

• Media de las horas en redes sociales (x̄) = (3 + 5 + 7 + 9 + 11) / 5 = 7

• Media de las notas en matemática (ȳ) = (18 + 16 + 14 + 12 + 10) / 5 = 14

Cov(X, Y) = -40 / 5 = -8

σX = √ (40 / 5) = √8 ≈ 2.83

σY = √ (40 / 5) = √8 ≈ 2.83

r = -8 / (2.83 * 2.83) ≈ -1

Resultados:

• Covarianza: -8

• Coeficiente de correlación: ≈ -1

9. Encontrar la covarianza y el coeficiente de correlación en la


siguiente tabla
Libros leídos y notas en comunicación
i Horas Notas comu..
x y
1 4 11
2 6 12
3 8 13
4 10 14
5 12 16
6 14 17
7 16 18
8 18 20
Total

Cov(X, Y) = Σ[(xi - x̄) * (yi - ȳ)] / (n )

calculamos

x̄= (4 + 6 + 8 + 10 + 12 + 14 + 16 + 18) / 8 = 12.25

ȳ = (11 + 12 + 13 + 14 + 16 + 17 + 18 + 20) / 8 = 15.125

Desviaciones y productos:

| i | x | y | xi - x̄| yi - ȳ | (xi - x̄) 2 (yi - ȳ) 2 |

| 1 | 4 | 11 | -8.25 | -4.125 | 34.03125 |

| 2 | 6 | 12 | -6.25 | -3.125 | 19.53125 |

| 3 | 8 | 13 | -4.25 | -2.125 | 9.03125 |

| 4 | 10 | 14 | -2.25 | -1.125 | 2.53125 |

| 5 | 12 | 16 | -0.25 | 0.875 | -0.21875 |

| 6 | 14 | 17 | 1.75 | 1.875 | 3.28125 |

| 7 | 16 | 18 | 3.75 | 2.875 | 10.78125 |

| 8 | 18 | 20 | 5.75 | 4.875 | 28.03125 |

| Total | | | | | 117.5 |

Covarianza:

Cov(X, Y) = 117.5 / 7 ≈ 16.79

2. Coeficiente de Correlación (de Pearson)

σX = √(185 / 7) ≈ 5.14

σY = √(68.875 / 7) ≈ 3.14

Coeficiente de correlación:

r = 16.79 / (5.14 * 3.14) ≈ 0.99

Resultados:

Covarianza: ≈ 16.79

Coeficiente de correlación: ≈ 0.99

También podría gustarte