SEGUNDA ESPECIALIDAD
ENFERMERÍA EN
Regresión y CRECIMIENTO,DESARROLLO
correlación
DEL NIÑO EST. 1RA. INF
CURSO: BIOESTADÍSTICA
DOCENTE: MG. ANNE E. ANICETO C.
SEMESTRE
ACADÉMICO
2024 B
¿Qué vamos a estudiar?
• En este capítulo vamos a tratar diferentes formas de describir
la relación entre dos variables cuando estas son numéricas.
• Estudiar si hay relación entre la altura y el peso.
• Haremos mención a otros casos:
• Alguna de las variables es ordinal.
• Estudiar la relación entre el sobrepeso y el dolor de
espalda (ordinal)
• Hay más de dos variables relacionadas.
• ¿Conocer el peso de una persona conociendo su altura
y contorno de cintura?
• Hay dos variables cualitativas relacionadas.
• ¿Hay relación entre fumar y padecer enfermedad de
pulmón?
ESTADÍSTICA BIDIMENSIONAL
Analiza el comportamiento conjunto de dos variables
en una unidad de estudio, es decir busca la asociación o
relación que existe entre ambas, se representa como un
conjunto de pares de datos (X,Y), donde:
X: es la variable independiente (llamado factor) Y:
es la variable dependiente (llamado resultado)
Ejemplos:
• Peso y talla de un grupo de profesionales
• Gasto en publicidad y volumen de ventas en un
establecimiento
• Nivel de estudios y región deprocedencia
• Ingresos y nivel socioeconómico
• Coeficiente intelectual y rendimientoacadémico
……..ESTADÍSTICA BIDIMENSIONAL…………..
La relación o dependencia de variables se daentre:
I. Dos variables cualitativas; carrera profesional y
género; Nivel de satisfacción y nivel de estudios.
[Link] variables cuantitativas; Ingresos y gastos en
una familia, Precio de PC y la velocidad del
procesador.
III. Una variable cualitativa y una cuantitativa;
Nivel de estudios y edad de las personas; Zona
de ventas y volumen de ventas.
4
Medidas de Asociación entre dos variables
cuantitativas
Comprobar el grado de relación de variables cuantitativas a través
de:
* Gráfico de dispersión
* Covarianza
* Coeficiente de correlación de Pearson
5
Correlaciones positivas
330 130
120
280
110
230 100
90
180 80
70
130 60
50
80 r=0,1 r=0,4
40
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
110 100
100 90
90 80
80 70
70
60
60
50
50
r=0,6 40 r=0,8
40
30
30
140 150 160 170 180 190 200
140 150 160 170 180 190 200
Mg. Anne Aniceto C. 6
Correlaciones casi perfectas y positivas
100 100
90 90
80 80
70 70
60 60
50 50
40 r=0,9 40 r=0,99
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
100
90
80
70
60
50
40 r=1
30
140 150 160 170 180 190 200
Mg. Anne Aniceto C. 7
correlaciones negativas
90 80
80 70
70 60
60
50
50
40 40
30 30
20 20
10 r=-0,5
10 r=-0,7
0
140 150 160 170 180 190 200 0
140 150 160 170 180 190 200
80 80
70 70
60 60
50 50
40 40
30 30
20 20
10 r=-0,95 10 r=-0,999
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Mg. Anne Aniceto C. 8
Medidas de Asociación
c) Covarianza: mide la variabilidad conjunta de X e Y
− x )( y j − y )
k l
f (x ij i
Cov( x, y ) = i =1 j =1
d) Coeficiente de correlación de Pearson (R): mide el grado de
asociación lineal entre las variables X e Y
cov( X , Y ) Donde : −1 R 1
R=
S xS y
Grado de relación de variables
R CORRELACIÓN
R= ± 1 Correlación perfecta
R= ± 0.9 R= ± 0.99 Correlación muy buena
R= ± 0.7 R= ± 0.89 Correlación buena
R= ± 0.40 R= ± 0.69 Correlación moderada
R= ± 0.30 R= ± 0.39 Correlación baja
R= ± 0.10 R= ± 0.29 Correlación muy baja
R= 0 Correlación nula
9
DIRECTA
Las variables van en el
mismo sentido.
Mientras una variable
aumenta la otra
aumenta
SENTIDO INVERSA
Las variables van en
sentido contrario.
Mientras una variable
aumenta la otra
disminuye.
Signo del coeficiente
Niveles de correlación según valores del C. Correlación
PerfectaAlta Media Baja Baja Media Alta Perfecta
-1 -.9 -.8 -.7 -.6 -.5 -.4 -.3 -.2 -.1 .1 .2 .3 .4 .5 .6 .7 .8 .9 1
0
Correlación negativa o inversa Correlación positiva o directa
Mg. Anne Aniceto Capristán
Aplicación
Se ha recolectado la estatura (X) en cm y su peso (Y) en kg de un grupo de
estudiantes cuyos resultados se muestran en la tabla de distribución de
frecuencias bidimensionales.
Estatura en Peso en kg
cm [50, 60> [60, 70> [70, 80>
[160, 165> 12 18 3
[165, 170> 15 25 8
[170, 175> 4 10 5
[175, 180> 1 3 10
a) Hallar las distribuciones marginales
b) Interprete f22 , f33 , f41, f1. , f.2
c) Encuentre e interprete el peso y la talla promedio
d) Encuentre la covarianza entre peso y estatura
e) Hallar el coeficiente de correlación de Pearson
12
REGRESION Y CORRELACION LINEAL SIMPLE
• Es un modelo matemático para predecir el
efecto de una variable sobre otra, ambas
cuantitativas.
• Una variable es la dependiente y otra la
independiente
• Se gráfica con el diagrama de dispersión.
• Dice cómo es la relación entre las dos variables.
• El análisis consiste en encontrar la “mejor” línea
recta de esos puntos.
Estudio conjunto de dos variables
Altura Peso
• A la derecha tenemos una posible manera de recoger los en cm. en Kg.
datos obtenido observando dos variables en varios 162 61
individuos de una muestra. 154 60
• En cada fila tenemos los datos de un individuo 180 78
• Cada columna representa los valores que toma una variable
158 62
sobre los mismos.
• Las individuos no se muestran en ningún orden particular. 171 66
169 60
• Dichas observaciones pueden ser representadas en un
diagrama de dispersión (‘scatterplot’). En ellos, cada 166 54
individuos es un punto cuyas coordenadas son los valores 176 84
de las variables. 163 68
• Nuestro objetivo será intentar reconocer a partir del mismo ... ...
si hay relación entre las variables, de qué tipo, y si es
posible predecir el valor de una de ellas en función de la
otra.
Diagramas de dispersión o nube de puntos
Tenemos las alturas y los pesos de 30 individuos representados en un
diagrama de dispersión.
100
90
Pesa 76 kg.
80
70
Mide 187 cm.
60
Pesa 50 kg.
50
Mide 161 cm.
40
30
140 150 160 170 180 190 200
Relación entre variables.
Tenemos las alturas y los pesos de 30 individuos representados en un
diagrama de dispersión.
100
90
80
70
60
50
40
30
140 150 160 170 180 190 200
Covarianza de dos variables X e Y
• La covarianza entre dos variables, Sxy, nos indica si la
posible relación entre dos variables es directa o
inversa:
1
S xy = ( xi − x )( yi − y )
• Directa: Sxy > 0 n i
• Inversa: Sxy < 0
• Incorrelacionadas: Sxy = 0
• El signo de la covarianza nos dice si el aspecto de la
nube de puntos es creciente o no, pero no nos dice
nada sobre el grado de relación entre las variables.
Tipos de diagrama de dispersión
Propiedades del coeficiente de correlación
• Sólo toma valores en [-1,1].
• Las variables no presentan correlación r = 0.
• Relación lineal perfecta entre dos variables r = 1 o r = -1.
• Cuanto más cerca esté r de 1 o -1 mejor será el grado de relación
lineal.
• Siempre que no existan observaciones anómalas
iRelación Relación
nversa directa casi
perfecta Variables
perfecta
negativa incorrelacionada
s
-1 0 +1
Coeficiente de correlación
lineal de Pearson
El coeficiente de correlación lineal de Pearson de dos
variables, r, nos indica si los puntos tienen una tendencia
a disponerse alineadamente (excluyendo rectas
horizontales y verticales).
Tiene el mismo signo que la covarianza (Sxy) ,por lo tanto
de su signo obtenemos que la posible relación sea directa
o inversa.
r es útil para determinar si hay relación lineal entre dos
variables, pero no servirá para otro tipo de relaciones
(cuadrática, logarítmica, exponencial)
S xy
r =
SxS y
Animación: Evolución de r y diagrama de dispersión
21
Resumen sobre bondad de un ajuste
• La bondad de un ajuste de un modelo de regresión se mide usando el
coeficiente de determinación R2
• R2 es una cantidad adimensional que sólo puede tomar valores en [0, 1]
• Cuando un ajuste es bueno, R2 será cercano a uno.
• Cuando un ajuste es malo R2 será cercano a cero.
• A R2 también se le denomina porcentaje de variabilidad explicado por el
modelo de regresión.
• R2 puede ser tedioso de calcular en modelos de regresión general, pero
en el modelo lineal simple, la expresión es de lo más sencilla: R2=r2
• Se pueden considerar otros tipos de modelos, en función del aspecto
que presente el diagrama de dispersión (regresión no lineal)
• Incluso se puede considerar el que una variable dependa de varias
(regresión múltiple).
¿recta o parábola?
140 150 160 170 180 190 200
¿recta o cúbica?
140 150 160 170 180 190 200
Modelos de análisis de regresión
1 variable explicativa 2+ variables explicativas
Modelos de
regresión
Simple Múltiple
Lineal No lineal Lineal No lineal
Mg. Anne Aniceto Capristán Pruebas Paramétricas y no Paramétricas
Con Minitab
Estadísticas > Estadísticas básicas > Prueba de normalidad.
Con SPSS
Analizar > Pruebas no paramétricas > K-S de 1 muestra
Analizar >Estadística descriptiva > Mostrar > Gráficos > Gráficos con
pruebas de
normalidad
Pruebas de
Normalidad
Prueba de Prueba de Prueba de Prueba de
kolmogorov- normalidad de Anderson-Darling Shapiro wilk
Smirnov Ryan-Joiner
Mg. Anne Aniceto Capristán