0% encontró este documento útil (0 votos)

15 vistas15 páginas

Correlación y regresión en bioestadística

tema 6

Cargado por

lauraa.zp79

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

15 vistas15 páginas

Correlación y regresión en bioestadística

tema 6

Cargado por

lauraa.zp79

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Tema-6-bien.

pdf

Atheris

Bioestadística

1º Grado en Medicina

Facultad de Medicina
Universidad de Lleida

Reservados todos los derechos.

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-6068074

Correlación y regresión
Correlación no es causalidad

1. Ideas clave
• Correlación
o Correlación no paramétrica
• Regresión lineal
o Regresión no lineal
• Plots
o Scatterplot
o Heatmap
o Regression line

2. ¿Siguen tus datos una distribución normal?

Hay diferentes formas de ver si los datos siguen una distribución normal, uno de ellos
es, por ejemplo, mediante métodos visuales

Todo esto se debe comprobar para poder aplicar tests paramétricos: diferencias de
medias, diferencias de probabilidades, etc.
Otras maneras de comprobar si sigue una distribución normal es realizar un test de
Normalidad: Shapiro – Wilk’s es un método recomendado para comprobar que
estamos ante una variable normal, es más fiable que el test normal de Kolmogorov –
Smirnov. Está basado en la correlación entre los datos y su correspondiente valor
normal. Para ello necesitamos realizar la hipótesis nula y de esta forma obtener el
valor p, el cual si es mayor que 0,05 implica que la distribución de los datos no es
significativamente diferente de una distribución normal, luego, podemos asumir que
sea una distribución normal. Hay que añadir que el test es muy sensible a la medida
de la muestra. Muestras pequeñas suelen pasar el test de normalidad. Por ello, es
importante combinar los dos métodos: el visual y el test mencionado, para poder
tomar la decisión adecuada.
En R se hace de la siguiente forma:

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-6068074

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
3. ¿Tienen tus variables una relación lineal?
Para poder hacer esta comprobación podemos empezar a partir de una representación
gráfica que bien puede hacerse a partir de un gráfico de dispersión normal o un
bubbleplot

4. Relación entre dos variables continuas.

1) Asociación  Una asociación entre dos variables continuas X e Y significa que los
valores de una variable, por ejemplo Y, tenderá a aumentar (o disminuir) cuando
los valores de la otra variable hacen lo propio. Si se da el caso en el que aumentan
lo mismo o disminuyen lo mismo hablamos de correlación
2) Predicción  Predice el valor de la variable Y siempre y cuando tengamos los
valores de X porque sabemos que existe una relación  Regresión

5. Correlación lineal o Correlación de Pearson.

• Utilizada para medir el grado de asociación lineal entre los puntos
• Puede tomar valores entre -1 y 1. Estos valores absolutos los toma cuando
todos los puntos están alineados. Positivo si son crecientes y negativo si son
decrecientes.
• Cuanto más esparcidos estén los puntos en el gráfico, más cercano a 0 será el
valor de correlación lineal.

• Por otro lado, se puede expresar mediante dos fórmulas distintas:

Plan Turbo - Eliminar los vídeos + 10 descargas sin publicidad por sólo 0,99€ / mes - Oferta limitada
Bioestadística
Banco de apuntes de la
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-6068074

Donde p representa a la población, r es para las muestras. La segunda fórmula

está expresada en términos de covariancia.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
5.1. Ejemplo.
Peso y altura dependiendo de la edad en niños.

En R:

5.2. Limitaciones
o Correlación no significa que exista una relación causal.
o El coeficiente puede variar mucho de una muestra a otra.
o Asumimos que se trata de distribución normal puesto que en otro tipo
de distribución no se puede aplicar.
o Si la muestra consta de diferentes subgrupos, la correlación para cada
subgrupo puede variar respecto a la correlación global.
5.3. Ejemplos donde no se puede usar este tipo de coeficiente de correlación.
Cuando la gráfica no es lineal (siendo r > 0), cuando la relación entre x e y
no es lineal (parábola, siendo r = 0) o por la aparición de outlayers (puntos
extremos, que desviarán el valor del coeficiente hacia sí mismo: r < 0).

Plan Turbo - Eliminar los vídeos + 10 descargas sin publicidad por sólo 0,99€ / mes - Oferta limitada
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-6068074

6. Correlación de Spearman.
Sirven como solución a los casos mencionados
con anterioridad donde no podemos utilizar el
test de Pearson.
• Es un test no paramétrico, por lo que no
es necesario que las variables tengan una
distribución normal ni que tengan una
dependencia lineal.
• En vez de trabajar con los valores de las
variables, lo hacemos con los rangos de
datos, es decir, es algo similar al cuantil
de la posición de los datos.
• La interpretación es la misma que para el
coeficiente de correlación de Pearson.
En R:

7. Correlograma.
Si existen múltiples correlaciones existen gráficos que ayudan a representar este tipo
de variables, son los que denominamos correlogramas.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Cuando solo representamos colores lo denominamos Heatmap.
Produce una matriz de alta calidad y ofrece herramientas estadísticas para normalizar
datos.

8. Regresión lineal
El modelo de regresión lineal predice la relación entre los datos mediante la siguiente

fórmula:
• El último elemento, Ei es el término error o residual. Indica lo mucho
que el valor observado se desvía de los esperado o del valor predicho,
de acuerdo con el modelo de regresión.
• Los coeficientes B0 y B1 son estimados utilizando los mínimos
cuadrados o el método de máxima verosimilitud.
8.1. Relación lineal entre dos variables cuantitativas

8.2. Mínimos cuadrados

Plan Turbo - Eliminar los vídeos + 10 descargas sin publicidad por sólo 0,99€ / mes - Oferta limitada
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-6068074

Consiste en minimizar la suma de los cuadrados de las distancias verticales

(residuales) que existen respecto a la línea observada.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
8.3. En R

8.4. Asunciones del modelo de regresión lineal

Para poder usar correctamente el modelo de regresión lineal deben
tomarse en cuenta tres asunciones:
• La variable Y tiene que tener una distribución normal
obligatoriamente respecto a los valores de la variable X.
• La variabilidad (variancia) de la variable Y tiene que ser similar
para diferentes valores de la variable X.
• La relación entre X e Y tiene que ser lineal.

8.5. ¿Podemos incluir variables cualitativas?

Si, los modelos lineales nos permiten capturar y representar diversos tipos
de eventos.
De tal forma, que para incluir una variable de este tipo, podríamos seguir
el mismo ejemplo que con las otras variables:
• El valor esperado para cada una de las observaciones es µ.

Plan Turbo - Eliminar los vídeos + 10 descargas sin publicidad por sólo 0,99€ / mes - Oferta limitada
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-6068074

• La distribución de cada residual explica la variación en cuanto a la

media.

• Fórmula:
8.6. Ejemplo de interpretación del modelo lineal con variables cualitativas
Se toma el género como una variable que afecta los niveles de colesterol.

Donde: yij  Nivel de colesterol del individuo j del grupo i

µ  Media
αi  Grupo del efecto i
épsilon  Variabilidad del individuo j del grupo i

Donde: El efecto del género es aditivo, la dispersión de los datos es similar

en hombres y mujeres y la dispersión del modelo es simétrico.
Por otro lado, los niveles de colesterol también cambian con la edad y el
género.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Conclusiones:
• El nivel de colesterol muestra un aumento lineal con la
edad.
• Las diferencias entre hombre y mujer se mantienen
constantes con la edad.
• Para cada edad, hombre y mujer muestras valores de
dispersión del colesterol similares.
Interacción entre el género y la edad:

Conclusiones:
• Los niveles de colesterol muestran un aumento lineal con la edad
• Este efecto es mayor en hombres.
• En una edad dada, los efectos del género serán diferentes.
• Para cada edad, hombre y mujer muestran valores de dispersión
del colesterol similares.
Los niveles de colesterol cambian con el género, pero no con la edad. (Son
independientes):

Plan Turbo - Eliminar los vídeos + 10 descargas sin publicidad por sólo 0,99€ / mes - Oferta limitada
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-6068074

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Conclusiones:
• Los niveles de colesterol son independientes respecto a la edad
• El efecto del género es constante con la edad. La media de
colesterol en hombres es mayor que en mujeres.
• Para cada edad, hombre y mujer muestran valores de dispersión
del colesterol similares.
8.7. Ideas clave
• El comportamiento estadístico de una variable puede ser explicada
por el efecto de diferentes factores y una variabilidad intrínseca.
• Los modelos lineales pueden explicar y predecir algunas
situaciones.
• Analizando los parámetros estimados, podemos decir que factores
son importantes para explicar la variabilidad de nuestras variables.
8.8. Subgrupos

8.8.1. Regresión lineal sin interacción (+)

Plan Turbo - Eliminar los vídeos + 10 descargas sin publicidad por sólo 0,99€ / mes - Oferta limitada
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-6068074

8.8.2. Regresión lineal con interacción (*)

8.9. Comparación de modelos

Cor.test  dos variables cuantitativas
T.test  diferencias de medias
RRS  suma de residuales al cuadrado  un residual es la diferencia entre
la observación y la predicción elevada al cuadrado para que salga positiva
y lo sumo todo.  Derivar para minimizar
ANOVA  permite comparar los modelos

8.10. Evaluación del modelo: CI y Residuales

Prima los intervalos de confianza por encima del valor p  en el fondo son
los que están dando la medida, por eso son más importantes. Es más
importante saber entre que números varía.

Plan Turbo - Eliminar los vídeos + 10 descargas sin publicidad por sólo 0,99€ / mes - Oferta limitada
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.

También podría gustarte

Interpretación de Resultados Estadísticos
Aún no hay calificaciones
Interpretación de Resultados Estadísticos
64 páginas
Análisis de Resultados en Investigación
Aún no hay calificaciones
Análisis de Resultados en Investigación
8 páginas
Análisis de Variables Cuantitativas
Aún no hay calificaciones
Análisis de Variables Cuantitativas
6 páginas
Investigación de Mercados B
Aún no hay calificaciones
Investigación de Mercados B
1 página
Tema 5 Estadistica Inferencial D..
Aún no hay calificaciones
Tema 5 Estadistica Inferencial D..
8 páginas
Ayuda Memoria SPSS Pruebas Paramétricass
Aún no hay calificaciones
Ayuda Memoria SPSS Pruebas Paramétricass
14 páginas
Guía Breve de Estadística para El TFM
Aún no hay calificaciones
Guía Breve de Estadística para El TFM
6 páginas
Guía de Estadística para Biología Marina
Aún no hay calificaciones
Guía de Estadística para Biología Marina
94 páginas
Tutorial R-Commander: Análisis Estadístico Básico
Aún no hay calificaciones
Tutorial R-Commander: Análisis Estadístico Básico
21 páginas
Estadística Básica en Ciencias de la Salud
Aún no hay calificaciones
Estadística Básica en Ciencias de la Salud
22 páginas
Manual de Bioestadística PDF
100% (7)
Manual de Bioestadística PDF
207 páginas
Manual de Bioestadística
100% (7)
Manual de Bioestadística
240 páginas
Introducción a la Bioestadística en Medicina
Aún no hay calificaciones
Introducción a la Bioestadística en Medicina
7 páginas
Fundamentos de Estadística en Medicina
100% (1)
Fundamentos de Estadística en Medicina
37 páginas
Estadistica Inferencial
Aún no hay calificaciones
Estadistica Inferencial
6 páginas
Prueba de bondad de ajuste chi-cuadrado
Aún no hay calificaciones
Prueba de bondad de ajuste chi-cuadrado
7 páginas
Bioestadística Descriptiva
100% (1)
Bioestadística Descriptiva
117 páginas
Informe1 Final
Aún no hay calificaciones
Informe1 Final
7 páginas
Resum Epi Tema 4 I 5
Aún no hay calificaciones
Resum Epi Tema 4 I 5
11 páginas
Correlación y Regresión Lineal 2025
Aún no hay calificaciones
Correlación y Regresión Lineal 2025
63 páginas
Bioestadística: Variables y Escalas de Medición
Aún no hay calificaciones
Bioestadística: Variables y Escalas de Medición
78 páginas
Semestral de Bio218
Aún no hay calificaciones
Semestral de Bio218
11 páginas
Manual de Bioestadística en Salud
100% (2)
Manual de Bioestadística en Salud
103 páginas
Manual de Bioestadística para La Salud
100% (1)
Manual de Bioestadística para La Salud
103 páginas
Correlación y Asociación en Estadística
Aún no hay calificaciones
Correlación y Asociación en Estadística
6 páginas
Clase 17. Estadística Inferencial
Aún no hay calificaciones
Clase 17. Estadística Inferencial
63 páginas
Wuolah Free Tema 7 Estadistica Inferencial Comparacion de Dos Medias Comparacion de Varias Medias y Analisis de Datos Emparejados
Aún no hay calificaciones
Wuolah Free Tema 7 Estadistica Inferencial Comparacion de Dos Medias Comparacion de Varias Medias y Analisis de Datos Emparejados
4 páginas
Intervalos de Confianza en Salud
Aún no hay calificaciones
Intervalos de Confianza en Salud
19 páginas
Bioestadística en Epidemiología: Fundamentos
Aún no hay calificaciones
Bioestadística en Epidemiología: Fundamentos
30 páginas
Encaps25-Metodos y Aplicaciones 2
Aún no hay calificaciones
Encaps25-Metodos y Aplicaciones 2
46 páginas
2 Curso de Bioestadistica para Enfermería
100% (1)
2 Curso de Bioestadistica para Enfermería
41 páginas
Conceptos Clave en Bioestadística y Análisis de Datos
Aún no hay calificaciones
Conceptos Clave en Bioestadística y Análisis de Datos
4 páginas
Correlación y Regresión en SPSS
Aún no hay calificaciones
Correlación y Regresión en SPSS
20 páginas
Introducción a la Bioestadística
Aún no hay calificaciones
Introducción a la Bioestadística
262 páginas
Correlaciones y Pruebas Estadísticas
Aún no hay calificaciones
Correlaciones y Pruebas Estadísticas
43 páginas
Wuolah-Free-Tema 2. Estadística Descriptiva
Aún no hay calificaciones
Wuolah-Free-Tema 2. Estadística Descriptiva
5 páginas
Bioestadistica
Aún no hay calificaciones
Bioestadistica
8 páginas
Estadística Paramétrica y No Paramétrica
Aún no hay calificaciones
Estadística Paramétrica y No Paramétrica
6 páginas
Introducción a la Estadística Básica
Aún no hay calificaciones
Introducción a la Estadística Básica
53 páginas
Fundamentos de Bioestadística en Medicina
Aún no hay calificaciones
Fundamentos de Bioestadística en Medicina
112 páginas
Tablas de Bioestadistica
Aún no hay calificaciones
Tablas de Bioestadistica
30 páginas
Introducción a la Estadística Descriptiva
Aún no hay calificaciones
Introducción a la Estadística Descriptiva
13 páginas
Universidad para El Bienestar Benito Juárez García
Aún no hay calificaciones
Universidad para El Bienestar Benito Juárez García
8 páginas
Fundamentos de Bioestadística en Salud
Aún no hay calificaciones
Fundamentos de Bioestadística en Salud
8 páginas
Copia de MATEMATICAS VI 2014
Aún no hay calificaciones
Copia de MATEMATICAS VI 2014
13 páginas
Introducción a la Estadística Descriptiva
Aún no hay calificaciones
Introducción a la Estadística Descriptiva
101 páginas
BIOESTADISTICA
Aún no hay calificaciones
BIOESTADISTICA
326 páginas
Estadística Inferencial y Probabilidades
Aún no hay calificaciones
Estadística Inferencial y Probabilidades
8 páginas
Fundamentos de Estadística y Bioestadística
Aún no hay calificaciones
Fundamentos de Estadística y Bioestadística
37 páginas
Distribuciones y Pruebas Estadísticas MIR
Aún no hay calificaciones
Distribuciones y Pruebas Estadísticas MIR
7 páginas
Métodos Estadísticos en Investigación Médica
Aún no hay calificaciones
Métodos Estadísticos en Investigación Médica
43 páginas
Modelos y Métodos en Estadística Descriptiva
Aún no hay calificaciones
Modelos y Métodos en Estadística Descriptiva
88 páginas
Resumen Final Bioestadística 1
Aún no hay calificaciones
Resumen Final Bioestadística 1
20 páginas
Variables Estadísticas y Escalas de Medición
Aún no hay calificaciones
Variables Estadísticas y Escalas de Medición
172 páginas
Actividad 2 CUESTIONARIO CENS
Aún no hay calificaciones
Actividad 2 CUESTIONARIO CENS
11 páginas
Persona Extraordinaria: Un Relato Único
Aún no hay calificaciones
Persona Extraordinaria: Un Relato Único
43 páginas
Cubierta y Membrana Celular
Aún no hay calificaciones
Cubierta y Membrana Celular
9 páginas
Trabajo Lilian
Aún no hay calificaciones
Trabajo Lilian
16 páginas
Organización en el Proceso Administrativo
Aún no hay calificaciones
Organización en el Proceso Administrativo
3 páginas
Los Abordajes Metodológicos
Aún no hay calificaciones
Los Abordajes Metodológicos
4 páginas
Plan de Estudios Ciencias Contables UNA Puno
Aún no hay calificaciones
Plan de Estudios Ciencias Contables UNA Puno
3 páginas
Parámetros y Métodos de Socavación en Suelos
Aún no hay calificaciones
Parámetros y Métodos de Socavación en Suelos
52 páginas
Quim Informe
Aún no hay calificaciones
Quim Informe
5 páginas
Folleto Transfer Factor Formula Avanzada PDF
Aún no hay calificaciones
Folleto Transfer Factor Formula Avanzada PDF
1 página
Muna TWR
Aún no hay calificaciones
Muna TWR
88 páginas
Estimulación Integral Inteligencia y Valores
100% (3)
Estimulación Integral Inteligencia y Valores
115 páginas
Taller de Ecuaciones Lineales
Aún no hay calificaciones
Taller de Ecuaciones Lineales
11 páginas
Guía de Sistemas de Filtración Multietapa
Aún no hay calificaciones
Guía de Sistemas de Filtración Multietapa
7 páginas
Proyecto Apícola Sostenible
Aún no hay calificaciones
Proyecto Apícola Sostenible
8 páginas
Práctica 1.1
Aún no hay calificaciones
Práctica 1.1
2 páginas
Estrategias de Procesos Productivos
Aún no hay calificaciones
Estrategias de Procesos Productivos
4 páginas
Análisis de Estilos de Comunicación
Aún no hay calificaciones
Análisis de Estilos de Comunicación
5 páginas
Dispositivos de Comunicación Inalámbrica
Aún no hay calificaciones
Dispositivos de Comunicación Inalámbrica
3 páginas
04-CS Teorica Coordinacion Dimensional N3 2023 Parte 1
Aún no hay calificaciones
04-CS Teorica Coordinacion Dimensional N3 2023 Parte 1
60 páginas
Fredher
Aún no hay calificaciones
Fredher
10 páginas
Plan Vial de La Ciudad de Juliaca
100% (1)
Plan Vial de La Ciudad de Juliaca
23 páginas
Análisis Freudiano de "Fragmentado"
Aún no hay calificaciones
Análisis Freudiano de "Fragmentado"
9 páginas
Amparo 115/2003: Donación de Órganos
Aún no hay calificaciones
Amparo 115/2003: Donación de Órganos
138 páginas
Ses Comun Lun 9 Papa Heroe de Mar 933623393 Yessenia Carrasco
Aún no hay calificaciones
Ses Comun Lun 9 Papa Heroe de Mar 933623393 Yessenia Carrasco
6 páginas
Observaciones a Oferentes Licitación Samacá
Aún no hay calificaciones
Observaciones a Oferentes Licitación Samacá
13 páginas
Valuación de Terreno y Edificación N301
Aún no hay calificaciones
Valuación de Terreno y Edificación N301
2 páginas
Informe de La Evaluación Interna Del Egsi Año 2024-Signed-Signedvalidacion
Aún no hay calificaciones
Informe de La Evaluación Interna Del Egsi Año 2024-Signed-Signedvalidacion
82 páginas
Salud y Simbolismo Imaginario
Aún no hay calificaciones
Salud y Simbolismo Imaginario
414 páginas