0% encontró este documento útil (0 votos)
75 vistas3 páginas

Análisis de Regresión Lineal en R

El documento describe un análisis de regresión lineal realizado por Esmeralda Martínez sobre el número de policías abatidos en función del año. Se utilizan varias librerías de R para realizar la regresión, y se presentan resultados estadísticos que indican un buen ajuste del modelo, con un coeficiente de determinación múltiple de 0.8847 y un valor de p significativo. La conclusión es que el modelo es útil para predecir la variable dependiente y explica una gran parte de la variabilidad de los datos.

Cargado por

leokenedy212
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
75 vistas3 páginas

Análisis de Regresión Lineal en R

El documento describe un análisis de regresión lineal realizado por Esmeralda Martínez sobre el número de policías abatidos en función del año. Se utilizan varias librerías de R para realizar la regresión, y se presentan resultados estadísticos que indican un buen ajuste del modelo, con un coeficiente de determinación múltiple de 0.8847 y un valor de p significativo. La conclusión es que el modelo es útil para predecir la variable dependiente y explica una gran parte de la variabilidad de los datos.

Cargado por

leokenedy212
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

#---------REGRESIÓN LINEAL--------------------------------

#Realizado por Esmeralda Martínez


#Instalamos las librerias que vamos a usar (solo se hace una vez)
[Link]("readr")
[Link]("tidyverse")
[Link]("ggplot2")
[Link]("boot")
[Link]("QuantPsyc")
[Link]("car")
[Link]("conflicted")

#llamamos a las librerias (esto lo tienes que repetir cada que


comienzas un proyecto)
library(tidyverse)
library(ggplot2)
library(boot)
library(QuantPsyc)
library(car)

#llamamos al archivo
attach(policias_abatidos)
#recordamos los nombres que pusimos en cada columna
names(policias_abatidos)

#Examinamos la correlación entre los datos en (y) y (x)


#usamos la función [Link](y,x) para calcularla
#correlación es una medida estadística que expresa hasta qué punto dos
#variablesestán relacionadas linealmente

[Link](`Policias abatidos`, Ano)

#Hacemos la regresión lineal


#El comando básico es lm(linear models).
#El primer argumento de este comando es una fórmula y ~ x en la que:
#y es la variable respuesta o dependiente
#x es la variable regresora o independiente
#data indica el fichero en el que se encuentran las variables
regresion_lineal=lm(`Policias abatidos` ~ Ano, data =
policias_abatidos)
#El resultado lo guardamos en un objeto llamado regresion_lineal

#para ver los resultados de la regresión usamos la función summary


summary(regresion_lineal)

#¿Cómo interpretamos los resultados?


#Call: y muestra la formula con la que obtuvimos el modelo

#Residuals: y nos da valores estadísticos sobre la distribución de los


residuos del
#modelo.
#Coefficients: y muestra los coeficientes estimados por el modelo,
#Recuerda que una regresión lineal tiene la forma y=mx+b
#Intercept=b es el valor que intercepta la recta con el eje y con x=0
#El segundo valor es la pendiente
#std. Error es la desviación estándar de los valores encontrados
#El valor p de cada término evalúa la hipótesis nula de que el
coeficiente =0 (no hay efecto)
#Un valor p bajo (< 0,05) indica que se puede rechazar la hipótesis
nula
#p grande indica que los cambios en el predictor no están asociados con
cambios en la respuesta.
#En este caso particular, los datos son:
#La pendiente m=0.9643 y la ordenada al origen es -1939.6786
#RSE mide la desviación estándar de los residuos, que son las
diferencias entre los valores
#observados de la variable dependiente y los valores predichos por el
modelo
#Adjusted R-squared, entre más cerca esté de 1, la recta ajusta mejor a
los puntos
#F-statistic mide si el modelo de regresión es útil para predecir la
variable dependiente

#Hacemos la gráfica con plot(y ~ x)


plot(`Policias abatidos` ~ Ano , pch=16,col='blue', bty='l',ylab='%
policías abatidos',xlab='Año')

#ponemos la línea que describe el ajuste de datos


abline(regresion_lineal, col="red", lwd=2)

#Podemos interpretar el modelo de regresión lineal como sigue:


#El valor del Residual standard error (RSE) es de 0.8238 unidades en la
#escala de la variable dependiente.

#El valor del coeficiente de determinación múltiple (Multiple #R-


squared) es de 0.8847. Esto indica que el modelo explica el 88.47% #de
la variabilidad total de la variable dependiente.

#El valor del coeficiente de determinación ajustado (Adjusted R-


squared) es de
#0.8617. Este coeficiente ajusta el coeficiente de determinación
múltiple por el
#número de variables explicativas y el tamaño de la muestra. En este
caso, el
#indica que el modelo es una buena representación de los datos, incluso
después
#de ajustar por el número de variables explicativas y el tamaño de la
muestra.

#El valor de la estadística F es de 38.37, con 1 y 5 grados de


libertad. Esta
#estadística mide la relación entre la variabilidad explicada y la
variabilidad
#no explicada en el modelo. Un valor alto de F y un valor bajo de p
indican que
#el modelo es significativo. En este caso, el valor de p es de 0.0016,
lo que
#significa que el modelo es significativo con un nivel de significancia
del 0.05%.

#En resumen, el modelo de regresión lineal tiene un buen ajuste a los


datos,
#con un alto coeficiente de determinación múltiple y un bajo valor de
RSE.
#Además, el valor de la estadística F y el valor de p indican que el
modelo es
#significativo y que puede ser utilizado para predecir la variable
dependiente.

#Datos obtenidos de
[Link]
espanol/bvinegi/productos/nueva_estruc/[Link]

También podría gustarte