Asignatura Datos del CIPA Fecha
Nombre CIPA: DIEZ
Integrantes: SERRANO MAIRA
MONTERO YINERIS
ESTADISTICA II 22 ENERO DE 2022
HEREDIA IVAN
SANTOS ANA JIMENA
RINCON MERVIN JOHANA
Actividad
Protocolo colaborativo de la unidad n°: TRES
Análisis y síntesis:
Síntesis e interpretación colaborativa de los temas vistos en la unidad
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE
La correlación y la regresión lineales simple son métodos estadísticos que estudian la
relación lineal existente entre dos variables. Conviene destacar algunas diferencias:
La regresión lineal simple consiste en generar un modelo de regresión (ecuación de una recta)
que permita explicar la relación lineal que existe entre dos variables. A la variable
dependiente o respuesta se le identifica como \(Y\) y a la variable predictora o independiente
como \(X\).Por lo tanto, es el proceso general de predecir una variable Y a partir de otra X.
Relaciones entre variables
• Relación directa: tiene pendiente positiva, porque la variable Y crece a medida que la
variable X también lo hace.
• Relación inversa: tiene pendiente negativa, porque a medida que aumenta la variable Y,
disminuye la variable X.
Variable independiente X es la variable cuyo valor se suponga conocido y se utiliza para
explicar o predecir el valor de otra variable.
Variable dependiente Y es la variable cuyo valor se suponga desconocido y que se explique
o prediga con ayuda de otra.
Diagramas de dispersión es la ilustración grafica usada en el análisis de regresión y consta
de la dispersión de puntos los cuales representan un valor de la variable independiente y un
valor asociado de la variable dependiente.
Método de mínimos cuadrados es usado para ajustar una línea de datos muestrales indicados
en el diagrama de dispersión. A partir de este método y los datos muestrales se calcula la
línea de regresión muestral o estimada, la cual se ajusta mejor al conjunto de datos (x,y) y se
calcula mediante la formula: 𝛾 = 𝑎 + 𝑏𝑋
• Pendiente b representa el grado de inclinación de la recta.
• Ordenada de origen a representa el punto en que la recta corta al eje de las Y.
Error estándar de estimación: mide la dispersión de los valores observados alrededor de la
línea de regresión y se representa como Se.
La correlación cuantifica como de relacionadas están dos variables, mientras que la regresión
lineal consiste en generar una ecuación (modelo) que, basándose en la relación existente entre
ambas variables, permita predecir el valor de una a partir de la otra.
Asignatura Datos del CIPA Fecha
Nombre CIPA: DIEZ
Integrantes: SERRANO MAIRA
MONTERO YINERIS
ESTADISTICA II 22 ENERO DE 2022
HEREDIA IVAN
SANTOS ANA JIMENA
RINCON MERVIN JOHANA
El cálculo de la correlación entre dos variables es independiente del orden o asignación de
cada variable a X e Y, mide únicamente la relación entre ambas sin considerar dependencias.
En el caso de la regresión lineal, el modelo varía según qué variable se considere dependiente
de la otra (lo cual no implica causa-efecto).
A nivel experimental, la correlación se suele emplear cuando ninguna de las variables se ha
controlado, simplemente se han medido ambas y se desea saber si están relacionadas. En el
caso de estudios de regresión lineal, es más común que una de las variables se controle
(tiempo, concentración de reactivo, temperatura…) y se mida la otra.
Por norma general, los estudios de correlación lineal preceden a la generación de modelos de
regresión lineal. Primero se analiza si ambas variables están correlacionadas y, en caso de
estarlo, se procede a generar el modelo de regresión.
COEFICIENTE DE CORRELACION LINEAL DE PEARSON
Se define en términos de covarianza de las variables aleatorias X y Y, es decir, que varían
conjuntamente y sus valores oscilan entre 0 y 1.
Interpretación: cuanto mas cerca de 1 mayor correlación y mas cerca del cero menor
correlación. La correlación efectiva es distinta de cero.
Prueba de hipótesis en esta establecemos un valor supuesto o hipotético del parámetro de
población antes de tomar la muestra.
• Hipótesis nula: es la suposición respecto a un parámetro de población que deseamos probar,
generalmente sobre el estatus quo. H0:µ=500 se lee la hipótesis nula es que la media de
población es igual a 500.
• Hipótesis alternativa: es la conclusión que aceptamos cuando los datos no respaldan la
hipótesis nula. H1:µ≠200 se lee la hipótesis alternativa es que la media de población no es
igual a 200.
Discusión:
Dudas, desacuerdos, discusiones