Estadística Descriptiva
UNIDAD 3 – PASO 4
Descripción de la Información
JOHN JAIRO ZARATE PAVAS
GRUPO: 208046_92
TUTOR: LEIDY MARCELA MENDEZ
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
CEAD JOSE ACEVEDO GÓMEZ
INGENIERIA DE SISTEMAS
BOGOTÁ D.C
MAYO 2 DE 2021
Actividad 3. Ejercicio Práctico
Para desarrollar apartado se trabajó con la Cantidad de lluvia y Partículas contaminantes, un
estudio realizado sobre la cantidad de lluvia y la contaminación en el aire eliminada en la
ciudad de Bogotá para el año 2020, en donde se obtuvieron los siguientes datos:
Cantidad Partículas
de Lluvia eliminadas
diaria (0,01 (cm3)
cm)
4,3 126
4,4 121
5,8 117
5,6 119
6,1 114
5,2 112
3,7 132
2,2 140
7,5 108
Tabla 2. Cantidad de lluvia y la contaminación en el aire eliminada en la ciudad de
Bogotá para el año 2020.
Para este ejercicio se respondieron los siguientes interrogantes:
a. Diagrama de dispersión y determine el tipo de asociación entre las variables.
Grafica 1. Cantidad de lluvia y la contaminación en el aire eliminada en la ciudad de
Bogotá para el año 2020.
b. Coeficiente de determinación y correlación.
A continuación, se observa la tabla de análisis de regresión lineal:
Tabla 3. Tablas de Análisis de Regresión lineal frente a la Cantidad de lluvia y la
contaminación en el aire eliminada en la ciudad de Bogotá para el año 2020.
En la tabla 3, se muestra que el coeficiente de terminación equivale a:
R2=0,88
Si a este valor lo multiplicamos por el 100% , nos confirma que la ecuación lineal obtenida
es confiable en un 88%.
Po otro lado, se determinó el coeficiente de correlación mediante la raíz cuadrada del valor
del coeficiente de determinación:
r =√ 0 ,88=0 , 94
Tabla 4. Grado de Correlación Lineal.
c. Determinación del modelo matemático para predecir el efecto de una variable sobre la
otra.
La tabla 3, nos indica que los valores de la pendiente son de -6.22, mientras que la ordenada
al origen corresponde a 151,96; estos valores fueron de suma importancia para proponer el
modelo matemático:
y=m ( x )+ b
y=−6 , 22 x +151,96
Como ejemplo, se reemplazando x por la cantidad de lluvia diaria, se obtiene que:
y=−6 , 22( 7,5)+151,96
y=−46,65+151,96=105,31
d. Determine el grado de relación de las dos variables.
Según la tabla 4, deja en evidencia que el valor del coeficiente de correlación indica que
estadísticamente la correlación es excelente, entre las variables seleccionadas: la cantidad
de Lluvia diaria y las partículas eliminadas.
Actividad 4. Regresión y correlación Lineal Simple
Para esta actividad se utiliza la base de datos relacionada con los Indicadores de impacto
del COVID-19 asociados a la deserción de 190 estudiantes en instituciones de educación
superior 2020 (16-1), donde se identificará los siguientes puntos:
a. Selección de las Variables cuantitativas de la situación estudiada.
Para esta actividad se seleccionaron las variables cuantitativas:
- Número de Personas en el Hogar, siendo esta la variable dependiente (Y).
-Número de Personas que trabajan durante la Pandemia, siendo la variable independiente
(X).
a. Diagrama de dispersión y determine el tipo de asociación entre las variables.
Grafica 2. Indicadores de impacto del COVID-19 asociados a la deserción de 190
estudiantes en instituciones de educación superior en Colombia para el 2020
b. Coeficiente de determinación y correlación.
A continuación, se observa la tabla de análisis de regresión lineal:
Tabla 5. Tablas de Análisis de Regresión lineal frente a la Cantidad de personas que
trabajaron durante la pandemia y la cantidad de personas de sus núcleos familiares.
En la tabla 5, se muestra que el coeficiente de terminación equivale a:
R2=0 ,65
r =√ 0 ,65=0 , 81
c. Determinación del modelo matemático para predecir el efecto de una variable sobre la
otra.
y=m ( x )+ b
y=−1,18 x +7,88
Como ejemplo, se reemplazando x por la cantidad de personas que trabajaron durante la
pandemia, se obtiene que:
y=−1,18 ( 3 )+7,88
y=−3,54+7,88=4,34
Actividad 5. Regresión y correlación múltiple.
Para esta actividad se utiliza la base de datos relacionada con los Indicadores de impacto
del COVID-19 asociados a la deserción de 190 estudiantes en instituciones de educación
superior 2020 (16-1), donde se identificará los siguientes puntos:
a. Selección de las Variables cuantitativas de la situación estudiada.
Para esta actividad se seleccionaron las variables cuantitativas:
- Número de Personas en el Hogar, siendo esta la variable dependiente.
-Número de Personas que trabajan durante la Pandemia, siendo la variable independiente.
- Estrato socioeconómico, como una variable independiente.
a. Diagrama de dispersión y determine el tipo de asociación entre las variables.
Grafica 3. Indicador Socioeconómico frente al impacto causado por el COVID-19
causando la deserción de 190 estudiantes en instituciones de educación superior en
Colombia para el 2020
Grafica 4. Tablas de Análisis de Regresión lineal frente a la Cantidad de personas que
trabajaron durante la pandemia y la cantidad de personas de sus núcleos.
La graficas 5, indica que hay una relación directa entre los datos, haciendo referencia que
entres más miembros de las familias trabajaran durante la pandemia es porque en el
núcleo familiar había mas cantidad de personas por sostener.
Grafica 5. Tablas de Análisis de Regresión lineal frente a los estratos socioeconómicos y
la cantidad de personas de sus núcleos familiares.
La graficas 6, indica que hay una relación directa entre los datos, haciendo referencia que
entre más elevado fuese el estrato socio económico, la cantidad de personas en el hogar es
mayor.
b. Coeficiente de determinación y correlación.
A continuación, se observa la tabla de análisis de regresión lineal:
Tabla 6. Tablas de Análisis de Regresión lineal frente a la Cantidad de personas que
trabajaron durante la pandemia, la cantidad de personas de sus núcleos familiares y los
estratos socioeconómicos.
En la tabla 6, se muestra que el coeficiente de terminación equivale a:
R2=0,6 6
Po otro lado, se determinó el coeficiente de correlación mediante la raíz cuadrada del valor
del coeficiente de determinación:
r =√ 0,6 6=0,81
c. Determinación del modelo matemático para predecir el efecto de una variable sobre la
otra.
y=a ( x1 ) + b ( x2 ) + c
Variables independientes:
X1= Número de Personas que trabajan.
X1= Estrato Socioeconómico.
y=(−1,17 ( x 1 ) )+(−0,07 ( x 2 ) )+ 8,15
Como ejemplo, se reemplazando x por la cantidad de personas que trabajaron durante la
pandemia y el estrato socioeconómico, se obtiene que:
y=(−1,17 ( 3 ) )+(−0,07 (1 ) )+8,15
y=(−3,51)+(−0,0 7)+8,15
y= (−3,58 )+ 8,15=4,57