UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESTADÍSTICA DESCRIPTIVA
ESTADÍSTICA DESCRIPTIVA
Unidad 2: Paso 4 - Descripción de la información.
Trabajo Individual Presentado por:
Diana Carolina Lara
Presentado a tutor:
MILENA DIAZ
Grupo 100105_248
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
Mayo 11 de 2020
1
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESTADÍSTICA DESCRIPTIVA
Introducción
El siguiente documento tiene como finalidad identificar los fundamentos básicos de la
Estadística Descriptiva aplica las medidas bivariantes, aplicando conceptos como Regresión
lineal, coeficiente de determinación lineal, coeficiente de correlación, Regresión simple y
Diagramas de dispersión. Estos conceptos se aplicarán para el caso de estudio de datos e
información de las Pruebas SABER 11 de 220 estudiantes del año 2020.
2
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESTADÍSTICA DESCRIPTIVA
Justificación
Por medio de esta investigación se tuvieron en cuenta varios aspectos de origen
informativo que nos podrían llevar a determinar de una forma más clara y el
rendimiento y resultado académico Pruebas SABER 11 de 220 estudiantes del año 2020,
entre los cuales se tuvo en cuenta varios aspectos como:
✓ Departamento Residencia
✓ Código Del Departamento
✓ Municipio De Residencia
✓ Estrato Familiar
✓ Número De Personas En El Hogar
✓ Cuartos En El Hogar
✓ Nivel De Educación Del Padre
✓ Nivel De Educación De La Madre
✓ Ocupación Del Padre
✓ Ocupación De La Madre
✓ Tiene Internet
✓ Servicio Tv cable
✓ Tiene computador
✓ Tiene lavadora
✓ Tiene automóvil
✓ Tiene motocicleta
✓ N° De Libros de Consulta
✓ Situación Económica
✓ Horas De Dedicación A La Lectura
✓ Entre otras
3
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESTADÍSTICA DESCRIPTIVA
Objetivos
Análisis de correlación simple de las variables cuantitativas seleccionadas.
Análisis y conclusiones, a partir de los resultados obtenidos y aplicados al
problema o situación estudiada.
Aplica las medidas bivariantes, aplicando conceptos como Regresión lineal,
coeficiente de determinación lineal, coeficiente de correlación, Regresión simple
y Diagramas de dispersión
4
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESTADÍSTICA DESCRIPTIVA
Mapa Metal
5
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESTADÍSTICA DESCRIPTIVA
Definición de conceptos
Diagrama de dispersión.
El diagrama de dispersión permite analizar si existe algún tipo de relación entre dos
variables. Por ejemplo, puede ocurrir que dos variables estén relacionadas de manera
que, al aumentar el valor de una, se incremente el de la otra. En este caso hablaríamos
de la existencia de una correlación positiva.
Correlación lineal simple.
La correlación, también conocida como coeficiente de correlación lineal (de Pearson), es
una medida de regresión que pretende cuantificar el grado de variación conjunta entre
dos variables. Por tanto, es una medida estadística que cuantifica la dependencia lineal
entre dos variables, es decir, si se representan en un diagrama de dispersión los valores
que toman dos variables, el coeficiente de correlación lineal señalará lo bien o lo mal que
el conjunto de puntos representados se aproxima a una recta.
Coeficiente de determinación R2
El coeficiente de determinación se define como la proporción de la varianza total de la
variable explicada por la regresión. El coeficiente de determinación, también llamado R
cuadrado, refleja la bondad del ajuste de un modelo a la variable que pretender explicar.
Es importante saber que el resultado del coeficiente de determinación oscila entre 0 y 1.
Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a la variable
que estamos intentando explicar. De forma inversa, cuanto más cerca de cero, menos
ajustado estará el modelo y, por tanto, menos fiable será.
Correlación positiva y correlación negativa
Con los diagramas de dispersión podemos ver cómo se relacionan ambas variables entre
sí. Esto es lo que se conoce como correlación. Hay tres tipos de correlación: positiva,
negativa y nula (sin correlación).
6
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESTADÍSTICA DESCRIPTIVA
Correlación positiva: ocurre cuando una variable aumenta y la otra también. Por ejemplo, la
altura de una persona y el tamaño de su pie; mientras aumenta la altura, el pie también.
Correlación negativa: es cuando una variable aumenta y la otra disminuye. El tiempo de
estudio y el tiempo que pasas jugando videojuegos, tienen una correlación negativa, ya
que cuando tu tiempo de estudio aumenta, no te queda tanto tiempo para jugar
videojuegos.
- ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?
De una forma menos coloquial, la podemos definir como el número que mide el grado de
intensidad y el sentido de la relación entre dos variables.
7
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESTADÍSTICA DESCRIPTIVA
Análisis de correlación lineal simple de las dos variables cuantitativas
seleccionadas.
1.1. Temperatura – Consumo de gas.
En una ciudad del norte de la costa colombiana fue registrada la temperatura
media del día y la cantidad de gas consumida en algunas de las residencias. Los
datos están representados en la siguiente tabla. Para estudiar la relación entre la
temperatura y el consumo de gas
X Temperatura Y Volumen de
Media - oC Gas consumido
– cm3
3 7
6 5
3 8
1 8
5 7
7 5
9 4
13 3
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las
variables
En conclusión, podemos
determinar que existen
correlación entre las
variables su dirección es
negativa y la fuerza o
intensidad es fuerte.
8
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESTADÍSTICA DESCRIPTIVA
b. Encuentre el modelo matemático que permite predecir el efecto de una variable
sobre la otra. ¿Es confiable?
Respuesta
El modelo matemático que nos permite predecir el efecto es Y=a+bx, Esta es una
herramienta muy confiable ya que permite determinar el comportamiento de las
variables si se halla de manera adecuada.
c. Determine el grado de relación de las dos variables.
Respuesta
a= -0,467800729
b= 8,623329283
X Temperatura Y Volumen de Gas
o
Media - C consumido – cm3 grado de Relación
3 7 25,40218712
6 5 51,27217497
3 8 25,40218712
1 8 8,155528554
5 7 42,64884569
7 5 59,89550425
9 4 77,14216282
13 3 111,63548
d. Determine el Volumen de gas consumido si la temperatura media llega a ser -1
grado o C?
Respuesta
El volumen de gas consumido cuando la temperatura es –1 o C es de -
9,091130012, ya que se aplica la formula Y=a+bx.
9
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESTADÍSTICA DESCRIPTIVA
1.2. X-Y Montaje – Horas de trabajo.
En una empresa se desea verificar si la calidad de los computadores con defectos
de montaje tiene relación con las horas trabajadas por día.
Los siguientes datos representan dicha situación:
Computado
res con
10 9 8 5 9 8 6 7 9 10
defectos
(Y)
Horas de
15 13 11 7 12 11 8 10 13 13
trabajo (X)
a. Identifique la variable dependiente (y) y la variable independiente (x), realice el
diagrama de dispersión y determine el tipo de asociación entre las variables
En conclusión,
podemos determinar
que existen
correlación entre las
variables su
dirección es positiva
y la fuerza o
intensidad es fuerte.
b. Encuentre el modelo matemático que permite predecir el efecto de una variable
sobre la otra. ¿Es confiable?
Respuesta
El modelo matemático que nos permite predecir el efecto es Y=a+bx, Esta es una
herramienta muy confiable ya que permite determinar el comportamiento de las
variables si se halla de manera adecuada.
10
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESTADÍSTICA DESCRIPTIVA
c. Determine el grado de correlación de las dos variables.
Respuesta
a= 0,659889094
b= 0,643253235
d. ¿Cuál será la cantidad de computadores con defectos producidas si un trabajador
labora 6 horas?
Respuesta
La cantidad de computadores con defectos producidas cuando una trabajador labora
durante 6 horas es 4,519408503, ya que se aplica la formula Y=a+bx.
1.3. Temperatura – Enfermedad respiratoria.
En una investigación realizada durante el mes de agosto en un hospital pediátrico
respecto a la relación de la temperatura ambiente media y los casos de
enfermedad registrados se obtuvieron los siguientes datos
Casos de
Temperatura
enfermedad
Media °C
respiratoria
9 28
11 26
14 22
15 22
17 22
18 16
20 12
21 6
22 6
11
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESTADÍSTICA DESCRIPTIVA
1. Realice el diagrama de dispersión y determine el tipo de asociación entre las
variables.
En conclusión, podemos
determinar que NO existen
correlación entre las
variables su dirección es
positiva y la fuerza o
intensidad es fuerte.
2. Ajuste un modelo matemático que permita predecir el efecto de una variable
sobre la otra. ¿Es confiable?
Respuesta
El modelo matemático que nos permite predecir el efecto es Y=a+bx, Esta es una
herramienta muy confiable ya que permite determinar el comportamiento de las
variables si se halla de manera adecuada.
3. Determine el porcentaje de explicación del modelo y el grado de relación de las
dos variables.
Respuesta
a= -1,733333333
b= 46,08888889
4. ¿Cuál será el número de casos esperados de enfermedad respiratoria en el
hospital, si la temperatura cae a 7 °C?
Respuesta
El número de casos esperados de enfermedad respiratoria en el hospital a una
temperatura de 7 °C es de 320,8888889, ya que se aplica la formula Y=a+bx.
12
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESTADÍSTICA DESCRIPTIVA
Análisis y conclusiones, a partir de los resultados obtenidos y aplicados al
problema o situación estudiada
Identificar dos variables cuantitativas de la situación estudiada que puedan estar
relacionadas e identificar la variable dependiente e independiente.
- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación
entre las variables.
En conclusión,
podemos determinar
que NO existen
correlación entre las
variables su
dirección es negativo
y la fuerza o
intensidad es suave.
- Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra. ¿Es confiable?
Respuesta
El modelo matemático que nos permite predecir el efecto es Y=a+bx, Esta es una
herramienta muy confiable ya que permite determinar el comportamiento de las
variables si se halla de manera adecuada.
13
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESTADÍSTICA DESCRIPTIVA
- Determine el grado de correlación de las dos variables.
Respuesta
a= - 0,008647979
b= 2,446574709
- Relacionar la información obtenida con el problema.
las horas de dedicación a Internet no tiene correlación con las horas que trabaja por
semana, ya que como se puede ver en el diagrama de dispersión no tiene una secuencia
lineal.
14
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESTADÍSTICA DESCRIPTIVA
Conclusiones
✓ Los conceptos antes mencionados han sido analizados e investigados de tal
manera de hacer más fácil su comprensión y entendimientos ya que la estadística
es la ciencia que trata de entender, organizar y tomar decisiones que estén de
acuerdo con los análisis efectuados.
✓ La estadística juega un papel muy importante en nuestras vidas, ya que actualmente
ésta se ha convertido en un método muy efectivo para describir con mucha precisión
los valores de datos económicos, políticos, sociales, psicológicos, biológicos y físicos,
además, sirve como herramienta para relacionar y analizar dichos datos.
✓ La estadística trata en primer lugar, de acumular la masa de datos numéricos
provenientes de la observación de multitud de fenómenos, procesándolos de forma
razonable. Mediante la teoría de la probabilidad analiza y explora la estructura
matemática subyacente al fenómeno del que estos datos provienen y, trata de sacar
conclusiones y predicciones que ayuden al mejor aprovechamiento del fenómeno.
15
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESTADÍSTICA DESCRIPTIVA
Bibliografía
Ortegón Pava, M. (2017). Ova_Medidas_Univariantes.Colombia.Recuperado
de http://hdl.handle.net/10596/11579
Montero, J. M. (2007). Características de Una Distribución de Frecuencias. Statistical
Descriptive. Cengage Learning Paraninfo, S.A. (pp 41-50). Recuperado de
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&
p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0
Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. (pp 151 –
158). Recuperado
de http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&
p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219
Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City:
Cengage Learning. (pp 675–686). Recuperado de
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&u=unad&it=r&
p=GVRL&sw=w&asid=e5
Matus, R., Hernández, Martha, and García, E (2010). Estadística. México, D.F., MX:
Instituto Politécnico Nacional, (2010). ProQuest ebrary. (pp 95-109). Recuperado de
http://site.ebrary.com/lib/unadsp/reader.action?ppg=12&docID=10365616&tm=147
1981556569
Sánchez, S. E. A., Inzunza, C. S., & Ávila, A. R. (2015). Probabilidad y estadística 1.
Distrito Federal, MÉXICO: Grupo Editorial Patria. (pp 99-109) Recuperado de
http://site.ebrary.com/lib/unadsp/reader.action?ppg=6&docID=11230886&tm=1471
982022168
16