Integrantes:
Liz Genyuri Montero Gómez
CARRERA
Ingeniería ambiental
SEMESTRE
Sexto
Nombre del Docente
JESÚS ARMANDO FAJARDO
UNIVERSIDAD MANUELA BELTRÁN
UNIDAD VIRTUAL
BOGOTÁ
2020
PARTE 1. ESTADÍSTICA : A Para los datos de la tabla obtenga medidas de centralización
(Media, Mediana y Moda) y dispersión (Desviación Estándar y Varianza).
Moda: Para calcular la moda se tendrá en cuenta que esta medida de tendencia central es el
valor que tiene mayor frecuencia, entonces:
Se tienen 100 estudiantes de los cuales cada uno tiene su respectiva nota es decir se tienen
100 datos de calificaciones, por lo cual partiendo de la tabla se identificará el valor que mas
se repite como se muestra en la siguiente tabla:
Tabla 1.
Calificación veces repetidas
81 7
63 6
72 6
68 5
69 5
70 5
83 5
66 4
79 4
82 4
88 4
61 3
64 3
71 3
74 3
75 3
76 3
84 3
85 3
86 3
87 3
89 3
62 2
67 2
73 2
80 2
60 1
65 1
77 1
78 1
Como se puede observar se analizaron los datos y se clasificaron de mayor a menor,
presentando una mayor repetitividad en los estudiantes de la calificación de 81, 7 veces y la
menor 60, 65,77,78 con 1 vez. Es decir que la moda de esta tabla es 81.
Mediana
Partiendo de su definición se sabe que la mediana es el valor que ocupa la posición central
del conjunto de datos, los cuales han sido previamente ordenados de manera creciente o
decreciente. Entonces.
1. Se organizarán los datos de las calificaciones del dato menor al mayor:
60 61 61 61 62 62 63 63 63 63 63 63 64 64 64 65 66 66 66 66 67 67 68 68 68 68 68 69
69 69 69 69 70 70 70 70 70 71 71 71 72 72 72 72 72 72 73 73 74 74 74 75 75 75 76 76
76 77 78 79 79 79 79 80 80 81 81 81 81 81 81 81 82 82 82 82 83 83 83 83 83 84 84 84
85 85 85 86 86 86 87 87 87 88 88 88 88 89 89 89
2. Como la totalidad de los datos es número par se escogerán los dos centrales en este
caso 74 y 74 se suman y se dividen entre 2.
74+74
Me = = 74
2
Media
La media o promedio se determinando sumando todos los datos y este valor obtenido se
divide por la cantidad de datos, es decir:
60 + 61+ 61+ 61+ 62 +62 +63 +63 +63 +63 +63+ 63 +64 +64 +64 +65 +66 +66 +66 +66
+67+ 67 +68+ 68+ 68 +68 +68 +69 +69 +69 +69 +69 +70 +70 +70 +70 +70 +71 +71
+71+ 72+ 72+ 72+ 72+ 72+ 72+ 73 +73 +74 +74 +74 +75 +75 +75 +76 +76 +76 +77
+78+ 79 +79 +79 +79 +80 +80 +81+ 81+ 81 +81 +81 +81 +81 +82 +82 +82 +82+ 83
+83 +83+ 83+ 83+ 84+ 84 +84 +85 +85 +85 +86 +86 +86 +87 +87 +87 +88 +88 +88
+88+ 89+ 89+ 89
100
= 7487/100 = 74.87
Media: 74,87
MEDIDAS DE DISPERSIÓN
Desviación estándar
Para aplicar la desviación estándar muestreal se utilizará la siguiente ecuación debido a que
se tienen los datos de todos los estudiantes que aplicaron a la prueba:
∑(𝑥−ẍ)^2
δ=√
𝑁−1
Donde:
x= los valores
ẍ= Promedio
N= Valor de datos
δ=
(60 − 74.87)2 + ((61 − 74.87)2 ∗ 3) + ((62 − 74.87)2 ∗ 2) + ((63 − 74.87)2 ∗ 6) + ((64 − 74.87)2 ∗ 3) + ((65 − 74.87)2 ) + ((66 − 74.87)2 ∗ 4) + ((67 − 74.87)2 ∗ 2)((68 − 74.87)2 ∗ 5)((69 − 74.87)2 ∗ 5)((70 − 74.87)2 ∗ 5)((71 − 74.87)2 ∗ 3)((72 − 74.87)2 ∗ 6)
√
100 − 1
+((73 − 74.87)2 ∗ 2) + ((74 − 74.87)2 ∗ 3) + ((75 − 74.87)2 ∗ 3) + ((76 − 74.87)2 ∗ 3) + ((77 − 74.87)2 ) + ((78 − 74.87)2 )((79 − 74.87)2 ∗ 4)((80 − 74.87)2 ∗ 2)((81 − 74.87)2 ∗ 7)((82 − 74.87)2 ∗ 4)((83 − 74.87)2 ∗ 5)
√
100 − 1
+((84 − 74.87)2 ∗ 3) + ((85 − 74.87)2 ∗ 3) + ((86 − 74.87)2 ∗ 3) + ((87 − 74.87)2 ∗ 3) + ((88 − 74.87)2 ∗ 4) + ((89 − 74.87)2 ∗ 3) = 8,46
√
100 − 1
Varianza
Para calcular la varianza simplemente elevaremos la desviación estándar al cuadrado representado por S2
S2 = 8,462
S2 = 71,5
B. Construya una tabla de frecuencias y grafique los resultados.
A continuación, se mostrará la tabla de frecuencias donde:
Xi: Cantidad de datos
fi: frecuencia absoluta
𝑓𝑖
fr: Frecuencia relativa = 𝑁
%: Porcentaje = fr*100
F: Frecuencia absoluta acumulativa
Tabla 2
Grafica 1
Distribución de notas
7
6
5
FRECUENCIA
4
3
2
1
0
60 62 64 66 68 70 72 74 76 78 80 82 84 86 88
CALIFICACIONES
Análisis de datos
De acuerdo a los datos obtenidos en primera estancia se puede observar en la gráfica los
estudiantes tienen un conocimiento medio alto referente a Colombia ya que se presenta una
frecuencia mas alta en las notas de tipo medio, aunque se debe resaltar que 7 estudiantes
tuvieron una nota alta el cual fue el mayor número de estudiantes en tener repetida esta nota.
Esto se respalda con la desviación estándar que arrojo un resultado de 8,46 frente a una media
de 74,87 es decir, que tiene una dispersión de datos baja.
PARTE 2. ESTADÍSTICA CORRELACIONAL (Desarrollar teniendo en cuenta los datos
suministrados en la tabla 2).
Calcule matemáticamente el coeficiente de correlación de los datos. Debe presentar el
procedimiento matemático de forma detallada, pues se evaluará todo el desarrollo.
Para calcular el coeficiente de correlación se utilizará la siguiente ecuación:
∑(𝑋−ẍ)(𝑌−ẏ)
r=
√∑(𝑋−ẍ)2 √∑(𝑌−ẏ)2
Y para satisfacerla se realizo la tabla que contiene todos los datos respectivos
Tabla 3.
Presión atmosférica Temperatura
Y X (X-ẍ) (Y-ẏ) (X-ẍ)2 (Y-ẏ)2 (X-ẍ)(Y-ẏ)
9 0,5 -0,23307692 0,76153846 0,05432485 0,57994083 -0,17749704
9,4 0,5 -0,23307692 1,16153846 0,05432485 1,3491716 -0,27072781
7,4 1,23 0,49692308 -0,83846154 0,24693254 0,70301775 -0,41665089
9,7 1 0,26692308 1,46153846 0,07124793 2,13609467 0,39011834
10,4 0,3 -0,43307692 2,16153846 0,18755562 4,67224852 -0,93611243
5 1,5 0,76692308 -3,23846154 0,58817101 10,4876331 -2,48365089
6,7 1 0,26692308 -1,53846154 0,07124793 2,36686391 -0,41065089
8,4 0,5 -0,23307692 0,16153846 0,05432485 0,02609467 -0,03765089
8 0,5 -0,23307692 -0,23846154 0,05432485 0,05686391 0,05557988
10 0,5 -0,23307692 1,76153846 0,05432485 3,10301775 -0,41057396
9,2 0,5 -0,23307692 0,96153846 0,05432485 0,92455621 -0,22411243
6,2 1 0,26692308 -2,03846154 0,07124793 4,15532544 -0,54411243
7,7 0,5 -0,23307692 -0,53846154 0,05432485 0,28994083 0,12550296
107,1 9,53 1,61667692 30,8507692 -5,34053846
Promedio ẏ=8,238461538 ẍ=0,73307692
N datos 13
Reemplazando en la ecuación:
−5,34053846
R= = -0,756
√(1,616677692) √(30,8507692)
Realice regresión lineal para hallar la ecuación de la recta que relaciona los datos.
La ecuación para calcular la ecuación de la recta es:
Y= ax+b para lo cual se deben calcular los coeficientes a y b con las ecuaciones planteadas
a continuación:
𝑁∗∑𝑥𝑦−∑𝑥∗∑𝑦
a=
𝑁∗∑𝑥 2 −(∑𝑥)2
∑𝑦−𝑎∑𝑥
b=
𝑛
Para satisfacer los requerimientos de las ecuaciones se realizo la siguiente tabla:
Tabla 4.
Presión atmosférica Temperatura
Y X X2 X*Y
9 0,5 0,25 4,5
9,4 0,5 0,25 4,7
7,4 1,23 1,5129 9,102
9,7 1 1 9,7
10,4 0,3 0,09 3,12
5 1,5 2,25 7,5
6,7 1 1 6,7
8,4 0,5 0,25 4,2
8 0,5 0,25 4
10 0,5 0,25 5
9,2 0,5 0,25 4,6
6,2 1 1 6,2
7,7 0,5 0,25 3,85
107,1 9,53 8,6029 73,172
Entonces
13∗73,172−9,53∗107,1
a= = -3.3
13∗8,6029−(9,53)2
107,1−(−3,3)∗9,53
b= 13
= 10,65
Reemplazando en la ecuación final:
Y= -3.3x+10,65
D. Realice una gráfica de dispersión y grafique la recta obtenida.
Grafica 2.
Variables Meteorológicas y = -3,3034x + 10,66
R² = 0,5718
12
10
Presión atmósferica
0
0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6
Temperatura
Analice los resultados obtenidos. Considere dentro de su análisis las siguientes preguntas:
¿cuál es el significado del coeficiente de correlación obtenido? ¿cuál es el significado del
signo del coeficiente de correlación?
En este caso se analizará la relación entre las variables de temperatura y presión atmosférica.
De acuerdo al resultado del coeficiente: -0,756 esto indica que existe una relación lineal alta
entre las variables, pero como el signo es negativo expresa que la relación es negativa, es
decir, a medida que aumenta la temperatura aumenta la presión o que a medida que disminuya
la presión la temperatura disminuirá.
REFERENCIAS
Ávila, R. (2018, octubre 4). Como fazer média, mediana e desvio padrão no Excel.
Recuperado 8 de mayo de 2020, de https://blog.luz.vc/es/excel/como-hacer-media-
mediana-y-desviaci%C3%B3n-patr%C3%B3n-excel/
Educativo, P. (s. f.). Media, moda, mediana, rango. Recuperado 8 de mayo de 2020, de
https://www.portaleducativo.net/octavo-basico/790/Media-moda-mediana-rango
Interpretar los resultados clave para Correlación - Minitab. (s. f.). Recuperado 8 de mayo
de 2020, de https://support.minitab.com/es-mx/minitab/18/help-and-how-to/statistics/basic-
statistics/how-to/correlation/interpret-the-results/key-results/
Módulo III. Determinación de la muestra, instrumentos de recolección de datos, estadística
descriptiva y correlacional. (2020). Universidad Manuela Beltrán. Bogotá, Colombia.