Paso 5 -Presentación de resultados
Presentado Por:
EMMA MARIA AROCA C.C.: 39070092
ANDREA MARCELA MORA
EDINSON MANUEL MARTINEZ
AURA ESTRELLA SAUMETH
RUTH TATIANA MONTES
Tutor:
CARLOS AUGUSTO GONZALEZ
Grupo: 204040_163
Universidad Nacional Abierta y a Distancia - UNAD
Escuela de Ciencias Básicas, Tecnología e Ingeniería
CCAV – PLATO Mayo 2019
Introducción
INTRODUCCION
El presente trabajo se refiere al análisis realizado a los indicadores socio
económicos de una muestra de 125 municipios de zonas vulnerables por
pobreza, violencia y ausencia del estado en Colombia entre marzo y
abril del 2016; para determinar dicho nivel socio económico se ha
realizado un profundo estudio de las distintas variables en lo
transcurrido del periodo académico del curso Estadística Descriptiva.
La actividad se constituye como un proceso de determinación de cuanto
incluye cada variable en la situación presentada; para lo cual se utilizan
distintas herramientas como diagramas de dispersión, tablas de
frecuencias, entre otros, que facilitan la compresión de los datos
permitiendo identificar las variaciones de los mismos.
A continuación, llegaremos a diferentes conclusiones, respecto a los
resultados obtenidos con cada uno de los ejercicios.
.
Justificación
El ejercicio facilita la interpretación analítica y grafica de la situación
para ello se utilizan variadas herramientas, el cual buscan disponer la
mayor cantidad de información para ser puesta en tela de juicio.
Realizar este ejercicio enseña una parte fundamental de cualquier
carrera o trabajo de campo que se pueda ejercer. El análisis y
presentación de resultados es campo fundamental de la vida laboral.
.
Objetivos
Reconocer los fundamentos básicos de la Estadística Descriptiva y las
etapas dentro de una investigación, por medio de datos tomados de un
fenómeno real, del nuestro entorno.
Aplicar las medidas estadísticas univariantes, en la solución de
diferentes problemas.
Aplica las medidas estadísticas bivariantes, en función de la
problemática de estudio.
A continuación, encontrará cuatro actividades para desarrollo
colaborativo, para esto debe participar activamente en el foro,
presentando aportes significativos y pertinentes para el desarrollo de la
actividad asignada.
Actividad 1. Ajuste de datos.
Descripción de la actividad.
Para dar inicio a su trabajo, el grupo deberá ajustar la base de datos
“Indicadores socioeconómicos 115 municipios (2019) 16-4”
trabajada en el periodo, la cual se encuentra en el entorno de
aprendizaje colaborativo, en la carpeta: guía de actividades y rúbrica de
evaluación - Paso 2– organización y presentación, el grupo dejará sólo
los primeros 50 datos en cada una de las variables y procederá a
procesarlos como una muestra de la base original.
Actividad 2. Procesamiento de variables
Descripción de la actividad.
Una vez ajustada la base de datos, el grupo deberá tomar mínimo cinco
variables (al menos dos cualitativas, una cuantitativa discreta y una
cuantitativa continua) y procesará para cada variable la información
solicitada a continuación:
Variable cualitativa
Para el desarrollo de esta actividad, es necesario que el grupo revise en
el Entorno de conocimiento (Unidad 1), las siguientes referencias:
Montero, J. M. (2007). Características de Una Distribución de
Frecuencias. Statistical Descriptive. Cengage Learning Paraninfo, S.A.
Página 4 – 10
OVI. Pacheco, P. N., Vergara, S .C (2013). Universidad Nacional de
Colombia. Bogotá. Estadística Fundamental.
Descripción de la actividad
Caracterizar la variable cualitativa presentando: tabla de frecuencias,
diagrama de barras o circular, moda, tabla de contingencias y
conclusiones.
Los cálculos de los parámetros los podrán realizar con el programa Excel
o Infostat,
Las Variables cualitativas escogidas son el tipo de riesgo al que se
expone la población y el grado de Marginación.
Tipo de Riego al que
se expone la
población frecuencia
Movimientos en masa 11
Sequías 5
Vulcanismos 9
Heladas 4
Sismos 11
Avenidas torrenciales 7
Desbordamientos 3
Total 50
Tipo de Riesgo al que se expone la
población
Desbordamientos; 3
Avenidas torrenciales; Movimientos en masa;
7 11
Sequías; 5
Sismos; 11
Vulcanísmos; 9
Heladas; 4
La moda: Son Las variables Movimientos en masa y Sismos.
Tabla de Contingencia:
GRADO DE MAGINACIÓN
Muy alto Alto Medio Bajo Muy bajo
Movimiento en masa 1 7 2 1
QUE SE EXPONE LA
TIPO DE RIESGO AL
Sequía 2 2 1
POBLACIÓN
Vulcanismo 1 5 3
Heladas 1 3
Sismo 1 4 5 1
Avenidas torrenciales 3 3 1
Desbordamientos 1 2
Conclusiones: De la elaboración de la tabla de contingencia se puede
concluir que la población que está expuesta a mayor riesgo es la de
grado de marginación medio y el riesgo asociado es el de movimiento en
masa.
Variable cuantitativa Discreta y Continua
Para el desarrollo de esta actividad, es necesario que el grupo revise en
el Entorno de conocimiento (Unidad 2 y 3), las siguientes referencias:
García, J. E (2005). Análisis de Datos [Link] al. Madrid:
Paraninfo. Página 26 -42
Montero, J. M. (2007). Características de Una Distribución de
Frecuencias. Statistical Descriptive. Cengage Learning Paraninfo, S.A.
Páginas 41-50
Montero, J.M. (2007). Regresión y Correlación Simple. Madrid:
Paraninfo. Paginas. 151 – 158
Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple.
México City: Cengage Learning. Páginas 675 – 686
Descripción de la actividad
Para la variable discreta elegida, se deberán calcular las medidas
univariantes de tendencia central: Media, Mediana, Moda. Todos los
cuartiles. Así mismo deberán calcular las medidas univariantes de
dispersión: Rango, Varianza, Desviación típica y Coeficiente de
variación.
Población Población
de 15 años de 15 años
o más sin o más sin
ሺܺ െതሻ
ܺ ሺܺ െതሻଶ
ܺ ሺܺ െതሻ
ܺ ሺܺ െതሻଶ
ܺ
N° Educación N° Educación
básica básica
primaria primaria
completa completa
1 678 -7.286,74 53.096.579,83 26 5585 -2.379,74 5.663.162,47
2 816 -7.148,74 51.104.483,59 27 6058 -1.906,74 3.635.657,43
3 1278 -6.686,74 44.712.491,83 28 6211 -1.753,74 3.075.603,99
4 1503 -6.461,74 41.754.083,83 29 6549 -1.415,74 2.004.319,75
5 1569 -6.395,74 40.905.490,15 30 6581 -1.383,74 1.914.736,39
6 1653 -6.311,74 39.838.061,83 31 6784 -1.180,74 1.394.146,95
7 1809 -6.155,74 37.893.134,95 32 7033 -931,74 868.139,43
8 1942 -6.022,74 36.273.397,11 33 7094 -870,74 758.188,15
9 2042 -5.922,74 35.078.849,11 34 7178 -786,74 618.959,83
10 2232 -5.732,74 32.864.307,91 35 7578 -386,74 149.567,83
11 2279 -5.685,74 32.327.639,35 36 7852 -112,74 12.710,31
12 2311 -5.653,74 31.964.775,99 37 8352 387,26 149.970,31
13 2960 -5.004,74 25.047.422,47 38 9159 1.194,26 1.426.256,95
14 3030 -4.934,74 24.351.658,87 39 9479 1.514,26 2.292.983,35
15 3192 -4.772,74 22.779.047,11 40 10054 2.089,26 4.365.007,35
16 3235 -4.729,74 22.370.440,47 41 12072 4.107,26 16.869.584,71
17 3240 -4.724,74 22.323.168,07 42 12178 4.213,26 17.751.559,83
18 3248 -4.716,74 22.247.636,23 43 13875 5.910,26 34.931.173,27
19 3697 -4.267,74 18.213.604,71 44 14404 6.439,26 41.464.069,35
20 3906 -4.058,74 16.473.370,39 45 16352 8.387,26 70.346.130,31
21 3940 -4.024,74 16.198.532,07 46 17058 9.093,26 82.687.377,43
22 4135 -3.829,74 14.666.908,47 47 17366 9.401,26 88.383.689,59
23 4202 -3.762,74 14.158.212,31 48 17995 10.030,26 100.606.115,67
24 4663 -3.301,74 10.901.487,03 49 23680 15.715,26 246.969.396,87
25 4854 -3.110,74 9.676.703,35 50 73296 65.331,26 [Link],19
Medidas Univariantes de Tendencia
Central
Media: 7.964,74
Media
N
∑ Xj 398.237
j=1
X= = =¿
N 50
X =7.964,74
Mediana:
Mediana
Mediana= X 25=4.854
Mediana=4.854
Moda:
No existe la moda porque
ningún dato se repite
Cuartiles:
Primer Cuartil (Q1)
1 1
Q1= ( X 12+ X 13) = ( 2.311+ 2.960 )=¿
2 2
Q1=2.635,5
Segundo Cuartil (Q2)
Q2=Mediana=4.854
Tercer Cuartil (Q3)
1 1
Q3= ( X 37+ X 38 )= ( 8.352+9.159 )=¿
2 2
Q 3=8.759
Medidas univariantes de
dispersión:
Rango (R)
R=X 50−X 1=73.296−678=¿
R=72.618
Varianza (s2):
N
∑ (X i− X)2 5.713.733 .527,62
2 i=1
s= = =¿
N 50
2
s =114.274 .670,55
Desviación típica(s=)
s= √ s
2
s= √114.274 .670,55=¿
s=10.689,93
Coeficiente de variación (V)
s 10.689,93
V= = =¿
X 7.964,74
V =1,34
Para la variable continúa elegida, se deberán calcular las medidas
univariantes de tendencia central: Media, Mediana, Moda. Todos los
cuartiles Así mismo deberán calcular las medidas univariantes de
dispersión: Rango, Varianza, Desviación típica y Coeficiente de
variación.
Los cálculos de los parámetros los podrán realizar con el programa Excel
o Infostat,
% de % de
Población de Población de
N° 15 años o N° 15 años o
más más
analfabeta analfabeta
1 2,11 26 8,14
2 3,46 27 8,20
3 3,79 28 8,27
4 4,01 29 8,31
5 4,18 30 8,31
6 4,23 31 8,52
7 4,80 32 9,20
8 4,89 33 9,43
9 5,14 34 9,55
10 5,16 35 9,57
11 5,24 36 9,80
12 5,45 37 10,13
13 5,52 38 10,13
14 5,66 39 10,18
15 5,83 40 10,56
16 6,38 41 10,82
17 6,50 42 10,95
18 6,81 43 11,02
19 7,13 44 11,27
20 7,16 45 11,36
21 7,17 46 13,77
22 7,45 47 14,57
23 7,57 48 16,18
24 7,91 49 17,09
25 7,98 50 19,47
Fórmula de Sturges
c=1+3,322∗log ( N )
c=1+3,322∗log ( 50 )=¿
c=6,64 ≈ 7 clases
Amplitud (a)
Mayor−menor
a= =¿
c
19,47−2,11
a= =¿
7
a=2,48
Distribución de frecuencias
% de Población de 15
frecuencias
años o más analfabeta
2,10 4,58 6
4,59 7,07 12
7,08 9,56 16
9,57 12,05 11
12,06 14,54 1
14,55 17,03 2
17,04 19,52 2
50
Medidas Univariantes de Tendencia Central
Media:
N
∑ f i Xi 423,47
i=1
X= = =¿
N 50
X =8,47
Mediana
Mediana=L1 +¿
donde:
L1: Límite inferior de la clase mediana
N: número de datos (frecuencia total)
¿ ¿: suma de las frecuencias de las clases inferiores a la clase mediana
fmediana: frecuencia de la clase mediana
c: anchura del intervalo de la clase mediana
La clase mediana es la tercera clase:
( )
50
−18
2
Mediana=7,08+ ∗2,49=¿
16
Mediana=8,17
La Moda
Moda=L1+ (∆1
∆1 +∆ 2)∗c
L 1: Frontera inferior de la clase modal
∆ 1: Exceso de la frecuencia modal sobre la clase inferior inmediata
∆ 2: Exceso de la frecuencia modal sobre la clase superior inmediata
c: anchura del intervalo de la clase modal
La clase modal es la tercera clase
Moda=7,075+
4
( )
5+ 4
∗2,49=¿
Moda=8,18
Cuartiles
Primer Cuartil (Q1)
Q 1=L1 +¿
donde:
L1: Límite inferior de la clase cuartil
Varianza (s2)
N
∑ (X j−XTípica
Desviación )
2
(s):
211,95
2 j=1
s = s= √ s2 =√ 4,24
= =¿
N 50
s=2,06
2
s =4,24
Regresión y correlación entre variables cuantitativas
Identificar dos variables cuantitativas de la situación estudiada que puedan estar
Coeficiente de Variación (V):
s 2,06
V= = =¿
X 8,47
V =0,24
relacionadas y:
a. Realizar el diagrama de dispersión de dichas variables y determinar el tipo de
asociación entre las variables.
Medidas de Dispersión:
Rango (R)
R=Mayor−menor=¿
R=19,47−2,11=¿
R=17,36
Diagrama de dispersión
8
cantidad de servicios publicos
7 f(x) = 6.54441836333592E-06 x + 3.19791594387531
R² = 0.140547307565631
6
disponibles 5
4
3
2
1
0
0 100 000 200 000 300 000 400 000 500 000 600 000 700 000 800 000
poblacion total (habitantes)
Podemos concluir según el diagrama que si existe correlación entre las dos
variables, que su dirección es positiva
b. Encontrar el modelo matemático que permite predecir el efecto de una
variable sobre la otra. ¿Es confiable?
y=7E-06x+3,1979
R² = 0,1405
la intensidad se puede denominar débil, por lo tanto, no es confiable
c. Determinar el grado de relación de las dos variables
r: 0,3748964
la correlación entre las variables es mínima
d. Relacionar la información obtenida con el problema.
Podemos determinar que según la cantidad de población se puede determinar la
cantidad de servicios públicos disponibles, donde según el grado de correlación
lineal se determina que el grado de correlación es mínima.
e. Realizar regresión múltiple en caso de que se determine dependencia entre las
variables cuantitativas.
Resumen
Estadísticas de la regresión
Coeficiente de0,41406899
correlación múltiple
Coeficiente de0,17145313
determinación R^2
R^2 ajustado 0,13619582
Error típico 3,32155862
Observaciones 50
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 2 107,302549 53,6512743 4,86290963 0,01203515
Residuos 47 518,539329 11,0327517
Total 49 625,841877
Superior 95,0% Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95,0%Superior 95,0%
Intercepción 10,7555246 1,11694065 9,62945048 1,0678E-12 8,50852989 13,0025194 8,50852989 13,0025194
Variable X 1 -8,0571E-06 5,4372E-06 -1,48184474 0,14505565 -1,8995E-05 2,8812E-06 -1,8995E-05 2,8812E-06
Variable X 2 -0,61933089 0,31147141 -1,98840366 0,05260798 -1,24593054 0,00726876 -1,24593054 0,00726876
y=10,75-8,057X1-0,619X2
En los datos obtenidos se observa que partir del coeficiente de correlación r2 que nos da un
valor de 0,136 un valor que se encuentra entre menor a 0,30 y nos muestra que la relación
que existe entre las variables múltiples según el grado de correlación lineal en nula lo que
quiere decir que no hay correlación entre las variables múltiples.
Actividad 3. Propuesta de solución a la problemática
Descripción de la actividad.
Finalmente, el grupo deberá responder a la pregunta: ¿Qué alternativa
de solución plantea para la problemática estudiada?, dicha respuesta
deberá estar justificada descriptivamente, es decir para ello (utilizará
tablas, gráficos, medidas, diagramas, entre otros) a partir de los
resultados estadísticos descriptivos realizados en la actividad anterior
(50 primeros datos) y la información obtenida de la problemática
planteada.
Del diagrama estadístico Tipo de Riesgo al que se Expone la Población se
desprende que la población con mayor exposición los Riesgos están
asociados con Movimiento de Masas y Sismos. De la tabla de
contingencia entre el Grado de Marginación y Tipo de Riesgo al que se
expone la población se desprende que la población expuestas los
Riesgos de Movimiento en Masas y Sismos tienen un grado de
marginación medio y bajo, es decir que están próximos a salir de la
condición de marginalidad lo que los motivará a mudarse a zonas mas
seguras. En cuanto a la población de 15 años o mas sin educación
básica completa se puede notar que el promedio de los municipios es de
7.965 el cual es un número manejable, que se pueden identificar y
reinsertarlos al sistema educativo con el objeto de especializar la mano
de obra. De la tabla de distribución del %Población con 15 años o mas
analfabeta se nota que esta concentrada en ciertos municipios ya que la
media, la mediana y la moda tienen valores muy parecido lo que es
indicativo de la concentración de los datos asi como el coeficiente de
variación es bajo. Esto sugiere que las políticas públicas deben dirigirse
a esos lugares con el objeto de combatir esa debilidad en nuestra
población. En cuanto a la relación entre la Población y la Población
mayor de 15 años completa se nota que están altamente relacionadas
como lo explica el coeficiente de determinación y la correlación, lo que
puede decirse que la población de 15 años o mas sin educación básica
completa es una parte de la población que guarda proporción en todos
los lugares habitados.
Actividad 4. Consolidación de informe descriptivo
Descripción de la actividad.
Hay 34 municipios cuyo % de la población ocupada con ingresos de
hasta 2 salarios mínimos se encuentra entre 42,92 % y 51,07 % con
una media de 46,99 % lo que indica que una cantidad importante de la
población tiene esos ingresos.
Hay 6 municipios cuyo % de la población ocupada con ingresos de hasta
2 salarios mínimos se encuentra entre 18,45 % y 26,61 % con una
media de 22,53 % lo que es indica menores ingresos.
Los resultados obtenidos indican que el promedio de la población de los
125 municipios de Colombia la población ocupada con ingreso hasta 2
salarios mínimos es 43,49% lo que se puede considerar bastante
aceptable teniendo en cuenta que la mayoría de la población debe ganar
solamente el salario mínimo.
Los valores de moda y media están muy cercanos al promedio lo que
indican que la mayoría de los datos se encuentran muy cerca del valor
promedio.
Esto también aparece reflejado en los resultados obtenidos en las
medidas de dispersión que para el rango o amplitud de los datos los
valores muestran poca dispersión.
Se puede concluir que el porcentaje de la población ocupada con
ingresos hasta 2 salarios mínimos es cercano a la mitad en los 125
municipios.
Conclusiones
La cantidad de información que se desprende de la realización de los
estudios estadísticos es muy completa y nos da una idea exacta de la
situación que nos permite tomar las decisiones adecuadas que conducen
a las soluciones de los problemas de una población
La la Estadística contribuye a documentar los datos y extraer
información que no es posible conocerla con solamente leer los datos.
Cada estadístico nos da una información específica que nos permite
interpretar la realidad de la información recolectada para el momento
que se hizo el estudio.
Referencias Bibliográficas
Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo
Churchill, G.A. (2009). "Análisis de Regresión Múltiple." Investigación de
mercados. México City: Cengage Learning.