0% encontró este documento útil (0 votos)
117 vistas13 páginas

Estadistica Ii

Este documento presenta los resultados de un estudio estadístico realizado sobre una muestra de población. Se analizan variables como la edad y el nivel educativo de hombres y mujeres. Los resultados muestran que la distribución de edades en la muestra tiene una asimetría positiva, y que la mayoría de la población se encuentra entre los 0 y 50 años. También se encontró que el nivel educativo promedio de las mujeres es mayor que el de los hombres.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
117 vistas13 páginas

Estadistica Ii

Este documento presenta los resultados de un estudio estadístico realizado sobre una muestra de población. Se analizan variables como la edad y el nivel educativo de hombres y mujeres. Los resultados muestran que la distribución de edades en la muestra tiene una asimetría positiva, y que la mayoría de la población se encuentra entre los 0 y 50 años. También se encontró que el nivel educativo promedio de las mujeres es mayor que el de los hombres.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

ESTADISTICA II

JUNIO 28 DE 2018 Institución Universitaria Politécnico Grancolombiano

ESTADISTICA II

ESTUDIANTES

WILLIAM MAURICIO OSMA OSMA COD: 1320013602

RUTH ESPERANZA ALAYON COD: 1711982983

VIVIANA MARCELA GODOY RUBIO COD: 1521024528

JHON MANUEL SABOGAL PINZON COD: 1721982849

DOCENTE

ALBERTO BOADA RODRIGUEZ

ASIGNATURA – ESTADISTICA II

UNIVERSIDAD POLITÉCNICO: GRANCOLOMBIANO


FACULTAD DE CIENCIAS ADMINISTRATIVAS, ECONÓMICAS Y
CONTABLES

BOGOTÁ, D.C. - COLOMBIA

2018

INTRODUCCIÓN

En este trabajo se quiere identificar el tamaño de muestra utilizando diferentes


variables también queremos identificar si se puede evidenciar que la asimetría de
la distribución en la edad de la muestra de la población tiene un sesgo positivo, Se
quiere validar si la desviación estándar es alta entre las edades de 10 y 20,

Queremos determinar si existen diferencias entre los niveles de estudio de los


hombres y las mujeres en Colombia.

En relación a este trabajo vamos a mostrar Para todos los estimadores trabajados
las medidas descriptivas obtenidas son similares en magnitud a medida que
aumentaba el tamaño muestral.
Tamaño de muestra
Utilizando la variable edad (P6040), realice lo siguiente:
● Realice un histograma y describa la información según la forma y la curtosis de los
datos.

El en histograma se evidencia lo siguiente:

Clase Frecuencia
10 55
20 68
30 56
40 50
50 52
60 42
70 31
80 11
90 5
y mayor... 0
Histograma
80
70
60
50
Frecuencia

40 Frecuencia
30
20
10
0
10 20 30 40 50 60 70 80 90 y mayor...
Clase

En el histograma se puede evidenciar que la asimetría de la distribución en la edad de la


muestra de la población tiene un sesgo positivo, por lo cual la moda del conjunto de datos
es mayor a la mediana y la misma es mayor a la media, adicional a que la curtosis es
platicurtica dado que la frecuencia de los datos no cuenta con grandes variaciones.

 Realice una descripción numérica y descripción como es la población.

porcentaje de
Clase Frecuencia Análisis
participación
10 55 15% El 15% tiene una edad entre los 0 y 10 años
20 68 18% El 18% tiene una edad entre los 10 y 20 años
30 56 15% El 15% tiene una edad entre los 20 y 30 años
40 50 14% El 14% tiene una edad entre los 30 y 40 años
50 52 14% El 14% tiene una edad entre los 40 y 50 años
60 42 11% El 11% tiene una edad entre los 50 y 60 años
70 31 8% El 8% tiene una edad entre los 60 y 70 años
80 11 3% El 3% tiene una edad entre los 70 y 80 años
90 5 1% El 1% tiene una edad entre los 80 y 90 años
Total 370 100%  

Se puede evidenciar que la desviación estándar es alta por lo cual los datos no son
simétricos, de igual manera concluimos lo siguiente el 18% de la muestra de la población
tiene una edad de 10 a 20 años y que el 15% tiene entre 20 y 30 años, por otro lado el
28% entre 30 y 50 años, lo que nos indica que la mayoría de la población se ubica en una
edad menor a los 60 años, por lo cual podemos evidenciar que en los departamentos
analizados las edades más frecuentes son la niñez, la adolescencia, los adultos jóvenes y
los adultos, la menor cantidad está en los adultos mayores, donde también se evidencia
que la desviación estándar ya que los datos no son simétricos.

● Calcule una nueva variable que sea el

En cuanto a la realización de ala variable se tomo en cuenta lo siguiente:

Clase Frecuencia
5 67
10 121
15 125
20 57
y mayor... 0

Histograma
150
Frecuencia

100
Frecuencia
50

0
5 10 15 20 y mayor...
Clase

En el histograma de P6040NEW se puede evidenciar que la asimetría de la distribución en


la edad de la muestra de la población es normal, adicional a que la curtosis es
mesocúrtica dado que la frecuencia de los datos cuenta con variaciones medias.

● Teniendo en cuenta la variable anterior realice el cálculo del tamaño de muestra,


utilizando la siguiente fórmula:
Donde, se tiene lo siguiente:

Z: Es el cuantil de la distribución normal estándar al nivel de significancia que se


establezca.
S: Es la desviación estándar de la variable.

Es el margen de error absoluto.

Para el calculo de la muestra utilizo lo siguiente:

1.96 2∗20.882657
n0 = =320.891260
0.52

320.891260
n= =319.193763
320.891260
1+
60356

Así que la muestra a tomar es de 320.

Para calcular el tamaño de la muestra, utilice un nivel de confianza del 95% y un margen
de error de absoluto que no supere 0.5.
Z=1.96
S=4.5266
Margen de error de 0.5

1.96 2 4.52662
n0 = =314.8591
0.52
314.8591
n= =170.1048
314.8591
1+
370

Se tomará una muestra de 170

● Teniendo en cuenta los resultados anteriores, realice una selección de elementos


para una muestra, utilizando el algoritmo del coordinado negativo.
A cada individuo se le asigna una probabilidad aleatoria generada de una distribución
uniforme 0,1 luego se ordenan los datos de menor a mayor tomando como referencia la
probabilidad. Luego selecciono los 170 primeros datos

● Compara la media poblacional, con la media muestral y determine la variación


relativa.
Para calcular la variación relativa usamos:

s 20.524209
cv = ∗100 %= ∗100 %=59.1576 %
media muestral 34.69411
Vemos que la variación relativa es alta, por lo tanto, tenemos en esta nueva muestra
mucha variación de las edades, es decir los datos esta muy dispersos, ahora comparando
la edad poblacional con la edad muestral vemos que la muestral es mayor que la
poblacional, es decir, la edad promedio poblacional es de 33.5486 años y la muestral es
de 34.694 años, vemos que se incremento un poco la edad de esta nueva muestra.

Intervalo de confianza para dos variables numéricas


Un investigador, cree determinar que existen diferencias entre los niveles de estudio de
los hombres y las mujeres en Colombia. Para determinar lo anterior, se sugiere utilizar la
base de la hoja “muestra” y realizar lo siguiente:

● Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma


para los hombres y mujeres. Según los resultados, ¿Existen diferencias?

Cu
ent
a
de
P6
02
P6020 0
16
Hombre 3
20
Mujer 7
250

200

150
Escolaridad

100

50

0
Hombre Mujer

Como vemos el grado de escolaridad en las mujeres es mas alto que en los hombres
como vemos hay mas frecuencia de mujeres que hombres, posiblemente eso ayude a que
las mujeres tengas mayor escolaridad.

● Teniendo en cuenta lo anterior, realice un estudio descriptivo de ambas variables.


Realice lectura de resultados.

ESC Hombre ESC Mujeres

6,76687116 7,94685990
Media 6 Media 3
0,37448447 0,33454176
Error típico 8 Error típico 1
Mediana 6 Mediana 8
Moda 11 Moda 11
4,78109775 4,81321777
Desviación estándar 1 Desviación estándar 3
22,8588957 23,1670653
Varianza de la muestra 1 Varianza de la muestra 3
Curtosis -0,82165222 Curtosis -0,89303957
Coeficiente de Coeficiente de
asimetría 0,31210214 asimetría -0,09231937
Rango 18 Rango 19
Mínimo 0 Mínimo 0
Máximo 18 Máximo 19
Suma 1103 Suma 1645
Cuenta 163 Cuenta 207
Como vemos el la media del escolaridad de los hombres es menor que la de las
mujeres, ambos tiene desviaciones estándar muestrales muy similares.

● Asumiendo que los datos son normales, calcule un intervalo de confianza del 95%
y determine, la escolaridad de los hombres y de las mujeres de forma individual.
Intervalo de confianza para las mujeres:
4.8132
7.9468 ±T 207−1,0.025
√ 207
Calculado el t 206, 0.025=1.97de la tabla de la normal. Se tiene que el intervalo de
confianza con un nivel de significancia del 5% es de
1.97∗4.8132
7.9468 ±
√ 207
(7.2877,8.6058)

Intervalo de confianza para las Hombres:

4.7810
6.7668 ±T 163−1,0.025
√ 163
Calculado el t 162, 0.025=1.97de la tabla de la normal. Se tiene que el intervalo de
confianza con un nivel de significancia del 5% es de
1.97∗4.7810
6.7668 ±
√163
(6.0290,7.5045)

● Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95%
para la diferencia de los niveles de escolaridad para los hombres y mujeres.

4.81322 4.78102
7.9468−6.7668± t V ,0.025
Donde v=¿ ¿
√ 207
+
163

Se tiene que v es 349, y calculando la así que calculando t 349, ,0.025 =1.96 el intervalo de
confianza da que es:

4.81322 4.7810 2
1.18 ±1.96
√ 207
+
163
(0.1957,2.1642)

Prueba de hipótesis para dos variables nominales


Un investigador, cree determinar que los hombres asisten más a un colegio oficial que las
mujeres en Colombia. Para determinar lo anterior, se sugiere utilizar la base de la hoja de
“muestra” y realizar lo siguiente:

Antes de realizar las siguientes pregunta se planea la siguiente tabla para tener una mejor
comprensión sobre la información que se pretende investigar

Percepción del      
encuestado
Sexo No No Sí Total
Responde general
Hombre 12 118 33 163
Mujer 13 153 41 207
Total general 25 271 74 370

Ahora se planea la proporción


Percepción del      
encuestado
Sexo Sí No No Total
Responde general
Hombre 20,25% 72,39% 7,36 100,00%
%
Mujer 19,81% 73,91% 6,28 100,00%
%
Total general 20,00% 73,24% 6,76 100,00%
%

● Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175) y


sexo (P6020), realice un diagrama de barras comparativo para los hombres y
mujeres en un solo gráfico. Según los resultados, ¿Existen diferencias?
EL ESTABLECIMIENTO AL QUE ASISTE ... ¿ES OFICIAL?
80.00%

70.00% 72.39% 73.91%

60.00%

50.00% Sí
No Responde
40.00% No

30.00%

20.00%
20.25% 19.81%

10.00%
7.36% 6.28%
0.00%
Hombre Mujer

de la gráfica comparando hombres con mujeres, los que dicen que si que asistieron a un
colegio oficial (barra azul) es muy poca, para hombres es de 20.25%, mientras que las
mujeres es de 19,81%, esta diferencia muy pequeña, seguido tenemos la información de
los que “No Responde” esta tiene la proporción mas grande en ambos sexos, finalmente
los que responden “No” (barra gris) son muy poquitos en comparación con las otras
respuestas, en ambos notamos que la diferencia entre hombres y mujeres respondiendo a
esta pregunta es muy similar.

Para los siguientes puntos usaremos la fórmula:


^p∗(1− ^p )
^p ± Z α
2 √ n

Con Z 0.05 =1.96 n=370


2
● Con un nivel de confianza del 95%, realice una estimación de los hombres que
asisten a un establecimiento oficial.
Estimamos la proporción de hombres que afirman que asistieron a colegio oficial,
la información la tomamos de la tabla anterior

33
P= =0. 2025
163
0.2025∗(1−0.2025)
0. 2025 ±1.96
√ 163
El intervalo de confianza para la proporción de hombres es (0.1408,0 .2641)
Por lo tanto, con una confianza del 95% de que el intervalo de confianza contenga
el verdadero valor de la proporción de hombres que afirman que sí.

● Con un nivel de confianza del 95%, realice una estimación de las mujeres que
asisten a un establecimiento oficial.
41
P= =0.1981
207
0. 1981∗(1−0. 1981)
0. 1981± 1.96
√ 207
El intervalo de confianza para la proporción de mujeres es (0.1438 , 0.2523) lo cual
nos indica que con una confianza del 95% el intervalo de confianza contiene el
verdadero valor de la proporción poblacional de las mujeres que afirman que si
asistieron a colegio oficial

● Realice una prueba de hipótesis para determinar la afirmación del investigador.


Utilice un nivel de significancia del 5%. ¿Qué se puede decir de lo anterior?
Prueba de Hipótesis a trabajar

H 0 :P Hombres=P mujeres vs H a : PHombres > P Mujeres

Estadístico de prueba:

P Hombres−Pmujeres −(π 1−π 2 )


Z=
PHombres∗(1−P Hombres ) Pmujeres∗(1−P mujeres)
√ n
+
m

Información para reemplazar en el estadístico de prueba


n=163 P Hombres=0.2025
m=207 Pmujeres =0.1981
( π 1−π 2 ) =0

0.2025−0.1981−0
Z= =0.1049351
0.2025∗(1−0.2025) 0.1981∗(1−0.1981)
√ 163
+
207

Se calcula el siguiente el valor crítico con un nivel de significancia es del 5%


Z α =Z 0.05=1.64

El valor critico lo comparamos con el valor de Z, vemos que el valor de Z es menor al


valor crítico, ósea 0.1049<1.64 entonces concluimos, con una confianza del 95% que la
proporción de mujeres y hombres que afirman asistir a colegios oficiales es igual.
Ósea la hipótesis nula H 0 P Hombres=P mujeres no se rechaza.

Conclusiones.

- Logramos identificar que la desviación estándar es alta por lo cual los datos no
son simétricos, de igual manera concluimos lo siguiente el 18% de la muestra de la
población tiene una edad de 10 a 20 años y que el 15% tiene entre 20 y 30 años.

- Analizando el estimador de la media muestral se concluye que para las


distribuciones continuas y discretas los dos métodos de estimación trabajados
proporcionan las mismas medidas descriptivas con una precisión de tres dígitos.

- Distinguimos que la variación relativa es alta, por lo tanto, tenemos en esta nueva
muestra mucha variación de las edades, es decir los datos está muy dispersos

- Este trabajo nos llevó a trabajar en equipo y en línea, logrando aportar cado uno
su conocimiento de lo aprendido sobre los temas vistos hasta hora, para poder
hacer este trabajo nos apoyamos con las teleconferencias y el material disponible
en la plataforma del aula virtual y de material encontrado en internet.

- Por otra parte, el trabajo nos llevó a practicar ejercicios y revisar las formulas
aritméticas y de Excel.

También podría gustarte