0% encontró este documento útil (0 votos)
15 vistas37 páginas

Brechas Salariales de Género en Colombia

Cargado por

eduardo.pineda
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
15 vistas37 páginas

Brechas Salariales de Género en Colombia

Cargado por

eduardo.pineda
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

FACULTAD DE CIENCIAS SOCIALES Y ECONÓMICAS

PROGRAMA DE PREGRADO DE ECONOMÍA

Entrega trabajo final

Eduardo José Gómez Pineda 2126295-3340


Michael Esteban Sanchez Largo 2123015-3340

Docente: Carlos Augusto Viafara

Curso: Género, raza y pluralidad económica

Agosto - Diciembre

2024 - II
Introducción

La desigualdad salarial entre hombres y mujeres persiste como un problema global que afecta

tanto a las economías desarrolladas como a las emergentes. A lo largo de la historia, las

diferencias en los roles sociales y económicos han limitado significativamente el acceso de

las mujeres a oportunidades laborales equitativas. Goldin et al. (2006) afirman que, aunque el

siglo XX marcó un avance en la educación y la participación laboral femenina, estas mejoras

no se han traducido completamente en igualdad salarial. A nivel mundial, las mujeres ganan,

en promedio, un 20 % menos que los hombres, según datos de las Naciones Unidas (2022).

Este fenómeno no solo refleja una desigualdad económica, sino también una pérdida de

eficiencia productiva para las economías. En Colombia, el panorama no es diferente. Galvis

(2010) señala que las brechas salariales entre hombres y mujeres son particularmente

marcadas en regiones con menor desarrollo económico.

Fuente: DANE, GEIH (2024)

Las estadísticas recientes evidencian que, en promedio, las mujeres tienen una menor Tasa

Global de Participación (TGP) y Tasa de Ocupación (TO), acompañadas de una mayor Tasa

de Desempleo (TD) comparadas con los hombres. Por ejemplo, las cifras del trimestre móvil

noviembre 2023-enero 2024 muestran que la TGP femenina está 24.8 puntos porcentuales

por debajo de la masculina, mientras que la TO también es menor en 24.9 puntos

porcentuales.
Desde un enfoque teórico, la discriminación laboral basada en género genera ineficiencias

económicas al subutilizar el potencial productivo de una parte significativa de la fuerza

laboral. Jacobsen (2007) explica que estas ineficiencias no solo limitan el crecimiento

económico, sino que también perpetúan desigualdades estructurales. Además, el modelo del

Capital Humano sostiene que las diferencias en ingresos pueden explicarse en parte por la

disparidad en los niveles de educación y experiencia laboral entre hombres y mujeres. Estas

brechas son exacerbadas por factores biológicos y sociales, como las interrupciones laborales

asociadas con el embarazo y el cuidado de los hijos.

El presente estudio tiene como objetivo analizar las brechas salariales entre hombres y

mujeres en Colombia utilizando la Encuesta de Calidad de Vida 2022. Para ello, se aplicarán

modelos econométricos basados en el método de Mínimos Cuadrados Ordinarios (MCO), con

el fin de identificar los determinantes principales de estas diferencias. Variables como años de

educación aprobados, experiencia laboral y horas trabajadas al mes serán consideradas como

factores clave. Como sugiere la teoría del Capital Humano, se espera que estas variables

expliquen parte de la brecha salarial, permitiendo un análisis detallado de los efectos

marginales y su comportamiento en la muestra analizada. El análisis también incluirá un

examen de los supuestos del Modelo Clásico de Regresión Lineal para garantizar la validez

de los resultados.

Con este trabajo, se pretende contribuir al debate sobre la equidad de género en el mercado

laboral colombiano, aportando evidencia empírica que pueda servir como base para el diseño

de políticas públicas orientadas a reducir estas brechas y promover una mayor eficiencia

económica y equidad social.

planteamiento del problema


La brecha salarial de género persiste como una problemática significativa en Colombia,

reflejando disparidades económicas y sociales que afectan el desarrollo equitativo del país. A

pesar de los avances en la participación laboral femenina, las mujeres continúan enfrentando

desventajas salariales en comparación con los hombres.

Según datos de la OIT, en 2021 las mujeres en Colombia ganaron en promedio un 6,3%

menos que los hombres. Esta brecha se amplía en áreas rurales, alcanzando un 28,4%, lo que

indica una desigualdad aún más pronunciada en estas regiones. Además, las mujeres con

bajos niveles educativos, viudas, entre 45 y 54 años, y aquellas que se identifican como

afrodescendientes presentan las mayores disparidades salariales.

Estudios académicos respaldan estas cifras. Por ejemplo, la investigación de Garzón y Ulloa

(2016) destaca que las brechas laborales por género han sido una característica persistente en

el mercado laboral colombiano, evidenciando discriminación salarial y ocupacional.

Asimismo, un análisis del (DNP, 2018) revela que, entre los contratistas independientes del

Estado colombiano, existe una brecha salarial de género significativa, lo que refleja una

desigualdad en sectores tanto públicos como privados.

La maternidad también influye en la disparidad salarial. Datos de la Dirección de Impuestos y

Aduanas Nacionales (DIAN) indican que en Colombia la brecha salarial entre hombres y

mujeres es 7 puntos porcentuales más alta para las personas con hijos, en comparación con

aquellas sin hijos. Esta situación resalta cómo las responsabilidades familiares afectan

desproporcionadamente a las mujeres en términos económicos.

Estas cifras evidencian la urgencia de abordar la brecha salarial de género en Colombia. La

persistencia de estas desigualdades no solo limita el potencial económico de las mujeres, sino

que también representa una pérdida de eficiencia para la economía en su conjunto. Por lo

tanto, es fundamental realizar estudios que analicen las causas y consecuencias de esta
problemática, proporcionando una base sólida para el diseño de políticas públicas orientadas

a promover la equidad salarial y la igualdad de oportunidades en el mercado laboral

colombiano.

Objetivo general

Evaluar los efectos diferenciados de las brechas salariales en el valle del cauca en razón de

género en el año 2022.

Objetivos específicos

● Identificar los factores que explican las brechas laborales existentes en el valle del

cauca.

● Analizar las estadísticas descriptivas para identificar y caracterizar las brechas

salariales entre hombres y mujeres.

● Estimar la magnitud de las brechas laborales entre hombres y mujeres en el valle del

cauca mediante el uso de modelos econométricos.

antecedentes

Las brechas salariales por género son un fenómeno mundial que está estrechamente vinculado

a los roles de género y a las estructuras de poder que se han establecido en el tiempo. Según

Jacobsen (2007), las mujeres enfrentan discriminación estructural que limita la entrada a

empleos bien remunerados creando un techo invisible en el mercado laboral, para el caso de

Colombia, Galvis (2010) destaca que las brechas salariales son pronunciadas en las regiones

de menor desarrollo económico, en el caso del Valle del Cauca logro evidenciar que las

mujeres cuentan con menor participación el mercado laboral y luchan contra barreras para el

acceso de empleos de calidad.

El Departamento Nacional de Planeación (DNP, 2018) enfatiza esta idea, señalando que,

además de las diferencias en variables como la educación y la experiencia que esto recae en
el ámbito de capital humano, la segregación ocupacional sigue siendo un factor importante.

Dicho esto las mujeres tienden a concentrarse en sectores de baja remuneración, lo que

restringe su potencial salarial en comparación con los hombres, quienes dominan sectores

más productivos. Además, el DNP remarca la baja representación femenina en cargos de alta

dirección, lo que perpetúa las desigualdades salariales.

El estudio de Garzón y Ulloa (2016) menciona que las mujeres siguen enfrentando el "techo

de cristal", que limita su ascenso a posiciones mejor remuneradas, a pesar de contar con

niveles similares de educación y experiencia que los hombres. Este fenómeno está

relacionado con la discriminación implícita en la asignación de roles de liderazgo.

Por último la Organización Internacional del Trabajo (OIT, 2021) sostiene que las brechas

salariales en Colombia siguen siendo un problema estructural, exacerbado por la pandemia de

COVID-19. A pesar de los esfuerzos por promover la equidad, las mujeres siguen ganando un

20% menos que los hombres, donde la pandemia empeoró esto en sectores como lo son los

informales provocando mayores brechas y desigualdades.

Metodología

El presente estudio analiza las brechas salariales entre hombres y mujeres mediante un

enfoque cuantitativo basado en la Encuesta de Calidad de Vida (ECV) del año 2022. La

metodología incluye varias etapas, descritas a continuación, para garantizar un tratamiento

riguroso de los datos y resultados confiables.

En primer lugar, se llevará a cabo un análisis exploratorio de los datos con el objetivo de

comprender su comportamiento, identificar posibles valores atípicos y evaluar las

distribuciones de las variables clave. Esta etapa permite verificar el cumplimiento de los
supuestos del Modelo Clásico de Regresión Lineal (MCRL), tales como la linealidad, la

independencia de los errores, la homocedasticidad y la normalidad de los errores.

En caso de detectar comportamientos atípicos o anomalías en las variables, se aplicarán las

siguientes acciones:

● Transformación funcional de las variables, por ejemplo, mediante logaritmos, para

estabilizar la varianza o mejorar la interpretación de los coeficientes.

● Exclusión de datos extremos que puedan distorsionar los resultados.

Posteriormente, se estimarán modelos de regresión lineal utilizando el método de Mínimos

Cuadrados Ordinarios (MCO). Este método minimiza la suma de los cuadrados de los

errores, definidos como la diferencia entre los valores observados de la variable dependiente

y las estimaciones generadas por el modelo. La elección de este método se basa en su

capacidad para proporcionar estimadores insesgados, consistentes y eficientes bajo los

supuestos del MCRL.

La ecuación general del modelo es la siguiente:

Log ( Yi ) = β0 + β1X1i + β2X2i + β3X3i + β4 ( X3i )2 + εi

Variables independientes o regresoras:

● X1i : Horas trabajadas por mes.

● X2i : Años de educación aprobados.

● X3i : Experiencia laboral (calculada como: Edad ー Años de educación aprobados ー

6).

Variable Dependiente o regresada:

● Yi : Ingreso Laboral. (transformado en logaritmo para capturar elasticidades y reducir

la influencia de valores extremos).


Se estimaron dos modelos para analizar las brechas salariales, los modelos serán estimados de

manera separada para hombres y mujeres. Esto permite identificar las diferencias en los

retornos salariales asociados a cada variable independiente entre ambos grupos.

La metodología empleada está fundamentada en estudios previos, como los realizados por

Goldin, Katz y Kuziemko (2006), quienes han explorado las disparidades de ingresos

relacionadas con factores de educación y experiencia laboral. Además, investigaciones

locales como las de Galvis (2010) y Garzón y Ulloa (2016) refuerzan la relevancia de

descomponer las brechas salariales por género en el contexto colombiano. Estas referencias

avalan el uso del MCO y la segmentación por género como herramientas idóneas para el

presente análisis.

análisis descriptivo

El análisis de la relación entre el ingreso laboral y el nivel educativo es un tema ampliamente

abordado en la economía, dado que la educación es considerada un componente esencial del

capital humano. Este concepto, introducido por Becker (1964), sugiere que la inversión en

educación aumenta las habilidades y la productividad de los individuos, lo que a su vez

mejora su capacidad de generar ingresos. Este incremento beneficia tanto a los individuos

como a las empresas y a la economía nacional. En este contexto, se utilizará la Encuesta de

Calidad de Vida 2022 (ECV-2022) para el Valle del Cauca, con el objetivo de analizar cómo

las diferencias en años de educación aprobados y experiencia laboral impactan el ingreso

laboral de hombres y mujeres mayores de 16 años.

La muestra incluye 3,671 observaciones, dividiendo el análisis entre hombres y mujeres. La

variable dependiente es el ingreso laboral anual en pesos colombianos, mientras que las

variables independientes son los años de educación aprobados, las horas trabajadas al mes, la

experiencia laboral y su cuadrado. Este análisis busca evaluar la eficiencia de la educación


como herramienta para mejorar los ingresos y examinar las brechas de género en el mercado

laboral regional.

Tabla 2

Las estadísticas descriptivas muestran diferencias significativas entre hombres y mujeres en

la muestra. El ingreso laboral anual presenta mayor variabilidad en las mujeres, con un rango

de ingresos más amplio (0 a 38,000,000) en comparación con los hombres (0 a 31,733,334).

La media del ingreso es ligeramente más alta en mujeres (1,024,639) que en hombres

(938,744). Este resultado podría explicarse por la presencia de ingresos extremos elevados en

mujeres, que afectan el promedio. La moda revela diferencias relevantes: el ingreso más

común entre los hombres es 500,000 pesos, mientras que entre las mujeres es 0 pesos. Esto

indica que hay un porcentaje considerable de mujeres sin ingreso laboral, lo que podría

reflejar barreras estructurales para su participación en el mercado laboral (OIT, 2021). La

desviación estándar es alta para ambos géneros, lo que indica una gran variabilidad en los

ingresos. Esta disparidad en los ingresos laborales también ha sido destacada en estudios

previos, como los de Goldin et al. (2006), quienes sugieren que las mujeres tienden a

enfrentar mayores fluctuaciones en sus ingresos debido a interrupciones laborales y empleo

parcial.
La edad promedio es similar para hombres (44.36 años) y mujeres (42.55 años), con

medianas de 44 y 42 años, respectivamente. Estas cifras reflejan una distribución simétrica en

ambos géneros, con desviaciones estándar también similares. Sin embargo, la moda difiere:

52 años para los hombres y 38 años para las mujeres, lo que podría indicar una mayor

proporción de hombres en edades avanzadas y más mujeres en edades medias.

Las mujeres presentan un rango de horas trabajadas más amplio (4.345 a 521.429) pero una

media menor (177.46) en comparación con los hombres (202.15). Este resultado sugiere que

los hombres tienden a tener jornadas laborales más consistentes y posiblemente a tiempo

completo, mientras que las mujeres podrían estar más representadas en empleos de tiempo

parcial o con menor estabilidad laboral. Estudios como los de Galvis (2010) también han

documentado estas diferencias, vinculandose a los roles de género y la carga del trabajo

doméstico no remunerado.

La desviación estándar es comparable entre ambos grupos, mientras que la moda (208.5714

horas) es idéntica para ambos géneros, lo que refleja un patrón común en las jornadas

laborales de tiempo completo.

Las mujeres tienen una media de años de educación aprobados ligeramente superior (10.37)

en comparación con los hombres (8.834). Este resultado es consistente con estudios como los

de Jacobsen (2007), quienes destacan que en muchas regiones, las mujeres han superado a los

hombres en logros educativos. Sin embargo, esto no necesariamente se traduce en igualdad

de oportunidades en el mercado laboral. Aunque la media favorece a las mujeres, las

medianas son iguales (11 años), lo que sugiere que la distribución de los años de educación

para los hombres tiene una cola más larga hacia niveles más bajos.

Los hombres tienen una mayor experiencia promedio (29.53 años) que las mujeres (26.18

años), con una variabilidad también más alta. Esto podría deberse a interrupciones en las
trayectorias laborales de las mujeres, asociadas a responsabilidades familiares o empleo en

sectores informales (Garzón & Ulloa, 2016). La experiencia laboral cuadrática es mayor para

los hombres, lo que refuerza la idea de que tienden a tener carreras laborales más largas y

sostenidas, en línea con la literatura sobre segregación ocupacional y roles de género (DNP,

2018).

De los resultados obtenidos, se destacan patrones importantes en la muestra del Valle del

Cauca. Aunque las mujeres tienen un nivel educativo ligeramente superior, enfrentan

mayores barreras en el mercado laboral, reflejadas en una mayor proporción de mujeres sin

ingreso laboral y menores horas trabajadas en promedio. Por otro lado, los hombres tienden a

tener mayor experiencia laboral, lo que podría explicar parte de las disparidades en los

ingresos observadas.

El estudio de estas brechas es crucial para diseñar políticas que promuevan la equidad en el

mercado laboral, como lo señala la OIT (2021). En los siguientes apartados, se profundizará

en los determinantes del ingreso laboral y se analizarán las diferencias de género mediante

modelos econométricos.

Resultados

En el anexo 31 y 32, se logra evidenciar los resultados proporcionados de los modelos de

regresión para los ingresos laborales de hombres y de las mujeres, sin embargo antes de

realizar una interpretación de los resultados, se realizará la revisión de análisis de supuestos

de modelo clásico MCO para corroborar si hay ciertos problemas con los modelos y si se

debe usar alguna corrección.

Pero haciendo un análisis superficial se puede decir que los resultados sugieren que, aunque

hay algunas similitudes en los factores que afectan los ingresos de hombres y mujeres (como
las horas trabajadas y los años de educación), existen diferencias importantes en el impacto

de estos factores. Los hombres parecen beneficiarse más de la educación y las horas

trabajadas en comparación con las mujeres. Esto podría indicar que hay brechas salariales

basadas en el género, incluso cuando se controlan variables como educación y experiencia

laboral. Para llegar a conclusiones más sólidas, sería recomendable explorar otras variables

que podrían estar influyendo en estas diferencias, como discriminación salarial o la

segregación ocupacional.

Análisis de Residuales y Supuestos para Hombres y Mujeres

A partir de los resultados proporcionados, se realiza un análisis detallado de los residuales y

los principales supuestos de los modelos para hombres y mujeres.

Normalidad de los residuos.

Una vez comprobado el cumplimiento de media cero en los residuales en el anexo 35, se

rechaza la hipótesis de normalidad en ambos modelos, según lo observado en los anexos 33 y

34. La alta kurtosis y la asimetría indican existencia de colas largas y sesgos en la

distribución de los residuales. Aunque el incumplimiento de normalidad no afecta

directamente la consistencia ni el sesgo de los estimadores de los coeficientes en los modelos

de MCO, sí puede impactar las inferencias estadísticas.

La distribución no normal de los residuos podría estar asociada a variables omitidas,

relaciones no lineales, o a la existencia de heterocedasticidad no completamente corregida, lo

que puede sesgar las estimaciones de varianza de los errores. Por otra parte se sigue

trabajando con estos modelos ya que se asume el no cumplimiento de este supuesto, ya que

en muestras grandes, el teorema del límite central asegura que las estimaciones de los
parámetros y las inferencias sean aproximadamente válidas, incluso si los residuos no son

normales (Wooldridge, 2016).

Linealidad de los residuales en el anexo 20 y 21 se evidencia buen ajuste general, pero se

observa sobreestimación para ciertos valores de experiencia en el modelo de mujeres.

Varianza constante.

En los anexos 24,25,26 y 27 se evidencia que los residuales contra los valores ajustados

muestran cierta dispersión desigual. Los límites de confianza (±1.96 desviaciones estándar)

indican posibles problemas en la homogeneidad de la varianza.

Fuente: elaboración propia

Los resultados del test de Breusch-Pagan muestran que hay evidencia estadística para

rechazar la hipótesis nula de homocedasticidad en ambos modelos, dado que los p-valores

son menores al nivel de significancia común de 0.05. La heterocedasticidad puede ser una

manifestación de desigualdades estructurales. En este caso, podría estar indicando que las

varianzas de los ingresos dependen de características como las horas trabajadas, la educación

o la experiencia, pero de manera diferente para hombres y mujeres. Para solucionar este

problema, se utilizó un método común que es recalcular los errores estándar usando métodos

robustos a la heterocedasticidad, como los errores estándar de White.


Fuente: elaboración propia

Análisis de resultados del modelo de hombres

El logaritmo del ingreso predicho para un hombre con 0 horas trabajadas, sin educación, ni

experiencia es 11.63, lo cual representa una base hipotética.

El coeficiente para las horas trabajadas de los hombres es 0.00280. Indica que por cada hora

adicional trabajada al mes, el ingreso de los hombres aumenta en 0.28%, siendo

estadísticamente significativo con un p-valor de 0.003.

Con respecto a los años de educación el coeficiente es 0.0777. Esto significa que cada año

adicional de educación incrementa el ingreso de los hombres en 7.77%. Este efecto es

altamente significativo con un p-valor de 1.036e−8.

El coeficiente de la variable experiencia es 0.0066. Indica que por cada año adicional de

experiencia, el ingreso de los hombres aumenta en 0.66%, pero no es estadísticamente

significativo p-valor de 0.371.

El coeficiente respecto al cuadrado de la experiencia es 7.38e−5. Esto sugiere que el impacto

de la experiencia en los ingresos no varía significativamente con niveles más altos de

experiencia. Este resultado no es significativo p-valor de 0.456.

Análisis de resultados del modelo de mujeres

El coeficiente para el intercepto es 12.286. Representa el logaritmo del ingreso estimado para

las mujeres que trabajan 0 horas al mes, no tienen educación ni experiencia laboral. Es

altamente significativo con un p-valor menor a 2.2e−16.


El coeficiente respecto a las horas trabajadas para las mujeres es 0.0017. Esto indica que por

cada hora adicional trabajada al mes, el ingreso de las mujeres aumenta en 0.17%. Este

resultado es estadísticamente significativo con un p-valor de 0.045.

El coeficiente de los años de educación es 0.0543. Esto significa que cada año adicional de

educación incrementa el ingreso de las mujeres en 5.43%, siendo estadísticamente

significativo con un p-valor de 0.0045.

El coeficiente de la experiencia es -0.0094. Esto significa que por cada año adicional de

experiencia, el ingreso de las mujeres disminuye en 0.94%, pero este efecto no es

estadísticamente significativo p-valor de 0.361.

El coeficiente para el cuadrado de la experiencia es 0.0003. Esto indica que el impacto de la

experiencia en los ingresos de las mujeres aumenta ligeramente con el tiempo, y este efecto

es estadísticamente significativo con un p-valor de 0.033.

No autocorrelación.

Para ambos modelos, En los anexos 22 y 23 se evidencia residuales rezagados que no

muestran patrones claros para determinar la no existencia de autocorrelación.

Multicolinealidad.

En los anexos 28 y 29 los diagramas de correlación se evidencia relaciones bajas o

moderadas entre las variables independientes del modelo.

Exogeneidad
Fuente: elaboración propia

Con base en las correlaciones reportadas, se cumple el supuesto de exogeneidad en ambos

modelos, ya que los residuales no parecen estar correlacionados con los valores ajustados,

porque la correlación entre los residuales y los valores ajustados en ambos es cercana a cero.

Comparación y conclusiones de los resultados obtenidos en los modelos

La falta de normalidad en los residuos y la evidencia de heterocedasticidad indican que las

inferencias deben interpretarse con precaución. Sin embargo, el uso de errores estándar

robustos permite que las estimaciones sean válidas para realizar comparaciones. Los

resultados reflejan la existencia de barreras estructurales que restringen el acceso de las

mujeres a empleos de mayor calidad y remuneración, alineándose con estudios previos que

señalan la segmentación del mercado laboral y los roles de género como factores

determinantes.

El impacto de las horas trabajadas en los ingresos es mayor para los hombres (0.28%) que

para las mujeres (0.17%). Este resultado refleja una diferencia en la elasticidad del ingreso

frente al esfuerzo laboral medido en tiempo, lo cual podría ser un indicio de desigualdad en

las oportunidades de remuneración por horas trabajadas, en línea con los hallazgos de la

(OIT, 2021), que evidencian menores tasas de pago por hora para las mujeres. Por otro lado,

cada año adicional de educación incrementa el ingreso de los hombres en 7.77%, mientras

que para las mujeres el incremento es de 5.43%. Este resultado refuerza la literatura que

sugiere que las mujeres enfrentan retornos marginales más bajos a la educación que los

hombres, a pesar de que sus tasas de acceso a la educación han aumentado considerablemente

en las últimas décadas (Goldin et al., 2006). Este fenómeno puede estar vinculado a la

segmentación del mercado laboral, que restringe el acceso de las mujeres a empleos de mayor

calidad y remuneración.
La experiencia laboral tiene un efecto positivo pero no significativo en los ingresos de los

hombres 0.66% y un efecto negativo y no significativo en los ingresos de las mujeres -0.94%.

Sin embargo, el coeficiente cuadrático de la experiencia es significativo para las mujeres,

indicando que el impacto de la experiencia en los ingresos aumenta ligeramente con el

tiempo. Esto podría sugerir que, aunque las mujeres inicialmente enfrenten una penalización,

el efecto de la experiencia puede volverse positivo en etapas avanzadas de la vida laboral,

consistente con el análisis de Galvis (2010) sobre las desigualdades de género a lo largo del

ciclo laboral.

Los resultados confirman la existencia de brechas significativas en los retornos marginales a

las variables clave del modelo, como las horas trabajadas y la educación, siendo mayores para

los hombres que para las mujeres. Esto refleja barreras estructurales en el mercado laboral

que perpetúan la desigualdad de género, en línea con lo documentado por Jacobsen (2007).

Los resultados refuerzan la idea de que los hombres y las mujeres no compiten en igualdad de

condiciones dentro del mercado laboral colombiano. Estas diferencias son consistentes con

los estudios de Garzón y Ulloa (2016) y del DNP (2018), que enfatizan la importancia de

diseñar políticas específicas para abordar estas inequidades, como la promoción de

flexibilidad laboral y medidas para reducir la discriminación de género. A pesar de que las

mujeres en la muestra presentan un nivel educativo promedio ligeramente superior al de los

hombres, estas enfrentan mayores barreras en el mercado laboral, reflejadas en menores

retornos marginales y una mayor proporción de mujeres sin ingresos laborales.

Este análisis pone en evidencia que las desigualdades de género no solo son una cuestión de

justicia social, sino que representan ineficiencias económicas significativas. Políticas que

incentiven la igualdad en los retornos a la educación, la compensación equitativa por horas


trabajadas y el apoyo a las mujeres en sus etapas iniciales de carrera podrían contribuir a

reducir las brechas salariales y aumentar la eficiencia productiva del país.


Referencias

Becker, G. S. (1964). Human capital: A theoretical and empirical analysis, with special

reference to education. University of Chicago Press.

Departamento Nacional de Planeación (DNP). (2018). Equidad de género en el mercado

laboral colombiano: Avances y retos pendientes. Bogotá, Colombia: DNP.

Galvis, L. A. (2010). Diferenciales salariales por género y región en Colombia: Una

aproximación con regresión por cuantiles. Documentos de trabajo sobre Economía Regional

y Urbana, (131). Banco de la República de Colombia.

Garzón, D., & Ulloa, C. (2016). Factores asociados a las brechas de género en el mercado

laboral colombiano. Revista de Economía del Caribe, (18), 64-89.

Goldin, C., Katz, L. F., & Kuziemko, I. (2006). The homecoming of American college

women: The reversal of the college gender gap. Journal of Economic Perspectives, 20(4),

133–156.

Jacobsen, J. P. (2007). The economics of gender (3rd ed.). Wiley-Blackwell.

Organización Internacional del Trabajo (OIT). (2021). Informe global sobre salarios 2021:

La pandemia del COVID-19 y su impacto en las desigualdades salariales. Ginebra, Suiza:

OIT.
Wooldridge, J. M. (2016). Introductory econometrics: A modern approach (6th ed.). Cengage

Learning.

Anexos

gráfico 1 gráfico 2

gráfico 3
gráfico 4

gráfico 5 gráfico 6

gráfico 7
gráfico 8
gráfico 9 gráfico 10

gráfico 11 gráfico 12

gráfico 13 gráfico 14

gráfico 15 gráfico 16
gráfico 17 gráfico 18

gráfico 19 gráfico 20

gráfico 21

gráfico 22

gráfico 24

gráfico 23
gráfico 25

gráfico 26

gráfico 27 gráfico 28

gráfico 30

gráfico 29

Anexo 31 Anexo 32
Anexo 33 Anexo 34

Anexo35

Medias de los errores igual a 0.

Se cumple el supuesto de media de los

errores igual 0.

Fuente: Elaboración propia con datos tomados del GEIH, 2022.


Rscript

#Cargamos los paquetes necesarios


library(sandwich)
library(ggplot2)
library(tidyverse)
library(psych)
library(stats)
library(GGally)
library(car)
library(moments)
library(gvlma)
library(readxl)
library(gridExtra)
library(nortest)
library(lmtest)
library(corrplot)
library(nortest)
library(dplyr)
library(readxl)
library(stargazer)
library(GGally)
library(ICglm)
library(tseries)
library(vcov)
library(pacman)

Datos= ECV2022Valle
attach(Datos)

#Limpio las observaciones que no son mayores a 16


datosMayoresEdad= subset(Datos, edad>16)

#creo el vector de experiencia


datosMayoresEdad$experiencia= datosMayoresEdad$edad - datosMayoresEdad$anoeduca - 6

#creo el vector que contiene el efecto cuadratico de la variable anterior


datosMayoresEdad$expeCuadra= datosMayoresEdad$experiencia^2

#construyo el dataset con las variables que usaré en el modelo


datosMayTodos= datosMayoresEdad[, c("Inglabm","edad","horatmes","anoeduca","experiencia",
"expeCuadra", "P6020")]

#quitamos los valores NA


datosMaToLimpi= [Link](datosMayTodos)
view(datosMaToLimpi)

#quitamos los valores negativos de la variable experiencia


datosCorr= subset(datosMaToLimpi, experiencia>=0)

#Cambiamos el nombre de las variables para que sean facilmente llamables


sexo= datosCorr$P6020 #sexo sujeto
edad= datosCorr$edad #edad sujeto
AnoEducaAprob= datosCorr$anoeduca #años de educacion aprobados
ingresoLab= datosCorr$Inglabm #ingreso laboral
horaTrabMes= datosCorr$horatmes
experiencia= datosCorr$experiencia
expeCuadra= datosCorr$expeCuadra

#de toda la muestra, no diferencia entre hombres y mujeres


datosCorr$LogIngresolab= log(datosCorr$Inglabm+1)
view(datosCorr)

#creamos la base de datos de los hombres


datosH= subset(datosCorr, sexo ==1)
view(datosH)

#comprobamos que nuestras columnas del data frame corregido no contenga NA'S
hay_na <- any([Link](datosCorr$Inglabm))

if (hay_na) {
print("Hay valores NA en la columna 'Inglabm'")
} else {
print("No hay valores NA en la columna 'Inglabm'")
}
hay_na <- any([Link](datosCorr$edad))

if (hay_na) {
print("Hay valores NA en la columna 'edad'")
} else {
print("No hay valores NA en la columna 'edad'")
}
hay_na <- any([Link](datosCorr$horatmes))

if (hay_na) {
print("Hay valores NA en la columna 'horatmes'")
} else {
print("No hay valores NA en la columna 'horatmes'")
}
hay_na <- any([Link](datosCorr$anoeduca))
if (hay_na) {
print("Hay valores NA en la columna 'anoeduca'")
} else {
print("No hay valores NA en la columna 'anoeduca'")
}
hay_na <- any([Link](datosCorr$experiencia))

if (hay_na) {
print("Hay valores NA en la columna 'experiencia'")
} else {
print("No hay valores NA en la columna 'experiencia'")
}
hay_na <- any([Link](datosCorr$expeCuadra))

if (hay_na) {
print("Hay valores NA en la columna 'expeCuadra'")
} else {
print("No hay valores NA en la columna 'expeCuadra'")
}
hay_na <- any([Link](datosCorr$P6020))

if (hay_na) {
print("Hay valores NA en la columna 'P6020'")
} else {
print("No hay valores NA en la columna 'P6020'")
}

#visualizamos algunas estadisticas para darnos una idea de qué datos tenemos
summary(datosH)

#vemos la desviación estandar y la moda de los datos.

desviacion_estandarH= sapply(datosH, sd)

# Calcular la moda de cada columna (DEFINIMOS LA FUNCION MODE)


ModeH= function(x) {
ux= unique(x)
ux[[Link](tabulate(match(x, ux)))]
}
moda= sapply(datosH, Mode)

resultadosH= [Link](Desviacion_EstandarH = desviacion_estandar, Moda = moda)

#los resultados interesantes son los de ingreso, edad, horasTrab, añoeduca y expe
print(resultadosH)
#resultados preliminares nos dicen que probablemente las horatmes y anoeduca tendrán un
#bajo nivel de confianza estadística, en comparación con las demas variables.
#Las modas muestran el vaor mas repetido de la muestra.

datosM= subset(datosCorr, sexo == 2)


view(datosM)

datosH$InglabmH= datosH$Inglabm
datosH$LogIngHom= log(datosH$InglabmH+1)
datosH$horatmesH= datosH$horatmes
datosH$edadH= datosH$edad
datosH$anoeducaH= datosH$anoeduca
datosH$experienciaH= datosH$experiencia
datosH$expeCuadraH= datosH$expeCuadra

inglabH= datosH$InglabmH
LogIngHom=log(datosH$InglabmH+1)
horatmesH=datosH$horatmes
edadH= datosH$edad
anoeducaH= datosH$anoeduca
experienciaH= datosH$experiencia
expeCuadraH= datosH$expeCuadra

#datos de solo mujeres


datosM$InglabmM= datosM$Inglabm
datosM$LogIngMuje= log(datosM$InglabmM+1)
datosM$horatmesM= datosM$horatmes
datosM$edadM= datosM$edad
datosM$anoeducaM= datosM$anoeduca
datosM$experienciaM= datosM$experiencia
datosM$expeCuadraM= datosM$expeCuadra

inglabM=datosM$InglabmM
LogIngMuje= log(datosM$InglabmM+1)
horatmesM= datosM$horatmes
edadM= datosM$edad
anoeducaM= datosM$anoeduca
experienciaM= datosM$experiencia
expeCuadraM= datosM$expeCuadra

#Vemos algunas descriptivas importantes de las variables de las mujeres


summary(datosM)

#vemos d.e y moda de las mujeres


desviacion_estandarM= sapply(datosM, sd)
ModeM= function(x) {
ux= unique(x)
ux[[Link](tabulate(match(x, ux)))]
}
moda= sapply(datosM, Mode)

resultadosM= [Link](Desviacion_Estandar = desviacion_estandarM, Moda = moda)


print(resultadosM)

#veamos como distribuyen las variables que tenemos hasta ahora

#kernel log ingreso hombres


ggplot(datosH, aes(x = LogIngHom)) +
geom_histogram(aes(y=..density..),fill = "skyblue", color = "black", bins = 30) +
labs(title = "Histograma del logaritmo del ingreso, hombres 2022",
x = "Log ingreso",
y = "Frecuencia") +
stat_function(fun= dnorm, args= list(mean= mean(LogIngHom),
sd = sd(LogIngHom)),col="darkgreen")+
geom_density(fill="black", alpha= 0.2)+
theme_bw()
#kernel edad hombres
ggplot(datosH, aes(x = edadH)) +
geom_histogram(aes(y=..density..),fill = "skyblue", color = "black", bins = 30) +
labs(title = "Histograma de la edad, hombres 2022",
x = "edad (años cuplidos)",
y = "Frecuencia") +
stat_function(fun= dnorm, args= list(mean= mean(edadH),
sd = sd(edadH)),col="darkgreen")+
geom_density(fill="black", alpha= 0.2)+
theme_bw()
#kernel horatmes hombres
ggplot(datosH, aes(x = horatmesH)) +
geom_histogram(aes(y=..density..),fill = "skyblue", color = "black", bins = 30) +
labs(title = "Histograma horas trabajadas mes, hombres 2022",
x = "horas trabajadas",
y = "Frecuencia") +
stat_function(fun= dnorm, args= list(mean= mean(horatmesH),
sd = sd(horatmesH)),col="darkgreen")+
geom_density(fill="black", alpha= 0.3)+
theme_bw()
#kernel años educacion aprobados hombres
ggplot(datosH, aes(x = anoeducaH)) +
geom_histogram(aes(y=..density..),fill = "skyblue", color = "black", bins = 30) +
labs(title = "Hist, años educacion aprobados, hombres 2022",
x = "años aprobados",
y = "Frecuencia") +
stat_function(fun= dnorm, args= list(mean= mean(anoeducaH),
sd = sd(anoeducaH)),col="darkgreen")+
geom_density(fill="black", alpha= 0.2)+
theme_bw()
#kernel experiencia
ggplot(datosH, aes(x = experienciaH)) +
geom_histogram(aes(y=..density..),fill = "skyblue", color = "black", bins = 30) +
labs(title = "Histograma experiencia, hombres 2022",
x = "años experiencia",
y = "Frecuencia") +
stat_function(fun= dnorm, args= list(mean= mean(experienciaH),
sd = sd(experienciaH)),col="darkgreen")+
geom_density(fill="black", alpha= 0.2)+
theme_bw()
#kernel experiencia cuadrada
ggplot(datosH, aes(x = expeCuadraH)) +
geom_histogram(aes(y=..density..),fill = "skyblue", color = "black", bins = 30) +
labs(title = "Histograma experiencia cuadrada, hombres 2022",
x = "años experiencia cuadrada",
y = "Frecuencia") +
stat_function(fun= dnorm, args= list(mean= mean(expeCuadraH),
sd = sd(expeCuadraH)),col="darkgreen")+
geom_density(fill="black", alpha= 0.2)+
theme_bw()

#KERNELS DE DENSIDAD PARA LAS MUJERES

#kernel log del ingreso MUJERES


ggplot(datosM, aes(x = LogIngMuje)) +
geom_histogram(aes(y=..density..),fill = "skyblue", color = "black", bins = 30) +
labs(title = "Histograma del logaritmo del ingreso, mujeres 2022",
x = "Log ingreso",
y = "Frecuencia") +
stat_function(fun= dnorm, args= list(mean= mean(LogIngMuje),
sd = sd(LogIngMuje)),col="darkgreen")+
geom_density(fill="black", alpha= 0.2)+
theme_bw()
#kernel edad MUJERES
ggplot(datosM, aes(x = edadM)) +
geom_histogram(aes(y=..density..),fill = "skyblue", color = "black", bins = 30) +
labs(title = "Histograma de la edad, mujeres 2022",
x = "edad (años cuplidos)",
y = "Frecuencia") +
stat_function(fun= dnorm, args= list(mean= mean(edadM),
sd = sd(edadM)),col="darkgreen")+
geom_density(fill="black", alpha= 0.2)+
theme_bw()
#kernel horatmes MUJERES
ggplot(datosM, aes(x = horatmesM)) +
geom_histogram(aes(y=..density..),fill = "skyblue", color = "black", bins = 30) +
labs(title = "Histograma horas trabajadas mes, mujeres 2022",
x = "horas trabajadas",
y = "Frecuencia") +
stat_function(fun= dnorm, args= list(mean= mean(horatmesM),
sd = sd(horatmesM)),col="darkgreen")+
geom_density(fill="black", alpha= 0.2)+
theme_bw()
#kernel años educacion aprobados MUJERES
ggplot(datosM, aes(x = anoeducaM)) +
geom_histogram(aes(y=..density..),fill = "skyblue", color = "black", bins = 30) +
labs(title = "Hist, años educacion aprobados, mujeres 2022",
x = "años aprobados",
y = "Frecuencia") +
stat_function(fun= dnorm, args= list(mean= mean(anoeducaM),
sd = sd(anoeducaM)),col="darkgreen")+
geom_density(fill="black", alpha= 0.2)+
theme_bw()
#kernel experiencia MUJERES
ggplot(datosM, aes(x = experienciaM)) +
geom_histogram(aes(y=..density..),fill = "skyblue", color = "black", bins = 30) +
labs(title = "Histograma experiencia, mujeres 2022",
x = "años experiencia",
y = "Frecuencia") +
stat_function(fun= dnorm, args= list(mean= mean(experienciaM),
sd = sd(experienciaM)),col="darkgreen")+
geom_density(fill="black", alpha= 0.2)+
theme_bw()
#kernel experiencia cuadrada MUJERES
ggplot(datosM, aes(x = expeCuadraM)) +
geom_histogram(aes(y=..density..),fill = "skyblue", color = "black", bins = 30) +
labs(title = "Histograma experiencia cuadrada, mujeres 2022",
x = "años experiencia cuadrada",
y = "Frecuencia") +
stat_function(fun= dnorm, args= list(mean= mean(expeCuadraM),
sd = sd(expeCuadraM)),col="darkgreen")+
geom_density(fill="black", alpha= 0.2)+
theme_bw()
##################################################################################
###
#DIAGRAMAS DE DISPERCIÓN

# Graficar diagrama de dispersión para mujeres y hombres juntos

#GRAFICOS DE DISPERIÓN LOG INGRESO VS. HORAS TRABAJADAS AL MES

plot_mujeres_horas= ggplot(datosM, aes(x = horatmesM, y = LogIngMuje)) +


geom_point(color = "blue", alpha = 0.5) +
geom_smooth(method = "lm", se = FALSE, color = "black") +
labs(title = "Mujeres",
x = "Horas Trabajadas", y = "Log Ingreso") +
theme_minimal()

plot_hombres_horas= ggplot(datosH, aes(x = horatmesH, y = LogIngHom)) +


geom_point(color = "red", alpha = 0.5) +
geom_smooth(method = "lm", se = FALSE, color = "black") +
labs(title = "Hombres",
x = "Horas trabajadas", y = "Log Ingreso") +
theme_minimal()

#juntamos las gráficas


[Link](plot_mujeres_horas, plot_hombres_horas, nrow = 1)

#lOG INGRESO VS. AÑOS DE EDUCACIÓN

plot_mujeres_educa= ggplot(datosM, aes(x = anoeducaM, y = LogIngMuje)) +


geom_point(color = "blue", alpha = 0.5) +
geom_smooth(method = "lm", se = FALSE, color = "black") +
labs(title = "Mujeres",
x = "Años educación aprobados", y = "Log Ingreso") +
theme_minimal()

plot_hombres_educa= ggplot(datosH, aes(x = anoeducaH, y = LogIngHom)) +


geom_point(color = "red", alpha = 0.5) +
geom_smooth(method = "lm", se = FALSE, color = "black") +
labs(title = "Hombres",
x = "Años educación aprobados", y = "Log Ingreso") +
theme_minimal()

[Link](plot_mujeres_educa, plot_hombres_educa, nrow = 1)

#LOG INGRESO VS. EDAD


plot_mujeres_edad= ggplot(datosM, aes(x = edadM, y = LogIngMuje)) +
geom_point(color = "blue", alpha = 0.5) +
geom_smooth(method = "lm", se = FALSE, color = "black") +
labs(title = "Mujeres",
x = "Edad (años cumplidos)", y = "Log Ingreso") +
theme_minimal()

plot_hombres_edad= ggplot(datosH, aes(x = edadH, y = LogIngHom)) +


geom_point(color = "red", alpha = 0.5) +
geom_smooth(method = "lm", se = FALSE, color = "black") +
labs(title = "Hombres",
x = "Edad (años cumplidos", y = "Log Ingreso") +
theme_minimal()

[Link](plot_mujeres_edad, plot_hombres_edad, nrow = 1)

#LOG INGRESO VS. EXPERIENCIA


plot_mujeres_expe= ggplot(datosM, aes(x = experienciaM, y = LogIngMuje)) +
geom_point(color = "blue", alpha = 0.5) +
geom_smooth(method = "lm", se = FALSE, color = "black") +
labs(title = "Mujeres",
x = "Experiencia (años)", y = "Log Ingreso") +
theme_minimal()

plot_hombres_expe= ggplot(datosH, aes(x = experienciaH, y = LogIngHom)) +


geom_point(color = "red", alpha = 0.5) +
geom_smooth(method = "lm", se = FALSE, color = "black") +
labs(title = "Hombres",
x = "Experiencia (años)", y = "Log Ingreso") +
theme_minimal()

[Link](plot_mujeres_expe, plot_hombres_expe, nrow = 1)

#LOG INGRESO VS. EXPERIENCIA CUADRADA


plot_mujeres_expe_cuadra= ggplot(datosM, aes(x = expeCuadraM, y = LogIngMuje)) +
geom_point(color = "blue", alpha = 0.5) +
geom_smooth(method = "lm", se = FALSE, color = "black") +
labs(title = "Mujeres",
x = "Experiencia al cuadrado", y = "Log Ingreso") +
theme_minimal()

plot_hombres_expe_cuadra= ggplot(datosH, aes(x = expeCuadraH, y = LogIngHom)) +


geom_point(color = "red", alpha = 0.5) +
geom_smooth(method = "lm", se = FALSE, color = "black") +
labs(title = "Hombres",
x = "Experiencia al cuadrado", y = "Log Ingreso") +
theme_minimal()

[Link](plot_mujeres_expe_cuadra, plot_hombres_expe_cuadra, nrow = 1)

#ESTIMACIÓN DE LOS MODELOS


modeloT= lm(Inglabm ~ horatmes+anoeduca+experiencia+expeCuadra, data=datosCorr)
stargazer(modeloT, type="text")
modeloH= lm(LogIngHom ~ horatmesH + anoeducaH + experienciaH + expeCuadraH, data =
datosH)
stargazer(modeloH, type = "text")

modeloM= lm(LogIngMuje ~ horatmesM + anoeducaM + experienciaM + expeCuadraM, data=


datosM)
stargazer(modeloM, type = "text")

#¿se cumplen los supuestos de MCRL?

#ANALIZEMOS LOS RESIDUALES

residuales_modeloH= resid(modeloH)
mean(residuales_modeloH)#se cumple la media de los errores cero

ggplot([Link](residuales = residuales_modeloH), aes(x = residuales)) +


geom_histogram(fill = "skyblue", color = "black", bins = 30) +
labs(title = "Histograma de Residuos Modelo para hombres",
x = "Residuos",
y = "Frecuencia") +
theme_minimal()

residuales_modeloM= resid(modeloM)
mean(residuales_modeloM) #se cumple media de los errores cero

ggplot([Link](residuales=residuales_modeloM), aes(x=residuales)) +
geom_histogram(fill= "skyblue", color="black", bins=30) +
labs(title="Hitograma de Residuos Modelo para Mujeres",
x="Residuos",
y="Frecuencia") +
theme_minimal()

#revisamos el supuesto de linealidad


plot(modeloH,1,caption="modelo Hombres", col = "blue", pch = 16, cex = 0.5)

plot(modeloM,1,caption="modelo Mujeres", col = "blue", pch = 16, cex=0.5)

##EXOGENEIDAD##
#HOMBRES
y_estiamdaH <- [Link](modeloH)
cor(residuales_modeloH, y_estiamdaH)
#MUJERES
y_estiamdaM <- [Link](modeloM)
cor(residuales_modeloM, y_estiamdaM)
##NORMALIDAD##
#HOMBRES, normalidad test Jarque Bera
plot(modeloH, which = 2)
[Link](residuales_modeloH)#rechazo H0 - no normalidad de los errores

#MUJERES, normalidad test Jarque Bera


plot(modeloM, which = 2)
[Link](residuales_modeloM)#rechazo Ho . no normalidad de los errores

#este problema de linealidad es por kurtosis o asimetría?


#hombres
kurtosis(residuales_modeloH)
skewness(residuales_modeloH)

#mujeres
kurtosis(residuales_modeloM)
skewness(residuales_modeloM)
##NO AUTOCORRELACIÓN##
#HOMBRES
residualesRezagadosH<-dplyr::lag(residuales_modeloH)
plot(residuales_modeloH,residualesRezagadosH)

#MUJERES
residualesRezagadosM<-dplyr::lag(residuales_modeloM)
plot(residuales_modeloM,residualesRezagadosM)

##VARIANZA CONSTANTE (HETEROCEDASTICIDAD) ANALISIS GRÁFICO##


#Para los hombres
(ggplot(modeloH, aes([Link](modeloH),residuales_modeloH))
+ geom_point(col=I("red"))
+ stat_smooth(method = "loess")
+ stat_binhex(bins = 50)
+ scale_fill_gradient(low = "light blue",high = "black")
+ geom_hline(yintercept = 0,col ="black", linetype = "dashed")
+ xlab("Fitted Values")
+ ylab("Residuals"))

#Para las mujeres


(ggplot(modeloM, aes([Link](modeloM),residuales_modeloM))
+ geom_point(col=I("red"))
+ stat_smooth(method = "loess")
+ stat_binhex(bins = 50)
+ scale_fill_gradient(low = "light blue",high = "black")
+ geom_hline(yintercept = 0,col ="black", linetype = "dashed")
+ xlab("Fitted Values")
+ ylab("Residuals"))
#HOMBRES - VARIANZA CONSTANTE
media_ResidualesH <- mean(residuales_modeloH)
sd_ResidualesH <- sd(residuales_modeloH)
limsup= media_ResidualesH + 1.96*sd_ResidualesH
liminf= media_ResidualesH - 1.96*sd_ResidualesH
plot(residuales_modeloH ~ residualesRezagadosH, data=datosH, pch=20, col=2,
xlab="Observaciones", ylab="Residuales",
main="Varianza constante Hombres")
abline(h=c(liminf, limsup), col="blue")

#MUJERES - VARIANZA CONSTANTE


media_ResidualesM= mean(residuales_modeloM)
sd_ResidualesM= sd(residuales_modeloM)
limsup= media_ResidualesM + 1.96*sd_ResidualesM
liminf= media_ResidualesM - 1.96*sd_ResidualesM
plot(residuales_modeloM ~ residualesRezagadosM, data=datosM, pch=20, col=2,
xlab="Observaciones", ylab="Residuales",
main="Varianza constante Mujeres")
abline(h=c(liminf, limsup), col="blue")

bptest(modeloH)
bptest(modeloM)
#correccion de heterocedasticidad
coeftest(modeloH, vcov = vcovHC(modeloH, type = "HC1"))
coeftest(modeloM, vcov = vcovHC(modeloM, type = "HC1"))

#NO MULTICOLINEALIDAD (BAJA MULTICOLINEALIDAD)


#HOMBRES
corrplot(cor(dplyr::select(datosH, horatmesH, anoeducaH , experienciaH, expeCuadraH)),
method = "number", [Link] = "black")
#MUJERES
corrplot(cor(dplyr::select(datosM, horatmesM, anoeducaM , experienciaM, expeCuadraM)),
method = "number", [Link] = "black")

#realizar pruebas de significancia individual de los parametros


#hombres, al 0.05%
confint(modeloH, level=0.90)
#MUJERES, AL 0.05%
confint(modeloM, level=0.90)

#¿diferencias significativas entre hombres y mujeres en la tasa de crecimiento del salario?


confint(modeloH)
confint(modeloM)

[Link](inglabM, inglabH, mu=0)


NOTA IMPORTANTE:ESTE TRABAJO FINAL HA TENIDO CAMBIOS CON RESPECTO A
LA PROPUESTA INICIAL.

También podría gustarte