UNIVERSIDAD NACIONAL DEL ALTIPLANO
FACULTAD DE INGENIERÍA MECÁNICA
ELÉCTRICA, ELECTRÓNICA Y SISTEMAS
ESCUELA PROFESIONAL DE INGENIERÍA DE SISTEMAS
ANÁLISIS DE DATOS CON R PARA DETERMINAR EL
NIVEL DE CUMPLIMIENTO DEL PERFIL DEL INGRESANTE
A LA FACULTAD DE INGENIERÍA MECÁNICA ELÉCTRICA,
ELECTRÓNICA Y SISTEMAS DE LA UNA - PUNO, 2017
TESIS
PRESENTADA POR:
HEBER RAUL ESCARCENA CHACOLLA
TANIA XIOMARA VELASQUEZ RIVERA
PARA OPTAR EL TÍTULO PROFESIONAL DE:
INGENIERO DE SISTEMAS
PUNO - PERÚ
2018
DEDICATORIA
A mi madre Nancy Chacolla, ejemplo de dedicación, trabajo y esfuerzo Gracias
Mamá por darme la vida y quererme mucho.
A mi Padre Raul Escarcena, por haberme apoyado en todo momento, por sus
consejos, sus valores, por la motivación constante que me ha permitido ser una persona
de bien.
A mi hermana Libia por ser el ejemplo de una hermana mayor y de la cual aprendí a
ser muy fuerte y decisivo en tomar decisiones; a mi hermana Fiorela, a mi hermanito
Royer quienes siempre estuvieron apoyándome.
Finalmente, a mis docentes de la Universidad, aquellos que marcaron cada etapa de
mi camino universitario, y que me ayudaron en asesorías y dudas presentadas en
la elaboración de la tesis.
Heber
A Dios por haberme dado vida y salud hasta este momento.
Con todo mi cariño y amor a mis padres que hicieron todo en la vida para que
pudiera lograr mis sueños, por motivarme, aconsejarme y darme la mano cuando más
lo necesitaba.
A toda mi familia quienes han vivido de cerca los distintos procesos de mi vida,
tanto momentos felices y tristes, siempre dándome palabras de aliento y amor.
A Celestina Limachi Miranda, Juan Rivera Rivera y Elias Velasquez Yupanqui por
ser ejemplo de motivación y guía en mi andar por la vida.
Tania
AGRADECIMIENTO
Agradecemos a la Universidad Nacional del Altiplano, escuela profesional de
Ingeniería de Sistemas y sus catedráticos que nos impartieron en aulas todos sus
conocimientos y contribuyeron a nuestra formación profesional.
A Dios por habernos dado vida, salud e inspiración para concluir el presente trabajo.
A cada una de las personas que han brindaron su apoyo y asesoría desinteresada.
De manera muy especial queremos agradecer al Dr. Henry Ivan Condori Alejo, Dr.
Elmer Coyla Idme, Dr. Elvis Aliaga Payehuanca y [Link]. Edgar Holguin Holguin;
docentes que por varios años impartieron sus conocimientos y que por último
aportaron con criterios, consejos, conocimientos y tiempo valiosos para la culminación
de este trabajo.
.
INDICE GENERAL
ÍNDICE DE FIGURAS .................................................................................................. 10
ÍNDICE DE TABLAS .................................................................................................... 13
ÍNDICE DE ANEXOS ................................................................................................... 14
ÍNDICE DE ACRÓNIMOS............................................................................................ 15
RESUMEN ..................................................................................................................... 16
ABSTRACT.................................................................................................................... 17
CAPITULO I .................................................................................................................. 18
1. INTRODUCCIÓN ...................................................................................................... 18
1.1. Planteamiento del problema ......................................................................... 20
1.1.1. Problema general .......................................................................................... 22
1.2. Justificación del problema ............................................................................ 23
1.3. Objetivos de la investigación........................................................................ 24
1.3.1. Objetivo general ........................................................................................... 24
1.3.2. Objetivos específicos .................................................................................... 24
CAPITULO II ................................................................................................................. 25
2. REVISIÓN DE LITERATURA ................................................................................. 25
2.1. Antecedentes de la investigación.................................................................. 25
2.1.1. Antecedentes nacionales ............................................................................... 25
2.1.2. Antecedentes internacionales ....................................................................... 27
2.2. Sustento teórico ............................................................................................ 29
2.2.1. Analisis de datos ........................................................................................... 29
2.2.2. Fases del proceso de análisis de datos .......................................................... 30
[Link]. Especificación de los requisitos de datos .......................................... 30
[Link]. Recopilación de datos ........................................................................ 30
[Link]. Procesamiento de datos ..................................................................... 30
[Link]. Limpieza de datos .............................................................................. 31
[Link]. Análisis de datos ................................................................................ 31
[Link]. Comunicación .................................................................................... 32
2.2.3. ¿Qué es R? .................................................................................................... 32
[Link]. Características importantes ................................................................ 32
[Link]. Data frames en R ............................................................................... 33
[Link]. El paquete ggplot2 ............................................................................. 33
[Link]. El paquete dplyr ................................................................................. 35
[Link]. Script.................................................................................................. 36
[Link]. ¿Por qué R es mejor que excel? ......................................................... 36
2.2.4. Procesos de admision a la universidad nacional del altiplano ...................... 39
2.2.5. Perfil del ingresante a la universidad nacional del altiplano ................. 40
2.3. Glosario de términos básicos ........................................................................ 42
CAPÍTULO III ................................................................................................................ 44
3. MATERIALES Y MÉTODOS ................................................................................... 44
3.1. Metodología de la investigación ................................................................... 44
3.2. Diseño de investigación ................................................................................ 44
3.3. Población y muestra ..................................................................................... 44
3.3.1. Población ...................................................................................................... 44
3.3.2. Muestra ......................................................................................................... 45
3.3.3. Sistema de variables ..................................................................................... 45
3.3.4. Operacionalizacion de variables ................................................................... 46
3.4. Metodología de implementación .................................................................. 48
3.4.1. Metodología CRISP-DM .............................................................................. 48
CAPÍTULO IV ............................................................................................................... 55
4. RESULTADOS Y DISCUSIÓN ................................................................................ 55
4.1. Aplicación de la metodología crisp-dm ........................................................ 55
4.1.1. Comprensión del negocio ............................................................................. 55
4.1.2. Comprensión de los datos ............................................................................. 58
4.1.3. Preparación de los datos ............................................................................... 71
4.1.4. Modelado ...................................................................................................... 75
4.1.5. Evaluación .................................................................................................... 79
4.1.6. Implantación ................................................................................................. 81
4.2. Organización de la información de los ingresantes a la facultad de ingeniería
mecánica eléctrica, electrónica y sistemas de la Universidad Nacional del Altiplano 81
4.3. Gráficos e interpretación del nivel de cumplimiento del perfil del ingresante a
la facultad de ingeniería mecánica eléctrica, electrónica y sistemas de la Universidad
Nacional del Altiplano. ............................................................................................... 83
4.3.1. Nivel de cumplimiento en Matemática I de los ingresantes a la facultad de
ingeniería mecánica eléctrica, electrónica y sistemas ................................................ 83
4.3.2. Nivel de cumplimiento en Matemática II de los ingresantes a la facultad de
ingeniería mecánica eléctrica, electrónica y sistemas ................................................ 88
4.3.3. Nivel de cumplimiento en Física de los ingresantes a la facultad de ingeniería
mecánica eléctrica, electrónica y sistemas respecto al perfil del ingresante ............... 93
4.3.4. Nivel de cumplimiento en Química de los ingresantes a la facultad de
ingeniería mecánica eléctrica, electrónica y sistemas ................................................ 98
4.3.5. Nivel de cumplimiento en Biología de los ingresantes a la facultad de
ingeniería mecánica eléctrica, electrónica y sistemas .............................................. 102
4.3.6. Nivel de cumplimiento en Psicología y Filosofía de los ingresantes a la
facultad de ingeniería mecánica eléctrica, electrónica y sistemas ........................... 107
4.3.7. Nivel de cumplimiento en Geografía de los ingresantes a la facultad de
ingeniería mecánica eléctrica, electrónica y sistemas .............................................. 112
4.3.8. Nivel de cumplimiento en Historia de los ingresantes a la facultad de
ingeniería mecánica eléctrica, electrónica y sistemas .............................................. 116
4.3.9. Nivel de cumplimiento en Educación Cívica de los ingresantes a la facultad
de ingeniería mecánica eléctrica, electrónica y sistemas ......................................... 121
4.3.10. Nivel de cumplimiento en Economía de los ingresantes a la facultad de
ingeniería mecánica eléctrica, electrónica y sistemas .............................................. 124
4.3.11. Nivel de cumplimiento en Comunicación de los ingresantes a la facultad de
ingeniería mecánica eléctrica, electrónica y sistemas .............................................. 128
4.3.12. Nivel de cumplimiento en Literatura de los ingresantes a la facultad de
ingeniería mecánica eléctrica, electrónica y sistemas .............................................. 132
4.3.13. Nivel de cumplimiento en Razonamiento Matemático de los ingresantes a la
facultad de ingeniería mecánica eléctrica, electrónica y sistemas ............................ 136
4.3.14. Nivel de cumplimiento en Razonamiento Verbal de los ingresantes a la
facultad de ingeniería mecánica eléctrica, electrónica y sistemas ........................... 143
4.3.15. Nivel de cumplimiento del perfil del ingresante a la facultad de ingeniería
mecánica eléctrica, electrónica y sistemas ................................................................ 151
CONCLUSIONES ........................................................................................................ 157
RECOMENDACIONES ............................................................................................... 158
BIBLIOGRAFÍA .......................................................................................................... 159
ANEXOS ...................................................................................................................... 161
ÍNDICE DE FIGURAS
Figura 3.1: Fases de CRISP-DM .............................................................................. 49
Figura 4.1: Prueba de exploración de datos .............................................................. 69
Figura 4.2: Lectura de archivos ................................................................................ 76
Figura 4.3: Resultados del análisis de Matemática I ................................................ 84
Figura 4.4: Densidad Kernel en Matemática I .......................................................... 84
Figura 4.5: Resultado de análisis de Ecuaciones lineales, cuadráticas y otros ......... 85
Figura 4.6: Resultado de análisis en Inecuaciones Lineales, Cuadráticas ............... 86
Figura 4.7: Factorización, Racionalización y Radicación ........................................ 87
Figura 4.8: Resultado de análisis de Expresiones Algebraicas, y operaciones........ 87
Figura 4.9: Resultado del Análisis de Matemática II ............................................... 88
Figura 4.10: Densidad de Kernel en Matemática II .................................................. 89
Figura 4.11: Resultado de análisis de Segmentos y Ángulos geométricos ............... 90
Figura 4.12: Resultado de análisis de Geometría analítica ....................................... 91
Figura 4.13: Resultado de análisis de Funciones trigonométricas ............................ 91
Figura 4.14: Resultado de análisis de Triángulos ..................................................... 92
Figura 4.15: Análisis de Física ................................................................................. 93
Figura 4.16: Densidad Kernel en Física.................................................................... 94
Figura 4.17: Resultado de análisis de Trabajo y Potencia ........................................ 95
Figura 4.18: Resultado de análisis de Electricidad y Magnetismo ........................... 96
Figura 4.19: Resultado del análisis de Dinámica ...................................................... 96
Figura 4.20: Resultado del análisis de Estática......................................................... 97
Figura 4.21: Resultado del Análisis de Química ...................................................... 98
Figura 4.22: Densidad Kernel en Química ............................................................... 99
Figura 4.23: Resultado del análisis de Funciones Químicas .................................. 100
Figura 4.24: Resultado del análisis de Estructura Atómica .................................... 100
Figura 4.25: Resultado del análisis de Materia - Energía ....................................... 101
Figura 4.26: Resultado del análisis de Funciones químicas oxigenadas ................ 102
Figura 4.27: Resultado del análisis de Biología ..................................................... 103
Figura 4.28: Densidad de Kernel en Biología......................................................... 103
Figura 4.29: Resultado del análisis de la Célula ..................................................... 104
Figura 4.30: Resultado del análisis de Fisiología Celular ...................................... 105
Figura 4.31: Resultado de análisis de Circulación .................................................. 106
Figura 4.32: Resultado de análisis de Ecología ...................................................... 106
Figura 4.33: Resultado del análisis de Psicología y Filosofía ................................ 107
Figura 4.34: Densidad de Kernel en Psicología y Filosofía ................................... 108
Figura 4.35: Resultado del análisis de Los Procesos Afectivos ............................. 109
Figura 4.36: Resultado del análisis de Estudio del Desarrollo Humano ................ 110
Figura 4.37: Resultado del Análisis de Filosofía .................................................... 110
Figura 4.38: Resultado del análisis de Epistemología ............................................ 111
Figura 4.39: Resultado del análisis de Geografía ................................................... 112
Figura 4.40: Densidad de kernel en Geografía ....................................................... 113
Figura 4.41: Resultados de Geografía del Perú ...................................................... 114
Figura 4.42: Resultado del análisis del Sistema planetario solar ............................ 114
Figura 4.43: Resultados del análisis del Sistema planetario solar. La tierra .......... 115
Figura 4.44: Resultados del análisis de Geografía del Perú Minerales .................. 116
Figura 4.45: Resultado del análisis del área de Historia ......................................... 117
Figura 4.46: Densidad de Kernel en Historia ......................................................... 117
Figura 4.47: Resultados del análisis de Transformaciones del Perú....................... 118
Figura 4.48:Resultados del análisis de Hechos y acontecimientos ........................ 119
Figura 4.49: Resultado del análisis de El mundo colonial como producto de la
tradición europea y andina ....................................................................................... 120
Figura 4.50: Resultado del análisis de Movimientos continentales ........................ 120
Figura 4.51: Resultados del análisis de Educación Cívica ..................................... 121
Figura 4.52: Densidad Kernel en Educación Cívica ............................................... 122
Figura 4.53: Resultado del análisis de La Constitución Política y la estructura .... 123
Figura 4.54: Resultado del análisis de la Familia ................................................... 123
Figura 4.55: Resultado del análisis de Economía ................................................... 124
Figura 4.56: Densidad de Kernel en Economía ...................................................... 125
Figura 4.57: Resultado del análisis del Sistema Financiero ................................... 126
Figura 4.58: Resultado del análisis de La Producción ............................................ 126
Figura 4.59: Resultado del Análisis de Competencia y Monopolio ....................... 127
Figura 4.60: Resultados del análisis de Comunicación .......................................... 128
Figura 4.61: Densidad de Kernel en Comunicación ............................................... 129
Figura 4.62: Resultados del análisis de Teoría del texto – Texto descriptivo ........ 130
Figura 4.63: Resultado del análisis de Técnicas de lectura y teoría del texto ........ 130
Figura 4.64: Resultado del análisis de Ortografía y gramática ............................... 131
Figura 4.65: Resultado del análisis de Teoría del texto .......................................... 132
Figura 4.66: Resultado del análisis de Literatura ................................................... 133
Figura 4.67: Densidad de Kernel en Literatura....................................................... 133
Figura 4.68: Resultado del análisis de pregunta de Literatura ................................ 134
Figura 4.69: Resultado del análisis de Literatura loca, regional y Perú ................. 135
Figura 4.70: Resultado del análisis de Razonamiento Matemático ........................ 136
Figura 4.71: Densidad Kernel en Razonamiento Matemático ................................ 137
Figura 4.72: Resultado del análisis de Problemas de edades .................................. 138
Figura 4.73: Resultado del análisis de Analisis Combinatorio ............................... 138
Figura 4.74: Resultado del análisis de Series y Sucesiones .................................... 139
Figura 4.75: Resultado del análisis de Planteo de ecuaciones ................................ 140
Figura 4.76: Resultado del análisis de Sistemas de numeración ............................ 140
Figura 4.77: Resultado del análisis de Figuras sombreadas ................................... 141
Figura 4.78: Resultado del análisis de Operadores matemáticos............................ 142
Figura 4.79: Resultado del análisis de sumatorias .................................................. 142
Figura 4.80: Resultado del análisis de Razonamiento Verbal ................................ 144
Figura 4.81: Densidad Kernel en Razonamiento verbal ......................................... 144
Figura 4.82: Resultado del análisis de Comprensión de textos .............................. 146
Figura 4.83: Resultado del análisis del Plan de Redacción .................................... 146
Figura 4.84: Resultado del análisis de Analogías ................................................... 147
Figura 4.85: Resultados del análisis de Término excluido ..................................... 148
Figura 4.86: Resultado del análisis de Antónimos ................................................. 148
Figura 4.87: Resultado del análisis de Palabras homógrafas .................................. 149
Figura 4.88: Resultado del análisis de sinónimos ................................................... 150
Figura 4.89: Resultado del análisis de Inclusión de términos................................. 150
Figura 4.90: Nivel de cumplimiento por áreas ....................................................... 153
ÍNDICE DE TABLAS
Tabla 2.1: Cantidad de ingresantes a la FIMEES en procesos de admisión 2017 .... 40
Tabla 2.2: Perfil del ingresante al área de ciencias de la ingeniería.......................... 41
Tabla 3.1: Cantidad de ingresantes en modalidad ordinaria- examen general ......... 45
Tabla 3.2: Operacionalización de variables .............................................................. 46
Tabla 4.1: Datos de los ingresantes a Ingeniería Mecánica Eléctrica ....................... 60
Tabla 4.2: Respuestas de ingresantes a Ingeniería Mecánica Eléctrica .................... 62
Tabla 4.3: Ingresantes a Ingeniería Electrónica ........................................................ 63
Tabla 4.4: Respuestas de ingresantes a Ingeniería Electrónica ................................. 65
Tabla 4.5: Datos de ingresantes a Ingeniería de sistemas ......................................... 66
Tabla 4.6: Respuestas de ingresantes a Ingeniería de Sistemas ................................ 68
Tabla 4.7: Respuestas para limpieza de datos ........................................................... 72
Tabla 4.8: Construcción de datos .............................................................................. 73
Tabla 4.9: Clave de respuestas para el área de ingenierías ....................................... 74
Tabla 4.10: Nivel de cumplimiento del perfil del ingresante FIMEES .................. 151
Tabla 4.11: Etapas de metodología KDD y metodología CRISP-DM ................... 155
ÍNDICE DE ANEXOS
ANEXO 1: Resolución Rectoral Nº 3231-2014-UNA ....................................... 161
ANEXO 2: Resolución Rectoral Nº 1334-2017-R-UNA ................................... 166
ANEXO 3: Ponderación de áreas en nivel de cumplimiento ............................. 190
ÍNDICE DE ACRÓNIMOS
TÉRMINO SIGNIFICADO
CCA Comisión Central de Admisión
CRAN Del inglés Comprehensive R Archive
Network
CRISP - DM Del inglés Cross Industry Standard
Process for Data Mining
ETL Extraer, transformar y cargar
FIMEES Facultad de Ingeniería Mecánica
Eléctrica, Electrónica y Sistemas
UNA Universidad Nacional del Altiplano
RESUMEN
El presente trabajo de investigación, propone un análisis de datos con R para
determinar el nivel de cumplimiento del perfil del ingresante a la Facultad de Ingeniería
Mecánica Eléctrica, Electrónica y Sistemas de la Universidad Nacional del Altiplano.
Para el desarrollo se utilizó la Metodología de análisis CRISP-DM (Cross Industry
Standard Process for Data Mining) en sus seis fases que están conformadas por la
comprensión del negocio, comprensión de los datos, preparación de los datos, modelado,
evaluación e implementación. Como entorno de análisis, procesamiento y visualización
de datos se utilizó la herramienta R Studio y los paquetes dplyr y ggplot2, entre otros. La
población de estudio estuvo constituida por los ingresantes a la Facultad de Ingeniería
Mecánica Eléctrica, Electrónica y Sistemas de la Universidad Nacional del Altiplano en
el examen de modalidad general del 21 de mayo del año 2017. Como resultado en base a
los datos generados, se obtuvo que el nivel de cumplimiento del perfil de ingresante a la
Facultad de Ingeniería Mecánica Eléctrica, Electrónica y Sistemas es de 55.14%. En la
escuela profesional de Ingeniería Mecánica Eléctrica el nivel de cumplimento del perfil
del ingresante es de 55.36%. Por otra parte, en la escuela profesional de Ingeniería
Electrónica el nivel obtenido es de 51.6% y en la escuela profesional de Ingeniería de
Sistemas, el resultado del nivel de cumplimiento es de 58.48%. Los resultados obtenidos
producto del análisis de datos, se encuentran dentro de las expectativas del perfil del
ingresante al área de ciencias de la Ingeniería de la Universidad Nacional del Altiplano.
PALABRAS CLAVE: Análisis de datos, R, perfil del ingresante, CRISP-DM.
16
ABSTRACT
The research proposes a data analysis with R, in order to determine the profile's
fulfillment level of the admitted students in the Faculty of Mechanical Electrical,
Electronics and Systems Engineering of the National University of the Altiplano. For the
development, the CRISP-DM methodology (Cross Industry Standard Process for Data
Mining) was used, in the six phases that are business understanding phase, understanding
the data, data preparation, modeling evaluation and implementation. The R Studio tool
and the dplyr and ggplot2 packages, among others, were used as data analysis, processing
and visualization environments. The study population was constituted by the admitted
students to the Faculty of Electrical Mechanical Engineering, Electronics and Systems of
the National University of the Altiplano in the general modality exam on May 21, 2017.
As a result, based in generated data, was obtained that the level of fulfillment of the
admitted student profile in the Faculty of Electrical, Electronic and Systems Mechanical
Engineering is 55.14%. In the professional school of Electrical Mechanical Engineering
the level of fulfillment of the profile of the admitted students is 55.36%. On the other
hand, in the professional school of Electronic Engineering the obtained level is 51.6%
and finally in the professional school of Systems Engineering, the result is 58.48%. The
results of the data analysis are within the expectations of the admitted students' profile to
the area of Engineering Sciences of the National University of the Altiplano
KEYWORDS: Data analysis, R, admitted student’s profile, CRISP-DM.
17
CAPITULO I
INTRODUCCIÓN
El desconocimiento del nivel de cumplimiento del perfil del ingresante a la
Universidad Nacional del Altiplano respecto de los ingresantes a la Facultad de
Ingeniería Mecánica Eléctrica, Electrónica y Sistemas, es un problema y una
oportunidad que requiere la definición e implementación de un análisis de datos, que
permita aprovechar los datos disponibles para extraer conocimiento y que sirvan de
apoyo a la toma de decisiones futuras.
La herramienta R contribuye de manera progresiva frente a la necesidad de procesar
datos y convertirlos en información relevante que pueda servir para la toma de
decisiones y mejora de procesos en diversas instituciones. Un claro ejemplo de ello
son los procesos de admisión a las diversas universidades, en las que se presentan miles
de postulantes para ser evaluados con una prueba de conocimientos y actitudes;
generándose de estas evaluaciones grandes cantidades de datos que son inutilizados
pero que podrían constituir una fuente de información valiosa para la misma
institución. Durante el 2017 convoco a ocho procesos de admisión en los que se
tuvieron 5283 ingresantes, por lo que se obtiene información del rendimiento
académico de los postulantes en las distintas modalidades de ingreso.
Teniendo en cuenta lo anterior, se realizó el planteamiento de esta investigación,
con el objetivo de realizar un análisis de datos con R para determinar el nivel de
cumplimiento del perfil del ingresante a la Universidad Nacional Del Altiplano.
En el Capítulo I, se tiene el planteamiento del problema, el cual comprende el
problema general, los problemas específicos, la justificación de la investigación, los
objetivos generales y específicos de la presente investigación.
18
En el Capítulo II, se desarrolla la revisión de literatura, partiendo de los antecedes
nacionales e internacionales de la presente investigación, sustento teórico de las
herramientas utilizadas para el desarrollo de la presente investigación.
En el Capítulo III, se describen los materiales y métodos de la investigación,
incluyendo la metodología CRISP -DM, diseño de la investigación, población, muestra
y operacionalización de variables independiente y dependiente de la presente
investigación.
En el Capítulo IV, se tiene los resultados y discusión, en donde se dará desarrollo
a las seis fases de la metodología CRISP-DM, comprensión del problema,
comprensión de los datos, preparación de los datos, modelado, evaluación e
implantación del modelo de análisis desarrollado, en el que se obtienen ilustraciones
por cada requisito exigido en el perfil del ingresante a la Universidad Nacional del
Altiplano que es comparado con la evaluación de conocimientos que estos rinden,
prueba en la que son evaluados en 14 áreas por lo que los resultados obtenidos son
para cada una de estas, a su vez se realiza un análisis de todas las preguntas que
comprenden cada área evaluada, también se incluye el grafico según la densidad de
kernel para determinar el nivel de asertividad de las respuestas del ingresante. En
cuanto al nivel de cumplimiento se obtienen resultados del análisis de la ponderación
de los resultados obtenidos por los ingresantes.
Finalmente, se tienen las conclusiones y recomendaciones a las que se arribaron
posterior al análisis de los datos de desempeño académico de los ingresantes a la
Facultad de Ingeniería Mecánica Eléctrica, Electrónica y Sistemas en función a lo
establecido en los requisitos del ingresante a la Universidad Nacional del Altiplano,
estas conclusiones y recomendaciones son descritas conforme a lo desarrollado en el
marco teórico y resultados obtenidos en la investigación.
19
[Link] DEL PROBLEMA
La Universidad Nacional del Altiplano, es una universidad pública ubicada en la
ciudad de Puno organizada en 19 facultades y 35 escuelas profesionales, entre ellas la
Facultad de Ingeniería Mecánica Eléctrica, Electrónica y Sistemas. Actualmente, para
alcanzar una vacante de ingreso, la Universidad Nacional del altiplano convoca a
procesos de admisión a través de la Comisión Central de Admisión (CCA). Según la
Resolución Rectoral N° 1334-2017-R-UNA, que aprobó el Reglamento de Admisión
2017, el que indica que los procesos de admisión de Pre Grado a todas las Escuelas
Profesionales de la Universidad Nacional del Altiplano se dan en dos modalidades:
a) Ordinario, que comprende:
• Examen General de Admisión
• Centro Preuniversitario
b) Extraordinario
• Primeros Puestos
• Traslados externos
• Traslados internos
• Titulados o graduados
• Deportistas calificados
Específicamente en el examen general, se evalúa a los postulantes en un total de 14
áreas como son: Matemática I, Matemática II, Física, Química, Biología, Psicología y
Filosofía, Geografía, Historia, Educación Cívica, Economía, Comunicación,
Literatura, Razonamiento Matemático y Razonamiento Verbal.
Según la Comisión Central de Admisión CCA de la Universidad Nacional del
Altiplano, se llevaron a cabo tres procesos de admisión en modalidad general durante
el 2017, para el ingreso a la Facultad de Ingeniería Mecánica Eléctrica, Electrónica y
20
Sistemas, llegándose a un total de 173 ingresantes. En cada uno de estos procesos de
admisión se recopilan entre los datos más resaltantes los de la tarjeta de respuestas de
los ingresantes.
Por otra parte, la Universidad Nacional del Altiplano establece el perfil del, por
áreas: Biomédicas, Ciencias de la Ingeniería y Ciencias Sociales y cada uno de estos
con su respectiva matriz para evaluar el perfil del ingresante en el que se incluye las
técnicas e instrumentos a utilizarse, pero actualmente se desconoce el grado de
cumplimiento de los requisitos establecido en el perfil del ingresante planteado por la
Universidad Nacional del Altiplano por parte de los ingresantes a la Facultad de
Ingeniería Mecánica Eléctrica, Electrónica y Sistemas.
El software R Studio constituye un entorno de desarrollo integrado (IDE) para el
lenguaje de programación R, recomendable para generar y visualizar gráficos, esta
herramienta se desarrolló de manera progresiva frente a la necesidad de procesar datos
y convertirlos en información relevante que pueda servir para la toma de decisiones y
mejora de procesos en diversas instituciones. Un claro ejemplo de ello son los procesos
de admisión a las diversas universidades, en las que se presentan miles de postulantes
para ser evaluados con una prueba de conocimientos y actitudes; generándose de estas
evaluaciones grandes cantidades de datos que son inutilizados pero que podrían
constituir una fuente de información valiosa para la misma institución.
Siguiendo los planteamientos anteriores, se cuenta con resultados de los procesos
de admisión obtenidos de la Comisión Central de Admisión y existe el
desconocimiento del nivel de cumplimiento de los requisitos exigidos en el perfil de
ingreso, por parte de los ingresantes a la Facultad de Ingeniería Mecánica Eléctrica,
Electrónica y Sistemas, hecho que se convierte en un problema y en una oportunidad
que requiere la definición e implementación de un análisis de datos con R que permita
21
aprovechar dichos datos disponibles para extraer conocimiento y que sirvan de apoyo
a la toma de decisiones en futuras investigaciones.
En el proceso de minería de datos es usual que las técnicas descriptivas o predictivas
utilizadas se apliquen sobre dataset extraídos de los datos por conveniencia o necesidad
del trabajo en concreto (Larose, 2016). Con respecto a las técnicas de análisis
multidimensionales estas se ven como un enfoque llamativo para lograr el cruce de
variables, pero los costos de las consultas se expresan como dificultades para su
implementación práctica y generalizada, en particular en instituciones disponibles para
usuarios diversos.
El almacenamiento y actualización de los datos registrados del rendimiento
académico de los ingresantes a la Facultad de Ingeniería Mecánica Eléctrica,
Electrónica y Sistemas implica un proceso de limpieza, filtrado y transformación (ETL)
y por otro lado el tipo y la estructura del esquema de análisis se refleja en las
ilustraciones del rendimiento académico de la muestra que se requiera y la
disponibilidad para la aplicación del software R Studio. El análisis de datos del
rendimiento académico de los ingresantes a la Facultad de Ingeniería Mecánica
Eléctrica, Electrónica y Sistemas de la Universidad Nacional del Altiplano, es una
fuente valiosa de información para determinar el grado de cumplimiento de los
requisitos establecidos en el perfil del ingresante al área de ciencias de la ingeniería.
Por lo descrito anteriormente, se formuló el siguiente problema:
1.1.1. PROBLEMA GENERAL
¿En qué medida el análisis de datos con R determinará el nivel de cumplimiento del
perfil del ingresante a la Facultad de Ingeniería Mecánica Eléctrica, Electrónica y
Sistemas?
22
[Link]ÓN DEL PROBLEMA
El enfoque de análisis de datos ofrece un abanico de tecnologías para el análisis
inteligente de datos, que están expuestos en las nuevas tecnologías de la información,
y se tendrá en cuenta para determinar el nivel de cumplimiento del perfil del ingresante
a la Facultad de Ingeniería Mecánica Eléctrica, Electrónica y Sistemas si los
ingresantes cumplen con lo exigido por el perfil del estudiante al área de ciencias de
la ingeniería de la Universidad Nacional del Altiplano de Puno. Técnicamente, se
utilizará un proceso que consiste en la organización de datos para analizarlos mediante
scripts que permiten determinar la información exacta respecto a nivel de
cumplimiento del perfil del ingresante. Un aporte rescatable de esta investigación es
el análisis satisfactorio con R para transformar los datos en conocimiento útil mediante
el análisis, proceso y almacenamiento de los datos recogidos.
Este trabajo de investigación permitirá conocer en qué medida los ingresantes a las
carreras de Ingeniería Mecánica Eléctrica, Electrónica y Sistemas cumplen con los
requisitos exigidos en el perfil del ingresante, mediante un análisis de datos con R del
desempeño académico de los ingresantes. Se realizó una investigación que se orientó
hacia el fortalecimiento de una estrategia para el tratamiento de datos del desempeño
académico de los ingresantes a la Facultad de Ingeniería Mecánica Eléctrica,
Electrónica y Sistemas de la Universidad Nacional del Altiplano durante el 2017,
incluyendo desde la preparación de los datos, modelado, evaluación y desarrollo del
análisis.
El análisis de Datos con R trata de hacer frente al desconocimiento del nivel de
cumplimiento del perfil del ingresante a la Facultad de Ingeniería Mecánica Eléctrica,
Electrónica y Sistemas de la Universidad Nacional del Altiplano.
23
Las principales contribuciones logradas con esta tesis se pueden resumir en los
siguientes aspectos:
• Desde una perspectiva conceptual se planteó la aplicación de la herramienta R
para la gestión de datos que abarca la preparación de los datos, evaluación y
desarrollo del análisis, pensando en la posibilidad de acoplar los paquetes de R en
una o más de estas capas de la metodología CRISP-DM (Cross Industry Standard
Process for Data Mining).
• Desde la perspectiva de investigación aplicada (investigación y desarrollo) se
trabajó en varios aspectos de la preparación de los datos, evaluación y desarrollo
del análisis, aplicando esto a la muestra de estudio seleccionada respecto al perfil
del ingresante.
[Link] DE LA INVESTIGACIÓN
1.3.1. OBJETIVO GENERAL
Realizar un análisis de datos con R para determinar el nivel de cumplimiento del perfil
del ingresante a la Facultad de Ingeniería Mecánica Eléctrica, Electrónica y Sistemas de
la Universidad Nacional del Altiplano.
1.3.2. OBJETIVOS ESPECÍFICOS
• Organizar la información de los ingresantes a la Facultad de Ingeniería Mecánica
Eléctrica, Electrónica y Sistemas de la Universidad Nacional del Altiplano .
• Implementar un modelo de análisis de datos del perfil del ingresante basado en la
metodología CRISP-DM en Rstudio.
• Analizar el nivel de cumplimiento del perfil del ingresante a la Facultad de Ingeniería
Mecánica Eléctrica, Electrónica y Sistemas de la Universidad Nacional del Altiplano.
24
CAPITULO II
REVISIÓN DE LITERATURA
[Link] DE LA INVESTIGACIÓN
2.1.1. ANTECEDENTES NACIONALES
Se tiene como como antecedente nacional la investigación denominada “Evaluación
del Rendimiento Académico de los Alumnos Ingresantes a la Escuela Profesional de
Ingeniería Industrial: Semestres: 2008A, 2008B, 2009A y su Impacto en la Población
Académica de la FIIS-UNAC” presentado en la Universidad Nacional del Callao por
(Suárez, 2010), se menciona lo siguiente:
Respecto a las Técnicas Estadísticas utilizadas en la investigación se tiene el Muestreo
Aleatorio Simple, dirigido a la obtención del grupo muestral y la utilización de un
software estadístico para visualizar el rendimiento de cada grupo muestral. Como
resultado del análisis se obtuvieron 30 gráficos generales del rendimiento académico en
la carrera de Ingeniería Industrial, indicando como conclusiones que, de las vacantes
propuestas, aproximadamente el 10% no se matriculan; y el 5% de alumnos matriculados,
no asisten a clases, presumiblemente porque postulan a dos universidades y ellos al
comparar el Plan Curricular de una y otra Universidad, eligen a la que mejor esté
adecuada al mercado laboral. También se menciona que existen diferencias significativas
entre el desarrollo de los sílabos y el perfil profesional de la EPII ya que no se cuenta con
los Laboratorios adecuados en Informática, Física, Química, Estudio del Trabajo y Dibujo
de Ingeniería entre otros. Estas deficiencias afectan directamente al proceso de enseñanza
- aprendizaje que los alumnos deben recibir, con calidad y finalmente se indica que la
acreditación universitaria exige en uno de sus factores de calificación, que como mínimo
el 25% de los titulados deben ser por trabajos de investigación, el actual Plan Curricular,
25
no permite el |ogro de este objetivo, ya que solamente se cuenta con un solo curso en
investigación y que incluso se dicta en el primer ciclo. Por lo tanto, se requiere un cambio
inmediato de| Plan curricular, donde incluya mínimamente tres cursos de Investigación,
que pueden ser: Metodología de la investigación Científica, Seminario de Tesis en
Investigación Tecnológica y Desarrollo de Tesis en Investigación Tecnológica.
También se tiene como antecedente nacional, la investigación denominada: “Guía
Metodológica para Obtener Patrones de Accidentabilidad Laboral usando Data Mining”
presentado en la Universidad de Piura por (Cevallos, 2013), que concluye lo siguiente:
La metodología expuesta en el presente documento no pretende implantar un método
único e infalible para determinar patrones de accidentabilidad. El espectro de
investigación y las posibilidades que ofrece el data mining son muy amplias como para
pretender establecer un estándar único. No obstante, recomienda una serie de pasos a
seguir para obtener un resultado específico que es hallar patrones de accidentabilidad. Ya
se ha mencionado que las empresas tienen la posibilidad de usar la estadística descriptiva
tradicional con la salvedad que la posibilidad de obtener conocimiento es reducida. El
data mining ofrece herramientas más robustas para este fin. Por otro lado, es preciso
reconocer que actualmente el Perú vive un contexto nuevo en relación a la gestión de la
seguridad y salud de sus trabajadores. La publicación de la legislación en estas materias
ha establecido un nuevo orden de trabajo para las empresas en las que esta disciplina ya
no será considerada como “algo más” sino que pasa a ser protagonista con una concepción
más interesante: ya no se trata de un gasto, sino de una inversión. El conocimiento que se
pueda obtener para entender la dinámica de la accidentabilidad de las empresas resulta
crucial en la implementación de medidas claras. Este trabajo debe ser tomado como una
guía referencial ya que en cierta medida es abstracto respecto a los caminos que debe
seguir un analista, es imposible determinar lo que se debe hacer en cada etapa del proceso
26
respecto al análisis que cualquiera decida realizar, aunque sí se pueden dar
recomendaciones y pautas a seguir, siempre apoyados en la metodología KDD. (p. 50)
2.1.2. ANTECEDENTES INTERNACIONALES
Se tiene como como antecedente internacional la investigación denominada "Data
Mining en el cálculo de Influencia en redes sociales" presentado en la Universidad de
Buenos Aires por (Rodríguez, 2014), que ha concluido en lo siguiente:
El producto este trabajo es un novedoso mecanismo que logra el objetivo de seleccionar,
a partir de orígenes de datos muy diversos, un conjunto de usuarios con alto grado de
influencia sobre el resto de la población, respetando las premisas planteadas de lograr
resultados de calidad en tiempos de procesamiento computacionalmente razonables.
A partir de las optimizaciones introducidas al modelo de datos original, los criterios de
conservación de datos establecidos y la posibilidad de parametrización ofrecida y
disponible al usuario final, se logró reducir notablemente el tamaño de la información
procesada. A su vez, la utilización de técnicas de clustering en la etapa final del proceso
permitió transformar el algoritmo Greedy, computacionalmente prohibitivo en su versión
original, en un procedimiento factible de ser utilizado en la búsqueda de usuarios
influenciadores. En este punto es importante destacar que sucesivas corridas, en las cuales
no se modificaron los valores de los parámetros de entrada, arrojaron resultados
prácticamente idénticos, confirmando que el agente aleatorio utilizado a la hora de elegir
un nodo por cluster no aporta ruido al proceso, gracias a la correcta definición del factor
de similitud. (p. 84)
La investigación denominada "Plan para enfocar las campañas bancarias utilizando
Datamining" presentado en la Universidad de Chile por (Luca, 2006), ha concluido lo
siguiente:
27
• De la fase de comprensión del negocio puede concluirse que es importante
identificar los objetivos de negocios que se espera con el proyecto de datamining,
de manera tal de hacer posible la validación de sus resultados contra dichos
objetivos. Ello está pensado para garantizar que los resultados de la minería de
datos no solo sean técnicamente válidos, sino que además tengan significado
desde el punto de vista de negocios. Así también de la fase de comprensión del
negocio puede concluirse que no es posible realizar estudios de datamining si
contar con el respaldo decidido de alguna gerencia, como única forma de
neutralizar los riesgos organizacionales y de timing del proyecto. En directa
relación con lo antes mencionado se encuentra una conclusión aún más
fundamental, y que establece que el éxito de un proyecto de datamining depende
no solo de que se satisfagan ciertos objetivos de negocios del Banco, sino que en
mucha mayor medida de que se logren beneficios tangibles para el patrocinador
del proyecto y sus intereses.
• De la fase de comprensión de los datos puede concluirse que a priori las
características más relevantes para predecir el nivel de riesgo crediticio de los
clientes y su rentabilidad potencial incluyen aspectos demográficos, renta, nivel
de vínculo entre el cliente y el banco, los ingresos contables y características
importantes.
• De la fase de preparación de los datos se concluye que puede ser inmenso el
esfuerzo destinado a integrar los datos necesarios para el estudio y a eliminar sus
inconsistencias, por cuanto al no existir un datawarehouse es preciso mezclar
datos provenientes de bases de datos operacionales residentes en sistemas
distintos y con información de fechas distintas.
28
• De la fase de modelamiento se puede concluir que es posible elaborar modelos
predictivos del riesgo de crédito y de la rentabilidad potencial de los clientes,
usando para ello técnicas de dataminig como la regresión logística, las redes
neuronales o los árboles de decisión.
• En la fase de despliegue puede concluirse que el éxito de los modelos de dataminig
en campañas bancarias podrán visualizarse a largo plazo. (p. 210)
[Link] TEÓRICO
2.2.1. ANALISIS DE DATOS
El Análisis de datos conlleva la recolección, transformación, limpieza y modelado de
datos con el objetivo de descubrir información útil y trascendente para los intereses de la
organización. Los resultados así obtenidos se comunican, se sugieren conclusiones y se
usan para apoyar la toma de decisiones. (Marketing Analítico, 2017). La visualización
gráfica de los datos se utiliza con frecuencia para retratar los datos y conseguir descubrir
patrones útiles con mayor facilidad.
El proceso de análisis de datos consiste en las siguientes fases de naturaleza iterativa:
• Especificación de los requisitos de datos
• Recopilación de datos
• Procesamiento de datos
• Limpieza de datos
• Análisis de los datos
• Comunicación
29
2.2.2. FASES DEL PROCESO DE ANÁLISIS DE DATOS
[Link].ESPECIFICACIÓN DE LOS REQUISITOS DE DATOS
Los datos requeridos para el análisis se basan en una pregunta o un experimento.
Basándose en los requisitos, se identifican los datos necesarios, desde la población o
colección de datos a las variables o atributos específicos de los mismos. (Marketing
Analítico, 2017). Se plantean preguntas de interés para la investigación, como pueden ser:
• ¿Cuál es el nivel de rendimiento respecto a la variable X?
• ¿Qué tan probable es la situación de cambio en los datos?
• ¿Cuál es el reporte de forma individual a general y viceversa?
[Link].RECOPILACIÓN DE DATOS
La recopilación de datos en el proceso de análisis de datos trata de la recolección de
información sobre las variables seleccionadas como requisitos de datos. El énfasis está en
garantizar la recolección exacta y honesta de datos. La recopilación de datos asegura que
los datos recogidos sean precisos de tal manera que las decisiones relacionadas sean
válidas. (Marketing Analítico, 2017)
La recolección de datos proporciona tanto una línea de base para medir como una meta
para mejorar. Los datos se recopilan de diversas fuentes, desde bases de datos
organizacionales hasta información en páginas web o redes sociales.
Los datos así obtenidos pueden no estar estructurados y pueden contener información
irrelevante. Por lo tanto, los datos recogidos requieren ser sometidos al procesamiento y
limpieza de datos.
[Link].PROCESAMIENTO DE DATOS
Los datos que se recogen deben ser procesados u organizados para su análisis. Esto
incluye estructurar los datos según sea necesario para las herramientas de análisis
30
pertinentes. Técnicas como la minería de datos, procesamiento de lenguaje natural (PNL)
y análisis de texto proporcionan diferentes métodos para encontrar patrones en esta
información o para interpretarla de alguna otra manera. (Marketing Analítico, 2017)
Por ejemplo, es posible que los datos tengan que colocarse en filas y columnas en una
tabla dentro de una hoja de cálculo o en una aplicación estadística. Es posible que se tenga
que crear un modelo de datos.
[Link].LIMPIEZA DE DATOS
En esta etapa del proceso de análisis de datos se realiza debido a que datos procesados
y organizados pueden estar incompletos, contener duplicados o contener errores. La
limpieza de datos es el proceso de prevenir y corregir estos errores. Existen varios tipos
de limpieza de datos que dependen del tipo de datos. Del mismo modo, los métodos de
datos cuantitativos pueden utilizarse para la detección de valores atípicos que
posteriormente se excluirán en el análisis. (Marketing Analítico, 2017)
[Link]. ANÁLISIS DE DATOS
Esta es la fase fundamental del proceso de análisis de datos, a la cual se tiene los datos
procesados, organizados y limpios. Se disponen de varias técnicas de análisis de datos
para comprender, interpretar y derivar conclusiones basadas en los requisitos.
La visualización de datos también se puede utilizar para examinar los datos en formato
gráfico y para obtener información adicional sobre los mensajes dentro de los datos. Los
Modelos de datos estadísticos como la correlación y el análisis de regresión se puede
utilizar para identificar las relaciones entre las variables de datos. Estos modelos
descriptivos de los datos son útiles para simplificar el análisis y comunicar resultados. El
proceso puede requerir una limpieza de datos adicional o una recopilación de datos
adicional, por lo que estas actividades son de naturaleza iterativa. (Marketing Analítico,
2017)
31
[Link].COMUNICACIÓN
Una vez concluidas las fases fundamentales del proceso de análisis de datos, los
resultados deben presentarse en un formato tal como lo requieran los usuarios para apoyar
sus decisiones y acciones futuras. La retroalimentación de los usuarios podría resultar en
un análisis adicional.
Los analistas de datos pueden elegir técnicas de visualización de datos, tales como
tablas y gráficos, que ayudan a comunicar el mensaje clara y eficientemente a los
usuarios. Las herramientas gráficas de análisis de datos proporcionan facilidad para
resaltar la información requerida con códigos de color y formato en tablas y gráficos.
(Marketing Analítico, 2017)
2.2.3. ¿QUÉ ES R?
R es un lenguaje de programación interpretado, de distribución libre, bajo Licencia
GNU, y se mantiene en un ambiente para el cómputo estadístico y gráfico. Este software
corre en distintas plataformas Linux, Windows, MacOS, e incluso en PlayStation 3. El
término ambiente pretende caracterizarlo como un sistema totalmente planificado y
coherente, en lugar de una acumulación gradual de herramientas muy específicas y poco
flexibles, como suele ser con otro software de análisis de datos (Santana, 2014 ).
[Link].CARACTERÍSTICAS IMPORTANTES
El sistema R está dividido en dos partes conceptuales:
• El sistema base de R, que es el que puedes bajar de CRAN; y,
• En todo lo demás. La funcionalidad de R consta de paquetes modulares.
El sistema base de R contiene el paquete básico que se requiere para su ejecución y la
mayoría de las funciones fundamentales. Los otros paquetes contenidos en la “base” del
sistema incluye a utils, stats, datasets, graphics, grDevices, grid, tools, parallel, compiler,
splines, tcltk, stats4.
32
La capacidad de gráficos de R es muy sofisticada y mejor que la de la mayoría de los
paquetes estadísticos. R cuenta con varios paquetes gráficos especializados, por ejemplo,
hay paquetería para graficar, crear y manejar los shapefiles4, para hacer contornos sobre
mapas en distintas proyecciones, graficado de vectores, contornos, etc. También existen
paqueterías que permiten manipular y crear datos en distintos formatos como netCDF,
Matlab, Excel entre otros. Cabe señalar que, además del paquete base de R, existen más
de 4000 paquetes en CRAN, que han sido desarrollados por usuarios y programadores
alrededor del mundo.
[Link].DATA FRAMES EN R
Ruben Sanchez menciona que: “El data frame es una estructura de datos muy
importante en R. La estructura de un data frame consiste en que cada fila representa una
observación y que cada columna representa una variable, medida o característica de dicha
observación” (Sánchez, 2017).
Dada la importancia de los data frames, es importante poseer un conjunto de
herramientas para trabajar con los mismos. En capítulos anteriores hemos discutido
algunas herramientas como la función subset() y el uso de los operadores [ y $ para
extraer subconjuntos de datos en data frames. Sin embargo, otras operaciones, como
filtros, reordenar, etc. pueden ser a menudo una labor tediosa. El paquete dplyr está
diseñado para mitigar muchos de los problemas y proporcionar un conjunto de rutinas
altamente optimizadas para el manejo de data frames.
[Link].EL PAQUETE ggplot2
Es un paquete de R creado por Hadley Wickham en 2005, constituye una
implementación de la Gramática de Gráficos de Leland Wilkinson, es decir, un esquema
33
general para la visualización de datos que divide los gráficos en componentes semánticos,
como escalas y capas.
Esto hace que ggplot2 sea de mucha utilidad para los programadores, ya que no está
limitado a un conjunto de gráficos preespecificados, sino que puede crear nuevos gráficos
que se adaptan precisamente a su problema.
En la práctica, ggplot2 proporciona hermosos gráficos sin complicaciones, que se
ocupan de pequeños detalles como dibujar leyendas. Los gráficos se pueden construir
iterativamente y editar más tarde. Además, se debe mencionar que en la mayoría de las
veces puede producir un gráfico de calidad de publicación en segundos, pero si tiene
requisitos de formato especiales, como un sistema de temática integral, es igual de
eficiente (Wickham, 2010).
- DENSIDAD CON ggplot2
Con la librería ggplot2 es posible realizar la estimación no paramétrica de funciones
de densidad, para ello se aplica, el método Kernel. La densidad de Kernel, es una
innovadora forma de estimar una función de densidad, que no siga un modelo normal,
binomial o exponencial. Este método tiene una enorme flexibilidad y lo que hace es
construir una función de densidad girando en torno a los valores muestrales y está
representado con la gramática opcional de geom_density(kernel = "gaussian").
- LA GRAMÁTICA DE ggplot2
ggplot2 está diseñado para funcionar en capas, comenzando con una capa que muestra
los datos sin procesar y luego agrega capas de anotaciones y sumas estadísticas. Permite
producir gráficos utilizando el mismo pensamiento estructurado que se usa para diseñar
un análisis, reduciendo la distancia entre una trama la cabeza y una en la página.
34
Por ejemplo, en la base R, si se diseña un nuevo gráfico, se compone de elementos de
trazado sin procesar, como puntos y líneas, y es difícil diseñar nuevos componentes que
se combinen con los trazados existentes.
En ggplot2, las expresiones utilizadas para crear un nuevo gráfico se componen de
elementos de alto nivel como representaciones de los datos sin procesar y
transformaciones estadísticas, y se pueden combinar fácilmente con nuevos conjuntos de
datos y otros gráficos. (Wickham, 2010).
[Link].EL PAQUETE dplyr
Según (Sánchez, 2017) el paquete dplyr fue desarrollado por Hadley Wickham de
RStudio y es una versión optimizada de su paquete plyr. El paquete dplyr no proporciona
ninguna nueva funcionalidad a R, en el sentido que todo aquello que podemos hacer con
dplyr lo podríamos hacer con la sintaxis básica de R
Una importante contribución del paquete dplyr es que proporciona una "gramática"
(particularmente verbos) para la manipulación y operaciones con data frames. Con esta
gramática podemos comunicar mediante nuestro código que es lo que estamos haciendo
en los data frames a otras personas (asumiendo que conozcan la gramática). Esto es muy
útil, ya que proporciona una abstracción que anteriormente no existía. Por último, cabe
destacar que las funciones del paquete dplyr son muy rápidas, puesto que están
implementadas con el lenguaje C++. (p. 46)
- LA GRAMÁTICA DE dplyr
Algunas de los principales "verbos" del paquete dplyr son:
• select: devuelve un conjunto de columnas
• filter: devuelve un conjunto de filas según una o varias condiciones lógicas
• arrange: reordena filas de un data frame
• rename: renombra variables en una data frame
35
• mutate: añade nuevas variables/columnas o transforma variables existentes
• summarise/summarize: genera resúmenes estadísticos de diferentes variables en
el data frame, posiblemente con strata
• _%>% : el operador "pipe" es usado para conectar múltiples acciones en una única
"pipeline" (tubería)
[Link].SCRIPT
El script, menciona (Jimenéz, 2017) que es un lenguaje de programación que ejecuta
diversas funciones en el interior de un programa de computador que en la presente
investigación será R Studio, el script contiene instrucciones, escritas en códigos de
programación.
Los scripts se encargan de cumplir las siguientes funciones:
• Combinar componentes
• Interactuar con el sistema operativo o con el usuario
• Controlar un determinado programa o aplicación
• Configurar o instalar sistemas operacionales, especialmente en los juegos, se usa
para controlar las acciones de los personajes
[Link].¿POR QUÉ R ES MEJOR QUE EXCEL?
Según (Psicología de Datos, 2014) se resaltan los siguientes puntos de diferencia:
• Manipulación de datos: R te permite manipular (seleccionar, recodifica, recuperar)
datos muy rápidamente. Algunos paquetes de R han sido diseñados para ello
especialmente, como plyr. Por lo general, la mayoría del tiempo dedicado a un
proyecto de análisis se disipa antes de los análisis, específicamente en la preparación
de los datos. R es mucho más hábil y eficiente en la preparación de datos que Excel.
36
• Automatización: R utiliza un lenguaje de script en lugar de una interfaz gráfica de
usuario, por lo que es mucho más fácil de automatizar cosas en R que en Excel. Esto
le puede ahorrar un montón de tiempo, especialmente cuando tiene que volver a
ejecutar el mismo análisis varias veces.
• Cálculo rápido: Debido a la automatización proporcionada por R, muchas
operaciones son mucho más rápidas para realizar en R de Excel.
• Lectura de datos: R puede leer prácticamente cualquier tipo de datos (.txt, .csv,
.dat, etc). También hay paquetes de R específicamente diseñados para leer archivos
JSON, SPSS, Excel, SAS, STATA. E incluso se puede usar los datos de cualquier
sitio web y ejecutar consultas SQL.
• Organización de Proyectos: En Excel, los proyectos se organizan a menudo en
diferentes pestañas del mismo libro. Esto puede hacer que los archivos de Excel sean
lentos, torpes y difíciles a la hora de trabajar con ellos. Es más fácil mantener un
proyecto organizado cuando se trata de R porque las diferentes tareas o sub-proyectos
se pueden guardar en archivos separados almacenados en la misma carpeta y unidos
entre sí en un mismo proyecto con RStudio.
• Compatibilidad con grandes conjuntos de datos: Excel tiene restricciones para el
tamaño pueden tener sus datos. Y aún en el caso de tus datos no superen este tamaño
máximo, Excel suele ser lento con grandes conjuntos de datos (sobre todo después
de añadir pestañas, fórmulas y referencias). R es compatible con los datos de mayor
tamaño, y puede soportar grandes volúmenes de datos con paquetes como Hadoop.
• Replicabilidad: R tiene características que hacen mucho más fácil replicar los
resultados de su análisis; algo que es importante para la detección de errores. En
primer lugar, es fácil de agregar comentarios a las secuencias de comandos para que
quede claro lo que estás haciendo. Comentar tu código es crucial, y puede servir
37
como una “traducción” para alguien más que lo vea en el futuro o incluso ¡como un
recordatorio de lo que hiciste hace 6 meses! Por contra, es difícil documentar los
pasos que has hecho en Excel. En segundo lugar, los datos y el análisis permanecen
separados en R, lo que permite ver la progresión lógica. En Excel, sin embargo, los
datos y las fórmulas están juntos, y puede ser difícil de seguir los pasos que dio el
analista de los datos. En tercer lugar, se puede utilizar el control de versiones con git
a) para realizar un seguimiento (y revertir) los cambios que realicen en el tiempo y
b) para compartir sus scripts con otros y colaborar en proyectos como una
comunidad. Tener más personas que examinan tu trabajo puede ayudar a encontrar y
corregir errores, y hacer mejoras importantes. Los archivos de Excel son archivos
binarios, por lo que no se pueden registrar cambios de esta manera.
• Precisión: Los investigadores han demostrado que Excel y otras hojas de cálculo
muestran inexactitudes importantes para análisis básicos como la regresión lineal. R
fue diseñado específicamente para hacer análisis estadístico, por lo que es más
preciso y exacto para el análisis de datos.
• Corrección de errores: Debido R utiliza secuencias de comandos en lugar de “hacer
clic” y permite comentarios y control de versiones, se puede ver un historial de las
acciones realizadas para lograr cada resultado. Esto hace que sea más fácil encontrar
y solucionar errores. En Excel, sin embargo, los errores se pueden ocultar en las
fórmulas de cualquier celdilla y allí pueden ser difíciles de encontrar. Los errores de
las hojas de cálculo han conducido han sido ampliamente publicitadas, incluyendo
cosas como pérdidas financieras desastrosas, políticas gubernamentales erróneas y
prescripción drogas equivocadas en pacientes de cáncer. Seamos justos: los seres
humanos cometen errores; es más, los errores en el análisis de datos son inevitables,
38
ya sea con hojas de cálculo o con el código R. Pero la conclusión lógica es que si es
más fácil encontrar y corregir estos errores en R que en Excel, R es una mejor opción.
• Es gratuito: La herramienta R es gratuita por ser software libre.
• Es código abierto: A diferencia de Excel y otros paquetes estadísticos que se utilizan
en análisis de datos, R no es una caja negra. Puedes examinar el código para cualquier
función o cálculo que se realiza. De hecho, puedes incluso modificar y mejorar estas
funciones cambiando el código.
• Estadística avanzada: R tiene muchas más (y más avanzadas) capacidades
estadísticas que Excel. También es más rápido y flexible. Parte de las capacidades
avanzadas de R se deben al punto anterior: R es código abierto y eso ha favorecido
que muchos usuarios hayan contribuido para realizar funciones especializadas.
• Capacidades avanzadas de gráficos. Se puede crear gráficos chulísimos utilizando
tanto el paquete básico de R como lattice o ggplot. A la gente le gusta ver los datos
y R proporciona algunas de las herramientas para la creación de visualizaciones más
bonitas del mercado.
• Multiplataforma: Puede utilizar R en Windows, Mac, Linux y Unix.
2.2.4. PROCESOS DE ADMISION A LA UNIVERSIDAD NACIONAL DEL
ALTIPLANO
Los procesos de admisión a la Universidad Nacional del Altiplano comprenden el
conjunto de pruebas que deben rendir los postulantes para obtener una vacante en alguna
de las Escuelas Profesionales que están divididas entre Ingenierías, Biomédicas y
Sociales, los mencionados procesos de admisión se encuentran organizados en dos
modalidades:
• Examen Ordinario, que comprende: Examen General de Admisión y Centro
Preuniversitario (CEPREUNA)
39
• Examen Extraordinario, que comprende alumnos de: Primeros Puestos, traslados
externos, traslados internos, titulados o graduados y deportistas calificados.
Durante el año 2017 se tuvo un total de 35541 postulantes en los 8 procesos de
admisión a la Universidad Nacional del Altiplano, de los que 2324 fueron postulantes a
la Facultad de Ingeniería Mecánica Eléctrica, Electrónica y Sistemas y un total de 173
ingresantes en modalidad general; esta información que se detalla en la siguiente tabla:
Tabla 2.1: Cantidad de ingresantes a la FIMEES en procesos de admisión 2017
CANTIDAD DE CANTIDAD DE
N° PROCESO DE ADMISIÓN
POSTULANTES INGRESANTES
0
1 Examen Extraordinario 2017 3
Examen CEPREUNA Marzo 45
2 241
2017
3 Examen General Mayo 2017 523 64
Examen CEPREUNA Junio 45
4 199
2017
5 Examen General Agosto 2017 599 57
Examen CEPREUNA 45
6 113
Setiembre 2017
Examen CEPREUNA 45
7 134
Diciembre 2017
Examen General Diciembre 52
8 512
2017
TOTAL DE POSTULANTES 2324 353
Fuente: Comisión Central de Admisión - UNA Puno
2.2.5. PERFIL DEL INGRESANTE A LA UNIVERSIDAD NACIONAL DEL
ALTIPLANO
El perfil del ingresante es el conjunto de características, necesidades y
expectativas que un estudiante registra en el momento de su inserción en el nivel
40
superior, constituyéndose como un aporte en la toma de decisiones institucionales y
curriculares de la universidad.
El perfil del ingresante al área de ciencias de la ingeniería de la Universidad
Nacional del Altiplano considera los criterios de aptitudes, conocimientos de las
asignaturas cursadas en los estudios básicos y actitudes conforme a lo aprobado
mediante la Resolución Rectoral Nº 3231-2014-R-UNA adjuntado en el Anexo 1 y
también descrito en el prospecto de admisión del examen general mayo -2017.
Tabla 2.2: Perfil del ingresante al área de ciencias de la ingeniería
CRITERIOS PERFIL DEL INGRESANTE
• Resuelve problemas de razonamiento
lógico, planteo de ecuaciones, edades,
móviles, cronometría, fracciones y
comparación de magnitudes, operaciones
RAZONAMIENTO
matemáticas, sucesiones, series, topología
MATEMÁTICO
y conteo de figuras, análisis combinatorio,
cálculo de probabilidades, razonamiento
geométrico, perímetros y áreas de
regiones sombreadas.
• Aplica estrategias metodológicas de
razonamiento verbal en el contexto de las
ciencias de la ingeniería.
• Posee dominio verbal en el idioma
español, respecto a ciencias de ingeniería.
RAZONAMIENTO • Analiza e interpreta signos lingüísticos
VERBAL con propósitos definidos.
• Comprende textos escritos del área de las
APTITUDES
ciencias de la ingeniería en el marco de los
niveles: literal, inferencial y crítico.
• Produce textos escritos en función al
bloque comunicativo textual.
41
Tabla 2.2: Perfil del ingresante al área de ciencias de la ingeniería
• Produce textos escritos en función al bloque
comunicativo textual.
• Comprende textos orales y escritos.
• Utiliza adecuadamente la lengua en todos sus
niveles
• Razona y demuestra proposiciones
matemáticas.
• Representa, analiza e interpreta datos
matemáticos contextualizados.
• Resuelve problemas matemáticos
CONOCIMIENTOS
contextualizados.
DE LAS
• Interpreta la información de la ciencia,
ASIGNATURAS
tecnología y ambiente.
CURSADAS EN LOS
• Resuelve problemas de la ciencia, tecnología y
ESTUDIOS BÁSICOS
ambiente.
• Interpreta información del espacio geográfico.
• Emite juicios críticos del contexto histórico y
cultural regional y nacional.
• Expresa concepciones respecto al ejercicio de la
ciudadanía y de la cultura cívica.
• Demuestra interés por las actividades afines a la
ingeniería
• Valora la información sobre ciencia, y
ACTITUDES tecnología y ambiente
• Relieva el control en la ejecución de obras de
ingeniería.
• Demuestra estabilidad emocional.
Fuente: Universidad Nacional del Altiplano
42
[Link] DE TÉRMINOS BÁSICOS
▪ Análisis de Datos: Es un proceso que consiste en inspeccionar, limpiar y
transformar datos con el objetivo de resaltar información útil, lo que sugiere
conclusiones, y apoyo en la toma de decisiones (Aguilar, 2013).
▪ Data Mining: Es el proceso de extracción de información predecible que se
encuentra en grandes bases de datos (Gallardo, 2009),
▪ R : Es un entorno y lenguaje de programación interpretado con un enfoque al
análisis estadístico. (Santana, 2014 )
• Script: Es un lenguaje de programación que ejecuta diversas funciones en el
interior de un programa de computador. (Jimenéz, 2017)
▪ Dplyr: Es un paquete de Rstudio que proporciona una gramática para la
manipulación y operaciones con data frames. (Sánchez, 2017)
▪ Ggplot2: Es un paquete de Rstudio que sirve para la visualización de datos con
una mejor presentación gráfica. (Wickham, 2010)
▪ CRAN: Es una red de servidores ftp y web de todo el mundo que almacena
versiones idénticas y actualizadas de código y documentación para R. (R-
Foundation, 2018)
▪ MapReduce: Es un framework que proporciona un sistema de procesamiento de
datos paralelo y distribuido. (Larose, 2016)
▪ NoSQL: Es una amplia clase de sistemas de gestión de bases de datos, son un
enfoque hacia la gestión de datos y el diseño de base de datos que es útil para
grandes conjuntos de datos distribuidos. (Aguilar, 2013)
43
CAPÍTULO III
MATERIALES Y MÉTODOS
[Link]ÍA DE LA INVESTIGACIÓN
La presente tesis, de acuerdo a las características de los objetivos y formulación de
la investigación, encuadra dentro del enfoque cuantitativo, debido a que pretende
analizar el nivel porcentual de cumplimiento haciendo uso de R y se ubica en una
investigación a nivel descriptivo que especifica características importantes del
fenómeno sometido a análisis.
[Link]ÑO DE INVESTIGACIÓN
Esta investigación corresponde a una investigación descriptiva donde siempre se
obtendrán resultados estadísticos, descritos respecto al problema de la investigación.
(Shuttleworth, 2018)
Con respecto a las características evaluadas, se confeccionaron gráficos
estadísticos descriptivos con distribución de frecuencias en valores absolutos y
relativos de cada materia evaluada en el examen de Admisión a los postulantes en el
área de ingenierías.
[Link]ÓN Y MUESTRA
3.3.1. POBLACIÓN
La población de estudio considerada para la investigación está constituida por
todos los ingresantes a la Facultad de Ingeniería Mecánica Eléctrica, Electrónica
y Sistemas de la Universidad Nacional del Altiplano durante el año 2017, que en
total son 173 ingresantes a las 3 escuelas profesionales Facultad de Ingeniería
Mecánica Eléctrica, Electrónica y Sistemas, en la modalidad general de ingreso
convocadas por la Comisión Central de Admisión acorde a la Resolución Rectoral
N° 1334-2017-R-UNA que aprobó el Reglamento de Admisión del año 2017.
44
Tabla 3.1: Cantidad de ingresantes en modalidad ordinaria- examen general
Total de ingresantes
Examen modalidad Fecha
FIMEES
1 General 21 – 05 – 2017 173
2 General 06 – 08 - 2017 168
3 General 03 – 12 - 2017 170
FUENTE: Comisión Central de Admisión – UNA Puno
3.3.2. MUESTRA
En este caso la población es finita y se tiene acceso a la información necesaria
para el análisis de datos con R de los ingresantes a la Facultad de Ingeniería
Mecánica Eléctrica, Electrónica y Sistemas de la Universidad Nacional del
Altiplano, se usó el muestreo no probabilístico y se ha considerado para el análisis
de datos la información de los ingresantes del Examen General del 21 de mayo
del 2017 a la Facultad de Ingeniería Mecánica Eléctrica, Electrónica y Sistemas.
3.3.3. SISTEMA DE VARIABLES
VARIABLE INDEPENDIENTE
- Análisis de datos con R.
VARIABLE DEPENDIENTE
- Cálculo del Nivel de cumplimiento del perfil del ingresante a la Universidad
Nacional del Altiplano.
45
3.3.4. OPERACIONALIZACION DE VARIABLES
Tabla 3.2: Operacionalización de variables
ANÁLISIS DE DATOS CON R PARA DETERMINAR EL NIVEL DE
CUMPLIMIENTO DEL PERFIL DEL INGRESANTE A LA
FACULTAD DE INGENIERÍA MECÁNICA ELÉCTRICA,
ELECTRÓNICA Y SISTEMAS DE LA UNA - PUNO, 2017
VARIABLES DIMENSIONES INDICADORES INSTRUMENTO
Establecimiento de
los objetivos del
Análisis perceptual
negocio
Comprensión del Evaluación de la
situación Análisis perceptual
negocio
Establecimiento de
los objetivos de la
Lista de tareas
minería de datos
Solicitud de
Recopilación inicial
de datos información a
CCA-UNA PUNO
Comprensión de
Descripción de los
Variable los datos datos Redacción
Independiente:
Verificación de Prueba comparativa
calidad de datos
Análisis de datos en R
con R
Selección de los
Selección simple
datos
Limpieza de datos Lenguaje R
Preparación de
Construcción de
los datos Lenguaje R
datos
Integración de datos Lenguaje R
Formateo de datos Lenguaje R
Selección de la
Modelado Tabla valorativa
técnica de modelado
46
Tabla 3.2: Operacionalización de variables
Diseño de la
Tabla valorativa
evaluación
Construcción del
Tabla valorativa
modelo
Evaluación del
Descripción
modelo
Establecimiento de Evaluación de
Evaluación
pasos resultados
Generación de Revisión de
informe final informe
Despliegue Revisión del
Análisis del proyecto
proyecto
VARIABLES DIMENSIONES INDICADORES INSTRUMENTO
Aptitudes Resolución de Resumen grafico
problemas de en Histograma
Variable
razonamiento
Dependiente: Densidad de kernel
matemático y
de las áreas de
Cálculo del nivel razonamiento
razonamiento
de cumplimiento verbal
matemático y
del perfil del
verbal
ingresante a la
Universidad Conocimientos Comprensión de Densidad de
Nacional del de las asignaturas textos orales y Kernel de las áreas
Altiplano, 2017. cursadas en los escritos de comunicación,
estudios básicos literatura,
educación cívica,
economía, historia,
geografía
47
Tabla 3.2: Operacionalización de variables
psicología y
filosofía, biología
Razonamiento y Densidad de Kernel
demostración de las áreas de
matemática I,
matemática II,
física y química
Resolución de Densidad de Kernel
problemas de las áreas de
matemática I,
matemática II
Elaborado por el equipo de trabajo
[Link]ÍA DE IMPLEMENTACIÓN
La metodología aplicada en la presente investigación es CRISP-DM por ser la que
mejor se adecua al contexto planteado inicialmente de determinar en qué medida se
cumplen los requisitos establecidos en el perfil del estudiante al área de ciencias de la
ingeniería por parte de los ingresantes a la Facultad de Ingeniería Mecánica Eléctrica,
Electrónica y Sistemas.
3.4.1. METODOLOGÍA CRISP-DM
CRISP-DM (Cross Industry Standard Process for Data Mining), es un modelo de
proceso de minería de datos que describe una manera en la que los expertos en esta
materia abordan el problema.
Según (Gallardo, 2009) CRISP-DM es la guía de referencia más ampliamente
utilizada en el desarrollo de proyectos de Data Mining, está dividida en 4 niveles de
abstracción organizados de forma jerárquica en tareas que van desde el nivel más
48
general, hasta los casos más específicos y organiza el desarrollo de un proyecto de
Data Mining, en una serie de seis fases.
Figura 3.1: Fases de CRISP-DM
Elaborado por el equipo de trabajo
[Link]. PRIMERA FASE: COMPRENSIÓN DEL NEGOCIO O PROBLEMA
Según (Gallardo, 2009), es probablemente la más importante y aglutina las
tareas de comprensión de los objetivos y requisitos del proyecto desde una
perspectiva empresarial o institucional, con el fin de convertirlos en objetivos
técnicos y en un plan de proyecto. Sin lograr comprender dichos objetivos,
ningún algoritmo por muy sofisticado que sea, permitirá obtener resultados
fiables. Para obtener el mejor provecho de Data Mining, es necesario entender
de la manera más completa el problema que se desea resolver, esto permitirá
recolectar los datos correctos e interpretar correctamente los resultados.
En esta fase, es muy importante la capacidad de poder convertir el
conocimiento adquirido del negocio, en un problema de Data Mining y en un
plan preliminar cuya meta sea el alcanzar los objetivos del negocio. Una
49
descripción de cada una de las principales tareas que componen esta fase es la
siguiente:
- Determinar los objetivos del negocio. Esta es la primera tarea a desarrollar y tiene
como metas, determinar cuál es el problema que se desea resolver, por qué la
necesidad de utilizar Data Mining y definir los criterios de éxito. Los problemas
pueden ser diversos como por ejemplo, detectar fraude en el uso de tarjetas de
crédito, detección de intentos de ingreso indebido a un sistema, asegurar el éxito de
una determinada campaña publicitaria, etc. En cuanto a los criterios de éxito, estos
pueden ser de tipo cualitativo, en cuyo caso un experto en el área de dominio,
califica el resultado del proceso de DM, o de tipo cuantitativo, por ejemplo, el
número de detecciones de fraude o la respuesta de clientes ante una campaña
publicitaria.
- Evaluación de la situación. En esta tarea se debe calificar el estado de la situación
antes de iniciar el proceso de DM, considerando aspectos tales como: ¿cuál es el
conocimiento previo disponible acerca del problema?, ¿se cuenta con la cantidad
de datos requerida para resolver el problema?, ¿cuál es la relación coste beneficio
de la aplicación de DM?, etc. En esta fase se definen los requisitos del problema,
tanto en términos de negocio como en términos de Data Mining.
- Determinación de los objetivos de DM. Esta tarea tiene como objetivo representar
los objetivos del negocio en términos de las metas del proyecto de DM, como, por
ejemplo, si el objetivo del negocio es el desarrollo de una campaña publicitaria para
incrementar la asignación de créditos hipotecarios, la meta de DM será, por
ejemplo, determinar el perfil de los clientes respecto de su capacidad de
endeudamiento. Producción de un plan del proyecto. Finalmente, esta última tarea
50
de la primera fase de CRISP-DM, tiene como meta desarrollar un plan para el
proyecto, que describa los pasos a seguir y las técnicas a emplear en cada paso.
[Link]. SEGUNDA FASE: COMPRENSIÓN DE LOS DATOS
Según (Gallardo, 2009), comprende la recolección inicial de datos, con el objetivo de
establecer un primer contacto con el problema, familiarizándose con ellos, identificar su
calidad y establecer las relaciones más evidentes que permitan definir las primeras hipó
tesis. Esta fase junto a las próximas dos fases, son las que demandan el mayor esfuerzo y
tiempo en un proyecto de DM.
Por lo general si la organización cuenta con una base de datos corporativa, es deseable
crear una nueva base de datos ad-hoc al proyecto de DM, pues durante el desarrollo del
proyecto, es posible que se generen frecuentes y abundantes accesos a la base de datos a
objeto de realizar consultas y probablemente modificaciones, lo cual podría generar
muchos problemas. Las principales tareas a desarrollar en esta fase del proceso son:
- Recolección de datos iniciales. La primera tarea en esta segunda fase del proceso de
CRISP-DM, es la recolección de los datos iniciales y su adecuación para el futuro
procesamiento. Esta tarea tiene como objetivo, elaborar informes con una lista de los
datos adquiridos, su localización, las técnicas utilizadas en su recolección y los problemas
y soluciones inherentes a este proceso.
- Descripción de los datos. Después de adquiridos los datos iniciales, estos deben ser
descritos. Este proceso involucra establecer volúmenes de datos (número de registros y
campos por registro), su identificación, el significado de cada campo y la descripción del
formato inicial.
- Exploración de datos. A continuación, se procede a su exploración, cuyo fin es encontrar
una estructura general para los datos. Esto involucra la aplicación de pruebas estadísticas
51
básicas, que revelen propiedades en los datos recién adquiridos, se crean tablas de
frecuencia y se construyen gráficos de distribución. La salida de esta tarea es un informe
de exploración de los datos.
- Verificación de la calidad de los datos. En esta tarea, se efectúan verificaciones sobre
los datos, para determinar la consistencia de los valores individuales de los campos, la
cantidad y distribución de los valores nulos, y para encontrar valores fuera de rango, los
cuales pueden constituirse en ruido para el proceso. La idea en este punto, es asegurar la
completitud y corrección de los datos.
[Link]. TERCERA FASE: PREPARACIÓN DE LOS DATOS
Según (Gallardo, 2009), en esta fase y una vez efectuada la recolección inicial de datos,
se procede a su preparación para adaptarlos a las técnicas de Data Mining que se utilicen
posteriormente, tales como técnicas de visualización de datos, de búsqueda de relaciones
entre variables u otras medidas para exploración de los datos. La preparación de datos
incluye las tareas generales de selección de datos a los que se va a aplicar una determinada
técnica de modelado, limpieza de datos, generación de variables adicionales, integración
de diferentes orígenes de datos y cambios de formato. Está constituida por las siguientes
tareas:
- Estructuración de los datos. Esta tarea incluye las operaciones de preparación de los
datos tales como la generación de nuevos atributos a partir de atributos ya existentes,
integración de nuevos registros o transformación de valores para atributos existentes.
- Integración de los datos. La integración de los datos, involucra la creación de nuevas
estructuras, a partir de los datos seleccionados, por ejemplo, generación de nuevos
campos a partir de otros existentes, creación de nuevos registros, fusión de tablas
campos o nuevas tablas donde se resumen características de múltiples registros o de
otros campos en nuevas tablas de resumen.
52
- Formateo de los datos. Esta tarea consiste principalmente, en la realización de
transformaciones sintácticas de los datos sin modificar su significado, esto, con la idea
de permitir o facilitar el empleo de alguna técnica de DM en particular, como por
ejemplo la reordenación de los campos y/o registros de la tabla o el ajuste de los valores
de los campos a las limitaciones de las herramientas de modelación (eliminar comas,
tabuladores, caracteres especiales, máximos y mínimos para las cadenas de caracteres,
etc.).
[Link]. CUARTA FASE: MODELADO
Según (Gallardo, 2009), en esta fase de CRISP-DM, se seleccionan las técnicas de
modelado más apropiadas para el proyecto de Data Mining específico. Las técnicas a
utilizar en esta fase se eligen en función de los siguientes criterios:
- Ser apropiada al problema.
- Disponer de datos adecuados.
- Cumplir los requisitos del problema.
- Tiempo adecuado para obtener un modelo.
- Conocimiento de la técnica.
[Link]. QUINTA FASE: EVALUACIÓN
Según (Gallardo, 2009), en esta fase se evalúa el modelo, teniendo en cuenta el
cumplimiento de los criterios de éxito del problema. Debe considerarse, además, que la
fiabilidad calculada para el modelo se aplica solamente para los datos sobre los que se
realizó el análisis. Es preciso revisar el proceso, teniendo en cuenta los resultados
obtenidos, para poder repetir algún paso anterior, en el que se haya posiblemente
cometido algún error. Las tareas involucradas en esta fase del proceso son las siguientes:
- Evaluación de los resultados: En los pasos de evaluación anteriores, se trataron
factores tales como la exactitud y generalidad del modelo generado. Esta tarea
53
involucra la evaluación del modelo en relación a los objetivos del negocio y busca
determinar si hay alguna razón de negocio para la cual, el modelo sea deficiente, o si
es aconsejable probar el modelo, en un problema real si el tiempo y restricciones lo
permiten.
- Determinación de futuras fases: Si se ha determinado que las fases hasta este
momento han generado resultados satisfactorios, podría pasarse a la fase siguiente,
en caso contrario podría decidirse por otra iteración desde la fase de preparación de
datos o de modelación con otros parámetros
[Link]. SEXTA FASE: IMPLANTACIÓN
Según (Gallardo, 2009), generalmente un proyecto de Data Mining no concluye en la
implantación del modelo, pues se deben documentar y presentar los resultados de manera
comprensible para el usuario, con el objetivo de lograr un incremento del conocimiento.
Por otra parte, en la fase de explotación se debe asegurar el mantenimiento de la
aplicación y la posible difusión de los resultados. Las tareas que se ejecutan en esta fase
son las siguientes:
▪ Plan de implementación: Para implementar el resultado de DM en la organización,
esta tarea toma los resultados de la evaluación y concluye una estrategia para su
implementación.
▪ Informe Final: Es la conclusión del proyecto de DM realizado. Dependiendo del
plan de implementación, este informe puede ser sólo un resumen de los puntos
importantes del proyecto y la experiencia lograda o puede ser una presentación final
que incluya y explique los resultados logrados con el proyecto.
▪ Revisión del proyecto: En este punto se evalúa qué fue lo correcto y qué lo
incorrecto, qué es lo que se hizo bien y qué es lo que se requiere mejora
54
CAPÍTULO IV
RESULTADOS Y DISCUSIÓN
[Link]ÓN DE LA METODOLOGÍA CRISP-DM
En la presente investigación se aplicó la metodología CRISP – DM para realizar el
análisis de los datos de los ingresantes a la Facultad de Ingeniería Mecánica Eléctrica,
Electrónica y Sistemas.
A continuación, se detallan las seis fases de la metodología CRISP – DM de acuerdo
a lo descrito en marco teórico de la presente tesis:
4.1.1. COMPRENSIÓN DEL NEGOCIO
[Link].DETERMINAR LOS OBJETIVOS DEL NEGOCIO
El objetivo del análisis de datos que se va a realizar en este proyecto es establecer
los niveles de rendimiento académico de lo más fiables posible a partir de los datos
que se disponen de los ingresantes a la Facultad de Ingeniería Mecánica Eléctrica,
Electrónica y Sistemas.
Contexto
La presente investigación se desarrolla en la Universidad Nacional del Altiplano. En
referencia a la situación de negocio, en la organización al principio de este proyecto se
cuenta con una base de datos de postulantes e ingresantes a la Facultad de Ingeniería
Mecánica Eléctrica, Electrónica y Sistemas en los diversos procesos de admisión
convocados por la Comisión Central de Admisión CCA-UNA y específicamente se tiene
la clave de respuestas referencial del examen general del 21 de mayo del 2017. Sin
embargo, no existe ningún estudio en profundidad sobre el nivel del rendimiento
académico de los de los estudiantes ingresantes a la Facultad de Ingeniería Mecánica
55
Eléctrica, Electrónica y Sistemas de los que se puedan sacar conclusiones o patrones para
hacer predicciones sobre los futuros ingresantes.
Objetivos del negocio
El objetivo es realizar un análisis de datos que permita determinar el nivel de
cumplimiento del perfil del ingresante a la Facultad de Ingeniería Mecánica Eléctrica,
Electrónica y Sistemas de la Universidad Nacional del Altiplano.
La información obtenida del análisis puede ser útil para mejorar la toma de decisiones en
la Facultad de Ingeniería Mecánica Eléctrica, Electrónica y Sistemas, tanto en los cursos
de nivelación para los ingresantes como en la malla curricular de las carreras.
Criterios de éxito
Se considera como criterio de éxito, el obtener información del nivel de cumplimiento
del perfil del ingresante a la Facultad de Ingeniería Mecánica Eléctrica, Electrónica y
Sistemas, esta información debe estar detallada en las 14 áreas del examen
porcentualmente para así ser una herramienta en la toma de decisiones.
[Link].EVALUACIÓN DE LA SITUACIÓN
Se tiene una base de datos referencial en la que se tiene información respecto de los
nombres, código para la prueba, tipo de prueba, y claves de respuesta en un examen de
admisión en modalidad general, vale decir que son 14 áreas evaluadas en dicha prueba
por lo que en total se tienen 60 preguntas de conocimientos generales con respuestas
únicas y 15 de actitudinales evaluadas según escala de Likert.
Inventario de recursos
Se dispone del software R y el entorno de trabajo R Studio de uso libre, para realizar
el análisis de datos de los ingresantes a la Facultad de Ingeniería Mecánica Eléctrica,
Electrónica y Sistemas en forma general. Los datos de postulantes e ingresantes son en
un total de 2300 estudiantes, todos ellos organizados y adecuados para el análisis de datos.
56
Requisitos, supuestos y restricciones
Las restricciones a la información de los postulantes e ingresantes a la Facultad de
Ingeniería Mecánica Eléctrica, Electrónica y Sistemas abarcan los nombres y datos
personales, mas no en las posibles claves de respuestas, razón por la que se optó por
utilizar datos relacionados únicamente a información pública.
Costos y beneficios
La información de esta investigación no supone ningún costo adicional a la
Universidad ya que estos datos corresponden a la misma por pertenecer a la información
del proceso de admisión de mayo del 2017.
Frente a los beneficios, ésta no genera ningún tipo de beneficio económico, el único
beneficio es lograr obtener información que posiblemente contribuya a mejorar la toma
de decisiones respecto a la situación de los ingresantes en la Facultad de Ingeniería
Mecánica Eléctrica, Electrónica y Sistemas.
[Link].DETERMINAR LOS OBJETIVOS DE LA MINERÍA DE DATOS
Los objetivos en términos de minería de datos son:
- Organizar los datos del desempeño académico de los ingresantes a las escuelas
profesionales de la facultad de Ingeniería Mecánica Eléctrica, Electrónica y
Sistemas.
- Procesar los datos del desempeño académico de los ingresantes a las escuelas
profesionales de la facultad de Ingeniería Mecánica Eléctrica, Electrónica y
Sistemas.
- Determinar el nivel de cumplimiento del perfil del ingresante a la facultad de
Ingeniería Mecánica Eléctrica, Electrónica y Sistemas.
57
[Link].REALIZAR EL PLAN DEL PROYECTO
Para cumplir con los objetivos y tener una mejor organización se dividió el proyecto en
5 etapas:
1. Organización de información
2. Preparación de datos
3. Elección y aplicación de técnicas de modelado
4. Análisis de datos
5. Interpretación de resultados.
[Link].EVALUACIÓN INICIAL DE HERRAMIENTAS Y TÉCNICAS
En la presente investigación, las herramientas son los paquetes ggplot2 y dplyr en
el entorno Rstudio y las técnicas que se van a emplear para la extracción de
conocimiento son: el agrupamiento, densidad de kernel y reglas de asociación.
4.1.2. COMPRENSIÓN DE LOS DATOS
En esta segunda fase de la metodología CRISP-DM se realiza la recolección
inicial de los datos para poder establecer un primer contacto con el problema,
familiarizarse con los datos y averiguar su calidad, así como identificar las relaciones
más evidentes.
[Link].RECOLECTAR LOS DATOS INICIALES
Los datos utilizados en la presente investigación son datos referentes a
ingresantes a la Facultad de Ingeniería Mecánica Eléctrica, Electrónica y Sistemas
en el examen general del 21 de mayo del 2017 que incluyen información personal
sobre ellos como nombres, apellidos, puntajes, DNI y contenido de tarjeta de
respuestas, divididos en dos grupos, el primero de ellos contiene los datos de
identificación de los postulantes a la Facultad de Ingeniería Mecánica Eléctrica,
Electrónica y Sistemas en el segundo grupo de información se tienen los datos
58
relacionados a las tarjetas de respuestas de los ingresantes, este último ha sido
generado a partir de los datos reales de acceso público en la Comisión Central de
Admisión y Oficina de Tecnologías de la Información de la Universidad Nacional
del Altiplano. A continuación, listamos datos adquiridos:
- DNI y Datos de Identificación
- Escuela Profesional
- Puntaje e ingreso
- Código
- Serie
- Maq y Nro
- Tipo de prueba
- Respuestas
59
DATOS ADQUIRIDOS PARA LA ESCUELA PROFESIONAL DE INGENIERÍA MECÁNICA ELÉCTRICA:
Tabla 4.1: Datos de los ingresantes a Ingeniería Mecánica Eléctrica
APELLIDO APELLIDO ESCUELA
NOMBRES PUNTAJE ING. CÓDIGO MAQ NRO TIPO
PATERNO MATERNO PROFESIONAL
Cotacallapa Mamani Carlos Rodrigo Ingeniería Mecánica Eléctrica 2675 SI 10900067440010320000000 #0001 178744 S
Mamani Yucra Erick Brandhon Ingeniería Mecánica Eléctrica 2505 SI 10900067450010320000000 #0001 178745 T
Calderon Ojeda Franklin Ingeniería Mecánica Eléctrica 2277 SI 10900068280010320000000 #0001 178828 P
Choquepata Luque Nilson David Ingeniería Mecánica Eléctrica 2213 SI 10900068290010320000000 #0001 178829 Q
Choque Pari Ronal Nils Ingeniería Mecánica Eléctrica 2205 SI 10900068300010320000000 #0001 178830 Q
Jimenez Teves Ivar Raul Ingeniería Mecánica Eléctrica 2189 SI 10900067460010320000000 #0001 178746 Q
Payé Yucra Frenny Luvania Ingeniería Mecánica Eléctrica 2185 SI 10900068310010320000000 #0001 178831 T
Arce Ramos Fernando Diego Ingeniería Mecánica Eléctrica 2179 SI 10900067470010320000000 #0001 178747 S
Solis Huanaco Edgar Daniel Ingeniería Mecánica Eléctrica 2155 SI 10900067480010320000000 #0001 178748 S
60
Churata Chuquipalla Orlando Raul Ingeniería Mecánica Eléctrica 2139 SI 10900068320010320000000 #0001 178832 Q
Pacosonco Humalla Moises Eddyzon Ingeniería Mecánica Eléctrica 2125 SI 10900067490010320000000 #0001 178749 R
Mendoza Arohuanca Antony Fabricio Ingeniería Mecánica Eléctrica 2065 SI 10900067500010320000000 #0001 178750 R
Chipana Mamani Edward Ingeniería Mecánica Eléctrica 2055 SI 10900067510010320000000 #0001 178751 Q
Turpo Diaz Jose Miguel Ingeniería Mecánica Eléctrica 2045 SI 10900067520010320000000 #0001 178752 Q
Quispe Lima Dante Miguel Ingeniería Mecánica Eléctrica 2035 SI 10900067530010320000000 #0001 178753 Q
Ccapa Flores Cruyff Brayan Ingeniería Mecánica Eléctrica 2015 SI 10900067540010320000000 #0001 178754 S
Vilca Flores Cristopher Candido Ingeniería Mecánica Eléctrica 2013 SI 10900067550010320000000 #0001 178755 R
Tapia Luque Smith Ingeniería Mecánica Eléctrica 1993 SI 10900068330010320000000 #0001 178833 P
Guiopp Ponce Jheyck Jossely Ingeniería Mecánica Eléctrica 1989 SI 10900068340010320000000 #0001 178834 Q
Saraya Ttito Carlos Daniel Ingeniería Mecánica Eléctrica 1985 SI 10900068350010320000000 #0001 178835 T
Coarita Yapuchura Juan Reynaldo Ingeniería Mecánica Eléctrica 1975 SI 10900068360010320000000 #0001 178836 S
Tabla 4.1: Datos de los ingresantes a Ingeniería Mecánica Eléctrica
Quispe Ticona Wilder Jhoel Ingeniería Mecánica Eléctrica 1973 SI 10900068370010320000000 #0001 178837 P
Joce Ticona Giovany Esteban Ingeniería Mecánica Eléctrica 1966 SI 10900068380010320000000 #0001 178838 Q
Fuentes Ccallo Richardson Ingeniería Mecánica Eléctrica 1965 SI 10900068390010320000000 #0001 178839 Q
Charca Parillo Rigoberto Ingeniería Mecánica Eléctrica 1945 SI 10900068400010320000000 #0001 178840 Q
Cueva Vilca Franklin Gustavo Ingeniería Mecánica Eléctrica 1935 SI 10900068410010320000000 #0001 178841 R
Condori Mamani Eber Alain Ingeniería Mecánica Eléctrica 1931 SI 10900068420010320000000 #0001 178842 S
Machaca Mamani Julio Ingeniería Mecánica Eléctrica 1919 SI 10900067560010320000000 #0001 178756 R
Valeriano Huayhua Roy Denilson Ingeniería Mecánica Eléctrica 1915 SI 10900067570010320000000 #0001 178757 S
Aro Maquera William Roberth Ingeniería Mecánica Eléctrica 1905 SI 10900068430010320000000 #0001 178843 R
Prado Castillo Rodrigo Ingeniería Mecánica Eléctrica 1905 SI 10900067580010320000000 #0001 178758 R
Vilca Yana Luciano Ingeniería Mecánica Eléctrica 1895 SI 10900067590010320000000 #0001 178759 P
Aquise Torres Wilfredo Ingeniería Mecánica Eléctrica 1875 SI 10900067600010320000000 #0001 178760 S
Villagra Chipana Edy Waldir Ingeniería Mecánica Eléctrica 1835 NO 10900068440010320000000 #0001 178844 S
61
Cahui Chuquimia Jhon Fernando Ingeniería Mecánica Eléctrica 1827 NO 10900068450010320000000 #0001 178845 R
Fernandez Quispe Clever Jhamel Ingeniería Mecánica Eléctrica 1819 NO 10900068460010320000000 #0001 178846 P
Ccori Quispe Kelvin Royer Ingeniería Mecánica Eléctrica 1813 NO 10900068470010320000000 #0001 178847 P
Villalta Quispe Andres Fernando Ingeniería Mecánica Eléctrica 1805 NO 10900068480010320000000 #0001 178848 Q
Jimenez Titi Cristhian Paul Ingeniería Mecánica Eléctrica 1799 NO 10900068490010320000000 #0001 178849 R
Huacani Suaña Leighton Bayoni Ingeniería Mecánica Eléctrica 1797 NO 10900067610010320000000 #0001 178761 S
Layme Luque Diego Rodolfo Ingeniería Mecánica Eléctrica 1785 NO 10900068500010320000000 #0001 178850 Q
Flores Alave Alberick Russo Ingeniería Mecánica Eléctrica 1777 NO 10900067620010320000000 #0001 178762 P
Mamani Huanca Nelson Leonidas Ingeniería Mecánica Eléctrica 1775 NO 10900067630010320000000 #0001 178763 R
Cruz Mamani Luis Fernando Ingeniería Mecánica Eléctrica 1775 NO 10900068510010320000000 #0001 178851 P
Coaquira Ccallo Reynaldo Ingeniería Mecánica Eléctrica 1775 NO 10900067640010320000000 #0001 178764 R
FUENTE: Comisión Central de Admisión
Tabla 4.2: Respuestas de ingresantes a Ingeniería Mecánica Eléctrica
62
Elaborado por el equipo de trabajo
DATOS ADQUIRIDOS PARA LA ESCUELA PROFESIONAL DE INGENIERÍA ELECTRÓNICA:
Tabla 4.3: Ingresantes a Ingeniería Electrónica
APELLIDO APELLIDO ESCUELA
NOMBRES PUNTAJE ING. CÓDIGO MAQ NRO TIPO
PATERNO MATERNO PROFESIONAL
Gonzales Ito Joel Michael Ingeniería Electrónica 2218 SI 10900069120010320000000 #0001 178912 T
Sanca Torres Hugo Valentino Ingeniería Electrónica 2195 SI 10900069450010320000000 #0001 178945 R
Curo Roque Luis Angel Ingeniería Electrónica 2165 SI 10900069460010320000000 #0001 178946 S
Condori Soto Kevin Juan Ingeniería Electrónica 2112 SI 10900069470010320000000 #0001 178947 P
Maquera Maquera Diego Ingeniería Electrónica 2089 SI 10900069130010320000000 #0001 178913 S
Ticona Huarsaya Rolfer Ingeniería Electrónica 1997 SI 10900069140010320000000 #0001 178914 S
Coaquira Arias Jean Carlos Abner Ingeniería Electrónica 1995 SI 10900069150010320000000 #0001 178915 S
Cuyo Puma Alex Ingeniería Electrónica 1969 SI 10900069480010320000000 #0001 178948 S
Machaca Aquino Jamil Josep Ingeniería Electrónica 1965 SI 10900069490010320000000 #0001 178949 Q
Enrique
Mejia Albarracin Yohara Daniel Ingeniería Electrónica 1940 SI 10900069160010320000000 #0001 178916 T
63
Carita Choque Yocer Angel Ingeniería Electrónica 1895 SI 10900069170010320000000 #0001 178917 P
Curo Pari David Francisco Ingeniería Electrónica 1876 SI 10900069500010320000000 #0001 178950 R
Gallegos Lizarraga Rudy Alex Ingeniería Electrónica 1875 SI 10900069180010320000000 #0001 178918 R
Chambilla Quispe Cristian Rolando Ingeniería Electrónica 1865 SI 10900069510010320000000 #0001 178951 S
Cajia Calsina Juan Luis Ingeniería Electrónica 1859 SI 10900069190010320000000 #0001 178919 S
Apaza Apaza Nelzon Jorge Ingeniería Electrónica 1859 SI 10900069520010320000000 #0001 178952 R
Mendoza Bejar Denys Alejandro Ingeniería Electrónica 1825 NO 10900069200010320000000 #0001 178920 S
Huaman Cutipa Aramir Alexander Ingeniería Electrónica 1795 NO 10900069530010320000000 #0001 178953 P
Gomez Quispe Luis Alberto Ingeniería Electrónica 1758 NO 10900069210010320000000 #0001 178921 R
Rodriguez Pacompia Luis Miguel Ingeniería Electrónica 1725 NO 10900069540010320000000 #0001 178954 Q
Lizama Chura Wilder Ingeniería Electrónica 1719 NO 10900069550010320000000 #0001 178955 S
Tabla 4.3: Ingresantes a Ingeniería Electrónica
Damian Damian Vidal Antonio Ingeniería Electrónica 1719 NO 10900069560010320000000 #0001 178956 Q
Mamani Montoya Jonathan Wilber Ingeniería Electrónica 1705 NO 10900069220010320000000 #0001 178922 R
Llanos Chipana Goody Raif Ingeniería Electrónica 1699 NO 10900069570010320000000 #0001 178957 Q
Pineda Lopez Ricardo Ingeniería Electrónica 1699 NO 10900069580010320000000 #0001 178958 Q
Puma Mamani Lizardo Ingeniería Electrónica 1675 NO 10900069590010320000000 #0001 178959 T
Flores Huillca Ederik Ingeniería Electrónica 1665 NO 10900069230010320000000 #0001 178923 R
Mamani Quispe Jherson Miguel Ingeniería Electrónica 1663 NO 10900069600010320000000 #0001 178960 S
Pari Zurita Eddy Alexander Ingeniería Electrónica 1645 NO 10900069610010320000000 #0001 178961 P
Mayta Mamani Yheyson Valentin Ingeniería Electrónica 1635 NO 10900069620010320000000 #0001 178962 R
Condori Roque Erik Simeon Ingeniería Electrónica 1635 NO 10900069240010320000000 #0001 178924 S
Rojas Fuentes Kennedy Waldir Ingeniería Electrónica 1633 NO 10900069250010320000000 #0001 178925 P
64
Mamani Juli Wilder Reynaldo Ingeniería Electrónica 1629 NO 10900069260010320000000 #0001 178926 S
Coello Choque Ricardo Erik Ingeniería Electrónica 1575 NO 10900069630010320000000 #0001 178963 P
Cano Cano Jodwar Millor Ingeniería Electrónica 1570 NO 10900069640010320000000 #0001 178964 R
Supo Alcca Juan Ronaldo Ingeniería Electrónica 1565 NO 10900069270010320000000 #0001 178927 T
Masco Chambi Ruth Katerine Ingeniería Electrónica 1553 NO 10900069280010320000000 #0001 178928 T
Saca Challco Brandon Bruce Ingeniería Electrónica 1550 NO 10900069650010320000000 #0001 178965 T
Mamani Coaquira Milton Ingeniería Electrónica 1535 NO 10900069290010320000000 #0001 178929 P
Alanoca Layme Alexander Ingeniería Electrónica 1533 NO 10900069660010320000000 #0001 178966 Q
Lima Cjuno Juan Nilton Ingeniería Electrónica 1489 NO 10900069670010320000000 #0001 178967 T
Abarca Mamani Andres David Ingeniería Electrónica 1453 NO 10900069680010320000000 #0001 178968 R
Pilco Larico Ivan Ingeniería Electrónica 1452 NO 10900069300010320000000 #0001 178930 S
Rojas Fuentes Javier Omar Ingeniería Electrónica 1431 NO 10900069690010320000000 #0001 178969 R
FUENTE: Comisión Central de Admisión – UNA Puno
Tabla 4.4: Respuestas de ingresantes a Ingeniería Electrónica
65
Elaborado por el equipo de trabajo
DATOS ADQUIRIDOS PARA LA ESCUELA PROFESIONAL DE INGENIERÍA DE SISTEMAS:
Tabla 4.5: Datos de ingresantes a Ingeniería de sistemas
APELLIDO APELLIDO ESCUELA
NOMBRES PUNTAJE ING. CÓDIGO SERIE MAQ NRO TIPO
PATERNO MATERNO PROFESIONAL
Panca Mamani Benjamin Israel Ingeniería De Sistemas 2445 SI 10900066210010320000000 5310 #0001 178621 Q
Mamani Pilco Oscar Ingeniería De Sistemas 2419 SI 10900066220010320000000 5310 #0001 178622 T
Barrantes Quello Angel Alex Ingeniería De Sistemas 2413 SI 10900066230010320000000 5310 #0001 178623 R
Argote Oha Yerko Elard Ingeniería De Sistemas 2355 SI 10900064620010320000000 5310 #0001 178462 T
Zuñiga Arias Zarufzabe Renato Ingeniería De Sistemas 2345 SI 10900064630010320000000 5310 #0001 178463 T
Roque Yucra Miguel Angel Ingeniería De Sistemas 2345 SI 10900064640010320000000 5310 #0001 178464 T
Guevara Macavilca Isaac Jesus Ingeniería De Sistemas 2339 SI 10900066240010320000000 5310 #0001 178624 S
Neira Montesinos Erikson Ingeniería De Sistemas 2315 SI 10900066250010320000000 5310 #0001 178625 P
Quispe Torres Obed Desiderio Ingeniería De Sistemas 2309 SI 10900066260010320000000 5310 #0001 178626 Q
66
Mestas Hancco Edison Nilver Ingeniería De Sistemas 2289 SI 10900066270010320000000 5310 #0001 178627 R
Mamani Lopez Julio Elias Ingeniería De Sistemas 2285 SI 10900066280010320000000 5310 #0001 178628 T
Carrera Huaracha Enson Yair Ingeniería De Sistemas 2285 SI 10900064650010320000000 5310 #0001 178465 Q
Vilca Lupacca Cleber Ingeniería De Sistemas 2283 SI 10900064660010320000000 5310 #0001 178466 Q
Condori Canaza Luis Beltran Ingeniería De Sistemas 2255 SI 10900064670010320000000 5310 #0001 178467 T
Huaraya Amanqui Silvana Yaneth Ingeniería De Sistemas 2225 SI 10900066290010320000000 5310 #0001 178629 P
Tapara Cansaya Dennis Henry Ingeniería De Sistemas 2215 SI 10900064680010320000000 5310 #0001 178468 T
Barraza Campos Angel Manuel Ingeniería De Sistemas 2185 SI 10900064690010320000000 5310 #0001 178469 R
Melo Cruz Luis Alexander Ingeniería De Sistemas 2173 SI 10900064700010320000000 5310 #0001 178470 S
Yepez Zuñiga Victor Brayan Ingeniería De Sistemas 2165 SI 10900066300010320000000 5310 #0001 178630 Q
Suca Coaquira Meyer Hervin Ingeniería De Sistemas 2155 SI 10900064710010320000000 5310 #0001 178471 P
Tabla 4.5: Datos de ingresantes a Ingeniería de sistemas
Alzamora Venegas Julio Cesar Ingeniería De Sistemas 2145 SI 10900064720010320000000 5310 #0001 178472 P
Tipula Checasaca Jose Armando Ingeniería De Sistemas 2135 SI 10900066310010320000000 5310 #0001 178631 Q
Condori Gutierrez Rodrigo Bernardo Ingeniería De Sistemas 2125 SI 10900064730010320000000 5310 #0001 178473 T
Ventura Condori Clinton Kenedy Ingeniería De Sistemas 2125 SI 10900064740010320000000 5310 #0001 178474 S
Sonco Clavedias Cliver Jimny Ingeniería De Sistemas 2125 SI 10900064750010320000000 5310 #0001 178475 T
Arocutipa Condori Walter Javier Ingeniería De Sistemas 2119 SI 10900064760010320000000 5310 #0001 178476 Q
Maquera Araca Luz Pilar Ingeniería De Sistemas 2087 SI 10900066320010320000000 5310 #0001 178632 P
Mamani Soncco Lissbeth Rudy Ingeniería De Sistemas 2069 SI 10900066330010320000000 5310 #0001 178633 Q
Cutipa Ancco Paul Yasmani Ingeniería De Sistemas 2057 SI 10900066340010320000000 5310 #0001 178634 T
Iberos Colque Daniel Sebastian Ingeniería De Sistemas 2045 NO 10900064770010320000000 5310 #0001 178477 S
Zapana Luque Cleny Lilis Ingeniería De Sistemas 2017 NO 10900064780010320000000 5310 #0001 178478 Q
67
Rodriguez Fernandez Willian Gustavo Ingeniería De Sistemas 2011 NO 10900066350010320000000 5310 #0001 178635 T
Romero Fernandez Mery Isabel Ingeniería De Sistemas 2005 NO 10900066360010320000000 5310 #0001 178636 P
Mamani Quispe Humberto Ingeniería De Sistemas 2003 NO 10900066370010320000000 5310 #0001 178637 P
Neira Montesinos Erika Ingeniería De Sistemas 2001 NO 10900066380010320000000 5310 #0001 178638 Q
Llanqui Ydme Jose Carlos Ingeniería De Sistemas 1975 NO 10900064790010320000000 5310 #0001 178479 R
Apaza Vilca Dania Gianella Ingeniería De Sistemas 1975 NO 10900064800010320000000 5310 #0001 178480 P
Llampi Huahuasoncco Lucy Beatriz Ingeniería De Sistemas 1955 NO 10900066390010320000000 5310 #0001 178639 T
Ccopa Condori Yoel Osterling Ingeniería De Sistemas 1949 NO 10900064810010320000000 5310 #0001 178481 S
Yana Mendoza Guillermo Ingeniería de Sistemas 1945 NO 10900066400010320000000 5310 #0001 178640 Q
Peña Aguilar Maricielo Ingeniería de Sistemas 1938 NO 10900064820010320000000 5310 #0001 178482 P
Mamani Holguin Williams Jefferson Ingeniería de Sistemas 1935 NO 10900064830010320000000 5310 #0001 178483 T
FUENTE: Comisión Central de Admisión - UNA Puno
Tabla 4.6: Respuestas de ingresantes a Ingeniería de Sistemas
68
Elaborado por el equipo de trabajo
[Link].EXPLORACIÓN DE DATOS
Una vez que se han descrito los datos, se procede a explorarlos, esto implica aplicar
pruebas estadísticas básicas que revelarán propiedades de los datos, y crear tablas de
frecuencia y gráficos de distribución de los datos. Este parte de la metodología sirve
principalmente para determinar la consistencia y completitud de los datos. Se
realizaron las primeras consultas para importar los datos y hacer la clasificación
posterior en R Studio tal como sigue:
rm(list=ls())#limpiar tablas, variables, etc.
library(ggplot2)
library(dplyr)
#library(extrafont)
##### Importar datos
lecturar <- [Link]("D:/_Tesis
R/Data_Postulantes_2017_2.csv",header = T)
preguntas <- [Link]("D:/_Tesis R/Cont_Preguntas.csv",header =
T)
[Link] <- [Link]("D:/_Tesis R/Cont_Preguntas.csv")
Areasread <- [Link]("D:/_Tesis R/[Link]")
#Clasificar estudiantes que ingresaron
ingresantes <- subset(lecturar,Ingreso=="SI")
#Clasificar estudiantes con sus respectivas respuestas del
examen
ingresantesFIMEES<-ingresantes[,c(6,90:164)]
Figura 4.1: Prueba de exploración de datos
Elaborado por el equipo de trabajo
69
La figura 4.1 muestra el entorno de desarrollo RStudio en el que se realizó la lectura
de los datos iniciales de prueba y se clasificó con sus respectivas respuestas del
examen.
[Link].VERIFICAR LA CALIDAD DE LOS DATOS
Después de hacer la exploración inicial de los datos se puede afirmar que estos son
completos. Los datos cubren los casos requeridos para la obtención de los resultados
necesarios para poder cumplir los objetivos del proyecto. Los datos no contienen
errores, tampoco se encuentran valores fuera de rango, ya que los datos son
controlados desde el mismo programa, por lo que no hay riesgo de ruido en el proceso
de la minería de datos. En cuanto a los valores nulos se les asigna un valor de 2 puntos
adicionales de acuerdo Reglamento General de Admisión 2017 que está en el Anexo
2. En esta tabla hay un gran número de campos con valor nulo, concretamente en los
campos que se refieren a los que no marcaron y los que marcaron de forma incorrecta,
ya que si uno marca incorrectamente la respuesta en la tarjeta de respuestas el puntaje
de los mismo sería nulo.
#Clasificar por carreras
[Link]=subset(ingresantesFIMEES,Escuela_Profesional=="Ingenie
ría de Sistemas")
[Link]=subset(ingresantesFIMEES,Escuela_Profesional=="Ingenie
ría Mecánica Eléctrica")
[Link]=subset(ingresantesFIMEES,Escuela_Profesional=="Ingenie
ría Electrónica")
######crear tabla con nombre de las carreras para resumen
Carrera <- c("Ingeniería Mecánica Eléctrica","Ingeniería
Mecánica Eléctrica","Ingeniería Mecánica Eléctrica",
"Ingeniería Electrónica","Ingeniería
Electrónica","Ingeniería Electrónica",
"Ingeniería de Sistemas","Ingeniería de
Sistemas","Ingeniería de Sistemas")
#Crear columna
Respuesta <- c("Correcta","Incorrecta","Sin
marcar","Correcta","Incorrecta","Sin
marcar","Correcta","Incorrecta","Sin marcar")
#Convirtiendo los valores NA a 0
ingresantesFIMEES [[Link](ingresantesFIMEES)]<-0
#####SEPARACION DE DATOS PARA CREAR DENSIDAD
for(i in 1:60) {
nad <- paste("colR", i, sep = "")
assign(nad,ingresantesFIMEES[,i+1])
}
70
4.1.3. PREPARACIÓN DE LOS DATOS
En esta fase de la metodología se trata de preparar los datos para adecuarlos a las
técnicas de minería de datos que se van a emplear sobre ellos. Esto implica seleccionar
el subconjunto de datos que se va a utilizar, limpiarlos para mejorar su calidad, añadir
nuevos datos a partir de los existentes y darles el formato requerido por la herramienta
de modelado.
[Link].SELECCIONAR LOS DATOS
En términos de registros, se van a utilizar todos los registros dentro de cada columna
que compone la base de datos, ya que al ser ésta una base de datos específicamente
creada para este proyecto, el número de registros que se han insertado ha sido elegido a
propósito. Sin embargo, hay campos dentro de estos registros que no son necesarios para
el análisis de datos de los ingresantes a la Facultad de Ingeniería Mecánica Eléctrica,
Electrónica y Sistemas de la Universidad Nacional del Altiplano, por lo que se puede
prescindir de algunos de ellos.
[Link].LIMPIAR LOS DATOS
En la investigación se cuenta con una base de datos que contiene toda la información
necesaria para poder cumplir los objetivos del análisis de datos del desempeño
académico de los ingresantes a la Facultad de Ingeniería Mecánica Eléctrica, Electrónica
y Sistemas, por lo tanto, estos datos son limpios y no hay necesidad de hacer una
limpieza más profunda sobre ellos.
Tampoco tenemos campos en los que falten valores, más allá de los valores nulos
que aparecen cuando la información que se quiere representar no existe en caso de que
los estudiantes no hayan marcado ninguna respuesta, y no se consideran como datos
faltantes, sino de acuerdo al reglamento se les asigna un valor de 2 puntos extra en el
puntaje.
71
MUESTRA DE PRIMERA LIMPIEZA DE DATOS
Tabla 4.72: Respuestas para limpieza de datos
Matemática 1
Matemática 1
Matemática 1
Matemática 1
Matemática 2
Matemática 2
Matemática 2
Matemática 2
Química
Química
Química
Química
Física
Física
Física
Física
R1 R2 R3 R4 R5 R6 R7 R8 R9 R10 R11 R12 R13 R14 R15 R16
E E B C A B E A B E C A A E A B
A E B C A B E A B E A C A A E E
E E B C B A E A B E A A A E A E
A A B C A B A C B A B C E B A
E B B E E A D A A D C A A E A C
C A C B C C B A C A A A B A B
B B C D A D C A C E A A A A
E A B C A B E A A E A A A C E E
C B C A C A C B D D C A C B A A
Elaborado por el equipo de trabajo
[Link].CONSTRUIR LOS DATOS
En este apartado sólo se puede destacar la transformación del campo de respuestas
en valores de 0,1 y en blanco dependiendo si la respuesta es correcta, incorrecta o sin
marcar.
##Bucle para procesar todas las respuestas correctas,
incorrectas y nulas
for(i in 1:60) {
nam <- paste("Resumen.R", i, sep = "")
assign(nam,c(length(which([Link][,i+1]==1)),length(whic
h([Link][,i+1]==0)),sum([Link]([Link][,i+1])),
length(which([Link][,i+1]==1)),length(which([Link][,i+1]=
=0)),sum([Link]([Link][,i+1])),
length(which([Link][,i+1]==1)),length(which([Link][,i+1]=
=0)),sum([Link]([Link][,i+1])))
) }
for(i in 1:60) {
nam <- paste("Porcentaje", i, sep = "")
assign(nam,c(round(length(which([Link][,i+1]==1))/nrow(ing
.mec)*100,2),round(length(which([Link][,i+1]==0))/nrow(ing
.mec)*100,2),round(sum([Link]([Link][,i+1]))/nrow([Link])*
100,2),
round(length(which([Link][,i+1]==1))/nrow([Link])*100,2),
round(length(which([Link][,i+1]==0))/nrow([Link])*100,2),
round(sum([Link]([Link][,i+1]))/nrow([Link])*100,2),
round(length(which([Link][,i+1]==1))/nrow([Link])*100,2),
round(length(which([Link][,i+1]==0))/nrow([Link])*100,2),
round(sum([Link]([Link][,i+1]))/nrow([Link])*100,2))
) }
72
DATOS DE TARJETA DE RESPUESTAS
Tabla 4.8: Construcción de datos
Matemática 1
Matemática 1
Matemática 1
Matemática 1
Matemática 2
Matemática 2
Matemática 2
Matemática 2
Química
Química
Química
Química
Física
Física
Física
Física
V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14 V15 V16
1 1 1 1 1 1 0 0 1 0 1 1 1 1 0 0
1 1 1 1 1 1 0 1 1 1 1 1 1 1 0 0
1 1 1 1 0 1 1 1 1 0 1 1 1 0 1 1
1 1 1 1 1 0 1 1 0 1 0 0 1 1 0 0
0 1 1 1 1 0 1 1 0 1 1 1 1 0 1 1
1 1 1 1 0 1 1 1 0 1 1 0 1 1 0 1
0 1 1 1 1 1 0 0 1 1 1 0 1 1 0
1 0 1 1 1 0 1 1 1 1 0 0 1 1 1 0
1 0 1 0 1 1 1 0 0 1 0 0 1 1 0
1 0 1 1 1 1 0 1 0 1 0 1 1 1
1 0 1 1 1 0 1 1 1 1 1 0 1 0 1 1
1 1 1 0 0 0 1 1 0 1 0 0 1 1 1 1
1 1 1 1 1 0 1 1 0 1 0 0 1 1 1
1 0 0 1 0 1 1 1 0 0 0 1 1 1 1
1 0 0 0 1 1 0 0 1 1 1 1 1 1
1 0 1 1 1 1 0 0 1 1 1 1 0 1 1 0
0 0 1 0 1 0 0 1 0 0 1 1 1 0
1 1 0 1 0 1 1 1 0 0 0 1 0 1 1 1
0 1 0 0 0 0 1 0 1 0 0 1 1
Elaborado por el equipo de trabajo
73
DATOS PARA COMPARACIÓN DE CLAVES DE RESPUESTA
Tabla 4.9: Clave de respuestas para el área de ingenierías
74
FUENTE: Comisión Central de Admisión
[Link].INTEGRAR LOS DATOS
No ha sido necesaria la creación de nuevas estructuras (campos, registros, etc.), ni
la fusión entre las columnas, ya que en la herramienta R se puede realizar estas tareas
automáticamente para las lecturas y el diseño de gráficos además de darse la lectura
incluso de los datos de los ingresantes.
4.1.4. MODELADO
En esta fase de la metodología se escogerá la técnica (o técnicas) más apropiadas
para los objetivos marcados de la minería de datos. A continuación, y una vez
realizado un plan de prueba para los modelos escogidos, se procederá a aplicar dichas
técnicas sobre los datos para generar el modelo y por último se tendrá que evaluar si
dicho modelo ha cumplido los criterios de éxito o no.
[Link].ESCOGER LA TÉCNICA DE ANÁLISIS
Es viable realizar un análisis los datos del rendimiento académico de los
ingresantes a la Facultad de Ingeniería Mecánica Eléctrica, Electrónica y Sistemas
con el entorno de lenguaje y programación R ya que cuenta con 2 paquetes que
permiten lograr los objetivos del análisis.
La técnica de análisis a utilizar es la visualización de datos a través de gráficos ya
que se muestran de forma rápida y simplificada para detectar patrones en los datos,
para ello se utilizarán las funciones ggplot y dplyr.
Para el nivel de asertividad se aplica la densidad de kernel a fin de generar gráficos
en los que se ajusta una superficie curva uniforme sobre cada punto que representa
las respuestas del ingresante por área, de manera que para su obtención el valor de
superficie es más alto en la ubicación del punto y disminuirá a medida que aumente
la distancia desde el punto y alcance cero en la distancia Radio de búsqueda desde el
75
punto. Para la densidad de kernel se utilizarán las funciones ggplot y factor con los
datos previamente organizados en data frames.
[Link].IMPLEMENTACIÓN DE ANALISIS
Se realizaron las siguientes consultas para la lectura de los data frames de las
respuestas y preguntas de los ingresantes a las carreras de Ingeniería Mecánica
Eléctrica, Ingeniería Electrónica e Ingeniería de Sistemas por separado:
Figura 4.2: Lectura de archivos
Elaborado por el equipo de trabajo
Para obtener los gráficos iniciales se organizó la información por colores en azul
(correctas), rojo (incorrectas) y verde (sin marcar) en gráficos de barras utilizando las
funciones ggplot, ggtitle, geom_text, entre otras y se almacenaron los gráficos en el
ordenador con las etiquetas del área al que corresponden.
#####Graficar los datos
[Link] = [Link]$CONTENIDOS
direccion<-"D:/_Tesis R/Graficos/Preguntas/"
##
Carreras = factor(Carrera, levels = c("Ingeniería Mecánica
Eléctrica","Ingeniería Electrónica","Ingeniería de Sistemas"))
#Grafico de barras de todas las preguntas
for (i in 1:60) {
Grafico <- ggplot(data=[Link],aes(x=Carreras,
y=[Link][,i+62] ,fill=Respuesta))+
76
geom_bar(stat="identity",position="dodge",alpha=0.5)+
scale_fill_manual(values=c("blue","red","green"))+
ggtitle(paste([Link]$PREGUNTA.N.[i],".",[Link][i]
))+
theme_bw()+
theme ([Link] = element_text(#family = "Comic Sans
MS",
vjust = 2,#Justificacion Vertical
face = "bold"))+
labs(y="Porcentaje (%)")+
geom_text(aes(y = [Link][,i+62] , label =
[Link][,i+62]),
position = position_dodge(width = 0.9), size=3,
vjust=-0.25, hjust=0.5 ,col="black")
ggsave(Grafico,
file=paste(direccion,[Link]$PREGUNTA.N.[i],[Link]
[i],".jpg",sep = ""),
height = 4,
width = 6.5
)
}
#Creación del Data Frame para graficar las 14 Areas
[Link] <-
[Link](Carrera,Respuesta,Area1,Area2,Area3,Area4,Area5,Area6,Are
a7,Area8,Area9,Area10,Area11,Area12,Area13,Area14
,Area.porcentaje1,Area.porcentaje2,Area.porcentaje3,Area.porcentaje4
,Area.porcentaje5,Area.porcentaje6,Area.porcentaje7,Area.porcentaje8
,Area.porcentaje9,Area.porcentaje10,Area.porcentaje11,[Link]
e12,Area.porcentaje13,Area.porcentaje14)
#Grafico por Áreas
direccion3<-"D:/_Tesis R/Graficos/Areas/"
Areas <- Areasread$Area
for (i in seq_along(Areas)) {
#
Grafico <- ggplot(data=[Link],aes(x=Carreras,
y=[Link][,i+16] ,fill=Respuesta))+
geom_bar(stat="identity",position="dodge",alpha=0.5)+
scale_fill_manual(values=c("blue","red","green"))+
ggtitle(paste(Areasread$Numero[i],Areas[i]))+
theme_bw()+
theme ([Link] = element_text(#family = "Comic Sans MS",
vjust = 2,#Justificacion
Vertical
face = "bold"))+
labs(y="Porcentaje (%)")+
77
geom_text(aes(y = [Link][,i+16] , label =
[Link][,i+16]),
position = position_dodge(width = 0.9), size=3,
vjust=-0.25, hjust=0.5 ,col="black")
print(Grafico)
ggsave(Grafico,
file=paste(direccion3,Areasread$Numero[i],Areas[i],".jpg",sep = ""),
height = 4,
width = 7
)
}
#dataframes de la densidad en areas
Densi.data1_8 <-
[Link](densi.area1,densi.area2[,2],densi.area3[,2],densi.area4[,
2],densi.area5[,2],densi.area6[,2],densi.area7[,2],
densi.area8[,2])
Densi.data9 <- [Link](densi.area9)
Densi.data10 <- [Link](densi.area10)
Densi.data11 <- [Link](densi.area11)
Densi.data12 <- [Link](densi.area12)
Densi.data13 <- [Link](densi.area13)
Densi.data14 <- [Link](densi.area14)
#------------Grafico Desidad Areas 1 8----------
direccion2<-"D:/_Tesis R/Graficos/Densidad/"
for (i in 1:8) {
Densidad1_8<- ggplot(Densi.data1_8, aes(x=Densi.data1_8[,i+1],
color=Densi.data1_8$ingresantesFIMEES...1.))+
geom_line(size=0.7,stat = "density",adjust = 2.3)+
ggtitle(paste(Areasread$Numero[i],".",Areasread$Area[i]))+
scale_color_discrete(name='Carreras')+
theme ([Link] = element_text(#family = "Comic Sans MS",
vjust = 2,#Justificacion Vertical
face = "bold"))+
labs(y="Densidad")+
scale_x_continuous(name = "Nivel de Asertividad")
print(Densidad1_8)
ggsave(Densidad1_8,
ile=paste(direccion2,Areasread$Numero[i],Areasread$Area[i],".jpg",se
p = ""),
height = 4,
width = 6.5
)
}
78
- PONDERACIÓN DE ÁREAS EN NIVEL DE CUMPLIMIENTO
Para obtener el nivel de cumplimento del perfil del ingresante se calculó la
ponderación del nivel de cumplimiento detalladas por carreras en las tablas del Anexo
3 en las cuales se tienen:
• PONDERACIÓN: Es la ponderación asignada para las respuestas correctas del
examen dependiendo del área.
• PORCENTAJE: Equivalente al puntaje perfecto del examen en modalidad
general entre el porcentaje de preguntas que representa cada área.
• [Link]: Es el porcentaje que representa la pregunta respecto a la
ponderación entre el porcentaje anterior.
• [Link]: Representa a la ponderación de cada pregunta entre el
porcentaje de la segunda columna y representa al nivel de asertividad en la
pregunta analizada.
4.1.5. EVALUACIÓN
En esta fase de la metodología se intentan evaluar los modelos generados, pero en esta
ocasión la evaluación se hace desde el punto de vista del objetivo de negocio en lugar de
los objetivos de minería de datos. Una vez realizada esta evaluación, se debe decidir si los
objetivos han sido cumplidos y de ser así se puede avanzar a la fase de implantación, de
lo contrario se tendría que identificar cualquier factor que se haya podido pasar por alto y
hacer una revisión del proceso.
[Link].EVALUAR LOS RESULTADOS
Desde el punto de vista del negocio, se logró organizar los datos de los ingresantes
para determinar el nivel de cumplimiento del perfil del ingresante.
79
Además, para poder calificar como aceptable o no los resultados se tiene una base
objetiva , como lo son los indicadores estadísticos descritos en el apartado 4.3 del
presente trabajo con base en la información obtenida en el anexo 3, para comprobar
que estos resultado son correctos se dispusieron datos de prueba final en los que se
asignaron todas las respuestas correctas y se obtuvo el nivel en un porcentaje casi
perfecto y opuestamente se realizó la prueba con otros datos comprobándose que el
modelo también es aplicable con información variada. En cualquier caso, basándonos
en los indicadores obtenidos mediante la herramienta de minería de datos, a
continuación, podemos hacer una evaluación de cada modelo para así descartar aquel
que no cumpla con unos requisitos mínimos.
• OBJETIVO 1
Organizar los datos del desempeño académico de los ingresantes a las escuelas
profesionales de la facultad de Ingeniería Mecánica Eléctrica, Electrónica y Sistemas.
Se organizaron satisfactoriamente los datos en la fase 1 y fase 2, formateando y
reemplazando datos de las respuestas de los ingresantes como se puede observar en
las tablas 6, tabla 8 y tabla 10 de la presente investigación.
• OBJETIVO 2
Procesar los datos del desempeño académico de los ingresantes a las escuelas
profesionales de la facultad de Ingeniería Mecánica Eléctrica, Electrónica y Sistemas.
Se procesaron satisfactoriamente los datos del desempeño académico de los
ingresantes y se obtuvieron gráficos que posteriormente fueron analizados e
interpretados en el apartado 4.3.
• OBJETIVO 3
Determinar el nivel de cumplimiento del perfil del ingresante a la Facultad de
Ingeniería Mecánica Eléctrica, Electrónica y Sistemas.
80
Se determino el nivel de cumplimiento en base a la ponderación de las preguntas
con los porcentajes de asertividad de las respuestas de los ingresantes.
[Link].DETERMINAR LOS PROXIMOS PASOS
Como siguiente paso se tiene la interpretación de los resultados del análisis de
datos del desempeño académico de los ingresantes a la Facultad de Ingeniería
Mecánica Eléctrica, Electrónica y Sistemas en función al perfil del ingresante al área
de ciencias de la ingeniería de la Universidad Nacional del Altiplano.
4.1.6. IMPLANTACIÓN
Esta es la última fase de la metodología CRISP-DM y el objetivo de la misma es
el de explicar al cliente como poner en funcionamiento el proyecto que se ha
construido en las fases anteriores, así como exponer los resultados obtenidos al
cliente de forma que lo pueda entender fácilmente lo cual se puede mostrar en los
resultados del presente.
[Link]ÓN DE LA INFORMACIÓN DE LOS INGRESANTES A LA
FACULTAD DE INGENIERÍA MECÁNICA ELÉCTRICA, ELECTRÓNICA Y
SISTEMAS DE LA UNIVERSIDAD NACIONAL DEL ALTIPLANO
La organización de los datos obtenidos par la muestra se desarrolló en la fase 2:
Comprensión de los datos y fase 3: preparación de los datos de la metodología CRISP-
DM en los que se puede observar que se realiza la recolección inicial de los datos para
poder establecer un primer contacto con el problema, familiarizarse con los datos y
averiguar su calidad, así como identificar las relaciones más evidentes para formular
las primeras hipótesis.
Cabe indicar que se tuvo que organizar y utilizar el contenido de las tarjetas de
respuestas de estudiantes ingresantes a la Facultad de Ingeniería Mecánica Eléctrica,
81
Electrónica y Sistemas, lo cual conlleva una serie de restricciones de acceso a la
información personal de los ingresantes, tomando en cuenta que el objetivo de la
investigación es realizar el análisis lo más real posible, por lo que se les asigno un
código de ingresante.
Por otra parte, debido a la gran cantidad de registros que es necesario analizar para
poder hacer un trabajo de minería de datos con éxito y que la información coincida, la
opción de insertar los registros manualmente uno a uno en la base de datos no era
viable, por lo que se optó por crear una distribución aleatoria con resultados de los
ingresantes.
En la organización de los datos con R se obtuvieron la Tabla 4.8 y Tabla 4.9 en
forma íntegra y listos para ser procesados en el script para Rstudio. Se observa que los
datos extraídos de la base de datos permiten el procesamiento de datos, mediante la
utilización de la herramienta R en la que se destaca la existencia de una gran
comunidad de usuarios que realizan aportes para ampliar la funcionalidad del software.
En la implementación se tiene la aplicación de los paquetes dplyr y ggplot2, el
primero de ellos proporciona una forma bastante ágil de manejar los ficheros de datos
de R, incluye un conjunto de comandos que coinciden con las acciones más comunes
que se realizan sobre un conjunto de datos. Lo que hace que la sintaxis sea
especialmente clara es la correspondencia tan nítida entre el comando y la acción.
En el análisis desarrollado con la Metodología CRISP – DM se tiene las fases 4:
modelado, fase 5: evaluación y fase 6: implementación en las que se realiza el proceso
de los datos detallándose en cada uno de estas partes utilizando la herramienta R.
82
[Link] E INTERPRETACIÓN DEL NIVEL DE CUMPLIMIENTO DEL
PERFIL DEL INGRESANTE A LA FACULTAD DE INGENIERÍA
MECÁNICA ELÉCTRICA, ELECTRÓNICA Y SISTEMAS DE LA
UNIVERSIDAD NACIONAL DEL ALTIPLANO.
Una vez realizado el análisis y sectorización de datos del rendimiento académico
de la muestra compuesta por los ingresantes a la Facultad de Ingeniería Mecánica
Eléctrica, Electrónica y Sistemas en el examen general Mayo-2017, se pudo observar
los niveles de rendimiento en las 14 áreas que comprendió esta prueba, la información
en mención se describe a continuación:
4.3.1. NIVEL DE CUMPLIMIENTO EN MATEMÁTICA I DE LOS
INGRESANTES A LA FACULTAD DE INGENIERÍA MECÁNICA
ELÉCTRICA, ELECTRÓNICA Y SISTEMAS RESPECTO AL PERFIL
DEL INGRESANTE
De acuerdo al perfil del ingresante de la Tabla 2 del presente trabajo como también
está establecido en el Prospecto de Admisión del examen general Mayo-2017, se
detalla que en el Área de Matemática I, el estudiante Razona y demuestra
proposiciones matemáticas y representa, analiza e interpreta datos matemáticos
contextualizados.
En cuanto a la Facultad de Ingeniería Mecánica Eléctrica, Electrónica y Sistemas
se obtuvieron los siguientes resultados del análisis y sectorización a nivel general:
83
Figura 4.3: Resultados del análisis de Matemática I
Elaborado por el equipo de trabajo
En el área de Matemática I se puede considerar que en la Escuela Profesional
de Ingeniería Mecánica Eléctrica se tiene un 66% de respuestas correctas, 32% de
respuestas incorrectas y 2% de respuestas en blanco. Por otra parte, en la Escuela
Profesional de Ingeniería Electrónica se tiene 44% de respuestas correctas, 48%
de respuestas incorrectas y 8% de respuestas en blanco. Finalmente, en la Escuela
Profesional de Ingeniería de Sistemas se tiene 61% de respuestas correctas, 35%
de respuestas incorrectas y 8% de respuestas en blanco.
Figura 4.4: Densidad Kernel en Matemática I
Elaborado por el equipo de trabajo
84
En el gráfico se puede visualizar la densidad Kernel del nivel de asertividad
correspondiente a las preguntas de Matemática I. Se denota el cumplimiento de
los requerimientos expuestos para la realización del gráfico sobre dos parámetros
clave: la función Kernel o núcleo y el ancho de banda para el Área de Matemática
I en la Escuela Profesional de Ingeniería Mecánica Eléctrica con el mayor número
de respuestas correctas, seguido de Ingeniería de Sistemas y con menor densidad
de respuestas correctas la Escuela Profesional de Ingeniería Electrónica.
Es importante considerar que de acuerdo al reglamento de admisión del Año
2017 que se encuentra en el Anexo 2, se establece que en el área de Matemática I
se tienen 4 preguntas de los siguientes temas:
1. Ecuaciones Lineales, Cuadráticas y de Grado Superior
2. Inecuaciones Lineales, Cuadráticas, Polinómicas y Racionales
3. Factorización, Racionalización y Radicación
4. Expresiones Algebraicas, Polinomios y operaciones
Se realizó el análisis haciendo uso de Lenguaje R de cada uno de los temas del
área de Matemática I; obteniendo los siguientes resultados:
Figura 4.5: Resultado de análisis de Ecuaciones lineales, cuadráticas y de grado
superior
Elaborado por el equipo de trabajo
85
En la pregunta N° 1 del tema Ecuaciones Lineales, Cuadráticas y de Grado
Superior se obtuvo como resultado que en la Escuela Profesional de Ingeniería
Mecánica Eléctrica se tiene un 52% de respuestas correctas, 48% de respuestas
incorrectas y ninguna respuesta en blanco. Por otra parte, la Escuela Profesional
de Ingeniería Electrónica tiene un 50% de respuestas correctas, 44% de respuestas
incorrectas y 6% de respuestas en blanco. Finalmente, en la Escuela Profesional
de Ingeniería de Sistemas se tiene un 66% de respuestas correctas 33% de
respuestas incorrectas y 1% de respuestas en blanco, todo ello de acuerdo a la
Figura 5.
Figura 4.6: Resultado de análisis en Inecuaciones Lineales, Cuadráticas,
Polinómicas y Racionales
Elaborado por el equipo de trabajo
En la pregunta N° 2 del tema Inecuaciones Lineales, Cuadráticas, Polinómicas
y Racionales se obtuvo como resultado que en la Escuela Profesional de Ingeniería
Mecánica Eléctrica se tiene un 55% de respuestas correctas, 42% de respuestas
incorrectas y 3% de respuestas en blanco. Por otra parte, en la Escuela Profesional
de Ingeniería Electrónica tiene un 50% de respuestas correctas, 44% de respuestas
incorrectas y 6% de respuestas en blanco. Finalmente, en la Escuela Profesional
de Ingeniería de Sistemas se tiene un 55% de respuestas correctas 41% de
respuestas incorrectas y 4% de respuestas en blanco, todo ello de acuerdo a la
Figura 4.6.
86
Figura 4.7: Factorización, Racionalización y Radicación
Elaborado por el equipo de trabajo
En la pregunta N° 3 del tema Factorización, Racionalización y Radicación se
obtuvo como resultado que en la Escuela Profesional de Ingeniería Mecánica Eléctrica
se tiene un 61% de respuestas correctas, 36% de respuestas incorrectas y 3% de
respuestas en blanco. Por otra parte, en la Escuela Profesional de Ingeniería
Electrónica se tiene un 44% de respuestas correctas, 44% de respuestas incorrectas y
12% de respuestas en blanco. Finalmente, en la Escuela Profesional de Ingeniería de
Sistemas se tiene un 69% de respuestas correctas 28% de respuestas incorrectas y 3%
de respuestas en blanco, todo ello de acuerdo a la Figura 4.7.
Figura 4.8: Resultado de análisis de Expresiones Algebraicas, Polinomios y
operaciones
Elaborado por el equipo de trabajo
87
En la pregunta 4 del tema Expresiones Algebraicas, Polinomios y operaciones
se obtuvo como resultado que en la Escuela Profesional de Ingeniería Mecánica
Eléctrica se tiene un 97% de respuestas correctas, 0% de respuestas incorrectas y
3% de respuestas en blanco. Por otra parte, en la Escuela Profesional de Ingeniería
Electrónica se tiene un 31% de respuestas correctas, 62% de respuestas incorrectas
y 6% de respuestas en blanco. Finalmente, en la Escuela Profesional de Ingeniería
de Sistemas se tiene un 55% de respuestas correctas 38% de respuestas incorrectas
y 7% de respuestas en blanco, todo ello se muestra en la figura 4.8.
4.3.2. NIVEL DE CUMPLIMIENTO EN MATEMÁTICA II DE LOS
INGRESANTES A LA FACULTAD DE INGENIERÍA MECÁNICA
ELÉCTRICA, ELECTRÓNICA Y SISTEMAS RESPECTO AL PERFIL
DEL INGRESANTE
De acuerdo al perfil del ingresante de la Tabla 2 del presente trabajo como
también está establecido en el Prospecto de Admisión del examen general Mayo-
2017, se detalla que en el Área de Matemática II, el estudiante Razona y demuestra
proposiciones matemáticas y representa, analiza e interpreta datos matemáticos
contextualizados. En cuanto a la Facultad de Ingeniería Mecánica Eléctrica,
Electrónica y Sistemas se obtuvieron los siguientes resultados del análisis y
sectorización de los datos de los ingresantes a nivel general:
Figura 4.9: Resultado del Análisis de Matemática II
Elaborado por el equipo de trabajo
88
En el área de Matemática II se puede considerar que en la Escuela Profesional
de Ingeniería Mecánica Eléctrica se tiene un 49% de respuestas correctas, 50% de
respuestas incorrectas y 1% de respuestas en blanco. Por otra parte, en la Escuela
Profesional de Ingeniería Electrónica se tiene 42% de respuestas correctas, 55%
de respuestas incorrectas y 3% de respuestas en blanco. Finalmente, en la Escuela
Profesional de Ingeniería de Sistemas se tiene 52% de respuestas correctas, 41%
de respuestas incorrectas y 7% de respuestas en blanco.
Figura 4.10: Densidad de Kernel en Matemática II
Elaborado por el equipo de trabajo
En el gráfico se puede visualizar la densidad Kernel del nivel de asertividad
correspondiente a las preguntas de Matemática II. Se denota el cumplimiento de
los requerimientos expuestos para la realización del gráfico sobre dos parámetros
clave: la función Kernel o núcleo y el ancho de banda para el Área de Matemática
II. La Escuela Profesional de Ingeniería de Sistemas cuenta con la mayor densidad
de respuestas correctas, seguido de Ingeniería Mecánica Eléctrica y con menor
densidad de respuestas correctas la Escuela Profesional de Ingeniería Electrónica.
De acuerdo al reglamento de admisión del Año 2017 que se encuentra en el
Anexo 2, se establece que en el área de Matemática II se tienen 4 preguntas de los
siguientes temas:
89
1. Segmentos y Ángulos geométricos
2. Geometría analítica
3. Funciones trigonométricas
4. Triángulos
Se realizó el análisis haciendo uso de Lenguaje R de cada uno de los temas del
área de Matemática II; obteniendo los siguientes resultados:
Figura 4.11: Resultado de análisis de Segmentos y Ángulos geométricos
Elaborado por el equipo de trabajo
En la pregunta N° 5 del tema Segmentos y Ángulos geométricos se obtuvo como
resultado que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene
un 48% de respuestas correctas, 52% de respuestas incorrectas y ninguna
respuesta en blanco. Por otra parte, en la Escuela Profesional de Ingeniería
Electrónica se tiene un 50% de respuestas correctas, 50% de respuestas incorrectas
y ninguna respuesta en blanco. Finalmente, en la Escuela Profesional de Ingeniería
de Sistemas se tiene un 48% de respuestas correctas 41% de respuestas incorrectas
y 11% de respuestas en blanco, todo ello se muestra en la Figura 4.11.
90
Figura 4.12: Resultado de análisis de Geometría analítica
Elaborado por el equipo de trabajo
En la pregunta N° 6 del tema Geometría analítica se obtuvo como resultado
que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 55%
de respuestas correctas, 45% de respuestas incorrectas y ninguna respuesta en
blanco. Por otra parte, la Escuela Profesional de Ingeniería Electrónica tiene un
44% de respuestas correctas, 56% de respuestas incorrectas y ninguna respuesta
en blanco. Finalmente, en la Escuela Profesional de Ingeniería de Sistemas se tiene
un 48% de respuestas correctas 42% de respuestas incorrectas y 10% de respuestas
en blanco, todo ello de acuerdo a la Figura 4.12.
Figura 4.13: Resultado de análisis de Funciones trigonométricas
Elaborado por el equipo de trabajo
91
En la pregunta N° 7 del tema Funciones trigonométricas se obtuvo como
resultado que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene
un 45% de respuestas correctas, 52% de respuestas incorrectas y 3% de respuestas
en blanco. Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se
tiene un 38% de respuestas correctas, 56% de respuestas incorrectas y 6% de
respuestas en blanco. Finalmente, en la Escuela Profesional de Ingeniería de
Sistemas se tiene un 62% de respuestas correctas 28% de respuestas incorrectas y
10% de respuestas en blanco, todo ello de acuerdo a la Figura 4.13.
Figura 4.14: Resultado de análisis de Triángulos
Elaborado por el equipo de trabajo
En la pregunta N° 8 del tema Triángulos se obtuvo como resultado que en la
Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 48% de
respuestas correctas, 52% de respuestas incorrectas y ninguna respuesta en blanco.
Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene un 38%
de respuestas correctas, 56% de respuestas incorrectas y 6% de respuestas en
blanco. Finalmente, en la Escuela Profesional de Ingeniería de Sistemas se tiene
un 48% de respuestas correctas 52% de respuestas incorrectas y ninguna respuesta
en blanco, todo ello se observa en la Figura 4.14.
92
4.3.3. NIVEL DE CUMPLIMIENTO EN FÍSICA DE LOS INGRESANTES A LA
FACULTAD DE INGENIERÍA MECÁNICA ELÉCTRICA,
ELECTRÓNICA Y SISTEMAS RESPECTO AL PERFIL DEL
INGRESANTE
De acuerdo al perfil del ingresante de la Tabla 2 del presente trabajo como
también está establecido en el Prospecto de Admisión del examen general Mayo-
2017, se detalla que en el Área de Física el estudiante interpreta la información y
resuelve problemas de ciencia, tecnología y ambiente.
En cuanto a la Facultad de Ingeniería Mecánica Eléctrica, Electrónica y
Sistemas se obtuvieron los siguientes resultados del análisis y sectorización a nivel
general:
Figura 4.15: Análisis de Física
Elaborado por el equipo de trabajo
En el área de Física se puede considerar que en la Escuela Profesional de
Ingeniería Mecánica Eléctrica se tiene un 42% de respuestas correctas, 56% de
respuestas incorrectas y 2% de respuestas en blanco. Por otra parte, en la Escuela
Profesional de Ingeniería Electrónica se tiene 27% de respuestas correctas, 68%
de respuestas incorrectas y 5% de respuestas en blanco. Finalmente, en la Escuela
Profesional de Ingeniería de Sistemas se tiene 59% de respuestas correctas, 34%
de respuestas incorrectas y 7% de respuestas en blanco.
93
Figura 4.16: Densidad Kernel en Física
Elaborado por el equipo de trabajo
En el presente gráfico se puede visualizar la densidad Kernel del nivel de
asertividad correspondiente a las preguntas de Física. Se denota el cumplimiento de
los requerimientos expuestos para la realización del gráfico sobre dos parámetros
clave: la función Kernel o núcleo y el ancho de banda. Para el área de Física en la
Escuela Profesional de Ingeniería de Sistemas se obtuvo la mayor densidad de
respuestas correctas, seguido de Ingeniería Mecánica Eléctrica y con menor densidad
de respuestas correctas la Escuela Profesional de Ingeniería Electrónica.
Es importante considerar que de acuerdo al reglamento de admisión del Año 2017
que se encuentra en el Anexo 2, se establece que en el área de Física se tienen 4
preguntas de los siguientes temas:
1. Trabajo y potencia
2. Electricidad y magnetismo
3. Dinámica
4. Estática
94
Se realizó el análisis haciendo uso de Lenguaje R de cada uno de los temas del
área de Física; obteniendo los siguientes resultados:
Figura 4.17: Resultado de análisis de Trabajo y Potencia
Elaborado por el equipo de trabajo
En la pregunta N° 9 del tema Trabajo y potencia se obtuvo como resultado que
en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 36% de
respuestas correctas, 64% de respuestas incorrectas y ninguna respuesta en blanco.
Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene un 31%
de respuestas correctas, 69% de respuestas incorrectas y ninguna respuesta en
blanco. Finalmente, en la Escuela Profesional de Ingeniería de Sistemas se tiene
un 59% de respuestas correctas 34% de respuestas incorrectas y 7% de respuestas
en blanco, todo ello de acuerdo a la Figura 4.17.
Se realizó el mismo proceso de análisis para el área de Electricidad y
Magnetismo considerando los aspectos del perfil del ingresante al área de ciencias
de la ingeniería de la Universidad Nacional del Altiplano.
95
Figura 4.18: Resultado de análisis de Electricidad y Magnetismo
Elaborado por el equipo de trabajo
En la pregunta N° 10 del tema Electricidad y magnetismo se obtuvo como
resultado que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene
un 33% de respuestas correctas, 64% de respuestas incorrectas y 3% de respuestas
en blanco. Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se
tiene un 25% de respuestas correctas, 69% de respuestas incorrectas y 6% de
respuestas en blanco. Finalmente, en la Escuela Profesional de Ingeniería de
Sistemas se tiene un 69% de respuestas correctas 24% de respuestas incorrectas y
7% de respuestas en blanco, todo ello de acuerdo a la Figura 4.18.
Figura 4.19: Resultado del análisis de Dinámica
Elaborado por el equipo de trabajo
96
En la pregunta N° 11 del tema Dinámica se obtuvo como resultado que en la
Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 45% de
respuestas correctas, 52% de respuestas incorrectas y 3% de respuestas en blanco.
Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene un 31%
de respuestas correctas, 62% de respuestas incorrectas y 6% de respuestas en
blanco. Finalmente, en la Escuela Profesional de Ingeniería de Sistemas se tiene
un 52% de respuestas correctas 34% de respuestas incorrectas y 14% de respuestas
en blanco, todo ello de acuerdo a la Figura 4.19.
Figura 4.20: Resultado del análisis de Estática
Elaborado por el equipo de trabajo
En la pregunta N° 12 del tema Estática se obtuvo como resultado que en la
Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 55% de
respuestas correctas, 45% de respuestas incorrectas y ninguna respuesta en blanco.
Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene un 19%
de respuestas correctas, 75% de respuestas incorrectas y 6% de respuestas en
blanco. Finalmente, en la Escuela Profesional de Ingeniería de Sistemas se tiene
un 59% de respuestas correctas 41% de respuestas incorrectas y ninguna respuesta
en blanco, todo ello de acuerdo a la Figura 4. 20. del presente trabajo.
97
4.3.4. NIVEL DE CUMPLIMIENTO EN QUÍMICA DE LOS INGRESANTES A
LA FACULTAD DE INGENIERÍA MECÁNICA ELÉCTRICA,
ELECTRÓNICA Y SISTEMAS RESPECTO AL PERFIL DEL
INGRESANTE
De acuerdo al perfil del ingresante de la Tabla 2 del presente trabajo como
también está establecido en el Prospecto de Admisión del examen general Mayo-
2017, se detalla que en el área de Química, el estudiante resuelve e interpreta
problemas de la ciencia, tecnología y ambiente.
En cuanto a la Facultad de Ingeniería Mecánica Eléctrica, Electrónica y
Sistemas se obtuvieron los siguientes resultados del análisis y sectorización a nivel
general:
Figura 4.21: Resultado del Análisis de Química
Elaborado por el equipo de trabajo
En el área de Química se puede considerar que en la Escuela Profesional de
Ingeniería Mecánica Eléctrica se tiene un 52% de respuestas correctas, 46% de
respuestas incorrectas y 2% de respuestas en blanco. Por otra parte, en la Escuela
Profesional de Ingeniería Electrónica se tiene 44% de respuestas correctas, 55%
de respuestas incorrectas y 1% de respuestas en blanco. Finalmente, en la Escuela
98
Profesional de Ingeniería de Sistemas se tiene 61% de respuestas correctas, 34%
de respuestas incorrectas y 5% de respuestas en blanco.
Figura 4.22: Densidad Kernel en Química
Elaborado por el equipo de trabajo
En el presente gráfico se puede visualizar la densidad Kernel del nivel de
asertividad correspondiente a las preguntas de Química. Se denota el
cumplimiento de los requerimientos expuestos para la realización del gráfico
sobre dos parámetros clave: la función Kernel o núcleo y el ancho de banda. Para
el Área de Química en la Escuela Profesional de Ingeniería de Sistemas se tiene
la mayor densidad de respuestas correctas, seguido de Ingeniería Mecánica
Eléctrica y con menor densidad de respuestas correctas la Escuela Profesional de
Ingeniería Electrónica.
Es importante considerar que de acuerdo al reglamento de admisión del Año
2017 que se encuentra en el Anexo 2, se establece que en el área de Química se
tienen 4 preguntas de los siguientes temas:
1. Funciones químicas
2. Estructura atómica
3. Materia – Energía
4. Funciones químicas oxigenadas
99
Se realizó el análisis haciendo uso de Lenguaje R de cada uno de los temas del
área de Química; obteniendo los siguientes resultados:
Figura 4.23: Resultado del análisis de Funciones Químicas
Elaborado por el equipo de trabajo
En la pregunta N° 13 del tema Funciones químicas se obtuvo como resultado
que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 58%
de respuestas correctas, 39% de respuestas incorrectas y 3% de respuestas en
blanco. Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene
un 44% de respuestas correctas, 50% de respuestas incorrectas y 6% de respuestas
en blanco. Finalmente, en la Escuela Profesional de Ingeniería de Sistemas se tiene
un 52% de respuestas correctas 41% de respuestas incorrectas y 7% de respuestas
en blanco, todo ello de acuerdo a la Figura 4.23.
Figura 4.24: Resultado del análisis de Estructura Atómica
Elaborado por el equipo de trabajo
100
En la pregunta N° 14 del tema Estructura atómica se obtuvo como resultado
que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 52%
de respuestas correctas, 48% de respuestas incorrectas y ninguna respuesta en
blanco. Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene
un 44% de respuestas correctas, 56% de respuestas incorrectas y ninguna
respuesta en blanco. Finalmente, en la Escuela Profesional de Ingeniería de
Sistemas se tiene un 76% de respuestas correctas 21% de respuestas incorrectas y
3% de respuestas en blanco, todo ello de acuerdo a la Figura 4.24.
Figura 4.25: Resultado del análisis de Materia - Energía
Elaborado por el equipo de trabajo
En la pregunta N° 15 del tema Materia - Energía se obtuvo como resultado que
en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 42% de
respuestas correctas, 52% de respuestas incorrectas y 6% de respuestas en blanco.
Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene un 38%
de respuestas correctas, 62% de respuestas incorrectas y ninguna respuesta en
blanco. Finalmente, en la Escuela Profesional de Ingeniería de Sistemas se tiene
un 62% de respuestas correctas 34% de respuestas incorrectas y 4% de respuestas
en blanco, todo ello de acuerdo a la Figura 4.25.
101
Figura 4.26: Resultado del análisis de Funciones químicas oxigenadas
Elaborado por el equipo de trabajo
En la pregunta N° 16 del tema Funciones químicas oxigenadas se obtuvo como
resultado que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene
un 55% de respuestas correctas, 45% de respuestas incorrectas y ninguna
respuesta en blanco. Por otra parte, en la Escuela Profesional de Ingeniería
Electrónica se tiene un 50% de respuestas correctas, 50% de respuestas incorrectas
y ninguna respuesta en blanco. Finalmente, en la Escuela Profesional de Ingeniería
de Sistemas se tiene un 55% de respuestas correctas 41% de respuestas incorrectas
y 4% de respuestas en blanco, todo ello de acuerdo a la Figura 4. 26.
4.3.5. NIVEL DE CUMPLIMIENTO EN BIOLOGÍA DE LOS INGRESANTES A
LA FACULTAD DE INGENIERÍA MECÁNICA ELÉCTRICA,
ELECTRÓNICA Y SISTEMAS RESPECTO AL PERFIL DEL
INGRESANTE
De acuerdo al perfil del ingresante de la Tabla 2 del presente trabajo como
también se establece en el Prospecto de Admisión del examen general Mayo-2017,
se detalla que en el área de Biología el estudiante interpreta la información de la
ciencia, tecnología y ambiente.
102
En cuanto a la Facultad de Ingeniería Mecánica Eléctrica, Electrónica y
Sistemas se obtuvieron los siguientes resultados del análisis y sectorización a nivel
general:
Figura 4.27: Resultado del análisis de Biología
Elaborado por el equipo de trabajo
En el área de Biología se puede considerar que en la Escuela Profesional de
Ingeniería Mecánica Eléctrica se tiene un 58% de respuestas correctas, 40% de
respuestas incorrectas y 2% de respuestas en blanco. Por otra parte, en la Escuela
Profesional de Ingeniería Electrónica se tiene 56% de respuestas correctas, 42%
de respuestas incorrectas y 2% de respuestas en blanco. Finalmente, en la Escuela
Profesional de Ingeniería de Sistemas se tiene 47% de respuestas correctas, 53%
de respuestas incorrectas y 0% de respuestas en blanco.
Figura 4.28: Densidad de Kernel en Biología
Elaborado por el equipo de trabajo
103
En el presente gráfico se puede visualizar la densidad Kernel del nivel de
asertividad correspondiente a las preguntas de Biología. Se denota el
cumplimiento de los requerimientos expuestos para la realización del gráfico
sobre dos parámetros clave: la función Kernel o núcleo y el ancho de banda. Para
el Área de Biología en la Escuela Profesional de Ingeniería Mecánica Eléctrica se
cuenta con la mayor densidad de respuestas correctas, seguido de Ingeniería
Electrónica y con menor densidad de respuestas correctas la Escuela Profesional
de Ingeniería de Sistemas.
Es importante considerar que de acuerdo al reglamento de admisión del Año
2017 que se encuentra en el Anexo 2, se establece que en el área de Biología se
tienen 4 preguntas de los siguientes temas:
1. Célula
2. Fisiología Celular
3. Circulación
4. Ecología
Se realizó el análisis haciendo uso de Lenguaje R de cada uno de los temas del
área de Biología; obteniendo los siguientes resultados:
Figura 4.29: Resultado del análisis de la Célula
Elaborado por el equipo de trabajo
104
En la pregunta N° 17 del tema Célula se obtuvo como resultado que en la
Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 61% de
respuestas correctas, 39% de respuestas incorrectas y ninguna respuesta en blanco.
Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene un 75%
de respuestas correctas, 19% de respuestas incorrectas y 6% de respuestas en
blanco. Finalmente, en la Escuela Profesional de Ingeniería de Sistemas se tiene
un 48% de respuestas correctas 52% de respuestas incorrectas y ninguna respuesta
en blanco, todo ello de acuerdo a la Figura 4. 29.
Figura 4.30: Resultado del análisis de Fisiología Celular
Elaborado por el equipo de trabajo
En la pregunta N° 18 del tema Fisiología Celular se obtuvo como resultado que en
la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 52% de respuestas
correctas, 45% de respuestas incorrectas y 3% de respuestas en blanco. Por otra parte,
en la Escuela Profesional de Ingeniería Electrónica tiene un 50% de respuestas
correctas, 50% de respuestas incorrectas y ninguna respuesta en blanco. Finalmente,
en la Escuela Profesional de Ingeniería de Sistemas se tiene un 41% de respuestas
correctas 59% de respuestas incorrectas y ninguna respuesta en blanco, todo ello de
acuerdo a la Figura 4. 30.
105
Figura 4.31: Resultado de análisis de Circulación
Elaborado por el equipo de trabajo
En la pregunta N° 19 del tema Circulación se obtuvo como resultado que en la
Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 64% de
respuestas correctas, 36% de respuestas incorrectas y ninguna respuesta en blanco.
Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene un 56%
de respuestas correctas, 44% de respuestas incorrectas y ninguna respuesta en
blanco. Finalmente, en la Escuela Profesional de Ingeniería de Sistemas se tiene
un 48% de respuestas correctas 52% de respuestas incorrectas y ninguna respuesta
en blanco, todo ello de acuerdo a la Figura 4.31.
Figura 4.32: Resultado de análisis de Ecología
Elaborado por el equipo de trabajo
106
En la pregunta N° 20 del tema Ecología se obtuvo como resultado que en la
Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 58% de
respuestas correctas, 39% de respuestas incorrectas y 3% de respuestas en blanco.
Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene un 44%
de respuestas correctas, 56% de respuestas incorrectas y ninguna respuesta en
blanco. Finalmente, en la Escuela Profesional de Ingeniería de Sistemas se tiene
un 52% de respuestas correctas 48% de respuestas incorrectas y ninguna respuesta
en blanco, todo ello de acuerdo a la Figura 4.32.
4.3.6. NIVEL DE CUMPLIMIENTO EN PSICOLOGÍA Y FILOSOFÍA DE LOS
INGRESANTES A LA FACULTAD DE INGENIERÍA MECÁNICA
ELÉCTRICA, ELECTRÓNICA Y SISTEMAS RESPECTO AL PERFIL
DEL INGRESANTE
De acuerdo al perfil del ingresante de la Tabla 2 del presente trabajo como
también está establecido en el Prospecto de Admisión del examen general Mayo-
2017, se detalla que en el área de Psicología y Filosofía el estudiante emite juicios
críticos acerca de filosofía y psicología.
En cuanto a la Facultad de Ingeniería Mecánica Eléctrica, Electrónica y
Sistemas se obtuvieron los siguientes resultados del análisis y sectorización a nivel
general:
Figura 4.33: Resultado del análisis de Psicología y Filosofía
Elaborado por el equipo de trabajo
107
En el área de Psicología y Filosofía se puede considerar que en la Escuela
Profesional de Ingeniería Mecánica Eléctrica se tiene un 51% de respuestas
correctas, 47% de respuestas incorrectas y 2% de respuestas en blanco. Por otra
parte, en la Escuela Profesional de Ingeniería Electrónica se tiene 56% de
respuestas correctas, 42% de respuestas incorrectas y 2% de respuestas en blanco.
Finalmente, en la Escuela Profesional de Ingeniería de Sistemas se tiene 58% de
respuestas correctas, 41% de respuestas incorrectas y 2% de respuestas en blanco.
Figura 4.34: Densidad de Kernel en Psicología y Filosofía
Elaborado por el equipo de trabajo
En el presente gráfico se puede visualizar la densidad Kernel del nivel de
asertividad correspondiente a las preguntas de Psicología y Filosofía. Se denota el
cumplimiento de los requerimientos expuestos para la realización del gráfico
sobre dos parámetros clave: la función Kernel o núcleo y el ancho de banda. Para
el área de Psicología y Filosofía en la Escuela Profesional de Ingeniería de
Sistemas se cuenta con la mayor densidad de respuestas correctas, seguido de
Ingeniería Mecánica Eléctrica y con menor densidad de respuestas correctas la
Escuela Profesional de Ingeniería Electrónica.
De acuerdo al reglamento de admisión del Año 2017 que se encuentra en el
Anexo 2, se establece que en el área de Psicología y Filosofía se tienen 4 preguntas
de los siguientes temas:
1. Los Procesos Afectivos
108
2. Estudio del Desarrollo Humano
3. Filosofía
4. Epistemología
Se realizó el análisis haciendo uso de Lenguaje R de cada uno de los temas del
área de Psicología y Filosofía; obteniendo los siguientes resultados:
Figura 4.35: Resultado del análisis de Los Procesos Afectivos
Elaborado por el equipo de trabajo
En la pregunta N° 21 del tema Los Procesos Afectivos se obtuvo como
resultado que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene
un 61% de respuestas correctas, 36% de respuestas incorrectas y 3% de respuestas
en blanco. Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se
tiene un 50% de respuestas correctas, 44% de respuestas incorrectas y 6% de
respuestas en blanco. Finalmente, en la Escuela Profesional de Ingeniería de
Sistemas se tiene un 59% de respuestas correctas 38% de respuestas incorrectas y
3% de respuestas en blanco, todo ello de acuerdo a la Figura 4.35.
109
Figura 4.36: Resultado del análisis de Estudio del Desarrollo Humano
Elaborado por el equipo de trabajo
En la pregunta N° 22 del tema Estudio del Desarrollo Humano se obtuvo como
resultado que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene
un 45% de respuestas correctas, 55% de respuestas incorrectas y ninguna
respuesta en blanco. Por otra parte, en la Escuela Profesional de Ingeniería
Electrónica se tiene un 50% de respuestas correctas, 50% de respuestas incorrectas
y ninguna respuesta en blanco. Finalmente, en la Escuela Profesional de Ingeniería
de Sistemas se tiene un 52% de respuestas correctas 48% de respuestas incorrectas
y ninguna respuesta en blanco, todo ello de acuerdo a la Figura 4.36.
Figura 4.37: Resultado del Análisis de Filosofía
Elaborado por el equipo de trabajo
110
En la pregunta N° 23 del tema Filosofía se obtuvo como resultado que en la
Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 42% de
respuestas correctas, 55% de respuestas incorrectas y 3% de respuestas en blanco.
Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene un 56%
de respuestas correctas, 44% de respuestas incorrectas y ninguna respuesta en
blanco. Finalmente, en la Escuela Profesional de Ingeniería de Sistemas se tiene
un 59% de respuestas correctas 41% de respuestas incorrectas y ninguna respuesta
en blanco, todo ello de acuerdo a la Figura 4.37.
Figura 4.38: Resultado del análisis de Epistemología
Elaborado por el equipo de trabajo
En la pregunta N° 24 del tema Epistemología se obtuvo como resultado que en
la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 55% de
respuestas correctas, 42% de respuestas incorrectas y 3% de respuestas en blanco.
Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene un 69%
de respuestas correctas, 31% de respuestas incorrectas y ninguna respuesta en
blanco. Finalmente, en la Escuela Profesional de Ingeniería de Sistemas se tiene
un 62% de respuestas correctas 38% de respuestas incorrectas y ninguna respuesta
en blanco, todo ello de acuerdo a la Figura 4.38.
111
4.3.7. NIVEL DE CUMPLIMIENTO EN GEOGRAFÍA DE LOS INGRESANTES
A LA FACULTAD DE INGENIERÍA MECÁNICA ELÉCTRICA,
ELECTRÓNICA Y SISTEMAS RESPECTO AL PERFIL DEL
INGRESANTE
De acuerdo al perfil del ingresante de la Tabla 2 del presente trabajo como
también está establecido en el Prospecto de Admisión del examen general Mayo-
2017, se detalla que en el Área de Geografía el estudiante interpreta información
del espacio geográfico.
En cuanto a la Facultad de Ingeniería Mecánica Eléctrica, Electrónica y
Sistemas se obtuvieron los siguientes resultados del análisis y sectorización a nivel
general:
Figura 4.39: Resultado del análisis de Geografía
Elaborado por el equipo de trabajo
En el área de Geografía se puede considerar que en la Escuela Profesional de
Ingeniería Mecánica Eléctrica se tiene un 53% de respuestas correctas, 45% de
respuestas incorrectas y 2% de respuestas en blanco. Por otra parte, en la Escuela
Profesional de Ingeniería Electrónica se tiene 52% de respuestas correctas, 46%
de respuestas incorrectas y 2% de respuestas en blanco. Finalmente, en la Escuela
Profesional de Ingeniería de Sistemas se tiene 51% de respuestas correctas, 48%
de respuestas incorrectas y 1% de respuestas en blanco.
112
Figura 4.40: Densidad de kernel en Geografía
Elaborado por el equipo de trabajo
En el presente gráfico se puede visualizar la densidad Kernel del nivel de
asertividad correspondiente a las preguntas de Geografía. Se denota el
cumplimiento de los requerimientos expuestos para la realización del gráfico
sobre dos parámetros clave: la función Kernel o núcleo y el ancho de banda. Para
el área de Biología en la Escuela Profesional de Ingeniería Mecánica Eléctrica se
cuenta con la mayor densidad de respuestas correctas, seguido de Ingeniería de
Sistemas y con menor densidad de respuestas correctas la Escuela Profesional de
Ingeniería Electrónica.
Es importante considerar que de acuerdo al reglamento de admisión del Año
2017 que se encuentra en el Anexo 2, se establece que en el área de Geografía se
tienen 4 preguntas de los siguientes temas:
1. Geografía del Perú
2. Sistema planetario solar
3. Sistema planetario solar. La tierra
4. Geografía del Perú. Minerales
Se realizó el análisis haciendo uso de Lenguaje R de cada uno de los temas del
área de Geografía; obteniendo los siguientes resultados:
113
Figura 4.41: Resultados de Geografía del Perú
Elaborado por el equipo de trabajo
En la pregunta N° 25 del tema Geografía del Perú se obtuvo como resultado
que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 64%
de respuestas correctas, 36% de respuestas incorrectas y ninguna respuesta en
blanco. Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene
un 62% de respuestas correctas, 38% de respuestas incorrectas y ninguna
respuesta en blanco. Finalmente, en la Escuela Profesional de Ingeniería de
Sistemas se tiene un 62% de respuestas correctas 38% de respuestas incorrectas y
ninguna respuesta en blanco, todo ello de acuerdo a la Figura 4.41.
Figura 4.42: Resultado del análisis del Sistema planetario solar
Elaborado por el equipo de trabajo
114
En la pregunta N° 26 del tema Sistema planetario solar se obtuvo como
resultado que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene
un 52% de respuestas correctas, 48% de respuestas incorrectas y ninguna
respuesta en blanco. Por otra parte, en la Escuela Profesional de Ingeniería
Electrónica se tiene un 44% de respuestas correctas, 56% de respuestas incorrectas
y ninguna respuesta en blanco. Finalmente, en la Escuela Profesional de Ingeniería
de Sistemas se tiene un 45% de respuestas correctas 55% de respuestas incorrectas
y ninguna respuesta en blanco, todo ello de acuerdo a la Figura 4.42.
Figura 4.43: Resultados del análisis del Sistema planetario solar. La tierra
Elaborado por el equipo de trabajo
En la pregunta N° 27 del tema Sistema planetario solar. La tierra se obtuvo
como resultado que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se
tiene un 55% de respuestas correctas, 45% de respuestas incorrectas y ninguna
respuesta en blanco. Por otra parte, en la Escuela Profesional de Ingeniería
Electrónica se tiene un 38% de respuestas correctas, 56% de respuestas incorrectas
y 6% de respuestas en blanco. Finalmente, en la Escuela Profesional de Ingeniería
de Sistemas se tiene un 55% de respuestas correctas 45% de respuestas incorrectas
y ninguna respuesta en blanco, todo ello de acuerdo a la Figura 4. 43.
115
Figura 4.44: Resultados del análisis de Geografía del Perú Minerales
Elaborado por el equipo de trabajo
En la pregunta N° 28 del tema Geografía del Perú. Minerales se obtuvo como
resultado que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene
un 42% de respuestas correctas, 52% de respuestas incorrectas y 6% de respuestas
en blanco. Por otra parte, la Escuela Profesional de Ingeniería Electrónica tiene
un 62% de respuestas correctas, 38% de respuestas incorrectas y ninguna
respuesta en blanco. Finalmente, en la Escuela Profesional de Ingeniería de
Sistemas se tiene un 42% de respuestas correctas 55% de respuestas incorrectas y
3% de respuestas en blanco, todo ello de acuerdo a la Figura 4.44.
4.3.8. NIVEL DE CUMPLIMIENTO EN HISTORIA DE LOS INGRESANTES A
LA FACULTAD DE INGENIERÍA MECÁNICA ELÉCTRICA,
ELECTRÓNICA Y SISTEMAS RESPECTO AL PERFIL DEL
INGRESANTE
De acuerdo al perfil del ingresante de la Tabla 2 del presente trabajo como
también está establecido en el Prospecto de Admisión del examen general Mayo-
2017, se detalla que en el Área de Historia el estudiante emite juicios críticos del
contexto histórico y cultural regional y nacional.
116
En cuanto a la Facultad de Ingeniería Mecánica Eléctrica, Electrónica y
Sistemas se obtuvieron los siguientes resultados del análisis y sectorización a nivel
general:
Figura 4.45: Resultado del análisis del área de Historia
Elaborado por el equipo de trabajo
En el área de Historia se puede considerar que en la Escuela Profesional de
Ingeniería Mecánica Eléctrica se tiene un 56% de respuestas correctas, 42% de
respuestas incorrectas y 2% de respuestas en blanco. Por otra parte, en la Escuela
Profesional de Ingeniería Electrónica se tiene 54% de respuestas correctas, 44%
de respuestas incorrectas y 2% de respuestas en blanco. Finalmente, en la Escuela
Profesional de Ingeniería de Sistemas se tiene 49% de respuestas correctas, 50%
de respuestas incorrectas y 1% de respuestas en blanco.
Figura 4.46: Densidad de Kernel en Historia
Elaborado por el equipo de trabajo
117
En el presente gráfico se puede visualizar la densidad Kernel del nivel de
asertividad correspondiente a las preguntas de Historia. Se denota el cumplimiento
de los requerimientos expuestos para la realización del gráfico sobre dos
parámetros clave: la función Kernel o núcleo y el ancho de banda. Para el Área de
Historia en la Escuela Profesional de Ingeniería Mecánica Eléctrica se cuenta con
la mayor densidad de respuestas correctas, seguido de Ingeniería Electrónica y
con menor densidad de respuestas correctas la Escuela Profesional de Ingeniería
de Sistemas.
Es importante considerar que de acuerdo al reglamento de admisión del Año
2017 que se encuentra en el Anexo 2, se establece que en el área de Historia se
tienen 4 preguntas de los siguientes temas:
1. Transformaciones del Perú, inicios del siglo XX
2. Hechos y acontecimientos de la historia reciente del Perú siglo XXI
3. El mundo colonial como producto de la tradición europea y andina
4. Movimientos continentales
Se realizó el análisis haciendo uso de Lenguaje R de cada uno de los temas del
área de Historia; obteniendo los siguientes resultados:
Figura 4.47: Resultados del análisis de Transformaciones del Perú, inicios del siglo
XX
Elaborado por el equipo de trabajo
118
En la pregunta N° 29 del tema Transformaciones del Perú, inicios del siglo XX
se obtuvo como resultado que en la Escuela Profesional de Ingeniería Mecánica
Eléctrica se tiene un 61% de respuestas correctas, 39% de respuestas incorrectas
y ninguna respuesta en blanco. Por otra parte, en la Escuela Profesional de
Ingeniería Electrónica se tiene un 69% de respuestas correctas, 31% de respuestas
incorrectas y ninguna respuesta en blanco. Finalmente, en la Escuela Profesional
de Ingeniería de Sistemas se tiene un 48% de respuestas correctas 52% de
respuestas incorrectas y ninguna respuesta en blanco, todo ello de acuerdo a la
Figura 4.47.
Figura 4.48:Resultados del análisis de Hechos y acontecimientos de la historia
reciente del Perú siglo XXI
Elaborado por el equipo de trabajo
En la pregunta N° 30 del tema Hechos y acontecimientos de la historia reciente
del Perú siglo XXI se obtuvo como resultado que en la Escuela Profesional de
Ingeniería Mecánica Eléctrica se tiene un 48% de respuestas correctas, 52% de
respuestas incorrectas y ninguna respuesta en blanco. Por otra parte, en la Escuela
Profesional de Ingeniería Electrónica se tiene un 56% de respuestas correctas,
44% de respuestas incorrectas y ninguna respuesta en blanco. Finalmente, en la
Escuela Profesional de Ingeniería de Sistemas se tiene un 52% de respuestas
correctas 45% de respuestas incorrectas y 3% de respuestas en blanco, todo ello
de acuerdo a la Figura 4.48.
119
Figura 4.49: Resultado del análisis de El mundo colonial como producto de la
tradición europea y andina
Elaborado por el equipo de trabajo
En la pregunta N° 31 del tema El mundo colonial como producto de la tradición
europea y andina se obtuvo como resultado que en la Escuela Profesional de
Ingeniería Mecánica Eléctrica se tiene un 61% de respuestas correctas, 39% de
respuestas incorrectas y ninguna respuesta en blanco. Por otra parte, la Escuela
Profesional de Ingeniería Electrónica tiene un 56% de respuestas correctas, 38%
de respuestas incorrectas y 6% de respuestas en blanco. Finalmente, en la Escuela
Profesional de Ingeniería de Sistemas se tiene un 45% de respuestas correctas 55%
de respuestas incorrectas y ninguna respuesta en blanco, todo ello de acuerdo a la
Figura 4.49.
Figura 4.50: Resultado del análisis de Movimientos continentales
Elaborado por el equipo de trabajo
120
En la pregunta N° 32 del tema Movimientos continentales se obtuvo como
resultado que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene
un 55% de respuestas correctas, 39% de respuestas incorrectas y 6% de respuestas
en blanco. Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se
tiene un 38% de respuestas correctas, 62% de respuestas incorrectas y ninguna
respuesta en blanco. Finalmente, en la Escuela Profesional de Ingeniería de
Sistemas se tiene un 52% de respuestas correctas 48% de respuestas incorrectas y
ninguna respuesta en blanco, todo ello de acuerdo a la Figura 4.50.
4.3.9. NIVEL DE CUMPLIMIENTO EN EDUCACIÓN CÍVICA DE LOS
INGRESANTES A LA FACULTAD DE INGENIERÍA MECÁNICA
ELÉCTRICA, ELECTRÓNICA Y SISTEMAS RESPECTO AL PERFIL DEL
INGRESANTE
De acuerdo al perfil del ingresante de la Tabla 2 del presente trabajo como también
está establecido en el Prospecto de Admisión del examen general Mayo-2017, se
detalla que en el Área de Educación Cívica el estudiante expresa concepciones
respecto al ejercicio de la ciudadanía y de la cultura cívica.
En cuanto a la Facultad de Ingeniería Mecánica Eléctrica, Electrónica y Sistemas
se obtuvieron los siguientes resultados del análisis y sectorización a nivel general:
Figura 4.51: Resultados del análisis de Educación Cívica
Elaborado por el equipo de trabajo
En el área de Educación Cívica se puede considerar que en la Escuela
Profesional de Ingeniería Mecánica Eléctrica se tiene un 60% de respuestas
121
correctas, 32% de respuestas incorrectas y 8% de respuestas en blanco. Por otra
parte, en la Escuela Profesional de Ingeniería Electrónica se tiene 72% de
respuestas correctas, 28% de respuestas incorrectas y ninguna respuesta en blanco.
Finalmente, en la Escuela Profesional de Ingeniería de Sistemas se tiene 53% de
respuestas correctas, 43% de respuestas incorrectas y 4% de respuestas en blanco.
Figura 4.52: Densidad Kernel en Educación Cívica
Elaborado por el equipo de trabajo
En el presente gráfico se puede visualizar la densidad Kernel del nivel de
asertividad correspondiente a las preguntas de Educación cívica. Se denota el
cumplimiento de los requerimientos expuestos para la realización del gráfico
sobre dos parámetros clave: la función Kernel o núcleo y el ancho de banda. Para
el Área de Educación cívica en la Escuela Profesional de Ingeniería Electrónica
se cuenta con la mayor densidad de respuestas correctas, seguido de Ingeniería
Mecánica Eléctrica y con menor densidad de respuestas correctas la Escuela
Profesional de Ingeniería de Sistemas.
Es importante considerar que de acuerdo al reglamento de admisión del Año
2017 que se encuentra en el Anexo 2, se establece que en el área de Educación
Cívica se tienen 2 preguntas de los siguientes temas:
1. La Constitución Política y la estructura del Estado
2. La familia
Se realizó el análisis haciendo uso de Lenguaje R de cada uno de los temas del
área de Educación Cívica; obteniendo los siguientes resultados:
122
Figura 4.53: Resultado del análisis de La Constitución Política y la estructura del
Estado
Elaborado por el equipo de trabajo
En la pregunta N° 33 del tema La Constitución Política y la estructura del
Estado se obtuvo como resultado que en la Escuela Profesional de Ingeniería
Mecánica Eléctrica se tiene un 67% de respuestas correctas, 24% de respuestas
incorrectas y 9% de respuestas en blanco. Por otra parte, en la Escuela Profesional
de Ingeniería Electrónica se tiene un 75% de respuestas correctas, 25% de
respuestas incorrectas y ninguna respuesta en blanco. Finalmente, en la Escuela
Profesional de Ingeniería de Sistemas se tiene un 52% de respuestas correctas 45%
de respuestas incorrectas y 3% de respuestas en blanco, todo ello de acuerdo a la
Figura 4.53.
Figura 4.54: Resultado del análisis de la Familia
Elaborado por el equipo de trabajo
123
En la pregunta N° 34 del tema La familia se obtuvo como resultado que en la
Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 55% de
respuestas correctas, 39% de respuestas incorrectas y 6% de respuestas en blanco.
Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene un 69%
de respuestas correctas, 31% de respuestas incorrectas y ninguna respuesta en
blanco. Finalmente, en la Escuela Profesional de Ingeniería de Sistemas se tiene
un 55% de respuestas correctas 41% de respuestas incorrectas y 5% de respuestas
en blanco, todo ello de acuerdo a la Figura 4.54.
4.3.10. NIVEL DE CUMPLIMIENTO EN ECONOMÍA DE LOS INGRESANTES
A LA FACULTAD DE INGENIERÍA MECÁNICA ELÉCTRICA,
ELECTRÓNICA Y SISTEMAS RESPECTO AL PERFIL DEL
INGRESANTE
De acuerdo al perfil del ingresante de la Tabla 2 del presente trabajo como
también está establecido en el Prospecto de Admisión del examen general Mayo-
2017, se detalla que en el Área de Economía el estudiante demuestra interés por
las actividades afines a la ingeniería.
En cuanto a la Facultad de Ingeniería Mecánica Eléctrica, Electrónica y
Sistemas se obtuvieron los siguientes resultados del análisis y sectorización a nivel
general:
Figura 4.55: Resultado del análisis de Economía
Elaborado por el equipo de trabajo
124
En el área de Economía se puede considerar que en la Escuela Profesional de
Ingeniería Mecánica Eléctrica se tiene un 48% de respuestas correctas, 49% de
respuestas incorrectas y 3% de respuestas en blanco. Por otra parte, en la Escuela
Profesional de Ingeniería Electrónica se tiene 65% de respuestas correctas, 33%
de respuestas incorrectas y 2% de respuestas en blanco. Finalmente, en la Escuela
Profesional de Ingeniería de Sistemas se tiene 64% de respuestas correctas, 33%
de respuestas incorrectas y 3% de respuestas en blanco.
Figura 4.56: Densidad de Kernel en Economía
Elaborado por el equipo de trabajo
En el presente gráfico se puede visualizar la densidad Kernel del nivel de
asertividad correspondiente a las preguntas de Economía. Se denota el
cumplimiento de los requerimientos expuestos para la realización del gráfico
sobre dos parámetros clave: la función Kernel o núcleo y el ancho de banda. Para
el Área de Economía; en la Escuela Profesional de Ingeniería de Sistemas se
cuenta con la mayor densidad de respuestas correctas, seguido de Ingeniería
Electrónica y con menor densidad de respuestas correctas la Escuela Profesional
de Ingeniería Mecánica Eléctrica. Es importante considerar que de acuerdo al
reglamento de admisión del Año 2017 que se encuentra en el Anexo 2, se establece
que en el área de Matemática I se tienen 3 preguntas de los siguientes temas:
1. El sistema financiero
2. La Producción
3. Competencia y monopolio
125
Se realizó el análisis haciendo uso de Lenguaje R de cada uno de los temas del
área de Economía, obteniendo los siguientes resultados:
Figura 4.57: Resultado del análisis del Sistema Financiero
Elaborado por el equipo de trabajo
En la pregunta N° 35 del tema El sistema financiero se obtuvo como resultado
que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 55%
de respuestas correctas, 45% de respuestas incorrectas y ninguna respuesta en
blanco. Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene
un 69% de respuestas correctas, 31% de respuestas incorrectas y ninguna
respuesta en blanco. Finalmente, en la Escuela Profesional de Ingeniería de
Sistemas se tiene un 55% de respuestas correctas 38% de respuestas incorrectas y
7% de respuestas en blanco, todo ello de acuerdo a la Figura 4.57.
Figura 4.58: Resultado del análisis de La Producción
Elaborado por el equipo de trabajo
126
En la pregunta N° 36 del tema La Producción se obtuvo como resultado que en
la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 45% de
respuestas correctas, 48% de respuestas incorrectas y 6% de respuestas en blanco.
Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene un 63%
de respuestas correctas, 31% de respuestas incorrectas y 6% de respuestas en
blanco. Finalmente, en la Escuela Profesional de Ingeniería de Sistemas se tiene
un 69% de respuestas correctas 31% de respuestas incorrectas y ninguna respuesta
en blanco, todo ello de acuerdo a la Figura 4.58.
Figura 4.59: Resultado del Análisis de Competencia y Monopolio
Elaborado por el equipo de trabajo
En la pregunta N° 37 del tema Competencia y monopolio se obtuvo como
resultado que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene
un 45% de respuestas correctas, 55% de respuestas incorrectas y ninguna
respuesta en blanco. Por otra parte, en la Escuela Profesional de Ingeniería
Electrónica se tiene un 62% de respuestas correctas, 38% de respuestas incorrectas
y ninguna respuesta en blanco. Finalmente, en la Escuela Profesional de
Ingeniería de Sistemas se tiene un 69% de respuestas correctas 31% de respuestas
incorrectas y ninguna respuesta en blanco, todo ello de acuerdo a la Figura 4.59.
127
4.3.11. NIVEL DE CUMPLIMIENTO EN COMUNICACIÓN DE LOS
INGRESANTES A LA FACULTAD DE INGENIERÍA MECÁNICA
ELÉCTRICA, ELECTRÓNICA Y SISTEMAS RESPECTO AL PERFIL
DEL INGRESANTE
De acuerdo al perfil del ingresante de la Tabla 2 del presente trabajo como
también está establecido en el Prospecto de Admisión del examen general Mayo-
2017, se detalla que en el Área de Comunicación el estudiante comprende textos
orales y escritos, además utiliza adecuadamente la lengua en todos sus niveles..
En cuanto a la Facultad de Ingeniería Mecánica Eléctrica, Electrónica y
Sistemas se obtuvieron los siguientes resultados del análisis y sectorización a nivel
general:
Figura 4.60: Resultados del análisis de Comunicación
Elaborado por el equipo de trabajo
En el área de Comunicación se puede considerar que en la Escuela Profesional
de Ingeniería Mecánica Eléctrica se tiene un 70% de respuestas correctas, 30% de
respuestas incorrectas y ninguna respuesta en blanco. Por otra parte, en la Escuela
Profesional de Ingeniería Electrónica se tiene 81% de respuestas correctas, 19%
de respuestas incorrectas y ninguna respuesta en blanco. Finalmente, en la Escuela
Profesional de Ingeniería de Sistemas se tiene 48% de respuestas correctas, 52%
de respuestas incorrectas y ninguna respuesta en blanco.
128
Figura 4.61: Densidad de Kernel en Comunicación
Elaborado por el equipo de trabajo
En el presente gráfico se puede visualizar la densidad Kernel del nivel de
asertividad correspondiente a las preguntas de Comunicación. Se denota el
cumplimiento de los requerimientos expuestos para la realización del gráfico
sobre dos parámetros clave: la función Kernel o núcleo y el ancho de banda. Para
el área de Comunicación en la Escuela Profesional de Ingeniería Mecánica
Eléctrica se cuenta con la mayor densidad de respuestas correctas, seguido de
Ingeniería Electrónica y con menor densidad de respuestas correctas la Escuela
Profesional de Ingeniería de Sistemas.
Es importante considerar que de acuerdo con el reglamento de admisión del
Año 2017 que se encuentra en el Anexo 2, se establece que en el área de
Matemática I se tienen 4 preguntas de los siguientes temas:
1. Teoría del texto - Texto descriptivo
2. Técnicas de lectura y teoría del texto
3. Ortografía y gramática:
4. Teoría del texto
Se realizó el análisis haciendo uso de Lenguaje R de cada uno de los temas del
área de Matemática I; obteniendo los siguientes resultados:
129
Figura 4.62: Resultados del análisis de Teoría del texto – Texto descriptivo
Elaborado por el equipo de trabajo
En la pregunta N° 38 del tema Teoría del texto - Texto descriptivo se obtuvo
como resultado que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se
tiene un 70% de respuestas correctas, 30% de respuestas incorrectas y ninguna
respuesta en blanco. Por otra parte, en la Escuela Profesional de Ingeniería
Electrónica se tiene un 81% de respuestas correctas, 19% de respuestas incorrectas
y ninguna respuesta en blanco. Finalmente, en la Escuela Profesional de Ingeniería
de Sistemas se tiene un 48% de respuestas correctas 52% de respuestas incorrectas
y ninguna respuesta en blanco, todo ello de acuerdo a la Figura 4.62.
Figura 4.63: Resultado del análisis de Técnicas de lectura y teoría del texto
Elaborado por el equipo de trabajo
130
En la pregunta N° 39 del tema Técnicas de lectura y teoría del texto se obtuvo
como resultado que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se
tiene un 58% de respuestas correctas, 42% de respuestas incorrectas y ninguna
respuesta en blanco. Por otra parte, en la Escuela Profesional de Ingeniería
Electrónica se tiene un 50% de respuestas correctas, 50% de respuestas incorrectas
y ninguna respuesta en blanco. Finalmente, en la Escuela Profesional de Ingeniería
de Sistemas se tiene un 38% de respuestas correctas 59% de respuestas incorrectas
y 3% de respuestas en blanco, todo ello de acuerdo a la Figura 4.63.
Figura 4.64: Resultado del análisis de Ortografía y gramática
Elaborado por el equipo de trabajo
En la pregunta N° 40 del tema Ortografía y gramática: se obtuvo como
resultado que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene
un 55% de respuestas correctas, 39% de respuestas incorrectas y 6% de respuestas
en blanco. Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se
tiene un 56% de respuestas correctas, 38% de respuestas incorrectas y 6% de
respuestas en blanco. Finalmente, en la Escuela Profesional de Ingeniería de
Sistemas se tiene un 38% de respuestas correctas 55% de respuestas incorrectas y
7% de respuestas en blanco, todo ello de acuerdo a la Figura 4.64.
131
Figura 4.65: Resultado del análisis de Teoría del texto
Elaborado por el equipo de trabajo
En la pregunta N° 41 del tema Teoría del texto se obtuvo como resultado que
en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 42% de
respuestas correctas, 55% de respuestas incorrectas y 3% de respuestas en blanco.
Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene un 56%
de respuestas correctas, 44% de respuestas incorrectas y ninguna respuesta en
blanco. Finalmente, en la Escuela Profesional de Ingeniería de Sistemas se tiene
un 59% de respuestas correctas 41% de respuestas incorrectas y ninguna respuesta
en blanco, todo ello de acuerdo a la Figura 4.65.
4.3.12. NIVEL DE CUMPLIMIENTO EN LITERATURA DE LOS
INGRESANTES A LA FACULTAD DE INGENIERÍA MECÁNICA
ELÉCTRICA, ELECTRÓNICA Y SISTEMAS RESPECTO AL PERFIL
DEL INGRESANTE
De acuerdo al perfil del ingresante de la Tabla 2 del presente trabajo como
también está establecido en el Prospecto de Admisión del examen general Mayo-
2017, se detalla que en el Área de Literatura el estudiante comprende textos
escritos de la literatura peruana y universal.
132
En cuanto a la Facultad de Ingeniería Mecánica Eléctrica, Electrónica y
Sistemas se obtuvieron los siguientes resultados del análisis y sectorización a nivel
general:
Figura 4.66: Resultado del análisis de Literatura
Elaborado por el equipo de trabajo
En el área de Literatura se puede considerar que en la Escuela Profesional de
Ingeniería Mecánica Eléctrica se tiene un 59% de respuestas correctas, 39% de
respuestas incorrectas y 2% de respuestas en blanco. Por otra parte, en la Escuela
Profesional de Ingeniería Electrónica se tiene 58% de respuestas correctas, 38%
de respuestas incorrectas y 4% de respuestas en blanco. Finalmente, en la Escuela
Profesional de Ingeniería de Sistemas se tiene 44% de respuestas correctas, 48%
de respuestas incorrectas y 8% de respuestas en blanco.
Figura 4.67: Densidad de Kernel en Literatura
Elaborado por el equipo de trabajo
133
En el presente gráfico se puede visualizar la densidad Kernel del nivel de
asertividad correspondiente a las preguntas de Literatura. Se denota el
cumplimiento de los requerimientos expuestos para la realización del gráfico
sobre dos parámetros clave: la función Kernel o núcleo y el ancho de banda. Para
el Área de Literatura en la Escuela Profesional de Ingeniería Mecánica Eléctrica
se cuenta con la mayor densidad de respuestas correctas, seguido de Ingeniería
Electrónica y con menor densidad de respuestas correctas la Escuela Profesional
de Ingeniería de Sistemas.
Es importante considerar que de acuerdo al reglamento de admisión del Año
2017 que se encuentra en el Anexo 2, se establece que en el área de Literatura se
tienen 2 preguntas de los siguientes temas:
1. Literatura
2. Literatura local. Regional y Perú
Se realizó el análisis haciendo uso de Lenguaje R de cada uno de los temas del
área de Literatura; obteniendo los siguientes resultados:
Figura 4.68: Resultado del análisis de pregunta de Literatura
Elaborado por el equipo de trabajo
134
En la pregunta N° 43 del tema Literatura se obtuvo como resultado que en la
Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 61% de
respuestas correctas, 36% de respuestas incorrectas y 3% de respuestas en blanco.
Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene un 62%
de respuestas correctas, 38% de respuestas incorrectas y ninguna respuesta en
blanco. Finalmente, en la Escuela Profesional de Ingeniería de Sistemas se tiene
un 42% de respuestas correctas 48% de respuestas incorrectas y 10% de respuestas
en blanco, todo ello de acuerdo a la Figura 4.68.
Figura 4.69: Resultado del análisis de Literatura loca, regional y Perú
Elaborado por el equipo de trabajo
En la pregunta N° 44 del tema Literatura local. Regional y Perú se obtuvo como
resultado que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene
un 55% de respuestas correctas, 42% de respuestas incorrectas y 3% de respuestas
en blanco. Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se
tiene un 56% de respuestas correctas, 38% de respuestas incorrectas y 6% de
respuestas en blanco. Finalmente, en la Escuela Profesional de Ingeniería de
Sistemas se tiene un 42% de respuestas correctas 48% de respuestas incorrectas y
10% de respuestas en blanco, todo ello de acuerdo a la Figura 4.69.
135
4.3.13. NIVEL DE CUMPLIMIENTO EN RAZONAMIENTO MATEMÁTICO DE
LOS INGRESANTES A LA FACULTAD DE INGENIERÍA MECÁNICA
ELÉCTRICA, ELECTRÓNICA Y SISTEMAS RESPECTO AL PERFIL
DEL INGRESANTE
De acuerdo al perfil del ingresante de la Tabla 2 del presente trabajo como
también está establecido en el Prospecto de Admisión del examen general Mayo-
2017, se detalla que en el Área de Razonamiento Matemático el estudiante
resuelve problemas de razonamiento lógico, planteo de ecuaciones, edades,
móviles, cronometría, fracciones y comparación de magnitudes, operaciones
matemáticas, sucesiones, series, topología y conteo de figuras, análisis
combinatorio, cálculo de probabilidades, razonamiento geométrico, perímetros y
áreas de regiones sombreadas y geometría analítica plana. En cuanto a la Facultad
de Ingeniería Mecánica Eléctrica, Electrónica y Sistemas se obtuvieron los
siguientes resultados del análisis y sectorización a nivel general:
Figura 4.70: Resultado del análisis de Razonamiento Matemático
Elaborado por el equipo de trabajo
En el área de Razonamiento Matemático se puede considerar que en la Escuela
Profesional de Ingeniería Mecánica Eléctrica se tiene un 63% de respuestas
correctas, 37% de respuestas incorrectas y ninguna respuesta en blanco. Por otra
parte, en la Escuela Profesional de Ingeniería Electrónica se tiene 66% de
respuestas correctas, 33% de respuestas incorrectas y 1% de respuestas en blanco.
136
Finalmente, en la Escuela Profesional de Ingeniería de Sistemas se tiene 65% de
respuestas correctas, 33% de respuestas incorrectas y 2% de respuestas en blanco.
Figura 4.71: Densidad Kernel en Razonamiento Matemático
Elaborado por el equipo de trabajo
En el presente gráfico se puede visualizar la densidad Kernel del nivel de
asertividad correspondiente a las preguntas de razonamiento matemático. Se
denota el cumplimiento de los requerimientos expuestos para la realización del
gráfico sobre dos parámetros clave: la función Kernel o núcleo y el ancho de banda
para el Área de razonamiento matemático en la Escuela Profesional de Ingeniería
de Sistemas con la mayor densidad de respuestas correctas, seguido de Ingeniería
Mecánica Eléctrica y con menor densidad de respuestas correctas la Escuela
Profesional de Ingeniería Electrónica.
Es importante considerar que de acuerdo al reglamento de admisión del Año
2017 que se encuentra en el Anexo 2, se establece que en el área de Razonamiento
Matemático se tienen 8 preguntas de los siguientes temas:
1. Problemas de edades
2. Análisis combinatorio
3. Series y Sucesiones
4. Planteo de ecuaciones
5. Sistemas de numeración
6. Figuras sombreadas
7. Operadores matemáticos
8. Sumatorias
137
Se realizó el análisis haciendo uso de Lenguaje R de cada uno de los temas del
área de Razonamiento Matemático; obteniendo los siguientes resultados:
Figura 4.72: Resultado del análisis de Problemas de edades
Elaborado por el equipo de trabajo
En la pregunta N° 45 del tema Problemas de edades se obtuvo como resultado
que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 100%
de respuestas correctas, 0% de respuestas incorrectas y ninguna respuesta en
blanco. Por otra parte, la Escuela Profesional de Ingeniería Electrónica tiene un
50% de respuestas correctas, 50% de respuestas incorrectas y ninguna respuesta
en blanco. Finalmente, en la Escuela Profesional de Ingeniería de Sistemas se tiene
un 82% de respuestas correctas 17% de respuestas incorrectas y ninguna respuesta
en blanco, todo ello de acuerdo a la Figura 4.72.
Figura 4.73: Resultado del análisis de Analisis Combinatorio
Elaborado por el equipo de trabajo
138
En la pregunta N° 46 del tema Análisis combinatorio se obtuvo como resultado
que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 55%
de respuestas correctas, 45% de respuestas incorrectas y ninguna respuesta en
blanco. Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene
un 56% de respuestas correctas, 44% de respuestas incorrectas y ninguna
respuesta en blanco. Finalmente, en la Escuela Profesional de Ingeniería de
Sistemas se tiene un 66% de respuestas correctas 34% de respuestas incorrectas y
ninguna respuesta en blanco, todo ello de acuerdo a la Figura 4.73.
Figura 4.74: Resultado del análisis de Series y Sucesiones
Elaborado por el equipo de trabajo
En la pregunta N° 47 del tema Series y Sucesiones se obtuvo como resultado
que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 58%
de respuestas correctas, 42% de respuestas incorrectas y ninguna respuesta en
blanco. Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene
un 69% de respuestas correctas, 31% de respuestas incorrectas y ninguna
respuesta en blanco. Finalmente, en la Escuela Profesional de Ingeniería de
Sistemas se tiene un 55% de respuestas correctas 45% de respuestas incorrectas y
ninguna respuesta en blanco, todo ello de acuerdo a la Figura 4.74.
139
Figura 4.75: Resultado del análisis de Planteo de ecuaciones
Elaborado por el equipo de trabajo
En la pregunta N° 48 del tema Planteo de ecuaciones se obtuvo como resultado
que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 58%
de respuestas correctas, 42% de respuestas incorrectas y ninguna respuesta en
blanco. Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene
un 69% de respuestas correctas, 31% de respuestas incorrectas y ninguna
respuesta en blanco. Finalmente, en la Escuela Profesional de Ingeniería de
Sistemas se tiene un 73% de respuestas correctas 24% de respuestas incorrectas y
3% de respuestas en blanco, todo ello de acuerdo a la Figura 4.75.
Figura 4.76: Resultado del análisis de Sistemas de numeración
Elaborado por el equipo de trabajo
140
En la pregunta N° 49 del tema Sistemas de numeración se obtuvo como
resultado que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene
un 61% de respuestas correctas, 39% de respuestas incorrectas y ninguna
respuesta en blanco. Por otra parte, en la Escuela Profesional de Ingeniería
Electrónica se tiene un 69% de respuestas correctas, 31% de respuestas incorrectas
y ninguna respuesta en blanco. Finalmente, en la Escuela Profesional de Ingeniería
de Sistemas se tiene un 72% de respuestas correctas 21% de respuestas incorrectas
y 7% de respuestas en blanco, todo ello de acuerdo a la Figura 4.76.
Figura 4.77: Resultado del análisis de Figuras sombreadas
Elaborado por el equipo de trabajo
En la pregunta N° 50 del tema Figuras sombreadas se obtuvo como resultado
que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 58%
de respuestas correctas, 42% de respuestas incorrectas y ninguna respuesta en
blanco. Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene
un 75% de respuestas correctas, 25% de respuestas incorrectas y ninguna
respuesta en blanco. Finalmente, en la Escuela Profesional de Ingeniería de
Sistemas se tiene un 41% de respuestas correctas 59% de respuestas incorrectas y
ninguna respuesta en blanco, todo ello de acuerdo a la Figura 4.77.
141
Figura 4.78: Resultado del análisis de Operadores matemáticos
Elaborado por el equipo de trabajo
En la pregunta N° 51 del tema Operadores matemáticos se obtuvo como
resultado que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene
un 52% de respuestas correctas, 45% de respuestas incorrectas y 3% de respuestas
en blanco. Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se
tiene un 75% de respuestas correctas, 25% de respuestas incorrectas y ninguna
respuesta en blanco. Finalmente, en la Escuela Profesional de Ingeniería de
Sistemas se tiene un 66% de respuestas correctas 31% de respuestas incorrectas y
3% de respuestas en blanco, todo ello de acuerdo a la Figura 4.78.
Figura 4.79: Resultado del análisis de sumatorias
Elaborado por el equipo de trabajo
142
En la pregunta N° 52 del tema Sumatorias se obtuvo como resultado que en la
Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 61% de
respuestas correctas, 39% de respuestas incorrectas y ninguna respuesta en blanco.
Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene un 69%
de respuestas correctas, 25% de respuestas incorrectas y 6% de respuestas en
blanco. Finalmente, en la Escuela Profesional de Ingeniería de Sistemas se tiene
un 62% de respuestas correctas 31% de respuestas incorrectas y 7% de respuestas
en blanco, todo ello de acuerdo a la Figura 4.79.
4.3.14. NIVEL DE CUMPLIMIENTO EN RAZONAMIENTO VERBAL DE LOS
INGRESANTES A LA FACULTAD DE INGENIERÍA MECÁNICA
ELÉCTRICA, ELECTRÓNICA Y SISTEMAS RESPECTO AL PERFIL
DEL INGRESANTE
De acuerdo al perfil del ingresante de la Tabla 2 del presente trabajo como
también está establecido en el Prospecto de Admisión del examen general Mayo-
2017, se detalla que en el Área de Razonamiento Verbal el estudiante:
• Aplica estrategias metodológicas de razonamiento verbal en el contexto de
las ciencias de la ingeniería.
• Posee dominio verbal en el idioma español, respecto de las ciencias de la
ingeniería.
• Analiza e interpreta signos lingüísticos con propósitos definidos.
• Comprende textos escritos del área de las ciencias de la ingeniería en el
marco de los niveles: literal, inferencial y crítico.
• Produce textos escritos en función al bloque comunicativo textual.
En cuanto a la Facultad de Ingeniería Mecánica Eléctrica, Electrónica y
Sistemas se obtuvieron los siguientes resultados del análisis y sectorización a nivel
general:
143
Figura 4.80: Resultado del análisis de Razonamiento Verbal
Elaborado por el equipo de trabajo
En el área de Razonamiento Verbal se puede considerar que en la Escuela
Profesional de Ingeniería Mecánica Eléctrica se tiene un 53% de respuestas
correctas, 45% de respuestas incorrectas y 2% de respuestas en blanco. Por otra
parte, en la Escuela Profesional de Ingeniería Electrónica se tiene 51% de
respuestas correctas, 48% de respuestas incorrectas y 2% de respuestas en blanco.
Finalmente, en la Escuela Profesional de Ingeniería de Sistemas se tiene 57% de
respuestas correctas, 41% de respuestas incorrectas y 2% de respuestas en blanco.
Figura 4.81: Densidad Kernel en Razonamiento verbal
Elaborado por el equipo de trabajo
144
En el presente gráfico se puede visualizar la densidad Kernel del nivel de
asertividad correspondiente a las preguntas de razonamiento verbal. Se denota el
cumplimiento de los requerimientos expuestos para la realización del gráfico
sobre dos parámetros clave: la función Kernel o núcleo y el ancho de banda. Para
el Área de razonamiento verbal en la Escuela Profesional de Ingeniería de
Sistemas cuenta con la mayor densidad de respuestas correctas, seguido de
Ingeniería Mecánica Eléctrica y con menor densidad de respuestas correctas la
Escuela Profesional de Ingeniería Electrónica.
Es importante considerar que de acuerdo al reglamento de admisión del Año
2017 que se encuentra en el Anexo 2, se establece que en el área de Razonamiento
Verbal se tienen 8 preguntas de los siguientes temas:
1. Comprensión de Textos
2. Plan de Redacción
3. Analogías
4. Término excluido
5. Antónimos
6. Palabras homógrafas, homófonas, parónimas y polisémicas
7. Sinónimos
8. Inclusión de términos
Se realizó el análisis haciendo uso de Lenguaje R de cada uno de los temas del
área de Razonamiento Verbal; obteniendo los siguientes resultados:
145
Figura 4.82: Resultado del análisis de Comprensión de textos
Elaborado por el equipo de trabajo
En la pregunta N° 53 del tema Comprensión de Textos se obtuvo como
resultado que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene
un 58% de respuestas correctas, 42% de respuestas incorrectas y ninguna
respuesta en blanco. Por otra parte, en la Escuela Profesional de Ingeniería
Electrónica se tiene un 69% de respuestas correctas, 31% de respuestas incorrectas
y ninguna respuesta en blanco. Finalmente, en la Escuela Profesional de Ingeniería
de Sistemas se tiene un 48% de respuestas correctas 52% de respuestas incorrectas
y ninguna respuesta en blanco, todo ello de acuerdo a la Figura 4.82.
Figura 4.83: Resultado del análisis del Plan de Redacción
Elaborado por el equipo de trabajo
146
En la pregunta N° 54 del tema Plan de Redacción se obtuvo como resultado
que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 52%
de respuestas correctas, 45% de respuestas incorrectas y 3% de respuestas en
blanco. Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene
un 50% de respuestas correctas, 50% de respuestas incorrectas y ninguna
respuesta en blanco. Finalmente, en la Escuela Profesional de Ingeniería de
Sistemas se tiene un 66% de respuestas correctas 34% de respuestas incorrectas y
ninguna respuesta en blanco, todo ello de acuerdo a la Figura 4.83.
Figura 4.84: Resultado del análisis de Analogías
Elaborado por el equipo de trabajo
En la pregunta N° 55 del tema Analogías se obtuvo como resultado que en la
Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 52% de
respuestas correctas, 48% de respuestas incorrectas y ninguna respuesta en blanco.
Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene un 62%
de respuestas correctas, 38% de respuestas incorrectas y ninguna respuesta en
blanco. Finalmente, en la Escuela Profesional de Ingeniería de Sistemas se tiene
un 59% de respuestas correctas 41% de respuestas incorrectas y ninguna respuesta
en blanco, todo ello de acuerdo a la Figura 4.84.
147
Figura 4.85: Resultados del análisis de Término excluido
Elaborado por el equipo de trabajo
En la pregunta N° 56 del tema Término excluido se obtuvo como resultado que
en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 58% de
respuestas correctas, 36% de respuestas incorrectas y 6% de respuestas en blanco.
Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene un 56%
de respuestas correctas, 44% de respuestas incorrectas y ninguna respuesta en
blanco. Finalmente, en la Escuela Profesional de Ingeniería de Sistemas se tiene
un 52% de respuestas correctas 41% de respuestas incorrectas y 7% de respuestas
en blanco, todo ello de acuerdo a la Figura 4.85
Figura 4.86: Resultado del análisis de Antónimos
Elaborado por el equipo de trabajo
148
En la pregunta N° 57 del tema Antónimos se obtuvo como resultado que en la
Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 55% de
respuestas correctas, 45% de respuestas incorrectas y ninguna respuesta en blanco.
Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene un 44%
de respuestas correctas, 56% de respuestas incorrectas y ninguna respuesta en
blanco. Finalmente, en la Escuela Profesional de Ingeniería de Sistemas se tiene
un 62% de respuestas correctas 38% de respuestas incorrectas y ninguna respuesta
en blanco, todo ello de acuerdo a la Figura 4.86.
Figura 4.87: Resultado del análisis de Palabras homógrafas
Elaborado por el equipo de trabajo
En la pregunta N° 58 del tema Palabras homógrafas, homófonas, parónimas y
polisémicas se obtuvo como resultado que en la Escuela Profesional de Ingeniería
Mecánica Eléctrica se tiene un 42% de respuestas correctas, 58% de respuestas
incorrectas y ninguna respuesta en blanco. Por otra parte, en la Escuela Profesional
de Ingeniería Electrónica se tiene un 44% de respuestas correctas, 56% de
respuestas incorrectas y ninguna respuesta en blanco. Finalmente, en la Escuela
Profesional de Ingeniería de Sistemas se tiene un 52% de respuestas correctas 45%
de respuestas incorrectas y 3% de respuestas en blanco, todo ello de acuerdo a la
Figura 4.87.
149
Figura 4.88: Resultado del análisis de sinónimos
Elaborado por el equipo de trabajo
En la pregunta N° 59 del tema Sinónimos se obtuvo como resultado que en la
Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 70% de
respuestas correctas, 27% de respuestas incorrectas y 3% de respuestas en blanco.
Por otra parte, en la Escuela Profesional de Ingeniería Electrónica se tiene un 44%
de respuestas correctas, 50% de respuestas incorrectas y 6% de respuestas en
blanco. Finalmente, en la Escuela Profesional de Ingeniería de Sistemas se tiene
un 62% de respuestas correctas 34% de respuestas incorrectas y 3% de respuestas
en blanco, todo ello de acuerdo a la Figura 4.88.
Figura 4.89: Resultado del análisis de Inclusión de términos
Elaborado por el equipo de trabajo
150
En la pregunta N° 60 del tema inclusión de términos se obtuvo como resultado
que en la Escuela Profesional de Ingeniería Mecánica Eléctrica se tiene un 39%
de respuestas correctas, 60% de respuestas incorrectas y ninguna respuesta en
blanco. Por otra parte, en la Escuela Profesional de Ingeniería Electrónica tiene
un 38% de respuestas correctas, 56% de respuestas incorrectas y 6% de respuestas
en blanco. Finalmente, en la Escuela Profesional de Ingeniería de Sistemas se tiene
un 59% de respuestas correctas 41% de respuestas incorrectas y ninguna respuesta
en blanco, todo ello de acuerdo a la Figura 4.89.
4.3.15. NIVEL DE CUMPLIMIENTO DEL PERFIL DEL INGRESANTE A LA
FACULTAD DE INGENIERÍA MECÁNICA ELÉCTRICA,
ELECTRÓNICA Y SISTEMAS
En la facultad de ingeniería mecánica eléctrica, electrónica y sistemas se
obtuvieron respecto a las 14 áreas evaluadas en el examen de modalidad general
los siguientes resultados del nivel de cumplimiento del perfil del ingresante
establecido en la Resolución Rectoral Nº 3231-2014-R-UNA:
Tabla 4.103: Nivel de cumplimiento del perfil del ingresante FIMEES
INGENIERÍA INGENIERÍA
INGENIERÍA
N° AREAS MECÁNICA DE
ELECTRÓNICA
ELÉCTRICA SISTEMAS
1 Matemática I 65,91 43,75 61,21
2 Matemática II 49,24 42,19 51,73
3 Fisica 42,42 26,56 59,48
4 Química 51,52 43,75 61,2
5 Biología 58,34 56,25 47,42
6 Psicología y Filosofía 50,76 56,25 57,76
7 Geografía 53,03 51,56 50,86
8 Historia 56,06 54,69 49,14
9 Educación Cívica 60,61 71,88 53,45
10 Economía 48,48 64,58 64,37
11 Comunicación 56,06 60,94 45,69
12 Literatura 58,59 58,33 43,68
Razonamiento
13 62,5 66,41 64,66
Matemático
14 Razonamiento Verbal 53,03 50,78 57,33
Elaborado por el equipo de trabajo
En la tabla 17 se pueden observar el porcentaje del nivel de cumplimiento del
perfil del ingresante ponderado por áreas en la que se puede observar que en la
escuela profesional de Ingeniería Mecánica Eléctrica se tiene un mayor nivel de
151
cumplimiento del perfil del ingresante en el área de Matemática I, en Ingeniería
Electrónica se tiene al área de Educación Cívica y finalmente en la escuela
profesional de Ingeniería de Sistemas se observa mayor nivel de cumplimiento en
el área de razonamiento matemático.
La información organizada en forma clara, exacta y confiable es fundamental
en la toma de decisiones por lo que los datos obtenidos del análisis son mostrados
en tablas como numero 17 y también se obtuvo el grafico, en el que se puede
observar con mayor claridad la información detallada por áreas, tal como se
muestra a continuación:
152
Figura 4.90: Nivel de cumplimiento por áreas
153
Elaborado por el equipo de trabajo
Respecto a los datos analizados de la Facultad de Ingeniería Mecánica Eléctrica,
Electrónica y Sistemas de la Universidad Nacional del Altiplano se ha de demostrado
que el nivel de cumplimiento del perfil de ingresante es de 55.14% en función a los
datos del desempeño académico de las 14 áreas evaluadas en el examen de modalidad
general.
En la escuela profesional de Ingeniería Mecánica Eléctrica el nivel de cumplimento
del perfil del ingresante es de 55.36%. Por otra parte, en la escuela profesional de
Ingeniería Electrónica el nivel de cumplimiento del perfil del ingresante es de 51.6%
y finalmente en la escuela profesional de Ingeniería de Sistemas, el nivel de
cumplimiento del perfil del ingresante es de 58.48%.
Los resultados obtenidos mediante el análisis de datos con R son más detallados
que los obtenidos en el trabajo de investigación realizado por (Suárez, 2010), en el que
se indica el uso de un software estadístico para la obtención de una cantidad menor de
gráficos de resumen respecto a la evaluación del rendimiento académico de los
alumnos ingresantes a la Escuela Profesional de Ingeniería Industrial de la Universidad
del Callao, por lo que el uso de la herramienta R es más eficiente por ser herramienta
de análisis estadístico permanentemente actualizada gracias a la contribución de una
comunidad de desarrolladores a nivel mundial, mediante la incorporación de las
últimas técnicas estadísticas a través de la creación de librerías, o pequeños programas
que se pueden instalar dentro del entorno, convirtiéndolo en un software de
automatización más que de programación.
Por otra parte, en las conclusiones de la investigación realizada por (Cevallos,
2013), indica textualmente que el espectro de investigación y las posibilidades que
ofrece el data mining son muy amplias como para pretender establecer un estándar
único y se recomienda una serie de pasos a seguir para obtener un resultado específico
que es hallar patrones de accidentabilidad. Ya se ha mencionado que las instituciones
tienen la posibilidad de usar la estadística descriptiva tradicional con la salvedad que
la posibilidad de obtener conocimiento es reducida. El data mining ofrece herramientas
más robustas para este fin, por lo que se apoya en le metodología KDD (Knowledge
Discovered in Databases). No obstante, en la presente investigación se comprueba la
primera premisa de lo indicado por (Cevallos, 2013) descrito en las 5 primeras fases
de la metodología CRISP-DM (Cross Industry Standard Process for Data Mining) al
verse diversas posibilidades de usar la estadística descriptiva tradicional pero por la
cantidad de variables e información no se podría obtener los resultados requeridos para
154
la presente investigación. En cuanto a la metodología KDD (Knowledge Discovered
in Databases) se puede apreciar que tiene un mayor número de procesos con resultados
menos optimos y que son comprendidos dentro de la metodología CRISP-DM (Cross
Industry Standard Process for Data Mining).
Tabla 4.114: Etapas de metodología KDD y metodología CRISP-DM
KDD CRISP-DM
Pre KDD Comprensión del Negocio
Selección
Comprensión de los datos
Pro Procesamiento
Transformación Preparación de los datos
Minería de Datos Modelado
Interpretación/Evaluación Evaluación
Post KDD Implementación
Elaborado por el equipo de trabajo
En la metodología CRISP-DM se diferencia la etapa de comprensión de datos por
lo que independientemente a la aplicación de esta metodología se debe considerar que
se debe tener una plataforma guía y experiencia base para el desarrollo de la minería
de datos.
En los antecedentes internacionales se tiene la investigación realizada por
(Rodríguez, 2014) se expone el algoritmo voraz o greddy para realizar un
procedimiento factible de ser utilizado en la búsqueda de usuarios influenciadores en
redes sociales, esta es una forma de minería de datos que optimiza el tiempo de
búsqueda y puede realizarse de manera más detallada con el uso de la herramienta R,
debido a que no se pueden omitir o reducir notablemente el tamaños de la información
procesada como indica el autor, debido a que se estaría perdiendo conocimiento
valioso para la correcta toma de decisiones de presentarse el caso, todo ello muy por
encima del tiempo que pueda tomar el análisis de datos.
En el análisis de datos con R se estableció determinar el nivel de cumplimiento del
perfil del ingresante a la Facultad de Ingeniería Mecánica Eléctrica, Electrónica y
Sistemas de la Universidad Nacional del Altiplano para lo que se utilizó la metodología
CRISP-DM. La información obtenida para la fase de comprensión del negocio
necesariamente tuvo que ser organizada técnicamente para establecer los objetivos de
155
la minería de datos, hecho que coincide con la investigación realizada por (Luca,
2006), en la que también se aplica la metodología CRISP-DM para diseñar un plan
enfocado en las campañas bancarias, por lo que se reafirma que un proyecto de
datamining depende no solo de que se satisfagan ciertos objetivos de negocios, sino
que en mucho mayor medida de que se logren beneficios tangibles para el proyecto y
sus intereses en la toma de decisiones. En cuanto a la etapa de comprensión de datos
es necesaria la descripción general de las características más relevantes de los datos a
ser analizados con esta metodología.
156
CONCLUSIONES
PRIMERO: El nivel de cumplimiento del perfil de ingresante en la Facultad de
Ingeniería Mecánica Eléctrica, Electrónica y Sistemas es de 55.14% en función a los
datos generados del desempeño académico de las 14 áreas evaluadas en el examen de
modalidad general. En la escuela profesional de Ingeniería Mecánica Eléctrica el nivel
de cumplimento del perfil del ingresante es de 55.36%. Por otra parte, en la escuela
profesional de Ingeniería Electrónica el nivel de cumplimiento del perfil del ingresante
es de 51.6% y finalmente en la escuela profesional de Ingeniería de Sistemas, el nivel
de cumplimiento del perfil del ingresante es de 58.48%. Los resultados obtenidos se
encuentran dentro de las expectativas del perfil del ingresante al área de ciencias de la
Ingeniería de la Universidad Nacional del Altiplano.
SEGUNDO: En base a la técnica de visualización de datos se logró estructurar la
información en data frames que incluyeron campos de datos numéricos y
alfanuméricos de todas las variables utilizadas entre las que se consideró la
ponderación y densidad de kernel como puntos importantes para el análisis.
TERCERO: Se logró implementar en Rstudio un modelo de análisis con las variables
de porcentaje individual, área, ponderación y densidad de Kernel de los datos de los
ingresantes a la Facultad de Ingeniería Mecánica Eléctrica, Electrónica y Sistemas,
basado en la metodología CRISP-DM.
CUARTO: El área con mayor nivel de cumplimiento del perfil del ingresante en la
escuela profesional de Ingeniería Mecánica Eléctrica es matemática I con un
porcentaje de 65.91%, en la escuela profesional de Ingeniería Electrónica es el área de
educación cívica con 71.88% y finalmente en la escuela profesional de Ingeniería de
Sistemas es el área de razonamiento matemático con un porcentaje de 64.66%. Por
otra parte, es importante resaltar que entre las áreas de menor dominio están física con
un porcentaje de 25.56% y matemática II con 42.19%, ello en base a datos generados.
Los resultados obtenidos nos indican que las áreas de menor dominio, no se encuentran
dentro de las expectativas del perfil del ingresante en el área de ciencias de la ingeniería
de la Universidad Nacional del Altiplano; en razonamiento matemático, y en las áreas
de mayor dominio se superaron las expectativas del perfil del ingresante respecto al
criterio de comprensión del ejercicio de la ciudadanía y la cultura cívica.
157
RECOMENDACIONES
PRIMERO: Se recomienda ampliar el estudio del perfil del ingresante, en las otras
carreras profesionales de la Universidad Nacional del Altiplano y medir el impacto
que el presente análisis pueda tener en las mismas, debido a que el modelo si adecuó
en el caso de la Facultad de Ingeniería Mecánica Eléctrica, Electrónica y Sistemas.
SEGUNDO: Recomendamos R para el procesamiento de información debido a que se
adapta exitosamente al modelamiento de datos de los ingresantes a la Facultad de
Ingeniería Mecánica Eléctrica, Electrónica y Sistemas.
TERCERO: Por otra parte, en base a los niveles del rendimiento académico genuinos,
de los ingresantes en exámenes de admisión general, se recomienda dictar cursos de
nivelación en la Facultad de Ingeniería Mecánica Eléctrica, Electrónica y Sistemas
como alternativa para que los estudiantes fortalezcan sus debilidades y se puedan
desenvolver óptimamente en sus estudios universitarios.
CUARTO: Se recomienda a futuros investigadores profundizar el estudio de las áreas
con menores niveles de cumplimiento del perfil del ingresante son Física, Matemática
II y Literatura y por otro lado las áreas con mejor nivel de cumplimiento son Educación
Cívica, Razonamiento Matemático y Matemática I.
158
BIBLIOGRAFÍA
Aguilar, L. J. (2013). Big Data Análisis de Grandes Volúmenes de Datos en
Organizaciones. México: Alfaomega Grupo Editor.
Cevallos, A. (2013). Guía Metodológica para obtener patrones de Accidentabilidad
Laboral usando Data Mining. Tesis de Maestría. Universidad de Piura, Perú.
Duque-Mendez, N. O.-A. (19 de 06 de 2017). DYNA. Obtenido de
[Link]
Gallardo, J. A. (2009). Metodología para la definición de requisitos en proyectos de Data
Mining. (tesis doctoral). Universidad Politecnica de Madrid.
Grandez, M. (2017). Aplicación de minería de datos para determinar patrones de consumo
futuro en clientes de una distribuidora de suplementos nutriciionales. (Tesis de pregrado).
Universidad San Ignacio de Loyola, Lima.
Herrera, M. (2013). Searching Information Part. U.S.A.: Roosevelt.
Jimenéz, A. (2017). Análisis Predictivo Para los Procesos de Admisión de la Universidad
Nacional del Altiplano. (Tesis doctoral). Universidad Nacional del Altiplano, Puno.
Joyanes, L. (2013). Big Data Análisis de Grandes Volúmenes de Datos en
Organizaciones. México: Alfaomega Grupo Editor.
Larose, D. &. (15 de 12 de 2016). Discovering knowledge in data: an introduction to
Data. Obtenido de:
[Link]
T22&d
López, D. (2013). Análisis de las posibilidades de uso de Big Data en las organizaciones.
Cantabria: Universidad de Cantabria.
Luca, M. (2006). Plan para enfocar las campañas bancarias utilizando Datamining. (Tesis
de grado). Universidad de Chile, Santiago de Chile.
Mamani, j. (2015). Análisis de Datos con Herramientas de Big Data Para la toma de
Decisiones en la Ugel de Azángaro. Perú: Universidad Nacional del Altiplano.
Marketing Analítico. (2017). El Proceso de Análisis de Datos. Marketing Analítico , 15.
McKinsey Institute, G. (26 de junio de 2011). Consultora Mckinsey. Obtenido de
http:[Link]/insights/mgi/research/technology_and_innovation/big_data_th
e_next_frontier_for_innovation
Portella, J. (17 de octubre de 2018). Innovation In Constant Motion. Obtenido de
[Link]
159
Psicología de Datos. (16 de octubre de 2014). Psicología de Datos. Obtenido de
[Link]
R-Foundation. (20 de octubre de 2018). CRAN R project. Obtenido de [Link]
[Link]
Rodríguez, F. T. (2014). Data Mining en el cálculo de influencia en redes sociales. (Tesis
de grado). Universidad de Buenos Aires, Buenos Aires.
Sánchez, R. (15 de 12 de 2017). Git Books. Obtenido de
[Link]
Santana, J. (2014 ). El arte de programar en R. Un lenguaje para la estadística. Mexico
: Instituto Mexicano de Tecnología del Agua.
Shuttleworth, M. (10 de 10 de 2018). Explorable, investigación científica . Obtenido de
[Link]
Suárez, C. (2010). Evaluación del rendimiento académico de los alumnos ingresantes a
la escuela profesional de ingeniería industrial, semestres: 2008A, 2008B, 2009A y su
impacto en la población académica de la FIIS-UNAC. Trabajo de Investigación.
Universidad Nacional del Callao, Lima.
Uriarte, C. (2018). Minería de datos para mejorar la toma decisiones en el área de gestión
al cliente de telefónica del Perú zonal Tarapoto. (Tesis de pregrado). Universidad
Nacional de San Martin - Tarapoto, Tarapoto, Perú.
Wickham, H. (2010). ggplot2: Elegant graphics for data analysis. New Zeland : Diario
de software estadístico.
160
ANEXOS
ANEXO 1
Resolución Rectoral Nº 3231-2014-UNA
ANEXO 2ANEXO 3
Resolución Rectoral Nº 3231-2014-UNA
161
162
163
164
165
ANEXO 2
Resolución Rectoral Nº 1334-2017-R-UNA
ANEXO 4
Resolución Rectoral Nº 1334-2017-R-UNA
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
ANEXO 3
Ponderación de áreas en nivel de cumplimiento
Tabla 1: Ponderación de áreas en nivel de cumplimiento en Ingeniería Mecánica Eléctrica
[Link]
N° AREA CONTENIDOS PONDERACIÓN PORCENTAJE [Link]
VIDUAL
Ecuaciones Lineales, Cuadráticas y 70 51.52 2.5925926 1.3357037
1 Matemática I
de Grado Superior
Inecuaciones Lineales, Cuadráticas, 70 54.55 2.5925926 1.4142593
2 Matemática I
Polinómicas y Racionales
Factorización, Racionalización y 70 60.61 2.5925926 1.5713704
3 Matemática I
Radicación
Expresiones Algebraicas, 70 96.97 2.5925926 2.514037
4 Matemática I
Polinomios y operaciones
5 Matemática II Segmentos y Ángulos geométricos 70 48.48 2.5925926 1.2568889
6 Matemática II Geometría analítica 70 54.55 2.5925926 1.4142593
7 Matemática II Funciones trigonométricas 70 45.45 2.5925926 1.1783333
70 48.48 2.5925926 1.2568889
190
8 Matemática II Triángulos
9 Fisica Trabajo y potencia 60 36.36 2.2222222 0.808
10 Fisica Electricidad y magnetismo 60 33.33 2.2222222 0.7406667
11 Fisica Dinámica 60 45.45 2.2222222 1.01
12 Fisica Estática 60 54.55 2.2222222 1.2122222
13 Química Funciones químicas 50 57.58 1.8518519 1.0662963
14 Química Estructura atómica 50 51.52 1.8518519 0.9540741
15 Química Materia - Energía 50 42.42 1.8518519 0.7855556
16 Química Funciones químicas oxigenadas 50 54.55 1.8518519 1.0101852
Tabla 1: Ponderación de áreas en nivel de cumplimiento en Ingeniería Mecánica Eléctrica
17 Biología Célula 20 60.61 0.7407407 0.448963
18 Biología Fisiología Celular 20 51.52 0.7407407 0.3816296
19 Biología Circulación 20 63.64 0.7407407 0.4714074
20 Biología Ecología 20 57.58 0.7407407 0.4265185
Psicología y 20 60.61 0.7407407 0.448963
21 Los Procesos Afectivos
Filosofía
Psicología y 20 45.45 0.7407407 0.3366667
22 Estudio del Desarrollo Humano
Filosofía
Psicología y 20 42.42 0.7407407 0.3142222
23 Filosofía
Filosofía
Psicología y 20 54.55 0.7407407 0.4040741
24 Epistemología
Filosofía
25 Geografía Geografía del Perú 20 63.64 0.7407407 0.4714074
20 51.52 0.7407407 0.3816296
191
26 Geografía Sistema planetario solar
27 Geografía Sistema planetario solar. La tierra 20 54.55 0.7407407 0.4040741
28 Geografía Geografía del Perú. Minerales 20 42.42 0.7407407 0.3142222
Transformaciones del Perú, inicios 10 60.61 0.3703704 0.2244815
29 Historia
del siglo XX
Hechos y acontecimientos de la 10 48.48 0.3703704 0.1795556
30 Historia
historia reciente del Perú siglo XXI
El mundo colonial como producto de 10 60.61 0.3703704 0.2244815
31 Historia
la tradición europea y andina
32 Historia Movimientos continentales 10 54.55 0.3703704 0.202037
La Constitución Política y la 10 66.67 0.3703704 0.2469259
33 Educación Cívica
estructura del Estado
34 Educación Cívica La familia 10 54.55 0.3703704 0.202037
Tabla 1: Ponderación de áreas en nivel de cumplimiento en Ingeniería Mecánica Eléctrica
35 Economía El sistema financiero 30 54.55 1.1111111 0.6061111
36 Economía La Producción 30 45.45 1.1111111 0.505
37 Economía Competencia y monopolio 30 45.45 1.1111111 0.505
38 Comunicación Teoría del texto - Texto descriptivo 20 69.7 0.7407407 0.5162963
39 Comunicación Técnicas de lectura y teoría del texto 20 57.58 0.7407407 0.4265185
40 Comunicación Ortografía y gramática: 20 54.55 0.7407407 0.4040741
41 Comunicación Teoría del texto 20 42.42 0.7407407 0.3142222
42 Literatura Acentuación y tildación 10 60.61 0.3703704 0.2244815
43 Literatura Literatura 10 60.61 0.3703704 0.2244815
44 Literatura Literatura local. Regional y Perú 10 54.55 0.3703704 0.202037
Razonamiento 80 100 2.962963 2.962963
45 Problemas de edades
192
Matemático
Razonamiento 80 54.55 2.962963 1.6162963
46 Análisis combinatorio
Matemático
Razonamiento 80 57.58 2.962963 1.7060741
47 Series y Sucesiones
Matemático
Razonamiento 80 57.58 2.962963 1.7060741
48 Planteo de ecuaciones
Matemático
Razonamiento 80 60.61 2.962963 1.7958519
49 Sistemas de numeración
Matemático
Razonamiento 80 57.58 2.962963 1.7060741
50 Figuras sombreadas
Matemático
Razonamiento 80 51.52 2.962963 1.5265185
51 Operadores matemáticos
Matemático
Razonamiento 80 60.61 2.962963 1.7958519
52 Sumatorias
Matemático
Tabla 1: Ponderación de áreas en nivel de cumplimiento en Ingeniería Mecánica Eléctrica
Razonamiento 70 57.58 2.5925926 1.4928148
53 Comprensión de Textos
Verbal
Razonamiento 70 51.52 2.5925926 1.3357037
54 Plan de Redacción
Verbal
Razonamiento 70 51.52 2.5925926 1.3357037
55 Analogías
Verbal
Razonamiento 70 57.58 2.5925926 1.4928148
56 Término excluido
Verbal
Razonamiento 70 54.55 2.5925926 1.4142593
57 Antónimos
Verbal
Razonamiento Palabras homógrafas, homófonas,
193
58 70 42.42 2.5925926 1.0997778
Verbal parónimas y polisémicas
Razonamiento 70 69.7 2.5925926 1.807037
59 Sinónimos
Verbal
Razonamiento 70 39.39 2.5925926 1.0212222
60 Inclusión de términos
Verbal
Elaborado por el equipo de trabajo
Tabla 2: Ponderación de áreas en nivel de cumplimiento en Ingeniería Electrónica
[Link] [Link]
N° AREA CONTENIDOS PONDERACIÓN PORCENTAJE
IVIDUAL DO
Ecuaciones Lineales, Cuadráticas y 70 65.52 2.5925926 1.6986667
1 Matemática I
de Grado Superior
Inecuaciones Lineales, Cuadráticas, 70 55.17 2.5925926 1.4303333
2 Matemática I
Polinómicas y Racionales
Factorización, Racionalización y 70 68.97 2.5925926 1.7881111
3 Matemática I
Radicación
Expresiones Algebraicas, Polinomios 70 55.17 2.5925926 1.4303333
4 Matemática I
y operaciones
5 Matemática II Segmentos y Ángulos geométricos 70 48.28 2.5925926 1.2517037
6 Matemática II Geometría analítica 70 48.28 2.5925926 1.2517037
7 Matemática II Funciones trigonométricas 70 62.07 2.5925926 1.6092222
8 Matemática II Triángulos 70 48.28 2.5925926 1.2517037
194
9 Fisica Trabajo y potencia 60 58.62 2.2222222 1.3026667
10 Fisica Electricidad y magnetismo 60 68.97 2.2222222 1.5326667
11 Fisica Dinámica 60 51.72 2.2222222 1.1493333
12 Fisica Estática 60 58.62 2.2222222 1.3026667
13 Química Funciones químicas 50 51.72 1.8518519 0.9577778
14 Química Estructura atómica 50 75.86 1.8518519 1.4048148
15 Química Materia - Energía 50 62.07 1.8518519 1.1494444
16 Química Funciones químicas oxigenadas 50 55.17 1.8518519 1.0216667
17 Biología Célula 20 48.28 0.7407407 0.3576296
Tabla 2: Ponderación de áreas en nivel de cumplimiento en Ingeniería Electrónica
18 Biología Fisiología Celular 20 41.38 0.7407407 0.3065185
19 Biología Circulación 20 48.28 0.7407407 0.3576296
20 Biología Ecología 20 51.72 0.7407407 0.3831111
Psicología y 20 58.62 0.7407407 0.4342222
21 Los Procesos Afectivos
Filosofía
Psicología y 20 51.72 0.7407407 0.3831111
22 Estudio del Desarrollo Humano
Filosofía
Psicología y 20 58.62 0.7407407 0.4342222
23 Filosofía
Filosofía
Psicología y 20 62.07 0.7407407 0.4597778
24 Epistemología
Filosofía
25 Geografía Geografía del Perú 20 62.07 0.7407407 0.4597778
195
26 Geografía Sistema planetario solar 20 44.83 0.7407407 0.3320741
27 Geografía Sistema planetario solar. La tierra 20 55.17 0.7407407 0.4086667
28 Geografía Geografía del Perú. Minerales 20 41.38 0.7407407 0.3065185
Transformaciones del Perú, inicios 10 48.28 0.3703704 0.1788148
29 Historia
del siglo XX
Hechos y acontecimientos de la 10 51.72 0.3703704 0.1915556
30 Historia
historia reciente del Perú siglo XXI
El mundo colonial como producto de 10 44.83 0.3703704 0.166037
31 Historia
la tradición europea y andina
32 Historia Movimientos continentales 10 51.72 0.3703704 0.1915556
La Constitución Política y la 10 51.72 0.3703704 0.1915556
33 Educación Cívica
estructura del Estado
34 Educación Cívica La familia 10 55.17 0.3703704 0.2043333
35 Economía El sistema financiero 30 55.17 1.1111111 0.613
Tabla 2: Ponderación de áreas en nivel de cumplimiento en Ingeniería Electrónica
36 Economía La Producción 30 68.97 1.1111111 0.7663333
37 Economía Competencia y monopolio 30 68.97 1.1111111 0.7663333
38 Comunicación Teoría del texto - Texto descriptivo 20 48.28 0.7407407 0.3576296
39 Comunicación Técnicas de lectura y teoría del texto 20 37.93 0.7407407 0.280963
40 Comunicación Ortografía y gramática: 20 37.93 0.7407407 0.280963
41 Comunicación Teoría del texto 20 58.62 0.7407407 0.4342222
42 Literatura Acentuación y tildación 10 48.28 0.3703704 0.1788148
43 Literatura Literatura 10 41.38 0.3703704 0.1532593
44 Literatura Literatura local. Regional y Perú 10 41.38 0.3703704 0.1532593
Razonamiento 80 82.76 2.962963 2.4521481
45 Problemas de edades
Matemático
196
Razonamiento 80 65.52 2.962963 1.9413333
46 Análisis combinatorio
Matemático
Razonamiento 80 55.17 2.962963 1.6346667
47 Series y Sucesiones
Matemático
Razonamiento 80 72.41 2.962963 2.1454815
48 Planteo de ecuaciones
Matemático
Razonamiento 80 72.41 2.962963 2.1454815
49 Sistemas de numeración
Matemático
Razonamiento 80 41.38 2.962963 1.2260741
50 Figuras sombreadas
Matemático
Razonamiento 80 65.52 2.962963 1.9413333
51 Operadores matemáticos
Matemático
Razonamiento 80 62.07 2.962963 1.8391111
52 Sumatorias
Matemático
Razonamiento 70 48.28 2.5925926 1.2517037
53 Comprensión de Textos
Verbal
Tabla 2: Ponderación de áreas en nivel de cumplimiento en Ingeniería Electrónica
Razonamiento 70 65.52 2.5925926 1.6986667
54 Plan de Redacción
Verbal
Razonamiento 70 58.62 2.5925926 1.5197778
55 Analogías
Verbal
Razonamiento 70 51.72 2.5925926 1.3408889
56 Término excluido
Verbal
Razonamiento 70 62.07 2.5925926 1.6092222
57 Antónimos
Verbal
Razonamiento Palabras homógrafas, homófonas, 70 51.72 2.5925926 1.3408889
58
Verbal parónimas y polisémicas
Razonamiento 70 62.07 2.5925926 1.6092222
59 Sinónimos
Verbal
Razonamiento 70 58.62 2.5925926 1.5197778
60 Inclusión de términos
Verbal
197
Elaborado por el equipo de trabajo
Tabla 3: Ponderación de áreas en nivel de cumplimiento en Ingeniería de Sistemas
N° AREA CONTENIDOS PONDERACIÓN PORCENTAJE [Link] [Link]
Ecuaciones Lineales, 70 50 2.5925926 1.2962963
1 Matemática I
Cuadráticas y de Grado Superior
Inecuaciones Lineales,
2 Matemática I Cuadráticas, Polinómicas y 70 50 2.5925926 1.2962963
Racionales
Factorización, Racionalización 70 43.75 2.5925926 1.1342593
3 Matemática I
y Radicación
Expresiones Algebraicas, 70 31.25 2.5925926 0.8101852
4 Matemática I
Polinomios y operaciones
Segmentos y Ángulos 70 50 2.5925926 1.2962963
5 Matemática II
geométricos
6 Matemática II Geometría analítica 70 43.75 2.5925926 1.1342593
7 Matemática II Funciones trigonométricas 70 37.5 2.5925926 0.9722222
8 Matemática II Triángulos 70 37.5 2.5925926 0.9722222
198
9 Fisica Trabajo y potencia 60 31.25 2.2222222 0.6944444
10 Fisica Electricidad y magnetismo 60 25 2.2222222 0.5555556
11 Fisica Dinámica 60 31.25 2.2222222 0.6944444
12 Fisica Estática 60 18.75 2.2222222 0.4166667
13 Química Funciones químicas 50 43.75 1.8518519 0.8101852
14 Química Estructura atómica 50 43.75 1.8518519 0.8101852
15 Química Materia - Energía 50 37.5 1.8518519 0.6944444
16 Química Funciones químicas oxigenadas 50 50 1.8518519 0.9259259
17 Biología Célula 20 75 0.7407407 0.5555556
Tabla 3: Ponderación de áreas en nivel de cumplimiento en Ingeniería de Sistemas
18 Biología Fisiología Celular 20 50 0.7407407 0.3703704
19 Biología Circulación 20 56.25 0.7407407 0.4166667
20 Biología Ecología 20 43.75 0.7407407 0.3240741
Psicología y 20 50 0.7407407 0.3703704
21 Los Procesos Afectivos
Filosofía
Psicología y 20 50 0.7407407 0.3703704
22 Estudio del Desarrollo Humano
Filosofía
Psicología y 20 56.25 0.7407407 0.4166667
23 Filosofía
Filosofía
Psicología y 20 68.75 0.7407407 0.5092593
24 Epistemología
Filosofía
25 Geografía Geografía del Perú 20 62.5 0.7407407 0.462963
26 Geografía Sistema planetario solar 20 43.75 0.7407407 0.3240741
20 37.5 0.7407407 0.2777778
199
27 Geografía Sistema planetario solar. La tierra
28 Geografía Geografía del Perú. Minerales 20 62.5 0.7407407 0.462963
Transformaciones del Perú, inicios 10 68.75 0.3703704 0.2546296
29 Historia
del siglo XX
Hechos y acontecimientos de la 10 56.25 0.3703704 0.2083333
30 Historia
historia reciente del Perú siglo XXI
El mundo colonial como producto de 10 56.25 0.3703704 0.2083333
31 Historia
la tradición europea y andina
32 Historia Movimientos continentales 10 37.5 0.3703704 0.1388889
La Constitución Política y la 10 75 0.3703704 0.2777778
33 Educación Cívica
estructura del Estado
34 Educación Cívica La familia 10 68.75 0.3703704 0.2546296
35 Economía El sistema financiero 30 68.75 1.1111111 0.7638889
Tabla 3: Ponderación de áreas en nivel de cumplimiento en Ingeniería de Sistemas
36 Economía La Producción 30 62.5 1.1111111 0.6944444
37 Economía Competencia y monopolio 30 62.5 1.1111111 0.6944444
38 Comunicación Teoría del texto - Texto descriptivo 20 81.25 0.7407407 0.6018519
39 Comunicación Técnicas de lectura y teoría del texto 20 50 0.7407407 0.3703704
40 Comunicación Ortografía y gramática: 20 56.25 0.7407407 0.4166667
41 Comunicación Teoría del texto 20 56.25 0.7407407 0.4166667
42 Literatura Acentuación y tildación 10 56.25 0.3703704 0.2083333
43 Literatura Literatura 10 62.5 0.3703704 0.2314815
44 Literatura Literatura local. Regional y Perú 10 56.25 0.3703704 0.2083333
Razonamiento 80 50 2.962963 1.4814815
45 Problemas de edades
Matemático
Razonamiento 80 56.25 2.962963 1.6666667
200
46 Análisis combinatorio
Matemático
Razonamiento 80 68.75 2.962963 2.037037
47 Series y Sucesiones
Matemático
Razonamiento 80 68.75 2.962963 2.037037
48 Planteo de ecuaciones
Matemático
Razonamiento 80 68.75 2.962963 2.037037
49 Sistemas de numeración
Matemático
Razonamiento 80 75 2.962963 2.2222222
50 Figuras sombreadas
Matemático
Razonamiento 80 75 2.962963 2.2222222
51 Operadores matemáticos
Matemático
Razonamiento 80 68.75 2.962963 2.037037
52 Sumatorias
Matemático
Razonamiento 70 68.75 2.5925926 1.7824074
53 Comprensión de Textos
Verbal
Tabla 3: Ponderación de áreas en nivel de cumplimiento en Ingeniería de Sistemas
Razonamiento 70 50 2.5925926 1.2962963
54 Plan de Redacción
Verbal
Razonamiento 70 62.5 2.5925926 1.6203704
55 Analogías
Verbal
Razonamiento 70 56.25 2.5925926 1.4583333
56 Término excluido
Verbal
Razonamiento 70 43.75 2.5925926 1.1342593
57 Antónimos
Verbal
Razonamiento Palabras homógrafas, homófonas, 70 43.75 2.5925926 1.1342593
58
Verbal parónimas y polisémicas
Razonamiento 70 43.75 2.5925926 1.1342593
59 Sinónimos
Verbal
Razonamiento 70 37.5 2.5925926 0.9722222
60 Inclusión de términos
Verbal
201
Elaborado por el equipo de trabajo