Universidad Autónoma de Nuevo León
Facultad de Ingeniería Mecánica y Eléctrica
TEMAS SEL. DE SISTEMAS INTELIGENTES
PIA SISTEMA INTELIGENTE
Profesor: MARTINEZ MARTINEZ RAQUEL
Nombre: Derek Alejandro Sauceda Morales
Matrícula: 1999672
Carrera: ITS
San Nicolás de los Garza, NL a 2 de mayo de 2025
Nombre del Proyecto
ClassifyEDU
Descripción del Proyecto
ClassifyEDU es una herramienta de organización automática de archivos
académicos desarrollada para estudiantes. Su propósito principal es facilitar la
clasificación de tareas, apuntes y materiales al final de cada semestre de manera
inteligente. Aprovecha el poder de las redes neuronales y técnicas de
emparejamiento lógico para analizar tanto los nombres como el contenido de los
archivos, identificando la materia correspondiente y organizándolos
automáticamente en carpetas estructuradas.
Desarrollo del Sistema Inteligente
El sistema fue desarrollado completamente en Python y emplea una combinación
de técnicas tradicionales de procesamiento de texto junto con aprendizaje
automático. Se utilizaron las siguientes estrategias clave:
Lógica de matcheo: A través del análisis de palabras clave, el sistema
intenta encontrar coincidencias entre el contenido del archivo y las materias
existentes.
Clasificación por redes neuronales: Se entrenó un modelo con scikit-
learn, donde se vectorizó el contenido textual utilizando TF-IDF, y se
calcularon las similitudes coseno entre archivos y centroides de materias.
Extracción de contenido: Se implementó el uso de PyPDF2 para leer
archivos PDF y python-docx para documentos .docx. También se incluyó
soporte para texto plano.
Interfaz de usuario: Aunque no se detalló aquí, se integró una interfaz
gráfica con Tkinter para facilitar la selección de carpetas.
Durante el proceso, se definieron tipos de archivo como documentos, PDFs,
audios, videos e imágenes, y se clasificaron adecuadamente dentro de
subcarpetas por materia. La arquitectura modular del código permite escalar o
ajustar el modelo fácilmente.
El sistema analiza los archivos mediante tres pasos principales:
1. Limpieza y normalización del texto.
2. Clasificación con el modelo de red neuronal.
3. Respaldo con lógica de matcheo si la similitud es baja.
Esta estructura garantiza una alta tasa de acierto en la clasificación de archivos,
incluso cuando el contenido no está explícito en el nombre del archivo.
Conclusiones Generales
El desarrollo de ClassifyEDU me permitió comprender profundamente la
importancia de utilizar bibliotecas especializadas para agilizar el desarrollo de
soluciones inteligentes. Herramientas como joblib, PyPDF2, y docx jugaron un
papel clave en la extracción y manipulación de datos.
Además, aprendí el valor de integrar redes neuronales simples como
clasificadores efectivos para tareas específicas, especialmente cuando se
combinan con lógica condicional que refuerza su rendimiento. El proyecto también
mostró que los sistemas inteligentes no necesitan ser complejos para ser útiles;
basta con una idea bien ejecutada y herramientas correctas para generar un
impacto significativo.
Video del funcionamiento
[Link]
Bibliografía
Van Rossum, G., & Drake, F. L. (2009). The Python Language Reference
Manual. Network Theory Ltd.
McKinney, W. (2017). Python for Data Analysis. O'Reilly Media, Inc.
Documentación oficial de python-docx:
[Link]
Documentación oficial de PyPDF2: [Link]
Documentación de Scikit-learn:
[Link]