MINERIA DE DATOS
INTEGRANTES
LUIS ENRIQUE LOZADA LAURELES
HERMENEGILDO DELGADILLO OLVERA
DOCENTE
[Link] CLEOFAS SANCHEZ
GRUPO 3901
¿QUÉ ES?
• LA MINERÍA DE DATOS ES UN PROCESO QUE PERMITE ANALIZAR GRANDES
CANTIDADES DE INFORMACIÓN PARA ENCONTRAR PATRONES Y RELACIONES
QUE PUEDAN AYUDAR A TOMAR DECISIONES. SE TRATA DE UNA TÉCNICA QUE
SE REALIZA CON LA AYUDA DE COMPUTADORAS Y QUE PUEDE SER
AUTOMÁTICA O SEMIAUTOMÁTICA.
¿POR QUÉ ES IMPORTANTE LA MINERÍA DE
DATOS?
• LA MINERÍA DE DATOS CONSTITUYE UN ELEMENTO CRUCIAL PARA
CUALQUIER INICIATIVA DE ANÁLISIS EXITOSA. LAS EMPRESAS PUEDEN
UTILIZAR EL PROCESO DE DESCUBRIMIENTO DE CONOCIMIENTOS PARA
AUMENTAR LA CONFIANZA DE LOS CLIENTES, ENCONTRAR NUEVAS FUENTES
DE INGRESOS Y LOGRAR QUE LOS CLIENTES REGRESEN. UNA MINERÍA DE
DATOS EFICAZ RESULTA DE GRAN UTILIDAD PARA DIVERSOS ASPECTOS DE LA
PLANIFICACIÓN EMPRESARIAL Y LA ADMINISTRACIÓN DE LAS OPERACIONES.
SECTORES DE APLICACIÓN
• TELECOMUNICACIONES, MEDIOS Y TECNOLOGÍA
LOS SECTORES VERTICALES DE ALTA COMPETENCIA, COMO LAS TELECOMUNICACIONES, LOS
MEDIOS Y LA TECNOLOGÍA UTILIZAN LA MINERÍA DE DATOS PARA MEJORAR EL SERVICIO DE
ATENCIÓN AL CLIENTE MEDIANTE LA BÚSQUEDA DE PATRONES EN EL COMPORTAMIENTO DE
ESTOS. POR EJEMPLO, UNA EMPRESA PODRÍA ANALIZAR LOS PATRONES DE USO DEL ANCHO
DE BANDA Y PROPORCIONAR ACTUALIZACIONES O RECOMENDACIONES DE SERVICIO
PERSONALIZADAS.
• BANCA Y SEGUROS
LOS SERVICIOS FINANCIEROS PUEDEN UTILIZAR APLICACIONES DE MINERÍA DE DATOS PARA
RESOLVER PROBLEMAS COMPLEJOS DE FRAUDE, CUMPLIMIENTO, GESTIÓN DE RIESGOS Y
DESERCIÓN DE CLIENTES. POR EJEMPLO, LAS COMPAÑÍAS DE SEGUROS PUEDEN DESCUBRIR
EL PRECIO ÓPTIMO DEL PRODUCTO AL COMPARAR EL RENDIMIENTO DEL PRODUCTO EN EL
PASADO CON LOS PRECIOS DE LA COMPETENCIA.
• EDUCACIÓN
LOS PROVEEDORES DE EDUCACIÓN PUEDEN UTILIZAR ALGORITMOS DE MINERÍA DE DATOS PARA EVALUAR A LOS
ESTUDIANTES, PERSONALIZAR LAS LECCIONES Y HACER QUE EL APRENDIZAJE SEA MÁS LÚDICO. UNA VISIÓN
UNIFICADA Y BASADA EN DATOS DEL AVANCE DE LOS ALUMNOS PUEDE AYUDAR A LOS EDUCADORES A
DETERMINAR QUÉ NECESITAN ESTOS Y A APOYARLOS MEJOR.
• FABRICACIÓN
LOS SERVICIOS DE FABRICACIÓN PUEDEN UTILIZAR TÉCNICAS DE MINERÍA DE DATOS PARA PROPORCIONAR UN
ANÁLISIS EN TIEMPO REAL Y PREDICTIVO DE LA EFICACIA GENERAL DE LOS EQUIPOS, LOS NIVELES DE SERVICIO,
LA CALIDAD DE LOS PRODUCTOS Y LA EFICIENCIA DE LA CADENA DE SUMINISTRO. POR EJEMPLO, LOS
FABRICANTES PUEDEN UTILIZAR DATOS HISTÓRICOS PARA PREDECIR EL DESGASTE DE LA MAQUINARIA DE
PRODUCCIÓN Y ANTICIPAR EL MANTENIMIENTO. DE ESTE MODO, PUEDEN OPTIMIZAR LA PROGRAMACIÓN DE LA
PRODUCCIÓN Y REDUCIR EL TIEMPO DE INACTIVIDAD.
• VENTA MINORISTA
LAS EMPRESAS DE VENTA MINORISTA DISPONEN DE GRANDES BASES DE DATOS DE CLIENTES CON DATOS SIN
PROCESAR SOBRE EL COMPORTAMIENTO DE COMPRA DE LOS CLIENTES. LA MINERÍA DE DATOS PERMITE
PROCESAR ESTOS DATOS PARA EXTRAER INFORMACIÓN RELEVANTE QUE SIRVA PARA LAS CAMPAÑAS DE
MARKETING Y LAS PREVISIONES DE VENTAS. MEDIANTE MODELOS DE DATOS MÁS PRECISOS, LAS EMPRESAS DE
VENTA MINORISTA PUEDEN OPTIMIZAR LAS VENTAS Y LA LOGÍSTICA Y ASÍ AUMENTAR LA SATISFACCIÓN DE LOS
CLIENTES. POR EJEMPLO, LA MINERÍA DE DATOS PUEDE REVELAR PRODUCTOS POPULARES DE TEMPORADA QUE
PUEDEN SER ALMACENADOS CON ANTELACIÓN PARA EVITAR LA ESCASEZ DE ÚLTIMA HORA.
¿CÓMO FUNCIONA LA MINERÍA DE DATOS?
EL PROCESO ESTÁNDAR INTERINDUSTRIAL PARA LA MINERÍA DE DATOS (CRISP-DM) ES UNA
EXCELENTE GUÍA PARA INICIAR EL PROCESO DE MINERÍA DE DATOS. CRISP-DM ES TANTO UNA
METODOLOGÍA COMO UN MODELO DE PROCESO QUE ES NEUTRAL EN CUANTO AL SECTOR,
LA HERRAMIENTA Y LA APLICACIÓN.
• COMO METODOLOGÍA, DESCRIBE LAS FASES TÍPICAS DE UN PROYECTO DE MINERÍA DE
DATOS, INDICA LAS TAREAS IMPLICADAS EN CADA ETAPA Y EXPLICA LAS RELACIONES
ENTRE ESTAS TAREAS.
• COMO MODELO DE PROCESO, CRISP-DM PROPORCIONA INFORMACIÓN GENERAL SOBRE EL
CICLO DE VIDA DE LA MINERÍA DE DATOS.
¿CUÁLES SON LAS SEIS FASES DEL PROCESO DE MINERÍA
DE DATOS?
• DEFINICIÓN DEL PROBLEMA: SE IDENTIFICAN LOS OBJETIVOS DEL ANÁLISIS, LOS DATOS
NECESARIOS Y EL PROBLEMA ESPECÍFICO QUE SE QUIERE RESOLVER MEDIANTE MINERÍA DE
DATOS. ESTO AYUDA A GUIAR EL PROCESO Y DEFINIR QUÉ RESULTADOS SE CONSIDERAN ÚTILES.
• RECOPILACIÓN Y SELECCIÓN DE DATOS: EN ESTA FASE SE RECOPILAN Y SELECCIONAN LOS
DATOS NECESARIOS PARA EL ANÁLISIS. ES IMPORTANTE ASEGURARSE DE QUE LOS DATOS SEAN
RELEVANTES Y REPRESENTATIVOS DEL PROBLEMA A RESOLVER.
• LIMPIEZA Y PREPROCESAMIENTO DE LOS DATOS: AQUÍ SE ELIMINAN LOS DATOS FALTANTES O
INCONSISTENTES, Y SE TRANSFORMAN LOS DATOS EN UN FORMATO ADECUADO PARA EL
ANÁLISIS. ES UNA DE LAS FASES MÁS IMPORTANTES, YA QUE LA CALIDAD DE LOS DATOS AFECTA
DIRECTAMENTE LA PRECISIÓN DEL MODELO.
• TRANSFORMACIÓN DE LOS DATOS: SE SELECCIONAN VARIABLES CLAVE Y, SI ES
NECESARIO, SE APLICAN TÉCNICAS DE REDUCCIÓN DE DIMENSIONALIDAD O
AGREGACIÓN DE DATOS PARA MEJORAR LA EFICIENCIA Y PRECISIÓN DEL ANÁLISIS.
• MODELADO: SE ELIGEN Y APLICAN ALGORITMOS DE MINERÍA DE DATOS PARA
IDENTIFICAR PATRONES Y RELACIONES EN LOS DATOS. ESTA FASE INCLUYE
TÉCNICAS COMO LA CLASIFICACIÓN, REGRESIÓN, CLUSTERING, O ANÁLISIS DE
ASOCIACIONES, DEPENDIENDO DEL PROBLEMA A RESOLVER.
• EVALUACIÓN E INTERPRETACIÓN: SE EVALÚAN LOS RESULTADOS OBTENIDOS PARA
DETERMINAR SI EL MODELO GENERADO ES ADECUADO Y CUMPLE CON LOS
OBJETIVOS ESTABLECIDOS EN LA PRIMERA FASE. SE INTERPRETAN LOS PATRONES
DESCUBIERTOS PARA EXTRAER CONCLUSIONES Y CONOCIMIENTOS VALIOSOS.
¿QUÉ TÉCNICAS DE MINERÍA DE DATOS
EXISTEN?
1. CLASIFICACIÓN
• OBJETIVO: ASIGNAR ELEMENTOS A CATEGORÍAS PREDEFINIDAS BASADAS EN ATRIBUTOS DE LOS DATOS.
• MÉTODOS: ALGORITMOS COMO ÁRBOLES DE DECISIÓN, REDES NEURONALES, MÁQUINAS DE SOPORTE
VECTORIAL (SVM) Y K-VECINOS MÁS CERCANOS (K-NN).
• APLICACIONES: DIAGNÓSTICO MÉDICO, ANÁLISIS DE CRÉDITO, DETECCIÓN DE SPAM.
2. REGRESIÓN
• OBJETIVO: PREDECIR VALORES CONTINUOS DE VARIABLES OBJETIVO BASÁNDOSE EN RELACIONES ENTRE
VARIABLES INDEPENDIENTES Y DEPENDIENTES.
• MÉTODOS: REGRESIÓN LINEAL, REGRESIÓN LOGÍSTICA, REGRESIÓN POLINOMIAL.
• APLICACIONES: PREDICCIÓN DE PRECIOS, DEMANDA DE PRODUCTOS, ANÁLISIS FINANCIERO.
3. AGRUPAMIENTO (CLUSTERING)
• OBJETIVO: AGRUPAR ELEMENTOS SIMILARES EN CLÚSTERES SIN CONOCER
PREVIAMENTE LAS ETIQUETAS DE CLASE.
• MÉTODOS: ALGORITMO K-MEANS, DBSCAN, JERÁRQUICO.
• APLICACIONES: SEGMENTACIÓN DE CLIENTES, ANÁLISIS DE COMPORTAMIENTO
DE USUARIOS.
4. DETECCIÓN DE ASOCIACIONES
OBJETIVO: IDENTIFICAR RELACIONES ENTRE ELEMENTOS EN GRANDES
CONJUNTOS DE DATOS.
MÉTODOS: ALGORITMO APRIORI, FP-GROWTH.
APLICACIONES: CESTAS DE COMPRA EN SUPERMERCADOS (REGLAS DE
ASOCIACIÓN), RECOMENDACIONES DE PRODUCTOS.
¿QUÉ TIPOS DE MINERÍA DE DATOS
EXISTEN?
• MINERÍA DE PROCESOS
LA MINERÍA DE PROCESOS ES UNA RAMA DE LA MINERÍA DE DATOS CUYO OBJETIVO ES DETECTAR,
SUPERVISAR Y MEJORAR LOS PROCESOS EMPRESARIALES. EXTRAE CONOCIMIENTOS DE LOS
REGISTROS DE EVENTOS QUE SE ENCUENTRAN EN LOS SISTEMAS DE INFORMACIÓN. AYUDA A LAS
ORGANIZACIONES A VER Y COMPRENDER LO QUE OCURRE EN ESTOS PROCESOS DÍA A DÍA.
• MINERÍA DE TEXTOS
LA MINERÍA DE TEXTOS O MINERÍA DE DATOS DE TEXTOS CONSISTE EN UTILIZAR UN SOFTWARE DE
MINERÍA DE DATOS PARA LEER Y COMPRENDER UN TEXTO. LOS CIENTÍFICOS DE DATOS UTILIZAN LA
MINERÍA DE TEXTOS PARA AUTOMATIZAR EL DESCUBRIMIENTO DE CONOCIMIENTOS EN RECURSOS
ESCRITOS, COMO PÁGINAS WEB, LIBROS, CORREOS ELECTRÓNICOS, RESEÑAS Y ARTÍCULOS.
• MINERÍA PREDICTIVA
LA MINERÍA DE DATOS PREDICTIVA UTILIZA LA INTELIGENCIA EMPRESARIAL
PARA PREDECIR TENDENCIAS. AYUDA A LOS LÍDERES EMPRESARIALES A
ESTUDIAR EL IMPACTO QUE TIENEN SUS DECISIONES EN EL FUTURO DE LA
EMPRESA Y A ELEGIR LAS OPCIONES MÁS EFICACES.
REFERENCIAS
• AWS (2024) ¿QUÉ ES LA MINERIA DE DATOS?, RECUPERADO DE
HTTPS://[Link]/ES/WHAT-IS/DATA-MINING/
• SAP (2024) ¿QUÉ ES LA MINERIA DE DATOS?, RECUPERADO DE
HTTPS://[Link]/LATINAMERICA/PRODUCTS/TECHNOLOGY-PLATFORM/
HANA/[Link]
• IBM (2024) ¿QUÉ ES LA MINERIA DE DATOS?, RECUPERADO DE
HTTPS://[Link]/MX-ES/TOPICS/DATA-MINING