¿Por qué consideras que CRISP-DM se ha convertido en la metodología más utilizado en Data Mining?
[ CITATION CRI19 \l 10250 ] CRISP-DM es el estándar de minería de datos más ampliamente utilizado
que divide el ciclo de vida de un ejercicio de minería de datos en seis fases diferentes. También define
las tareas que se llevarán a cabo en cada fase y el resultado esperado. El siguiente paso depende del
resultado del paso anterior, le permite volver a él y es menos rígido que un modelo de cascada
tradicional utilizado en el desarrollo de software (Sharma et al., 2017). Como lo definen Daihani y
Feblian (2016) es la estandarización del proceso de minería de datos como una estrategia general de
resolución de problemas del negocio o unidad de estudio.
¿En qué consiste el proceso Knowledge Discovery in Databases o KDD?
[ CITATION Jav16 \l 10250 ] Es un proceso metodológico para encontrar un “modelo” válido, útil y
entendible que describa patrones de acuerdo a la información, y como modelo entendemos que es la
representación que intenta explicar ese patrón en los datos.
Abstracción del escenario
Selección de los datos
Limpieza y pre-procesamiento
Transformación de los datos
Selección de la apropiada tarea de Minería de Datos
Elección del algoritmo de Minería de Datos
Evaluación
Aplicación
¿Bajo qué contexto, consideras más adecuado el uso de la metodología SEMMA?
[ CITATION Jor19 \l 10250 ] Bajo el contexto donde aplican técnicas estadísticas de exploración y
visualización, donde se seleccionan y transforman variables, se modela con las variables para predecir
los y se evalúa la exactitud del modelo.
Muestreo de los datos
Exploración de datos
Modificación de datos
Modelado de datos
Evaluación de datos
Trabajos citados
Landa, J. (19 de 02 de 2016). ¿Qué es KDD y Minería de Datos? Obtenido de fcojlanda:
http://fcojlanda.me/es/ciencia-de-los-datos/kdd-y-mineria-de-datos-espanol/
MURCIA, C. D. (1 de Febrero de 2019). MODELO BASADO EN CRISP-DM EXTENDIDO MEDIANTE
PRÁCTICAS DE METODOLOGÍAS ÁGILES PARA PROYECTOS MEDIANOS DE ANALÍTICA DE DATOS.
Obtenido de repository Udem:
https://repository.udem.edu.co/bitstream/handle/11407/6341/T_MIS_398.pdf?
sequence=2&isAllowed=y
Romero, J. (11 de Junio de 2019). Metodologías de Minería de Datos. Obtenido de jorgeromero.net:
https://jorgeromero.net/metodologias-de-mineria-de-datos/