1) KDD (Knowledge Discovery in Databases)
El Descubrimiento de conocimiento en bases de datos (KDD, del
inglés Knowledge Discovery in Databases) es básicamente
un proceso automático en el que se combinan descubrimiento y
análisis. El proceso consiste en extraer patrones en forma de
reglas o funciones, a partir de los datos, para que el usuario los
analice.
2) SEMMA (Sample, Explore, Modify, Model and Access)
Lametodologia semma se enfoca en la parte técnica de los datos deja del aldo el análisis de la probelmatica de
l negocio tiene 5 fases
La metodología SEMMA (Sample, Explore, Modify, Model, Assess) fue propuesta por SAS Institute,
el cual la define como el proceso de selección, exploración y modelado aplicado a cantidades
significativas de datos al- macenados que permitan el descubrimiento de patrones como
herramientas de apoyo para el negocio.
1 muestreo
2 exploracion
3 modificacion
4 modelado
5 valoraxion
CRISP-DM: una metodología para minería
de datos en salud
Data mining / Por Juan Francisco Vallalta Rueda
Me gustan las metodologías. Aunque no te aseguran el éxito, te guían
por el camino que debes transitar para ejecutar un proyecto con mayor
probabilidad de éxito.
En el ámbito de la minería de datos, la metodología CRISP-DM (Cross
Industry Standard Process for Data Mining) se ha convertido en un
estándar de factor del mercado. Surgida en dos empresas que han sido
pioneras en la aplicación de minería de datos a los procesos de
negocio: DaimlerChrysler y SPSS.
La metodología CRISP-DM establece un proyecto de minería de datos
como una secuencia de fases:
1. Comprensión del negocio.
2. Compresión de los datos.
3. Preparación de los datos.
4. Modelado.
5. Evaluación.
6. Despliegue.
En este post vamos a revisar las fases en la que se estructura un
proyecto de minería de datos en salud tomando como referencia
CRISP-DM.