0% encontró este documento útil (0 votos)

128 vistas3 páginas

Técnicas de Minería de Datos

Este documento describe diferentes modelos de minería de datos, incluyendo modelos descriptivos como OLAP y clustering que buscan patrones en los datos, y modelos predictivos como series de tiempo y regresión que utilizan variables para predecir valores futuros. También explica métodos como clustering, clasificación, análisis factorial, regresión, descubrimiento de secuencias y asociación.

Cargado por

Andres Roberto Solano Ricaurte

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

128 vistas3 páginas

Técnicas de Minería de Datos

Cargado por

Andres Roberto Solano Ricaurte

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Taller

Andres Roberto Solano Ricaurte

Cod: 1201597

Modelos de Minería de Datos

Descriptivas

Buscar patrones humano-interpretables que describen datos.

● OLAP (visualización)
● “Clustering”
● Métodos factoriales como ACP, AFC.

Predictivas

Utilizan algunas variables para predecir valores futuros desconocidos de la misma variable o
bien de otras variables.

● Series de Tiempo
● Análisis de Discriminante
● Regresión
● Árboles de Decisión

“Clustering” : (Clasificación no supervisada, aprendizaje no supervisado): Es similar a la

clasificación, excepto que los grupos no son predefinidos. El objetivo es participar o
segmentar un conjunto de datos o individuos en grupos que pueden ser disjuntos o no. Los
grupos se forman basados en la similaridad de los datos o individuos en ciertas variables.
Como los grupos no son dados a priori el experto debe dar una interpretación de los grupos
que forman.

Métodos:
● Clasificación Jerárquica (grupos disjuntos)
● Nubes Dinámicas (grupos disjuntos)
● Clasificación Piramidal (grupos No disjuntos )

Clasificación (discriminación): Mapea o asocia datos a grupos predefinidos (aprendizaje

supervisado)
● encuentra modelos (funciones) que describen y distinguen clases o conceptos para
predicciones.
● Ejemplos: Credit Scoring
● Métodos: Análisis discriminante, decision-tree, classification rule, neural network

Descubrimiento de Factores(Análisis Factorial)

El análisis factorial es un nombre genérico que se da una clase de métodos multivariantes
cuyo propósito principal es encontrar la estructura subyacente en una tabla de
datos(factores ocultos).
Aborda el problema de cómo analizar la estructura de la interrelaciones (correlaciones)
entre un gran número de variables con la definición de una serie de dimensiones
subyacentes comunes, conocidas como factores.

Métodos:
-Análisis de componentes principales(ACP)
-Análisis Factorial de Correspondencias simples y múltiples (AFC)
-Análisis Canónico (AC)
-Análisis Discriminante

Regresión

Se usa una regresión para predecir los valores ausentes de una variable basándose en su
relación con otras variables de conjunto de datos.

Entre ellas podemos destacar: regresión lineal, no lineal, logística, logarítmica, univariada,
multivariada entre otras.

Descubrimiento de secuencias:

“Sequential Analysis” es usado para descubrir secuencia de patrones en los datos, estos
patrones son similares a los encontrados con reglas de asociación pero tales relaciones son
basadas en el tiempo.

Métodos:
● Redes Neuronales
● Series de tiempo

Series de Tiempo: Una serie de tiempo corresponde a un conjunto de observaciones

hechas respecto a una variable en momento equidistantes en el tiempo, pasos:

1. X t : Serie de tiempo
2. Corregir errores sistemáticos
3. Transformaciones matemáticas
4. X t = Tendencia + Estacionalidad + Ciclos + E t
5. Para E t (si no es un ruido blanco)
1. Elegir el modelo (Box- Jenkings)
1. ARMA(p,q)(AutoRegressive Moving Average)
2. ARIMA(p,d,q)(AutoRegressive-Integrated Moving Average)
2. Estimar costos
[Link]ósticos
Sumarización
● los métodos de sumarización asigna los datos a conjuntos (individuos de segundo
orden) que tiene asociadas descripciones.
● Estos métodos permiten extraer o derivar datos representativos de una base de
datos
● permite el análisis de conceptos

Métodos
● Análisis de datos simbólicos
● Lógica difusa
● Interval Analysis

Asociacion de Análisis de Afinidad

Conocido como “Link Analysis” se refiere a encontrar relaciones no evidentes en los datos

Métodos
● Reglas de asociación (Association Rules)
● Análisis de Correlación y de Causalidad

Bibliografía

Minería de Datos - Oldemar Rodriguez

[Link]
onceptos_B%C3%[Link]

Tecnicas de mineria de datos-

[Link]

También podría gustarte

Fases Clave en Minería de Datos
Aún no hay calificaciones
Fases Clave en Minería de Datos
10 páginas
Gestión de Residuos en Bio Bio Recicla
Aún no hay calificaciones
Gestión de Residuos en Bio Bio Recicla
24 páginas
Silabo Sistemas de Informacion
Aún no hay calificaciones
Silabo Sistemas de Informacion
4 páginas
Sintaxis de Python en Windows Portable
Aún no hay calificaciones
Sintaxis de Python en Windows Portable
56 páginas
ARTICULO. Analíticas & Big Data
Aún no hay calificaciones
ARTICULO. Analíticas & Big Data
5 páginas
El Arte del Análisis de Datos
Aún no hay calificaciones
El Arte del Análisis de Datos
30 páginas
Sys ML
Aún no hay calificaciones
Sys ML
19 páginas
Como Aumentar La Productividad
Aún no hay calificaciones
Como Aumentar La Productividad
3 páginas
Desarrollo Adaptativo de Software
Aún no hay calificaciones
Desarrollo Adaptativo de Software
13 páginas
Análisis de Datos: Descriptivo, Predictivo y Prescriptivo
Aún no hay calificaciones
Análisis de Datos: Descriptivo, Predictivo y Prescriptivo
9 páginas
Particiones Fijas y Variables 2
Aún no hay calificaciones
Particiones Fijas y Variables 2
27 páginas
Flujo de Caja
Aún no hay calificaciones
Flujo de Caja
12 páginas
Mineria de Datos
Aún no hay calificaciones
Mineria de Datos
30 páginas
Diagramas de Flujo de Datos (Analisis1)
Aún no hay calificaciones
Diagramas de Flujo de Datos (Analisis1)
18 páginas
3 Recyclaje - Recycla Chile
Aún no hay calificaciones
3 Recyclaje - Recycla Chile
5 páginas
Listas en C++: Pilas y Colas
100% (1)
Listas en C++: Pilas y Colas
21 páginas
Ciclo de Vida del Análisis de Big Data
Aún no hay calificaciones
Ciclo de Vida del Análisis de Big Data
18 páginas
Informe Financiero Ejemplo Tarea
Aún no hay calificaciones
Informe Financiero Ejemplo Tarea
19 páginas
Carlostruji85 - PPT Eje Tematico 3
Aún no hay calificaciones
Carlostruji85 - PPT Eje Tematico 3
22 páginas
Estructuras de Repetición
Aún no hay calificaciones
Estructuras de Repetición
12 páginas
Caso de Empresa de I+D+i
Aún no hay calificaciones
Caso de Empresa de I+D+i
28 páginas
Herramientas Clave para Análisis de Datos
Aún no hay calificaciones
Herramientas Clave para Análisis de Datos
5 páginas
Metodologías Ágiles: Scrum y XP
Aún no hay calificaciones
Metodologías Ágiles: Scrum y XP
31 páginas
Gestión de Proyectos SCRUM (J. Palacio) PDF
Aún no hay calificaciones
Gestión de Proyectos SCRUM (J. Palacio) PDF
98 páginas
Planteamiento Del Problema
Aún no hay calificaciones
Planteamiento Del Problema
42 páginas
Distribución de Planta para Contenedores
Aún no hay calificaciones
Distribución de Planta para Contenedores
23 páginas
Técnicas y Aplicaciones de Minería de Datos
Aún no hay calificaciones
Técnicas y Aplicaciones de Minería de Datos
5 páginas
Metodologías de Gestión del Conocimiento
Aún no hay calificaciones
Metodologías de Gestión del Conocimiento
5 páginas
Introducción al Data Mining
Aún no hay calificaciones
Introducción al Data Mining
35 páginas
Sílabo Informática Básica Univ. Boyacá
Aún no hay calificaciones
Sílabo Informática Básica Univ. Boyacá
5 páginas
Silabo de Inteligencia de Negocios UTP
100% (1)
Silabo de Inteligencia de Negocios UTP
4 páginas
Modelos Matemáticos y TIC en Ingeniería
Aún no hay calificaciones
Modelos Matemáticos y TIC en Ingeniería
9 páginas
Planeación Estratégica en Empresas
100% (1)
Planeación Estratégica en Empresas
10 páginas
Acta de Constitución Del Proyecto
Aún no hay calificaciones
Acta de Constitución Del Proyecto
10 páginas
Fundamentos Del Análisis de Datos para Toma de Decisiones - AFR
Aún no hay calificaciones
Fundamentos Del Análisis de Datos para Toma de Decisiones - AFR
10 páginas
Algoritmia I: Fundamentos y Estructuras
Aún no hay calificaciones
Algoritmia I: Fundamentos y Estructuras
6 páginas
U2 - Act Integradora - Gestión de La Integración y Gestión de Alcance
Aún no hay calificaciones
U2 - Act Integradora - Gestión de La Integración y Gestión de Alcance
21 páginas
Reingeniería
Aún no hay calificaciones
Reingeniería
17 páginas
Manual ISO 9001 para Empresas
Aún no hay calificaciones
Manual ISO 9001 para Empresas
21 páginas
Inteligencia Artificial Aplicada en Los Negocios Gabriel Ramos Segovia Pa Final
Aún no hay calificaciones
Inteligencia Artificial Aplicada en Los Negocios Gabriel Ramos Segovia Pa Final
12 páginas
Pilas y Colas
Aún no hay calificaciones
Pilas y Colas
12 páginas
Actividades de Word Empresas
Aún no hay calificaciones
Actividades de Word Empresas
9 páginas
Proceso KDD
Aún no hay calificaciones
Proceso KDD
15 páginas
Análisis de Datos Cualitativos
Aún no hay calificaciones
Análisis de Datos Cualitativos
12 páginas
Ordenamiento Radix: Método y Aplicaciones
Aún no hay calificaciones
Ordenamiento Radix: Método y Aplicaciones
14 páginas
Evolución y Tipos de Bases de Datos
50% (2)
Evolución y Tipos de Bases de Datos
32 páginas
09 - Bucles o Ciclos en Python
100% (1)
09 - Bucles o Ciclos en Python
34 páginas
Taller de Programacion-Programas de Módulo-Técnico en Programación y Análisis de Sistemas - 2020-II°Semestre
Aún no hay calificaciones
Taller de Programacion-Programas de Módulo-Técnico en Programación y Análisis de Sistemas - 2020-II°Semestre
34 páginas
Metodologia para La Solucion de Problemas
Aún no hay calificaciones
Metodologia para La Solucion de Problemas
11 páginas
Taller SQL y Power BI para Coderhouse
Aún no hay calificaciones
Taller SQL y Power BI para Coderhouse
25 páginas
Algoritmos de Búsqueda No Informada (Ciega)
Aún no hay calificaciones
Algoritmos de Búsqueda No Informada (Ciega)
10 páginas
Analisis de Sensibilidad
Aún no hay calificaciones
Analisis de Sensibilidad
9 páginas
Listas en C++
Aún no hay calificaciones
Listas en C++
14 páginas
Investigacion 8ds
Aún no hay calificaciones
Investigacion 8ds
11 páginas
Escenarios de Planeación
Aún no hay calificaciones
Escenarios de Planeación
9 páginas
Tareas Metodos Algoritmos Datascience
Aún no hay calificaciones
Tareas Metodos Algoritmos Datascience
4 páginas
(09-1) Base de Datos Avanzada - Clase
Aún no hay calificaciones
(09-1) Base de Datos Avanzada - Clase
24 páginas
3 - Mineria de Datos
Aún no hay calificaciones
3 - Mineria de Datos
116 páginas
Introducción a la Minería de Datos
Aún no hay calificaciones
Introducción a la Minería de Datos
19 páginas
Data Mining
Aún no hay calificaciones
Data Mining
5 páginas
Ga Some Tria
Aún no hay calificaciones
Ga Some Tria
13 páginas
Examen Bloque 3 - Funciones
Aún no hay calificaciones
Examen Bloque 3 - Funciones
3 páginas
Aceite Festo
Aún no hay calificaciones
Aceite Festo
5 páginas
Toldos Armados Tunali Tec: Guía Completa
Aún no hay calificaciones
Toldos Armados Tunali Tec: Guía Completa
12 páginas
Cantidades o Magnitudes Escalares Informe Lab de Fisica
Aún no hay calificaciones
Cantidades o Magnitudes Escalares Informe Lab de Fisica
6 páginas
Optimización de la Combustión Eficiente
Aún no hay calificaciones
Optimización de la Combustión Eficiente
11 páginas
Programación Lineal en Economía
Aún no hay calificaciones
Programación Lineal en Economía
27 páginas
CONUNAB12100202220
Aún no hay calificaciones
CONUNAB12100202220
6 páginas
Manual Completo de Acordes para Guitarra
100% (2)
Manual Completo de Acordes para Guitarra
175 páginas
Pensum Electronica
Aún no hay calificaciones
Pensum Electronica
1 página
P1-Dis3 Ch3.2.3.4 Lab
Aún no hay calificaciones
P1-Dis3 Ch3.2.3.4 Lab
6 páginas
Los 5 Conceptos Básicos de Iluminación para Usar Dialux - SEED Studio
Aún no hay calificaciones
Los 5 Conceptos Básicos de Iluminación para Usar Dialux - SEED Studio
5 páginas
Dexametasona Fosfato Sódico Inyectable
Aún no hay calificaciones
Dexametasona Fosfato Sódico Inyectable
2 páginas
Ejercicios No 8 Interes Simple y Compuesto
Aún no hay calificaciones
Ejercicios No 8 Interes Simple y Compuesto
4 páginas
Curso Oracle Tema-6
Aún no hay calificaciones
Curso Oracle Tema-6
24 páginas
Circuito RLC en Serie
Aún no hay calificaciones
Circuito RLC en Serie
13 páginas
Actividades - Conecta Empleo
Aún no hay calificaciones
Actividades - Conecta Empleo
6 páginas
Fórmulas en Tablas de Word 2016
Aún no hay calificaciones
Fórmulas en Tablas de Word 2016
12 páginas
Dante Certification Level 1 2a Edicion Es
Aún no hay calificaciones
Dante Certification Level 1 2a Edicion Es
152 páginas
Cálculos de Interés Compuesto y Tasas
Aún no hay calificaciones
Cálculos de Interés Compuesto y Tasas
3 páginas
Ecuaciones e Inecuaciones con Módulo
100% (2)
Ecuaciones e Inecuaciones con Módulo
21 páginas
Termodinamica Lavado Soto 2010 II Sexto Ciclo
Aún no hay calificaciones
Termodinamica Lavado Soto 2010 II Sexto Ciclo
4 páginas
Indice de Margalef - Ejemplo de Taller
Aún no hay calificaciones
Indice de Margalef - Ejemplo de Taller
3 páginas
p2 - Raz Matematico-1
Aún no hay calificaciones
p2 - Raz Matematico-1
4 páginas
Microeconomia Polleria EL POLLON
100% (1)
Microeconomia Polleria EL POLLON
23 páginas
Principios de Propulsión de Trenes Maglev
Aún no hay calificaciones
Principios de Propulsión de Trenes Maglev
6 páginas
Codigo Malicioso PDF
Aún no hay calificaciones
Codigo Malicioso PDF
2 páginas
La Metafora Ensayos Transdisciplinares PDF
Aún no hay calificaciones
La Metafora Ensayos Transdisciplinares PDF
332 páginas
Plantas Vapor Santy
100% (1)
Plantas Vapor Santy
16 páginas
Práctica C++: Estructura Hacer Mientras
Aún no hay calificaciones
Práctica C++: Estructura Hacer Mientras
2 páginas

Técnicas de Minería de Datos

Cargado por

Técnicas de Minería de Datos

Cargado por

Taller

Andres Roberto Solano Ricaurte

Modelos de Minería de Datos

Buscar patrones humano-interpretables que describen datos.

“Clustering” ​: (Clasificación no supervisada, aprendizaje no supervisado): Es similar a la

Clasificación​ (discriminación): Mapea o asocia datos a grupos predefinidos (aprendizaje

Descubrimiento de Factores(Análisis Factorial)

Series de Tiempo: Una serie de tiempo corresponde a un conjunto de observaciones

Asociacion de Análisis de Afinidad

Minería de Datos - Oldemar Rodriguez

Tecnicas de mineria de datos-

También podría gustarte

“Clustering” : (Clasificación no supervisada, aprendizaje no supervisado): Es similar a la

Clasificación (discriminación): Mapea o asocia datos a grupos predefinidos (aprendizaje