0% encontró este documento útil (0 votos)

146 vistas92 páginas

Clustering

Este documento trata sobre los fundamentos del clustering o agrupamiento de datos. Explica brevemente diferentes métodos de clustering como k-means, jerárquicos y basados en densidad. También describe conceptos clave como similitud, medidas de distancia y validación de clusters. El objetivo general del clustering es agrupar objetos similares minimizando la distancia intra-cluster e maximizando la distancia inter-cluster.

Cargado por

afsdhfkhsjdf

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PPT, PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

146 vistas92 páginas

Clustering

Cargado por

afsdhfkhsjdf

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PPT, PDF, TXT o lee en línea desde Scribd

Fundamentos de Minera de Datos

Clustering
Fernando Berzal
[email protected]
http://elvex.ugr.es/idbis/dm/
Intelligent Databases and Information Systems research group

Department of Computer Science and Artificial Intelligence

E.T.S Ingeniera Informtica Universidad de Granada (Spain)

Clustering
Introduccin
Similitud
Mtodos
K-Means
Jerrquicos
Densidad
Otros
Subspace
clustering
Validacin
Bibliografa

Sinnimos segn el contexto

Clustering (IA)

Aprendizaje no supervisado (IA)

Clasificacin (Estadstica)

Ordenacin (Psicologa)

Segmentacin (Marketing)

Clustering
Introduccin
Similitud
Mtodos
K-Means
Jerrquicos
Densidad
Otros
Subspace
clustering
Validacin
Bibliografa

Objetivo
Agrupar objetos similares entre s que sean
distintos a los objetos de otros agrupamientos
[clusters].
Aprendizaje no supervisado
No existen clases predefinidas
Los resultados obtenidos dependern de:

El algoritmo de agrupamiento seleccionado.

El conjunto de datos disponible

La medida de similitud utilizada para

3
comparar objetos.

Clustering
Encontrar agrupamientos de tal forma que los
objetos de un grupo sean similares entre s y
diferentes de los objetos de otros grupos:

Minimizar
distancia
intra-cluster

Maximizar
distancia
intercluster

Clustering
Aplicaciones

Reconocimiento de formas.
Mapas temticos (GIS)
Marketing: Segmentacin de clientes
Clasificacin de documentos
Anlisis de web logs (patrones de acceso
similares)

Aplicaciones tpicas en Data Mining:

Exploracin de datos (segmentacin & outliers)

Preprocesamiento (p.ej. reduccin de datos)

Clustering
Cul es la forma natural de agrupar los
personajes?

Hombres
vs.
Mujeres

Clustering
Cul es la forma natural de agrupar los
personajes?

Simpsons
vs.
Empleados
de la escuela
de Springfield

Clustering
Cul es la forma natural de agrupar los
personajes?

El clustering es subjetivo !!!

Medidas de similitud

Peter Pedro

342.7

0.23
3

Medidas de similitud
Usualmente, se expresan en trminos de
distancias:
d(i,j) > d(i,k)
nos indica que el objeto i es ms parecido a k que
aj

La definicin de la mtrica de similitud/distancia

ser distinta en funcin del tipo de dato y
de la interpretacin semntica que nosotros
hagamos.
En otras palabras, la similitud entre objetos10
es

Medidas de similitud

Cuntos
agrupamiento
s?

Seis?

Dos?

Cuatro?

Medidas de similitud
Atributos continuos
Usualmente, se estandarizan a priori:

Desviacin absoluta media:

s f 1n (| x1 f m f | | x2 f m f | ... | xnf m f |)

m f 1n (x1 f x2 f

...

xnf )

z-score (medida estandarizada):

xif m f
zif
sf

Medidas de similitud
Mtricas de distancia
Distancia de Minkowski

Distancia de Manhattan (r=1) / city block /

taxicab

Distancia eucldea (r=2):

Distancia de Chebyshev (r) / dominio /

chessboard

Medidas de similitud
Mtricas de distancia
Distancia de Minkowski

Distancia de Manhattan = 12
Distancia Eucldea 8.5
Distancia de Chebyshev = 6

Medidas de similitud
Mtricas de distancia
Distancia de Minkowski d(i,j) 0

Propiedad reflexiva

Propiedad simtrica

Desigualdad triangular

d(i,i) = 0
d(i,j) = d(j,i)
d(i,j) d(i,k)+d(k,j)

Medidas de similitud
Mtricas de distancia
Distancia de Chebyshev

Tambin conocida
como distancia de
tablero de ajedrez
(chessboard distance):
Nmero de
movimientos
que el rey ha de hacer
para llegar de una
casilla a otra en un
tablero de ajedrez.

Medidas de similitud
Mtricas de distancia
Distancia de Mahalanobis

Considera las
correlaciones
entre variables.
No depende de la
escala de medida.

Medidas de similitud
Mtricas de distancia
Distancia de edicin = Distancia de
Levenshtein
Nmero de operaciones necesario
para transformar una cadena en otra.
d(data mining, data minino) = 1
d(efecto, defecto) = 1
d(poda, boda) = 1
d(night,natch) = d(natch,noche) =
3
Aplicaciones:
Aplicaciones Correctores ortogrficos,
19
reconocimiento de voz, deteccin de plagios,

Medidas de similitud
Mtricas de distancia
Vecinos compartidos
i

Mutual Neighbor Distance

donde NN(xi,xj) es el nmero de vecino

de xj con respecto a xi

Medidas de similitud
Medidas de correlacin
Producto escalar

Cosine similarity

Coeficiente de Tanimoto

Medidas de similitud
Modelos basados en Teora de
Conjuntos
Modelo de Tversky

Modelo de Restle

Interseccin

Medidas de similitud
Modelos basados en Teora de
Conjuntos
Modelo proporcional

Modelo de Gregson = Coeficiente de Jaccard

Distancia de Tanimoto

Mtodos de agrupamiento
Requisitos del algoritmo perfecto

Escalabilidad
Manejo de distintos tipos de datos
Identificacin de clusters con formas arbitrarias
Nmero mnimo de parmetros
Tolerancia frente a ruido y outliers
Independencia con respecto al orden de
presentacin de los patrones de entrenamiento
Posibilidad de trabajar en espacios con muchas
dimensiones diferentes
Capacidad de incorporar restricciones
especificadas por el usuario (domain
knowledge)
26
Interpretabilidad / Usabilidad

Mtodos de agrupamiento
Tipos de algoritmos de clustering

Agrupamiento por particiones

k-Means, CLARANS
Clustering jerrquico
BIRCH, ROCK, CHAMELEON
Mtodos basados en densidad
DBSCAN

Mtodos de agrupamiento
Clustering por particiones

Datos originales

Datos agrupados

Mtodos de agrupamiento
Clustering jerrquico
p1

p3 p4
p2

p1 p2
Tradicional

p3 p4

DENDOGRAMA

p1
p3

p1 p2
No tradicional

p3 p4

Mtodos de agrupamiento
Mtodos basados en densidad

Un cluster en una regin densa de puntos,

separada por regiones poco densas de otras
regiones densas.
tiles cuando los clusters tienen formas
irregulares, estn entrelazados o hay ruido/outliers
en los datos.

k-Means
Algoritmo de agrupamiento por particiones
(MacQueen, 1967)

Nmero de clusters conocido (k)

Cada cluster tiene asociado un centroide
(centro geomtrico del cluster).
Los puntos se asignan al cluster cuyo centroide
est ms cerca (utilizando cualquier mtrica de
distancia).
Iterativamente, se van actualizando los centroides
en funcin de las asignaciones de puntos a
clusters, hasta que los centroides dejen de
cambiar.
Complejidad O(n*k*I*d)
donde n es el nmero de datos, k el nmero de

k-Means
Iteration 6
1
2
3
4
5

3
2.5
2

1.5
1
0.5
0

-2

-1.5

-1

-0.5

0.5

1.5

k-Means
Iteration 1

Iteration 2

1.5

2.5

0.5

-2

-1.5

-1

-0.5

0.5

1.5

-2

Iteration 4

-1.5

-1

-0.5

0.5

1.5

-2

Iteration 5

1.5

0.5

-1

-0.5

0.5

1.5

-1

-0.5

0.5

1.5

Iteration 6

2.5

-1.5

2.5

-2

Iteration 3

-2

-1.5

-1

-0.5

0.5

1.5

-2

-1.5

-1

-0.5

0.5

k-Means
Iteration 5
1
2
3
4

3
2.5
2

1.5
1
0.5
0

-2

-1.5

-1

-0.5

0.5

1.5

k-Means
Iteration 1

1.5

2.5

0.5

-2

-1.5

-1

-0.5

0.5

Iteration 3

Iteration 2

1.5

-2

-1.5

-1

Iteration 4

-0.5

1.5

0.5

-1

-0.5

0.5

1.5

Iteration 5

2.5

-1.5

0.5

2.5

-2

-1.5

-1

-0.5

0.5

1.5

-2

-1.5

-1

-0.5

0.5

1.5

k-Means
3
2.5

Puntos originales

1.5
1
0.5
0

-2

-1.5

-1

-0.5

0.5

1.5

2.5

1.5

0.5

-2

-1.5

-1

-0.5

0.5

Solucin ptima

1.5

-2

-1.5

-1

-0.5

ptimo local

0.5

1.5

k-Means
Ejercicio
Agrupar los 8 puntos de la
figura en 3 clusters usando
el algoritmo de las K medias.
Centroides iniciales:
A1, A7 y A8
Mtricas de distancia:

Distancia eucldea

Distancia de Manhattan

Distancia de Chebyshev

k-Means
Ejercicio resuelto
Distancia eucldea

Primera iteracin

Segunda iteracin

k-Means
Ejercicio resuelto
Distancia eucldea

Tercera iteracin
Configuracin final

k-Means
DEMO: K-Means
http://www.elet.polimi.it/upload/matteucc/Clustering/tutorial_html/AppletKM.html

k-Means
Ventaja

Eficiencia O(nkId)
vs. PAM
O(Ik(n-k)2)
CLARA O(ks2+k(n-k))

Desventajas

Termina en un ptimo local:

El resultado depende de la seleccin inicial de
centroides.
Necesidad de conocer el nmero de
agrupamientos k
Incapacidad para detectar ruido / identificar
outliers.
No resulta adecuado para detectar clusters no
convexos

k-Means
Clusters de
distinto tamao

Clusters de
distinta densidad

Clusters
no convexos

k-Means
Variantes

GRASP [Greedy Randomized Adaptive Search

Procedure] para evitar ptimos locales.
k-Modes (Huang1998) utiliza modas en vez de
medias (para poder trabajar con atributos de tipo
categrico).
k-Medoids utiliza medianas en vez de medias
para limitar la influencia de los outliers
vg. PAM (Partitioning Around Medoids, 1987)
CLARA (Clustering LARge Applications, 1990)
44
CLARANS (CLARA + Randomized Search,

k-Means
DEMO: Fuzzy C-Means
http://www.elet.polimi.it/upload/matteucc/Clustering/tutorial_html/AppletFCM.html

Clustering jerrquico

DENDROGRAMA:
DENDROGRAMA La similitud entre dos objetos
viene dada por la altura del nodo comn ms
cercano.

Clustering jerrquico

El DENDROGRAMA nos puede ayudar a determinar

el nmero adecuado de agrupamientos (aunque
47
normalmente no ser tan fcil).

Clustering jerrquico

Outlier

El DENDROGRAMA
tambin nos puede servir para detectar outliers.48

Clustering jerrquico
0

a
b

aglomerativo
(AGNES)
AGglomerative NESting

ab
abcde

cde

e
4

divisivo
(DIANA)
Divisive ANAlysis

En lugar de establecer de antemano el nmero de

clusters, tenemos que definir un criterio de parada

Clustering jerrquico
Cmo medir la distancia entre clusters?

MIN
single-link

MAX
complete
linkage
(diameter)

Clustering jerrquico
Cmo medir la distancia entre clusters?

Promedio

Centroides
p.ej. BIRCH

Clustering jerrquico
Ejercicio
Utilizar un algoritmo aglomerativo de clustering jerrquico para
agrupar los datos descritos por la siguiente matriz de
distancias:

Variantes:

Single-link (mnima distancia entre agrupamientos)

Complete-link (mxima distancia entre agrupamientos)

Clustering jerrquico
Ejercicio resuelto
Single-link

Complete-link

Clustering jerrquico
DEMO: Algoritmo aglomerativo
http://www.elet.polimi.it/upload/matteucc/Clustering/tutorial_html/AppletH.html

Clustering jerrquico
Datos sintticos (4 clusters): Single-link

Clustering jerrquico
Datos sintticos (4 clusters): Complete-link

Clustering jerrquico
Datos sintticos (aleatorios): Single-link

Clustering jerrquico
Datos sintticos (aleatorios): Complete-link

Clustering jerrquico
Principal inconveniente del clustering
jerrquico:

Baja escalabilidad
O(n2)

Algoritmos escalables:

BIRCH: Balanced Iterative Reducing and

Clustering using Hierarchies (Zhang,
Ramakrishnan & Livny, SIGMOD1996)
ROCK: RObust Clustering using linKs
(Guha, Rastogi & Shim, ICDE1999)
CURE: Clustering Using REpresentatives

Clustering jerrquico

CURE

Clustering jerrquico
Agrupamientos
con distintas
densidades

CURE

Clustering jerrquico
Particin del grafo

Clusters finales

CHAMELEON

Combinar
particiones

Clustering jerrquico

CHAMELEON

Density-based Clustering
Criterio de agrupamiento local:

Densidad de puntos
Regin densas de puntos separadas
de otras regiones densas por regiones poco
densas

Caractersticas

Identifica clusters de formas arbitrarias.

Robusto ante la presencia de ruido

Escalable: Un nico recorrido del conjunto de

Density-based Clustering
Algoritmos

DBSCAN: Density Based Spatial Clustering of

Applications with Noise (Ester et al., KDD1996)
OPTICS: Ordering Points To Identify the Clustering
Structure (Ankerst et al. SIGMOD1999)
DENCLUE: DENsity-based CLUstEring
(Hinneburg & Keim, KDD1998)
CLIQUE: Clustering in QUEst
(Agrawal et al., SIGMOD1998)
SNN (Shared Nearest Neighbor) density-based
clustering
65
(Ertz, Steinbach & Kumar, SDM2003)

Density-based Clustering
Ejercicio
Agrupar los 8 puntos
de la figura utilizando
el algoritmo DBSCAN.

Nmero mnimo de puntos

en el vecindario:
MinPts = 2
Radio del vecindario:
Epsilon

Density-based Clustering
Ejercicio resuelto
Distancia eucldea

Density-based Clustering
Ejercicio resuelto

Epsilon =

A1, A2 y A7 no tienen vecinos en su vecindario,

por lo que se consideran outliers (no estn en zonas densas):

Density-based Clustering
Ejercicio resuelto

Epsilon =

Al aumentar el valor del parmetro Epsilon,

el vecindario de los puntos aumenta y todos quedan agrupados:

Density-based Clustering
DEMO: DBSCAN et al.
http://www.cs.ualberta.ca/~yaling/Cluster/Applet/Code/Cluster.html

Density-based Clustering

Clusters

DBSCAN cuando funciona bien

Density-based Clustering

DBSCAN sensible al valor inicial de sus

parmetros

Density-based Clustering

SNN density-based clustering O(n2)

Otros mtodos
Grids multiresolucin

STING, a STatistical INformation Grid approach

(Wang, Yang & Muntz, VLDB1997)
WaveCluster, basado en wavelets
(Sheikholeslami, Chatterjee & Zhang,
VLDB1998)
CLIQUE: CLustering In QUEst
(Agrawal et al., SIGMOD1998)

Otros mtodos
Clustering basado en modelos
Ajustar los datos a un modelo matemtico
Se supone que los datos provienen de la
superposicin de varias distribuciones de
probabilidad.

Algoritmos

Estadstica:
EM [Expectation Maximization], AutoClass
Clustering conceptual (Machine Learning):
COBWEB, CLASSIT
Redes neuronales:
SOM [Self-Organizing Maps]

Otros mtodos
Clustering con restricciones
p.ej. Clustering con obstculos

Posibles aplicaciones:
Distribucin de cajeros
automticos/supermercados

Subspace clustering
La dimensionalidad de los datos
Por qu es un problema?

Los datos en una dimensin estn

relativamente cerca
Al aadir una nueva dimensin, los datos se
alejan.
Cuando tenemos muchas dimensiones, las
medidas de distancia no son tiles
(equidistancia).

Subspace clustering
La dimensionalidad de los datos
Soluciones

Transformacin de caractersticas (PCA,

SVD)
til slo si existe correlacin/redundancia
Seleccin de caractersticas (wrapper/filter)
til si se pueden encontrar clusters en
subespacios
Subspace clustering
Buscar clusters en todos los subespacios
posibles.

Subspace clustering

Subspace clustering
DEMO: CLIQUE et al.
http://www.cs.ualberta.ca/~yaling/Cluster/Applet/Code/Cluster.html

Validacin
Cmo se puede evaluar
la calidad de los clusters obtenidos?
Depende de lo que estemos buscando

Hay situaciones en las que nos interesa:

Evitar descubrir clusters donde slo hay ruido.
Comparar dos conjuntos de clusters
alternativos.
Comparar dos tcnicas de agrupamiento

Validacin

Criterios externos
(aportando informacin adicional)
p.ej. entropa/pureza (como en clasificacin)

Criterios internos
(a partir de los propios datos),
p.ej. SSE (Sum of Squared Error)

para comparar clusters

para estimar el nmero de clusters

Otras medidas:
84
cohesin, separacin, coeficientes de silueta

Validacin
Cul es el nmero adecuado de agrupamientos?
p.ej. SSE (Sum of Squared Error)

k=1
J = 873.0

k=2
J = 173.1

k=3
J = 133.6

Validacin
Cul es el nmero adecuado de agrupamientos?
p.ej. SSE (Sum of Squared Error)

1.00E+03
9.00E+02
8.00E+02
7.00E+02
6.00E+02
5.00E+02
4.00E+02
3.00E+02
2.00E+02
1.00E+02
0.00E+00
1

El codo en k=2 sugiere que ste es el

valor
adecuado para el nmero de

k
86

Validacin
6
4
2
0
-2
-4
-6
5

10
9
8
7

SSE

6
5
4
3
2
1
0

Validacin
1

5
7

Validacin
Matriz de similitud
Ordenamos los datos en la matriz de similitud
con respecto a los clusters en los que quedan
los datos e inspeccionamos visualmente
1

0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

0.9

Points

0.8

0.5
0.4

0.1
0

0.2

0.4

0.6

0.8

100

Points

0
100 Similarity

Validacin
Matriz de similitud

1
10

0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.9

0.1

Points

Clusters en datos aleatorios

(DBSCAN y k-Means)

100

0.8

0.7

Points

0
100 Similarity

0.6
1

0.5
0.4

0.9
0.8

0.7

0.2

0.6

0.5

0.4

0.3

0.2

0.1

Points

0.3

0.1
0

0.2

0.4

0.6

0.8

100

Points

0
100 Similarity

Validacin
Matriz de similitud

DBSCAN

5
7

1
0.9
500

0.8
0.7

1000

0.6
1500

0.5
0.4

2000

0.3
0.2

2500

0.1
3000

500

1000

1500

2000

2500

3000

Bibliografa

R. Agrawal, J. Gehrke, D. Gunopulos, and P. Raghavan. Automatic

subspace clustering of high dimensional data for data mining
applications. SIGMOD'98

M. Ankerst, M. Breunig, H.-P. Kriegel, and J. Sander. Optics: Ordering

points to identify the clustering structure, SIGMOD99.

L. Ertz, M. Steinbach, and V. Kumar. Finding clusters of different

sizes, shapes, and densities in noisy, high-dimensional data,
SDM2003

M. Ester, H.-P. Kriegel, J. Sander, and X. Xu. A density-based algorithm

for discovering clusters in large spatial databases. KDD'96.

D. Fisher. Knowledge acquisition via incremental conceptual

clustering. Machine Learning, 2:139-172, 1987.

D. Gibson, J. Kleinberg, and P. Raghavan. Clustering categorical data:

An approach based on dynamic systems. VLDB98

S. Guha, R. Rastogi, and K. Shim. Cure: An efficient clustering

algorithm for large databases. SIGMOD'98.

S. Guha, R. Rastogi, and K. Shim. ROCK: A robust clustering algorithm

for categorical attributes. In ICDE'99, Sydney, Australia, March 1999.

Bibliografa

A. Hinneburg, D.l A. Keim: An Efficient Approach to Clustering in

Large Multimedia Databases with Noise. KDD98.

G. Karypis, E.-H. Han, and V. Kumar. CHAMELEON: A Hierarchical

Clustering Algorithm Using Dynamic Modeling. COMPUTER,
32(8): 68-75, 1999.

L. Parsons, E. Haque and H. Liu, Subspace Clustering for High

Dimensional Data: A Review , SIGKDD Explorations, 6(1), June
2004

G. Sheikholeslami, S. Chatterjee, and A. Zhang. WaveCluster: A

multi-resolution clustering approach for very large spatial
databases. VLDB98.

A. K. H. Tung, J. Hou, and J. Han. Spatial Clustering in the

Presence of Obstacles , ICDE'01

H. Wang, W. Wang, J. Yang, and P.S. Yu. Clustering by pattern

similarity in large data sets, SIGMOD 02.

W. Wang, Yang, R. Muntz, STING: A Statistical Information grid

Approach to Spatial Data Mining, VLDB97.

T. Zhang, R. Ramakrishnan, and M. Livny. BIRCH : an efficient data

Crditos
Jiawei Han (University of Illinois at UrbanaChampaign): Data Mining: Concepts and
Techniques, captulo 7, 2006
Pang-Ning Tan (Michigan State University),
Michael Steinbach & Vipin Kumar (University of
Minnesota): Introduction to Data Mining,
captulos 8 y 9, 2006

Apndice: Notacin O
El impacto de la eficiencia de un algoritmo
n

100

1000

10000

100000

O(n)

10ms

0.1s

10s

100s

O(nlog2 n)

33ms

0.7s

10s

2 min

28 min

O(n2)

100ms

10s

17 min

28 horas 115 das

O(n3)

17min

12 das 31 aos 32

milenios

También podría gustarte

Tema 6 PDF
Aún no hay calificaciones
Tema 6 PDF
96 páginas
4clustering 230711164802 60c9e798
Aún no hay calificaciones
4clustering 230711164802 60c9e798
89 páginas
Análisis de Clúster: Técnicas y Métricas
100% (1)
Análisis de Clúster: Técnicas y Métricas
68 páginas
Conferencia #7. Agrupamiento
Aún no hay calificaciones
Conferencia #7. Agrupamiento
39 páginas
Clustering en Minería de Datos
Aún no hay calificaciones
Clustering en Minería de Datos
49 páginas
Clustering Ciencia Datos
Aún no hay calificaciones
Clustering Ciencia Datos
78 páginas
Clase 6 Minería de Datos
Aún no hay calificaciones
Clase 6 Minería de Datos
64 páginas
Tecnicas de Clustering en Machine Learning
Aún no hay calificaciones
Tecnicas de Clustering en Machine Learning
12 páginas
Algoritmos y Medidas de Agrupamiento
Aún no hay calificaciones
Algoritmos y Medidas de Agrupamiento
6 páginas
Tema2 - Metodos Jerarquicos
Aún no hay calificaciones
Tema2 - Metodos Jerarquicos
36 páginas
T4
Aún no hay calificaciones
T4
13 páginas
Aprendizaje No Supervisado Clustering
Aún no hay calificaciones
Aprendizaje No Supervisado Clustering
57 páginas
Métodos de Agrupamiento en Clustering
Aún no hay calificaciones
Métodos de Agrupamiento en Clustering
21 páginas
(13-1) Base de Datos Avanzada - Clase
Aún no hay calificaciones
(13-1) Base de Datos Avanzada - Clase
26 páginas
Técnicas y Algoritmos de Clustering
Aún no hay calificaciones
Técnicas y Algoritmos de Clustering
40 páginas
Guía de Clustering en Negocios
Aún no hay calificaciones
Guía de Clustering en Negocios
42 páginas
AnaliticaDeDatos Modulo5 TecnicasDeClustering
Aún no hay calificaciones
AnaliticaDeDatos Modulo5 TecnicasDeClustering
48 páginas
Modulo 2 - UNIDAD 01 - Clustering
Aún no hay calificaciones
Modulo 2 - UNIDAD 01 - Clustering
5 páginas
Técnicas de Agrupamiento en Minería de Datos
Aún no hay calificaciones
Técnicas de Agrupamiento en Minería de Datos
76 páginas
Clustering en Aprendizaje No Supervisado
Aún no hay calificaciones
Clustering en Aprendizaje No Supervisado
68 páginas
Clase 2 - Machine Learning - Unsupervised
Aún no hay calificaciones
Clase 2 - Machine Learning - Unsupervised
32 páginas
Análisis de Conglomerados: José A Perusquía Cortés Análisis Multivariado Semestre I
Aún no hay calificaciones
Análisis de Conglomerados: José A Perusquía Cortés Análisis Multivariado Semestre I
53 páginas
Análisis de Clúster: Técnicas y Aplicaciones
Aún no hay calificaciones
Análisis de Clúster: Técnicas y Aplicaciones
33 páginas
Metodos Segmentación Python
Aún no hay calificaciones
Metodos Segmentación Python
37 páginas
T Ecnicas de Agrupamiento para El Analisis de Datos Cuantitativos y Cualitativos
Aún no hay calificaciones
T Ecnicas de Agrupamiento para El Analisis de Datos Cuantitativos y Cualitativos
53 páginas
Tema 6.análisis de Cluster
Aún no hay calificaciones
Tema 6.análisis de Cluster
49 páginas
Clustering
Aún no hay calificaciones
Clustering
30 páginas
Modulo 2 - UNIDAD 01 - Clustering - V.3
Aún no hay calificaciones
Modulo 2 - UNIDAD 01 - Clustering - V.3
6 páginas
1 - Segmentación de Mercados
Aún no hay calificaciones
1 - Segmentación de Mercados
23 páginas
43 Clustering - Density
Aún no hay calificaciones
43 Clustering - Density
28 páginas
Segmentación de Datos en Python
100% (1)
Segmentación de Datos en Python
37 páginas
Clasificacion
Aún no hay calificaciones
Clasificacion
25 páginas
No Super Visa Do Agr Up Amien To
Aún no hay calificaciones
No Super Visa Do Agr Up Amien To
61 páginas
M D KDD: Técnicas de Minería de Datos
Aún no hay calificaciones
M D KDD: Técnicas de Minería de Datos
81 páginas
Análisis de Agrupación Jerárquica
Aún no hay calificaciones
Análisis de Agrupación Jerárquica
27 páginas
K-Means y X-Means: Clustering Efectivo
Aún no hay calificaciones
K-Means y X-Means: Clustering Efectivo
14 páginas
Agrupamientos
Aún no hay calificaciones
Agrupamientos
8 páginas
Técnicas de Agrupamiento en Datos
Aún no hay calificaciones
Técnicas de Agrupamiento en Datos
57 páginas
LopezZugasti Lectura3
Aún no hay calificaciones
LopezZugasti Lectura3
4 páginas
Silva 15 DM y KDD Pre
Aún no hay calificaciones
Silva 15 DM y KDD Pre
60 páginas
Analisis Cluster
Aún no hay calificaciones
Analisis Cluster
22 páginas
Sesion 6
Aún no hay calificaciones
Sesion 6
39 páginas
Dca Planeacion
Aún no hay calificaciones
Dca Planeacion
12 páginas
Análisis de Cluster, Un Ejemplo Sencillo
Aún no hay calificaciones
Análisis de Cluster, Un Ejemplo Sencillo
9 páginas
Clustering K-means en Aprendizaje No Supervisado
Aún no hay calificaciones
Clustering K-means en Aprendizaje No Supervisado
20 páginas
Clasificación KNN: Método y Funcionamiento
Aún no hay calificaciones
Clasificación KNN: Método y Funcionamiento
33 páginas
Clase 10
Aún no hay calificaciones
Clase 10
53 páginas
15 Agrupacion
Aún no hay calificaciones
15 Agrupacion
60 páginas
Introducción al Data Mining No Supervisado
Aún no hay calificaciones
Introducción al Data Mining No Supervisado
78 páginas
3.atdf105 s8 Leal
Aún no hay calificaciones
3.atdf105 s8 Leal
22 páginas
Teorico 3
Aún no hay calificaciones
Teorico 3
32 páginas
K Meas
Aún no hay calificaciones
K Meas
4 páginas
K Means
Aún no hay calificaciones
K Means
25 páginas
Clustering
Aún no hay calificaciones
Clustering
38 páginas
Clustering
Aún no hay calificaciones
Clustering
26 páginas
Solucion Pregunta 2
100% (2)
Solucion Pregunta 2
5 páginas
Calor Específicos de Los Sólidos
Aún no hay calificaciones
Calor Específicos de Los Sólidos
8 páginas
Stewar Calculo Vectorial
Aún no hay calificaciones
Stewar Calculo Vectorial
5 páginas
Clase #5-Modelos Estocásticos de Inventarios V - VI
Aún no hay calificaciones
Clase #5-Modelos Estocásticos de Inventarios V - VI
7 páginas
Uso de Figuras Geométricas en La Arquitectura
Aún no hay calificaciones
Uso de Figuras Geométricas en La Arquitectura
12 páginas
Falacias Ensayo
Aún no hay calificaciones
Falacias Ensayo
5 páginas
RM 4 Bio
Aún no hay calificaciones
RM 4 Bio
6 páginas
Números Naturales y Operaciones Básicas
Aún no hay calificaciones
Números Naturales y Operaciones Básicas
76 páginas
Estrategias para Mejorar la Competencia Matemática
Aún no hay calificaciones
Estrategias para Mejorar la Competencia Matemática
13 páginas
Absorbancias de Colores de Pintura
Aún no hay calificaciones
Absorbancias de Colores de Pintura
2 páginas
Programacion Anual de Matematica 2024-Quinto
Aún no hay calificaciones
Programacion Anual de Matematica 2024-Quinto
18 páginas
Georreferenciación de Parcelas en Huancayo
Aún no hay calificaciones
Georreferenciación de Parcelas en Huancayo
7 páginas
Temas de Los Ensayos Argumentativos
Aún no hay calificaciones
Temas de Los Ensayos Argumentativos
4 páginas
Bernoulli y Binomial PDF
Aún no hay calificaciones
Bernoulli y Binomial PDF
4 páginas
Función de Variable Real y Su Representación Gráfica
Aún no hay calificaciones
Función de Variable Real y Su Representación Gráfica
4 páginas
División Exacta de Números: Ejercicios y Conceptos
Aún no hay calificaciones
División Exacta de Números: Ejercicios y Conceptos
3 páginas
Escuela Marginalista o Neoclasica
Aún no hay calificaciones
Escuela Marginalista o Neoclasica
1 página
Ejercicios Mallas PERT (Resuelto 8ppt)
100% (2)
Ejercicios Mallas PERT (Resuelto 8ppt)
9 páginas
Curso Carreteras 2022 - (G1, G2)
Aún no hay calificaciones
Curso Carreteras 2022 - (G1, G2)
7 páginas
Sistemas Lineales y Planos: Ejercicios
Aún no hay calificaciones
Sistemas Lineales y Planos: Ejercicios
20 páginas
4
Aún no hay calificaciones
4
3 páginas
Emisión de Documentos EMPD en Aerolíneas
Aún no hay calificaciones
Emisión de Documentos EMPD en Aerolíneas
46 páginas
Vibraciones en Elementos Acústicos
Aún no hay calificaciones
Vibraciones en Elementos Acústicos
11 páginas
Amplificador Operacional: Modos y Ganancia
Aún no hay calificaciones
Amplificador Operacional: Modos y Ganancia
57 páginas
Notación Científica
Aún no hay calificaciones
Notación Científica
15 páginas
Taller en Clase 2
Aún no hay calificaciones
Taller en Clase 2
6 páginas
Multiplicación para 4° y 5° Grado
Aún no hay calificaciones
Multiplicación para 4° y 5° Grado
5 páginas
Ejercicios de Leyes de Álgebra Proposicional
Aún no hay calificaciones
Ejercicios de Leyes de Álgebra Proposicional
3 páginas
Detección de Señales de Multifrecuencia de Dos Tonos
Aún no hay calificaciones
Detección de Señales de Multifrecuencia de Dos Tonos
8 páginas