0% found this document useful (0 votes)

65 views2 pages

Clustering in Machine Learning Notes

Uploaded by

kunal b malviya

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

65 views2 pages

Clustering in Machine Learning Notes

Uploaded by

kunal b malviya

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

UNIT-II: Clustering in Machine Learning

Clustering in Machine Learning:

-------------------------------

1. Types of Clustering Methods:

- Partitioning Clustering: Involves dividing the data into distinct, non-overlapping clusters.

- Distribution Model-Based Clustering: Assumes the data is generated by a mixture of underlying

probability distributions.

- Hierarchical Clustering: Builds a hierarchy of clusters either agglomeratively (bottom-up) or

divisively (top-down).

- Fuzzy Clustering: Allows a data point to belong to multiple clusters with varying degrees of

membership.

2. Birch Algorithm:

- A clustering algorithm that constructs a CF (Clustering Feature) tree for efficient clustering of

large datasets.

- It works by dynamically adjusting the threshold to maintain a balance between clustering quality

and efficiency.

3. CURE Algorithm:

- A hierarchical clustering algorithm designed to handle large datasets.

- CURE uses representative points and applies a combination of centroid-based and

distance-based techniques to improve cluster quality.

4. Gaussian Mixture Models (GMM) and Expectation Maximization (EM):

- GMM is a probabilistic model that assumes all data points are generated from a mixture of

several Gaussian distributions.

- The EM algorithm is used to estimate the parameters of the GMM by iteratively refining the

likelihood of the model based on observed data.

5. Parameters Estimations:

- Maximum Likelihood Estimation (MLE): A method for estimating the parameters of a statistical

model by maximizing the likelihood function.

- Maximum A Posteriori (MAP): A method similar to MLE but incorporates prior information (a

prior distribution) to improve the estimation process.

6. Applications of Clustering:

- Image segmentation, market segmentation, anomaly detection, social network analysis, and

document categorization are some common applications of clustering.

Detailed Clustering in Machine Learning Notes
No ratings yet
Detailed Clustering in Machine Learning Notes
4 pages
Unit 5
No ratings yet
Unit 5
3 pages
Clustering in Machine Learning
No ratings yet
Clustering in Machine Learning
4 pages
Clustering Algorithms Overview
No ratings yet
Clustering Algorithms Overview
6 pages
Big Data Analytics
No ratings yet
Big Data Analytics
25 pages
Unit 2 ML
No ratings yet
Unit 2 ML
11 pages
FAI Lecture - 9-10-2023 PDF
No ratings yet
FAI Lecture - 9-10-2023 PDF
16 pages
Clustering
No ratings yet
Clustering
3 pages
ML Assignment 2
No ratings yet
ML Assignment 2
2 pages
Clustering
No ratings yet
Clustering
20 pages
Data Mining - 5
No ratings yet
Data Mining - 5
4 pages
ML
No ratings yet
ML
28 pages
DWDM Unit 3
No ratings yet
DWDM Unit 3
21 pages
ML Unit 4 (Ab 22)
No ratings yet
ML Unit 4 (Ab 22)
39 pages
Clustering Techniques in Machine Learning
No ratings yet
Clustering Techniques in Machine Learning
3 pages
M.L. 3,5,6 Unit 3
No ratings yet
M.L. 3,5,6 Unit 3
6 pages
Clustering Notes
No ratings yet
Clustering Notes
17 pages
HTCB Unit 5
No ratings yet
HTCB Unit 5
3 pages
Unit 4 Introduction To Algorithm
No ratings yet
Unit 4 Introduction To Algorithm
10 pages
Clustering
No ratings yet
Clustering
6 pages
Asynchronous Task Cluster Analysis
No ratings yet
Asynchronous Task Cluster Analysis
2 pages
Data Science For Civil Engineering Unit 5 Notes
No ratings yet
Data Science For Civil Engineering Unit 5 Notes
17 pages
Fundamentals of Data Science Unit 3
No ratings yet
Fundamentals of Data Science Unit 3
15 pages
ML 7th Sem AIML ITE Notes Complete LONG (1) - 155-202
No ratings yet
ML 7th Sem AIML ITE Notes Complete LONG (1) - 155-202
48 pages
Cbsyllabus Bda
No ratings yet
Cbsyllabus Bda
5 pages
ML Unit-3
No ratings yet
ML Unit-3
22 pages
Lecturer-1 Unit 3
No ratings yet
Lecturer-1 Unit 3
31 pages
Clustering
No ratings yet
Clustering
11 pages
Clustering
No ratings yet
Clustering
45 pages
Unit 5
No ratings yet
Unit 5
10 pages
Chapter 7
No ratings yet
Chapter 7
3 pages
BDA Lecture Unit 3 With LAB
No ratings yet
BDA Lecture Unit 3 With LAB
20 pages
DM 3rd Unit
No ratings yet
DM 3rd Unit
5 pages
ML Unit 5
No ratings yet
ML Unit 5
20 pages
Cluster Analysis
No ratings yet
Cluster Analysis
18 pages
Classification in Data Mining
No ratings yet
Classification in Data Mining
60 pages
Data Mining Clustering Techniques
No ratings yet
Data Mining Clustering Techniques
43 pages
Kavin
No ratings yet
Kavin
15 pages
Machine Learning Note Modul 4 5
No ratings yet
Machine Learning Note Modul 4 5
20 pages
Machine Learning Clustering Guide
No ratings yet
Machine Learning Clustering Guide
7 pages
Unit VII
No ratings yet
Unit VII
30 pages
Unsupervised Machine Learning
No ratings yet
Unsupervised Machine Learning
63 pages
Clustering in Machine Learning
No ratings yet
Clustering in Machine Learning
21 pages
Data Mining Assignment 2
No ratings yet
Data Mining Assignment 2
25 pages
Unit No 3
No ratings yet
Unit No 3
10 pages
ML ModuleUntitled 2
No ratings yet
ML ModuleUntitled 2
8 pages
1M and 10 M
No ratings yet
1M and 10 M
23 pages
Clustering
No ratings yet
Clustering
7 pages
Introduction To Machine Learning
No ratings yet
Introduction To Machine Learning
2 pages
Machine Learning Clustering AlgorithmsI
No ratings yet
Machine Learning Clustering AlgorithmsI
129 pages
Unit 4
No ratings yet
Unit 4
62 pages
Clustering in Machine Learning - Javatpoint
No ratings yet
Clustering in Machine Learning - Javatpoint
10 pages
Unit 4
No ratings yet
Unit 4
29 pages
ML Unit 4 Notes - NJ
No ratings yet
ML Unit 4 Notes - NJ
15 pages
Unit 4-DWDM
No ratings yet
Unit 4-DWDM
23 pages
Segment 7 (Ch10)
No ratings yet
Segment 7 (Ch10)
60 pages
Unit Iv
No ratings yet
Unit Iv
14 pages
Assignment 2nd DMDW
No ratings yet
Assignment 2nd DMDW
11 pages

Clustering in Machine Learning Notes

Uploaded by

Clustering in Machine Learning Notes

Uploaded by

UNIT-II: Clustering in Machine Learning

Clustering in Machine Learning:

1. Types of Clustering Methods:

- Distribution Model-Based Clustering: Assumes the data is generated by a mixture of underlying

- Hierarchical Clustering: Builds a hierarchy of clusters either agglomeratively (bottom-up) or

- A hierarchical clustering algorithm designed to handle large datasets.

- CURE uses representative points and applies a combination of centroid-based and

distance-based techniques to improve cluster quality.

4. Gaussian Mixture Models (GMM) and Expectation Maximization (EM):

several Gaussian distributions.

likelihood of the model based on observed data.

model by maximizing the likelihood function.

prior distribution) to improve the estimation process.

document categorization are some common applications of clustering.

You might also like