0% found this document useful (0 votes)

26 views35 pages

Clustering Machine Learning Algorithms

Uploaded by

Amine Benattouch

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

26 views35 pages

Clustering Machine Learning Algorithms

Uploaded by

Amine Benattouch

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Clustering

Machine
Learning
Algorithms
Outline

01 ML Categories 03 K-Means

02 What is clustering? 04 Hierarchical Clustering

Machine Learning Catgeories

(1) Supervised
● Used to train machines using
labeled data
● Takes labeled inputs and maps it
to known outputs (you already Classification
know the target variable)
&
Regression Problems
Machine Learning Catgeories

Clustering
&
(2) Unsupervised Association Problems
● Uses unlabeled data to discover
patterns and features in the data
● Understands patterns and trends in
the data and discovers the output
Machine Learning Catgeories

Reward Based
(3) Reinforcement Problems
● Uses an agent and an environment
to produce actions and rewards
● Follows trial and error method to
arrive at final solution
● Agent receives award after
finishing task
Clustering

Grouping similar objects together

Clusters

According to some predefined similarity or dissimilarity measures

Clustering Methods

01 02

Partitional Hierarchical
Partitional Clustering

Database
‘k’
partitions
‘n’ Objects of data

Satisfying: Process:
- Each group contains at least one object - Create Initial partitioning
- Each object belongs to exactly one cluster - Use an iterative relocation technique to improve
partitioning
K-Means
K-Means

Stop Condition
- Define a maximum number of iterations
- Inertia doesn’t decrease or only
decreases insignificantly
(Inertia is the sum of squared distances. It
keeps decreasing throughout the iterations,
thus improving the data compactness)
K-Means

Avoiding Local Optima

By minimizing initialization bias:
We perform 10 different random
initializations and run the K-Means
algorithm and calculate inertia.
We then choose the best option
(lowest inertia)
This can be performed in R language
via n_init parameter
K-Means

Advantages
Fast
Can serve as a data reduction
technique
K-Means

Disadvantages
It has a tendency to identify clusters
with same size ad volume (spherical
shapes)
Unable to identify elongated or non-
convex clusters
K-Means

Practical Use

Text Mining
Predictive Marketing
Clustering Methods

01 02

Partitional Hierarchical
Hierarchical Clustering

Database
Dendrogram
‘n’ Objects
Hierarchical Clustering
Hierarchical Clustering

Top-Bottom

Clustering continues until small

groups of similar clusters are
obtained
Hierarchical Clustering

Bottom-Up

Clustering continues until a

single cluster is obtained
Hierarchical Clustering
Algorithm

Step1: Consider every data point as

an individual cluster
Step 2: Calculate Proximity Matrix
for each cluster
Step 3:Merge the clusters which are
highly similar or close to each other.
Step 4: Recalculate the proximity
matrix for each cluster
Step 5: Repeat Steps 3 and 4 until
only a single cluster remains.
Hierarchical Clustering
Linkage Methods

A B C D E

A 0

B 1 0

C 2 2 0

D 2 5 3 0

E 3 4 6 6 0
Hierarchical Clustering
Linkage Methods

A B C D E

A 0

B 1 0

C 2 2 0

D 2 5 3 0

E 3 4 6 6 0
Hierarchical Clustering
Linkage Methods

A,B C D E

A,B 0

C 0

D 3 0

E 6 6 0
Hierarchical Clustering
Linkage Methods

A,B C D E

A,B 0

Single C 2 0

Link D 2 3 0

E 3 6 6 0
Hierarchical Clustering
Linkage Methods

A,B C D E

A,B 0

Complete C 2 0

Link D 5 3 0

E 4 6 6 0
Hierarchical Clustering
Linkage Methods

A,B C D E

A,B 0

C 2 0
Average D 3.5 3 0

E 3.5 6 6 0
Hierarchical Clustering
Linkage Methods

A,B C D E

A,B 0

C 2 0
Average D 3.5 3 0

E 3.5 6 6 0
Hierarchical Clustering
Linkage Methods

(A,B),C D E

(A,B),C 0

D 0
Average E 6 0
Hierarchical Clustering
Linkage Methods

(A,B),C D E

(A,B),C 0

D 3.33 0
Average E 4.33 6 0
Hierarchical Clustering
Linkage Methods

Single Link criteria

Complete Link criteria
Distance between
Average criteria cluster means

Centeroid criteria
Ward’s criteria
Hierarchical Clustering
Linkage Methods

Single Link criteria

Complete Link criteria
Minimize total within
Average criteria cluster variance

Centeroid criteria
Ward’s criteria
Hierarchical Clustering

Advantages Disadvantages

It overcomes the spherical High complexity level because

shape problem of K-Means it makes a huge number of
calculations between groups
‫بالتوفيق‬

Lecture 4.6 Unsupervised-Learning Clustering
No ratings yet
Lecture 4.6 Unsupervised-Learning Clustering
60 pages
Unsupervised Learning
No ratings yet
Unsupervised Learning
83 pages
22AIP3101A Session 9
No ratings yet
22AIP3101A Session 9
38 pages
Data Science Unit 5
No ratings yet
Data Science Unit 5
105 pages
Clustering Algorithm
No ratings yet
Clustering Algorithm
47 pages
Clustering
No ratings yet
Clustering
38 pages
U1 - KMeans - 5th Sem - DS
No ratings yet
U1 - KMeans - 5th Sem - DS
14 pages
Day 3 - Content
No ratings yet
Day 3 - Content
50 pages
Unit IV
No ratings yet
Unit IV
6 pages
Day 3
No ratings yet
Day 3
74 pages
ML Unit III
No ratings yet
ML Unit III
82 pages
Week 9. Unsupervised Learning
No ratings yet
Week 9. Unsupervised Learning
32 pages
DA-Unit V
No ratings yet
DA-Unit V
152 pages
K Mean Clustering
No ratings yet
K Mean Clustering
59 pages
DSML-ML09. Unsupervised Learning
No ratings yet
DSML-ML09. Unsupervised Learning
69 pages
Customer Segmentation Techniques Explained
No ratings yet
Customer Segmentation Techniques Explained
46 pages
K-Means vs Hierarchical Clustering
No ratings yet
K-Means vs Hierarchical Clustering
30 pages
Lec09 Clustering
No ratings yet
Lec09 Clustering
27 pages
AppliedML Chap1 Clustering
No ratings yet
AppliedML Chap1 Clustering
37 pages
Unit 5
No ratings yet
Unit 5
5 pages
Text Analytics Unit-3
No ratings yet
Text Analytics Unit-3
11 pages
Unit 4
No ratings yet
Unit 4
74 pages
Clustering
No ratings yet
Clustering
131 pages
Session 37 CO4 Unsupervised Learning
No ratings yet
Session 37 CO4 Unsupervised Learning
34 pages
ML Module 4 Unsupervised Learning - Updated
No ratings yet
ML Module 4 Unsupervised Learning - Updated
55 pages
Lecture 2.1.1 To 2.1.2
No ratings yet
Lecture 2.1.1 To 2.1.2
97 pages
Unit 4 Clustering - K-Means and Hierarchical
No ratings yet
Unit 4 Clustering - K-Means and Hierarchical
40 pages
Cluster
100% (1)
Cluster
72 pages
ML CH 4
No ratings yet
ML CH 4
51 pages
ML UNIT 4 Sir
No ratings yet
ML UNIT 4 Sir
42 pages
Clustering Techniques for Analysts
No ratings yet
Clustering Techniques for Analysts
7 pages
Clustering
No ratings yet
Clustering
67 pages
Machine Learning & Data Mining
No ratings yet
Machine Learning & Data Mining
108 pages
Machine Learning Chapter 3
No ratings yet
Machine Learning Chapter 3
12 pages
Unsupervised Learning: Clustering
No ratings yet
Unsupervised Learning: Clustering
57 pages
Unit-4 ML
No ratings yet
Unit-4 ML
16 pages
Mlclustering2022 10 26
No ratings yet
Mlclustering2022 10 26
36 pages
Clustering Techniques - Hierarchical, K-Means Clustering
No ratings yet
Clustering Techniques - Hierarchical, K-Means Clustering
22 pages
ML Mod 4 Part 1
No ratings yet
ML Mod 4 Part 1
99 pages
Chapter 5. Clustering Algorithms-Stud
No ratings yet
Chapter 5. Clustering Algorithms-Stud
44 pages
ML Unit 4
No ratings yet
ML Unit 4
110 pages
Clustering Part1
No ratings yet
Clustering Part1
84 pages
Clustering
No ratings yet
Clustering
44 pages
07 Clustering
No ratings yet
07 Clustering
34 pages
Unit 2 ML
No ratings yet
Unit 2 ML
11 pages
Lect 10 - Unsupervised Learning
No ratings yet
Lect 10 - Unsupervised Learning
50 pages
Module 6 - Un-Supervised Learning Algorithms
No ratings yet
Module 6 - Un-Supervised Learning Algorithms
31 pages
K-Means Clustering Guide for Beginners
No ratings yet
K-Means Clustering Guide for Beginners
19 pages
K Means Clustering
No ratings yet
K Means Clustering
22 pages
Clustering
No ratings yet
Clustering
84 pages
Clustering Explanation
No ratings yet
Clustering Explanation
8 pages
FML Unit4
No ratings yet
FML Unit4
14 pages
Unsupervised Learning
No ratings yet
Unsupervised Learning
23 pages
Final ML Unit3 May24
No ratings yet
Final ML Unit3 May24
154 pages
Unsupervised Machine Learning Techniques
No ratings yet
Unsupervised Machine Learning Techniques
58 pages
Machine Learning Notes-1 (Clustering-1)
No ratings yet
Machine Learning Notes-1 (Clustering-1)
25 pages
Lec 05 Unsupervised-Kmeans
No ratings yet
Lec 05 Unsupervised-Kmeans
50 pages
Week 14 and 15 Machine Learning Unsupervised 2
No ratings yet
Week 14 and 15 Machine Learning Unsupervised 2
25 pages
Unsupervised Learning and Clustering Techniques
No ratings yet
Unsupervised Learning and Clustering Techniques
60 pages
PCA and Clustering of Toothpaste Perceptions
No ratings yet
PCA and Clustering of Toothpaste Perceptions
5 pages
Chapter 4
No ratings yet
Chapter 4
38 pages
Chap 11 TRADE TestBank
No ratings yet
Chap 11 TRADE TestBank
12 pages
Chap 09 TRADE TestBank
No ratings yet
Chap 09 TRADE TestBank
17 pages
Developing Nations' Trade Policies
No ratings yet
Developing Nations' Trade Policies
4 pages
Q3 (Tuto3) .PNG
No ratings yet
Q3 (Tuto3) .PNG
1 page
Partial Differentiation
No ratings yet
Partial Differentiation
12 pages
B.LAW Chapter 7 - Company Law
No ratings yet
B.LAW Chapter 7 - Company Law
5 pages
Course Report
No ratings yet
Course Report
22 pages
K-Means Clustering Explained
No ratings yet
K-Means Clustering Explained
16 pages
Abreu 2016
No ratings yet
Abreu 2016
40 pages
Fruit Disease Detection via CNN
No ratings yet
Fruit Disease Detection via CNN
5 pages
Cluster Evolution Analysis - Identification and Detection of Similar Clusters and Migration Patterns
No ratings yet
Cluster Evolution Analysis - Identification and Detection of Similar Clusters and Migration Patterns
16 pages
An Improved K-Means Clustering Algorithm For Global Earthquake Catalogs and Earthquake Magnitude Prediction
No ratings yet
An Improved K-Means Clustering Algorithm For Global Earthquake Catalogs and Earthquake Magnitude Prediction
16 pages
GANQ: GPU-Adaptive Non-Uniform Quantization For Large Language Models
No ratings yet
GANQ: GPU-Adaptive Non-Uniform Quantization For Large Language Models
12 pages
Model Exam Question Set 1
No ratings yet
Model Exam Question Set 1
2 pages
SIC AI Chapter 6 Quiz With Answers v1.2
No ratings yet
SIC AI Chapter 6 Quiz With Answers v1.2
3 pages
Spectral Image Analysis Toolbox
No ratings yet
Spectral Image Analysis Toolbox
22 pages
Scalability Challenges in Big Data Science
No ratings yet
Scalability Challenges in Big Data Science
33 pages
Assignment
No ratings yet
Assignment
3 pages
Marketing Campaign Analysis for Dealers
No ratings yet
Marketing Campaign Analysis for Dealers
6 pages
Hariprasath Conferencepaper
No ratings yet
Hariprasath Conferencepaper
6 pages
Handout: Course Information: CS 229 Machine Learning
No ratings yet
Handout: Course Information: CS 229 Machine Learning
4 pages
Lecture 3.2.3 3.2.4
No ratings yet
Lecture 3.2.3 3.2.4
28 pages
Improving Arabic Document Clustering Using K-Means Algorithm and Particle Swarm Optimization
No ratings yet
Improving Arabic Document Clustering Using K-Means Algorithm and Particle Swarm Optimization
7 pages
(English (Auto-Generated) ) All Machine Learning Algorithms Explained in 17 Min (DownSub - Com)
No ratings yet
(English (Auto-Generated) ) All Machine Learning Algorithms Explained in 17 Min (DownSub - Com)
19 pages
Anjali Weka Software Report
No ratings yet
Anjali Weka Software Report
17 pages
Data Mining Techniques for Recommender Systems
No ratings yet
Data Mining Techniques for Recommender Systems
58 pages
Introduction to Web Mining Techniques
No ratings yet
Introduction to Web Mining Techniques
12 pages
Python Code for Central Tendency
No ratings yet
Python Code for Central Tendency
28 pages
Clustering
No ratings yet
Clustering
11 pages
Evaluating Clustering Quality Methods
No ratings yet
Evaluating Clustering Quality Methods
103 pages
CSE 575 Statistical Machine Learning Assignment
No ratings yet
CSE 575 Statistical Machine Learning Assignment
3 pages
Kubernetes For Generative AI Solutions - Sukirti GuptaSukirti Gupta
100% (1)
Kubernetes For Generative AI Solutions - Sukirti GuptaSukirti Gupta
334 pages
Tourism Enhancement Using LLMs & Neural Network - Report
No ratings yet
Tourism Enhancement Using LLMs & Neural Network - Report
37 pages
Chapter 7 - Clustering
No ratings yet
Chapter 7 - Clustering
74 pages
Applying Data Mining To Telecom Churn Ma
No ratings yet
Applying Data Mining To Telecom Churn Ma
10 pages
Big Data
No ratings yet
Big Data
17 pages