0% found this document useful (0 votes)

52 views39 pages

Machine Learning Numpy

The document discusses several machine learning concepts including text classification using Bayes' theorem, k-means clustering, and principal component analysis (PCA). It explains k-means clustering as an iterative process of calculating distances between data points and cluster centroids, and updating the centroids. It also discusses calculating the elbow method to determine the optimal number of clusters. The document provides three key uses of PCA: 1) data visualization by projecting high-dimensional data onto two dimensions, 2) reducing noise by rejecting less informative attributes, and 3) reducing memory usage by dropping redundant dimensions. It illustrates PCA by projecting random data points and showing how different component axes can better distinguish the classes.

Uploaded by

Amalina Sulaiman

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

52 views39 pages

Machine Learning Numpy

Uploaded by

Amalina Sulaiman

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Machine learning numpy,

school of AI Kuala Lumpur

Husein Zolkepli
Bayes theorem text classification

Likelihood probability, probability Prior probability,

of vector X when class C probability of class C
going to occur

Posterior probability, probability of Marginal probability, probability of

class C going to happen when vector X, most of the case, its
vector is X unobserve
Rebranding bayes theorem
Rebranding bayes theorem
Rebranding bayes theorem
Rebranding bayes theorem
Rebranding bayes theorem
Text classification
index i like chicken meat label

1 1 1 1 0 0

2 1 1 0 1 1
Kmean

1. Initiate random centroids, or use kmeans++.

Kmean

2. Keep iterating to calculate distances between individuals and centroids, and

mean clustered individuals.
Kmean
3. To calculate ELBOW,

Iterate N K-means, every iteration, calculate sum of distances between centroids

and grouped individuals, and plot.
Principal Component Analysis
Principal Component Analysis
1. Visualization
Principal Component Analysis
1. Visualization

Height, x Weight, y Bmi, z Score, a Hair Age, c Steps, d

length, b
Principal Component Analysis
1. Visualization

Height, x Weight, y Bmi, z Score, a Hair Age, c Steps, d

length, b

It does not makes sense if you want to plot this table into a vector space, we have
7 dimensions!
Principal Component Analysis
2. Reduce noise

Let say you want to study stress level of a student, based on,
Principal Component Analysis
2. Reduce noise

Let say you want to study stress level of a student, based on,

Height, x Weight, y Bmi, z Score, a Hair Age, c Steps, d

length, b

Not all these 7 dimensions bring important information! We want to reject some
attributes.
Principal Component Analysis
2. Reduce noise

Let say you want to study stress level of a student, based on,

Height, x Weight, y Bmi, z Score, a Hair Age, c Steps, d

length, b

Not all these 7 dimensions bring important information! We want to reject some
attributes. Maybe 7 does not hurt much. What happen if you have 512 * 512 * 3
(image) dimension?! insane!
Principal Component Analysis
3. Reduce memory (computer science)

Height, x Weight, y Bmi, z Score, a Hair Age, c Steps, d

length, b

Let say a float took 1 bytes, we have 7 columns and 1 billion of rows.

7 * 1,000,000,000 * 1 = 7,000,000,000 bytes == 70 GB!

Drop a column will save us 10 GB of memory!

Principal Component Analysis
I have data points
Principal Component Analysis
I have data points

I have data points

Principal Component Analysis
I have data points

I have data points

Let say, this plane is Rn , we only visualize it on R2 , I want to visualize the data
points at axis-0, which is x-axis.
Principal Component Analysis
Principal Component Analysis
Principal Component Analysis
Principal Component Analysis

We cannot distinguish between oranges and blues!

Principal Component Analysis

We cannot distinguish between oranges and blues! How about axis-2, which is,
axis-y?
Principal Component Analysis
Principal Component Analysis

It is quite okay, just a few data points overlapped each others.

Principal Component Analysis

It is quite okay, just a few data points overlapped each others. But we don’t
overlapping right?!
Principal component analysis

Eigenvector, R1, of our

covariance matrix
Principal component analysis
Principal component analysis
Principal component analysis

Im too tired man to draw one-by-one :(

Principal component analysis
How to make sense of it?
Principal component analysis
Principal component analysis
Principal component analysis

[5, 4], [5, -4],

[4, 6] [-4, 6]

Value 1 is y axis, 0 correlation

[5, 0],
[0, 1]
Principal component analysis

[1., 0.], lambda = 5

[5, 0],
[0, 1]

l, v = np.linalg.eig(np.array([[5,0],[0,1]]))
l, v
(array([5., 1.]), array([[1., 0.],
[0., 1.]]))

Unsupervised ML 2 - Dr. Niyati - NIT KKR
No ratings yet
Unsupervised ML 2 - Dr. Niyati - NIT KKR
54 pages
P-3.1.4 - Pca
No ratings yet
P-3.1.4 - Pca
44 pages
Kinya Sharon - Ass2 - Machine Learning
No ratings yet
Kinya Sharon - Ass2 - Machine Learning
12 pages
Lecture-3 Unit 3
No ratings yet
Lecture-3 Unit 3
22 pages
Principal Component Analysis and Cluster Analysis
No ratings yet
Principal Component Analysis and Cluster Analysis
14 pages
Dimensionality Reduction Techniques
No ratings yet
Dimensionality Reduction Techniques
7 pages
Remote Sensing Assignment
No ratings yet
Remote Sensing Assignment
10 pages
PCA in Machine Learning Explained
No ratings yet
PCA in Machine Learning Explained
33 pages
Understanding Principal Component Analysis
No ratings yet
Understanding Principal Component Analysis
22 pages
PCA for Data Scientists
No ratings yet
PCA for Data Scientists
9 pages
Principle Component Analysis
No ratings yet
Principle Component Analysis
7 pages
IDS 4 (Week 14)
No ratings yet
IDS 4 (Week 14)
66 pages
PCA Finds Representation Through Linear Transformation
No ratings yet
PCA Finds Representation Through Linear Transformation
28 pages
Pca&kmean
No ratings yet
Pca&kmean
6 pages
PCA Notes
No ratings yet
PCA Notes
3 pages
PCA Guide and R Implementation
No ratings yet
PCA Guide and R Implementation
11 pages
Dimensionality Reduction (Principal Component Analysis)
No ratings yet
Dimensionality Reduction (Principal Component Analysis)
12 pages
Unit 3
No ratings yet
Unit 3
28 pages
Module 3 ML
No ratings yet
Module 3 ML
19 pages
Dimensionality Reduction (Pca)
No ratings yet
Dimensionality Reduction (Pca)
32 pages
Program 3
No ratings yet
Program 3
7 pages
PCA Complete
No ratings yet
PCA Complete
8 pages
PCA - Ensemble Classifiers
No ratings yet
PCA - Ensemble Classifiers
9 pages
Advanced Data Analysis Techniques 2
No ratings yet
Advanced Data Analysis Techniques 2
32 pages
PCA
100% (1)
PCA
33 pages
Module 3
No ratings yet
Module 3
41 pages
Love Report 1
No ratings yet
Love Report 1
10 pages
Principal Component Analysis
No ratings yet
Principal Component Analysis
27 pages
Ai Notes V
No ratings yet
Ai Notes V
7 pages
315 F19 27 Pca1
No ratings yet
315 F19 27 Pca1
28 pages
Principal Component Analysis
100% (1)
Principal Component Analysis
10 pages
Clustering and Dimensionality Reduction Techniques PCA T SNE K Means
No ratings yet
Clustering and Dimensionality Reduction Techniques PCA T SNE K Means
15 pages
SVD and PCA in Data Science
No ratings yet
SVD and PCA in Data Science
58 pages
1501589578da Mod15 Q1 e Text
No ratings yet
1501589578da Mod15 Q1 e Text
9 pages
Dimensionality Reduction: Motivation I: Data Compression
No ratings yet
Dimensionality Reduction: Motivation I: Data Compression
35 pages
The Intuition Behind PCA: Machine Learning Assignment
No ratings yet
The Intuition Behind PCA: Machine Learning Assignment
11 pages
Principal Component Analysis
No ratings yet
Principal Component Analysis
6 pages
PCA Guide for Data Scientists
No ratings yet
PCA Guide for Data Scientists
11 pages
5 Data Pre Processing III
No ratings yet
5 Data Pre Processing III
30 pages
Principal Component Analysis Concepts
No ratings yet
Principal Component Analysis Concepts
16 pages
Data Science: Dimensionality Reduction
No ratings yet
Data Science: Dimensionality Reduction
24 pages
U5@-Data Reduction
No ratings yet
U5@-Data Reduction
22 pages
Assignment
No ratings yet
Assignment
24 pages
Principal Component Analysis
No ratings yet
Principal Component Analysis
8 pages
Dimensionality Reduction
No ratings yet
Dimensionality Reduction
19 pages
ML (Unit 5)
No ratings yet
ML (Unit 5)
34 pages
Importing Libraries Used in This Chapter
No ratings yet
Importing Libraries Used in This Chapter
8 pages
Deep Learning Notes III To IV
No ratings yet
Deep Learning Notes III To IV
22 pages
PCA for Data Analysis Beginners
No ratings yet
PCA for Data Analysis Beginners
6 pages
Reduce Data Dimensionality Using PCA
No ratings yet
Reduce Data Dimensionality Using PCA
6 pages
Principal Component Analysis
No ratings yet
Principal Component Analysis
8 pages
CH 6
No ratings yet
CH 6
11 pages
Principal Component Analysis
No ratings yet
Principal Component Analysis
34 pages
10-2 Data Analysis and Pre-Processing Part 4 PDF
No ratings yet
10-2 Data Analysis and Pre-Processing Part 4 PDF
23 pages
6 Principal Component Analysis
No ratings yet
6 Principal Component Analysis
7 pages
Principal Component Analysis (PCA)
No ratings yet
Principal Component Analysis (PCA)
18 pages
What Is PCA?: Image Source
No ratings yet
What Is PCA?: Image Source
17 pages
Geology 3153: Sedimentary Rocks and Processes Guide To Using Past Exams
No ratings yet
Geology 3153: Sedimentary Rocks and Processes Guide To Using Past Exams
1 page
Pin Diameter (MM) Pin Diameter (Pixel) Factor
No ratings yet
Pin Diameter (MM) Pin Diameter (Pixel) Factor
2 pages
Mantapkan Aqidah dalam Islam
No ratings yet
Mantapkan Aqidah dalam Islam
1 page
Kus Preparation
No ratings yet
Kus Preparation
3 pages
Effects of A Novel Compound On Fungal Contamination
No ratings yet
Effects of A Novel Compound On Fungal Contamination
30 pages
AADE 03 NTCE 35 Power
No ratings yet
AADE 03 NTCE 35 Power
9 pages
HW#5-Solutions: Steven Tipton: The University of Tulsa
No ratings yet
HW#5-Solutions: Steven Tipton: The University of Tulsa
10 pages
Math Lab Schedule: Mon-Thurs 2-6 PM
No ratings yet
Math Lab Schedule: Mon-Thurs 2-6 PM
1 page
HW 1
No ratings yet
HW 1
9 pages
Patrick Ahern-Informative Nature vs. Nurture
No ratings yet
Patrick Ahern-Informative Nature vs. Nurture
4 pages
Chapter 10 Borgnakke Sonntag
67% (3)
Chapter 10 Borgnakke Sonntag
215 pages
Remain in Its State of Rest or of Uniform Motion in A Straight Line
No ratings yet
Remain in Its State of Rest or of Uniform Motion in A Straight Line
3 pages
Wireshark Network Protocol Analysis Lab
No ratings yet
Wireshark Network Protocol Analysis Lab
10 pages
UCCX BK UAF969F8 00 Uccx-serviceability-Admin-guide
No ratings yet
UCCX BK UAF969F8 00 Uccx-serviceability-Admin-guide
50 pages
IT Officer Exam Questions & Answers
No ratings yet
IT Officer Exam Questions & Answers
7 pages
Evolving A Hex-Playing Agent: Figure 1. A Completed Game of Hex On An 11x11 Board (From Wikipedia)
No ratings yet
Evolving A Hex-Playing Agent: Figure 1. A Completed Game of Hex On An 11x11 Board (From Wikipedia)
6 pages
CMS Integration Test Plan
No ratings yet
CMS Integration Test Plan
3 pages
Deploying Client Access Servers in Exchange
No ratings yet
Deploying Client Access Servers in Exchange
4 pages
Exam Overview: GCP Data Engineer
100% (1)
Exam Overview: GCP Data Engineer
12 pages
Iseries Commands
No ratings yet
Iseries Commands
28 pages
Debug Port Design Guidelines
No ratings yet
Debug Port Design Guidelines
7 pages
Neo4j Graph Data Modeling - Sample Chapter
100% (1)
Neo4j Graph Data Modeling - Sample Chapter
22 pages
Steady Convection and Diffusion 1D MATLAB CFD Code
No ratings yet
Steady Convection and Diffusion 1D MATLAB CFD Code
11 pages
If Statements
No ratings yet
If Statements
4 pages
Connecting to SQL Server with sqlcmd
No ratings yet
Connecting to SQL Server with sqlcmd
3 pages
SPECCTRA Command Guide for Engineers
100% (1)
SPECCTRA Command Guide for Engineers
4 pages
Rapid Miner
No ratings yet
Rapid Miner
24 pages
LTE Security I: Concept and Authentication
No ratings yet
LTE Security I: Concept and Authentication
13 pages
8051pin CH 34
No ratings yet
8051pin CH 34
23 pages
Logpap Package: LaTeX Graph Paper Examples
No ratings yet
Logpap Package: LaTeX Graph Paper Examples
1 page
Laboratory 1
No ratings yet
Laboratory 1
8 pages
RFP Vol II For CGSDC
No ratings yet
RFP Vol II For CGSDC
97 pages
Software Testing and Automation Overview
100% (2)
Software Testing and Automation Overview
29 pages
Linear Programming for Students
No ratings yet
Linear Programming for Students
4 pages
VHDL Monday Test
No ratings yet
VHDL Monday Test
2 pages
Chapter 20: Database System Architectures
No ratings yet
Chapter 20: Database System Architectures
38 pages
Fluent C# Errata and Notes Guide
No ratings yet
Fluent C# Errata and Notes Guide
82 pages
Event Management System Design
No ratings yet
Event Management System Design
19 pages
RIS SQL User's Guide
No ratings yet
RIS SQL User's Guide
312 pages
Mugabe School Record Management System
No ratings yet
Mugabe School Record Management System
34 pages
Learn Math Using Scratch
100% (1)
Learn Math Using Scratch
33 pages
Win 8.1 Powershell USB Suspend Fix - To Stop IStorage Drives From Locking
No ratings yet
Win 8.1 Powershell USB Suspend Fix - To Stop IStorage Drives From Locking
2 pages