0% found this document useful (0 votes)

12 views11 pages

Lec9 - Evaluation

Uploaded by

Ahmed Amer

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

12 views11 pages

Lec9 - Evaluation

Uploaded by

Ahmed Amer

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 11

Evaluation

Training Data and Test Data

• Training data: data used to build the model
• Test data: new data, not used in the training process

• Training performance is often a poor indicator of

generalization performance
– Generalization is what we really care about in ML
– Easy to overfit the training data
– Performance on test data is a good indicator of
generalization performance
– i.e., test accuracy is more important than training accuracy

Classification Metrics

# correct predictions
accuracy =
# test instances

# incorrect predictions
error = 1 — accuracy =
# test instances
Confusion Matrix
• Given a dataset of P positive instances and N negative instances:
Predicted Class
Yes No
TP + TN
Actual Class

Yes TP FN accuracy =
P + N
No FP TN

• Imagine using classifier to identify positive cases (i.e., for

information retrieval)
TP TP
precision = recall =
TP + F P TP + F N
Probability that a randomly Probability that a randomly
selected result is relevant selected relevant document
is retrieved

Example
Example: The Overfitting Phenomenon

A Complex Model
Y = high-order polynomial in X

X
The True (simpler) Model
Y = a X + b + noise

How Overfitting Aﬀects Prediction

Predictive
Error

Error on Training Data

Model Complexity
How Overfitting Aﬀects Prediction

Predictive
Error

Error on Test Data

Error on Training Data

Model Complexity

How Overfitting Aﬀects Prediction

Predictive Underfitting Overfitting

Error

Error on Test Data

Error on Training Data

Model Complexity

Ideal Range
for Model Complexity
Comparing Classifiers
Say we have two classifiers, C1 and C2, and want to
choose the best one to use for future predictions

Can we use training accuracy to choose between them?

• No!
– e.g., C1 = pruned decision tree, C2 = K-‐NN
training_accuracy(K‐NN) = 100%, but may not be best

Instead, choose based on test accuracy...

Training and Test Data

Training Data Idea:

Full Data Set Train each
model on the
“training data”...

...and then test

each model’s
Test Data
accuracy on
the test data
k-‐Fold Cross-‐Validation
• Why just choose one particular “split” of the data?
– In principle, we should do this multiple times since
performance may be diﬀerent for each split

• k-‐Fold Cross-‐Validation (e.g., k=10)

– randomly partition full data set of n instances into
k disjoint subsets (each roughly of size n/k)
– Choose each fold in turn as the test set; train model
on the other folds and evaluate
– Compute statistics over k test performances, or
choose best of the k models
– Can also do “leave-‐one-‐out CV” where k = n
k-‐Fold Cross-‐Validation

k-‐Fold Cross-‐Validation
Example 3-‐Fold CV

Full Data Set 1st Partition 2nd Partition kth Partition

Training
Test Data Data Training

Training
Test Data ... Data

Data Training
Data Test Data

Test Test Test

Performance Performance Performance

Summary statistics
over k test
performances

Optimizing Model Parameters

Training Data 1st Partition 2nd Partition kth Partition

Validation Training
Set Data Training

Training
Validation
Set
... Data

Data Training Validation

Data Set
Found that Found that Found that
Test Data optimal P = p1 optimal P = p2 optimal P = pk

Choose value of p of the model with the best validation performance

More on Cross-‐Validation
• Cross-‐validation generates an approximate estimate
of how well the classifier will do on “unseen” data
– As k  n, the model becomes more accurate
(more training data)
– ...but, CV becomes more computationally expensive
– Choosing k < n is a compromise

• Averaging over diﬀerent partitions is more robust

than just a single train/validate partition of the data

• It is an even better idea to do CV repeatedly!

Multiple Trials of k-‐Fold CV

1.) Loop for t trials:
Full Data Set
a.) Randomize
Data Set Shuﬄe

Full Data Set 1st Partition 2nd Partition kth Partition

Training
Test Data
Data Training
b.) Perform Test Data ... Data
k-‐fold CV Training
Data Training
Data Test Data

Test Test Test

Performance Performance Performance

2.) Compute statistics over

t x k test performances

2020 Evaluation PDF
No ratings yet
2020 Evaluation PDF
25 pages
L03 Generalization, Train Test Splits and Validation
No ratings yet
L03 Generalization, Train Test Splits and Validation
49 pages
Model Generalization
No ratings yet
Model Generalization
117 pages
14 Model Selection and Boosting
No ratings yet
14 Model Selection and Boosting
51 pages
CH-5 ML
No ratings yet
CH-5 ML
36 pages
Unit 3 ML
No ratings yet
Unit 3 ML
40 pages
Train and Test Datasets in Machine Learning
No ratings yet
Train and Test Datasets in Machine Learning
6 pages
K-Fold Cross Validation in Python
No ratings yet
K-Fold Cross Validation in Python
11 pages
Train and Test Datasets in Machine Learning
No ratings yet
Train and Test Datasets in Machine Learning
26 pages
ML Pyq Ans
No ratings yet
ML Pyq Ans
37 pages
CSL0777 L08
No ratings yet
CSL0777 L08
29 pages
Day 6 Model Evaluation Generalization
No ratings yet
Day 6 Model Evaluation Generalization
49 pages
ML Unit 4 Trupesh Patel
No ratings yet
ML Unit 4 Trupesh Patel
56 pages
Ovefitting, Generalization, Cross Validation
No ratings yet
Ovefitting, Generalization, Cross Validation
20 pages
Module 6
No ratings yet
Module 6
24 pages
Cofusion Matrix Cross - Validation
No ratings yet
Cofusion Matrix Cross - Validation
34 pages
Improving Machine Learning Performance
No ratings yet
Improving Machine Learning Performance
14 pages
Classifier Evaluation Techniques
No ratings yet
Classifier Evaluation Techniques
59 pages
Chapter 3
No ratings yet
Chapter 3
56 pages
Introduction To Machine Learning
No ratings yet
Introduction To Machine Learning
116 pages
Unit 2
No ratings yet
Unit 2
28 pages
Unit 5 (ML)
No ratings yet
Unit 5 (ML)
25 pages
Model Selection and Evaluation
No ratings yet
Model Selection and Evaluation
23 pages
Modelling and Evaluation
No ratings yet
Modelling and Evaluation
36 pages
Cross-Validation in Model Evaluation
No ratings yet
Cross-Validation in Model Evaluation
16 pages
Cross Validation Thesis
100% (4)
Cross Validation Thesis
5 pages
Unit I - ML For Data Analytics
No ratings yet
Unit I - ML For Data Analytics
106 pages
ML Unit 2
No ratings yet
ML Unit 2
18 pages
ML.1Lecture.2 (Old)
No ratings yet
ML.1Lecture.2 (Old)
23 pages
Overfitting vs Underfitting in ML
No ratings yet
Overfitting vs Underfitting in ML
20 pages
TR Rain Error
No ratings yet
TR Rain Error
6 pages
Evaluation Metrics
No ratings yet
Evaluation Metrics
25 pages
Lec 16
No ratings yet
Lec 16
18 pages
Comparing Multiple Algorithms
No ratings yet
Comparing Multiple Algorithms
70 pages
ML 3170724 Unit-3
No ratings yet
ML 3170724 Unit-3
48 pages
Presentation On Classification
No ratings yet
Presentation On Classification
18 pages
Data Mining: Practical Machine Learning Tools and Techniques
No ratings yet
Data Mining: Practical Machine Learning Tools and Techniques
73 pages
Understanding Model Regularization in ML
No ratings yet
Understanding Model Regularization in ML
42 pages
Prediction Accuracy in Data Modeling
No ratings yet
Prediction Accuracy in Data Modeling
28 pages
Unit 2 Part 2 Data Science Final 23june
No ratings yet
Unit 2 Part 2 Data Science Final 23june
39 pages
Model Evaluation
No ratings yet
Model Evaluation
44 pages
Overtraining and Cross-Validation in ML
No ratings yet
Overtraining and Cross-Validation in ML
20 pages
04 - Model Selection
No ratings yet
04 - Model Selection
62 pages
Lecture 5 Evaluation - Classifer
No ratings yet
Lecture 5 Evaluation - Classifer
61 pages
Evaluating Model Performance in ML
No ratings yet
Evaluating Model Performance in ML
16 pages
Cross Validation Techniques
No ratings yet
Cross Validation Techniques
27 pages
RO47002 - Lecture 2C - Hyperparameters and Cross-Validation
No ratings yet
RO47002 - Lecture 2C - Hyperparameters and Cross-Validation
10 pages
Ensemble Learning Techniques Explained
No ratings yet
Ensemble Learning Techniques Explained
107 pages
P-2.1.2 Cross Validation and Regularization
No ratings yet
P-2.1.2 Cross Validation and Regularization
37 pages
Lecture 9 - Evaluations
No ratings yet
Lecture 9 - Evaluations
68 pages
ML Mod 5
No ratings yet
ML Mod 5
58 pages
T1 ML QB Soln
No ratings yet
T1 ML QB Soln
23 pages
M.L L-6 Re-Sampling Methods
No ratings yet
M.L L-6 Re-Sampling Methods
24 pages
6 Model Evalution
No ratings yet
6 Model Evalution
16 pages
First Cut Draft LS1.4
No ratings yet
First Cut Draft LS1.4
11 pages
Chapter 7 Learning
No ratings yet
Chapter 7 Learning
34 pages
Codes and Concepts of ML-Developer-2
No ratings yet
Codes and Concepts of ML-Developer-2
17 pages
Lec 10
No ratings yet
Lec 10
36 pages
Jntuk r20 Unit-I Deep Learning Techniques (WWW - Jntumaterials.co - In)
No ratings yet
Jntuk r20 Unit-I Deep Learning Techniques (WWW - Jntumaterials.co - In)
23 pages
Group Assignment - Fraud Detection-1
No ratings yet
Group Assignment - Fraud Detection-1
15 pages
Previewpdf
No ratings yet
Previewpdf
45 pages
1-MATERIAL DL Syllabus V2
No ratings yet
1-MATERIAL DL Syllabus V2
2 pages
Traffic Prediction Using Machine Learning
No ratings yet
Traffic Prediction Using Machine Learning
7 pages
CS-30004 (Dsa) - CS End Nov 2024
No ratings yet
CS-30004 (Dsa) - CS End Nov 2024
17 pages
CalCOFI Machine Learning Model
No ratings yet
CalCOFI Machine Learning Model
7 pages
Predictive Analytics-Mid Sem Exam Question Bank
No ratings yet
Predictive Analytics-Mid Sem Exam Question Bank
28 pages
Chapter-2 (Deep Learning)
No ratings yet
Chapter-2 (Deep Learning)
18 pages
Python ML Guide for Beginners
100% (6)
Python ML Guide for Beginners
541 pages
Drdo Project Report Harsh
No ratings yet
Drdo Project Report Harsh
30 pages
Unit - 1 Deep Learning Techniques
No ratings yet
Unit - 1 Deep Learning Techniques
18 pages
Machine Learning in Manufacturing Efficiency
No ratings yet
Machine Learning in Manufacturing Efficiency
7 pages
WHAV
No ratings yet
WHAV
36 pages
ML Interview Questions
No ratings yet
ML Interview Questions
21 pages
Question Bank-DA
No ratings yet
Question Bank-DA
5 pages
Ensemble Methods Unit - 4
No ratings yet
Ensemble Methods Unit - 4
17 pages
Unit-5 ML Notes
No ratings yet
Unit-5 ML Notes
72 pages
Assignment SQGAN
No ratings yet
Assignment SQGAN
14 pages
Machine Learning - UNIT I Notes
No ratings yet
Machine Learning - UNIT I Notes
31 pages
UNIT-3 Material
No ratings yet
UNIT-3 Material
19 pages
ML Quiz 1
No ratings yet
ML Quiz 1
4 pages
Varshenee Report
No ratings yet
Varshenee Report
111 pages
02 Titanic Dataset Descr
No ratings yet
02 Titanic Dataset Descr
5 pages
Machine Learning-2
No ratings yet
Machine Learning-2
87 pages
Machine Learning Exam: Statistical Methods
No ratings yet
Machine Learning Exam: Statistical Methods
24 pages
Data Science 4-Week Internship Report
No ratings yet
Data Science 4-Week Internship Report
14 pages
Anomaly Detection in Power Meters
No ratings yet
Anomaly Detection in Power Meters
40 pages
Op Jeeva1
No ratings yet
Op Jeeva1
36 pages
School of Computer Science Engineering and Information System Review - Ii
No ratings yet
School of Computer Science Engineering and Information System Review - Ii
40 pages