0% found this document useful (0 votes)

15 views11 pages

Week 05 Classification Performance

Uploaded by

sabrinashah2002

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

15 views11 pages

Week 05 Classification Performance

Uploaded by

sabrinashah2002

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

05-09-2024

TOD 533
Classification Performance:
Validation and metrics
Amit Das
TODS / AMSOM / AU
[email protected]

Model validation: Holdout sample

• Training set: data for training model (optimum values of parameters)
• Validation set: assessing performance on data withheld from training
• Opportunity to set / refine some model (hyper)parameters
• Test set: Expose model to data of interest for prediction

• Avoid overfitting – customizing model to quirks of training data that

are absent in other (particularly, target) data
• Prefer simpler models (Occam’s razor)

1
05-09-2024

k-fold Cross-validation
• Divide training data into k equally-sized subsets
• Randomize order, if necessary
• Train model on subsets 2, 3, …, k
• Choose subset 1 for testing model

• Repeat with subsets 2, 3, …, k as testing sets

• Stratified k-fold cross-validation

• Average performance over k runs (accuracy, …)

Comparing predicted to actual

Confusion Classification
Matrix Table

2
05-09-2024

Performance: accuracy

Performance: precision

3
05-09-2024

Performance: sensitivity (recall)

Performance: specificity

4
05-09-2024

Accuracy, precision, sensitivity and specificity

Actual
Positive Negative
Positive True Positive False Positive
Predicted
TP FP
Negative False Negative True Negative
FN TN

Accuracy (TP + TN) / (TP + TN + FP + FN)

Precision TP / (TP + FP)
Sensitivity (Recall) TP / (TP + FN)
Specificity TN / (TN + FP)

In the Diabetes context

Predicted
Diabetic Healthy
Diabetic True Positive False Negative
TP FN
Actual
153 115
Healthy False Positive True Negative
FP TN
60 440

Accuracy (TP + TN) / (TP + TN + FP + FN) = 0.772

Precision TP / (TP + FP) = 0.718
Sensitivity (Recall) TP / (TP + FN) = 0.571
Specificity TN / (TN + FP) = 0.880

5
05-09-2024

Jamovi output: Classification table

Results
Classification Table – …
Predicted
Observed tested_negative tested_positive % Correct
tested_negative 445 55 89.0
tested_positive 112 156 58.2
Note. The cut-off value is set to 0.5

Results
Predictive Measures
Accuracy Specificity Sensitivity
0.783 0.890 0.582
Note. The cut-off value is set to 0.5

Accuracy of classification: Logistic Regression

Accuracy

6
05-09-2024

Confusion Matrix: Logistic Regression

Specificity

Precision Sensitivity

F-measure
• Harmonic mean of precision and recall

• More generally,

• b < 1 focuses on precision, while b > 1 emphasizes recall

7
05-09-2024

MCC (Matthews correlation coefficient)

• It can be calculated from the confusion matrix as:

ROC Curves
• ROC is an abbreviation of Receiver Operating Characteristic
coming from the signal detection theory, developed during
World War II (for analysis of radar images).
• In the context of classifiers, ROC plot is a useful tool to study
• the behavior of a classifier or
• comparing two or more classifiers.

• A ROC plot is a two-dimensional graph, where the x-axis

represents FP rate (FPR) and y-axis represents TP rate (TPR).

8
05-09-2024

Comparing classifiers using ROC Plot

• We can use the concept of the “area
under the curve” (AUC) as a method to
compare two or more classifiers
• If a model is perfect, then its AUC = 1
• If a model simply performs random
guessing, then its AUC = 0.5
• A model that is strictly better than
another has a larger value of AUC than
the other

• Here, C3 is best, and C2 is better than

C1 as AUC(C3) > AUC(C2) > AUC(C1)

Comparison of Area under the ROC curve (AUC)

Classifier Logistic Discriminant KNN-5 Naïve Bayes Decision Tree Decision Rules
AUC 0.832 0.832 0.766 0.819 0.751 0.739

Amit’s Grades
AUC > 0.9 Excellent
AUC 0.8 to 0.9 Very Good
AUC 0.7 to 0.8 Good
AUC 0.6 to 0.7 Needs Improvement
AUC 0.5 to 0.6 Hopeless

9
05-09-2024

Multiway Classification: The Iris dataset

SepalLength SepalWidth PetalLength PetalWidth Species

5.1 3.5 1.4 0.2 Iris-setosa
4.9 3 1.4 0.2 Iris-setosa
4.7 3.2 1.3 0.2 Iris-setosa
4.6 3.1 1.5 0.2 Iris-setosa
5 3.6 1.4 0.2 Iris-setosa
7 3.2 4.7 1.4 Iris-versicolor
6.4 3.2 4.5 1.5 Iris-versicolor
6.9 3.1 4.9 1.5 Iris-versicolor
5.5 2.3 4 1.3 Iris-versicolor
6.5 2.8 4.6 1.5 Iris-versicolor
6.3 3.3 6 2.5 Iris-virginica
5.8 2.7 5.1 1.9 Iris-virginica
7.1 3 5.9 2.1 Iris-virginica
6.3 2.9 5.6 1.8 Iris-virginica
6.5 3 5.8 2.2 Iris-virginica

Multinomial Logistic Regression

Model Coefficients - Species
Species Predictor Estimate SE Z p Odds ratio
Iris-versicolor -
Intercept 18.68 30.3 0.6165 0.538 1.30e+8
Iris-setosa
PetalWidth -3.09 39.7 -0.0779 0.938 0.04535
PetalLength 13.95 52.6 0.2655 0.791 1.15e+6
SepalWidth -8.65 134.2 -0.0645 0.949 1.75e-4
SepalLength -5.32 76.7 -0.0694 0.945 0.00488
Iris-virginica -
Intercept -23.70 31.2 -0.7594 0.448 5.10e-11
Iris-setosa
PetalWidth 15.10 40.2 0.3756 0.707 3.61e+6
PetalLength 23.34 52.9 0.4415 0.659 1.37e+10
SepalWidth -15.31 134.2 -0.1140 0.909 2.25e-7
SepalLength -7.78 76.7 -0.1015 0.919 4.17e-4

10
05-09-2024

Multiway classification (Weka)

Logistic Regression with ridge parameter of 1.0E-8

Coefficients...
Class
Variable Iris-setosa Iris-versicolor
=============================================== === Confusion Matrix ===
SepalLength 21.8065 2.4652
SepalWidth 4.5648 6.6809 a b c <-- classified as
PetalLength -26.3083 -9.4293 50 0 0 | a = Iris-setosa
PetalWidth -43.887 -18.2859 0 46 4 | b = Iris-versicolor
Intercept 8.1743 42.637 0 2 48 | c = Iris-virginica

Separability of classes

Lecture 3b - Evaluation
No ratings yet
Lecture 3b - Evaluation
37 pages
Module 5 ML
No ratings yet
Module 5 ML
12 pages
Lecture11evaluationmetricsforclassification 240913060639 0c766554
No ratings yet
Lecture11evaluationmetricsforclassification 240913060639 0c766554
28 pages
Ai DS 2 Book-Chpt-5
No ratings yet
Ai DS 2 Book-Chpt-5
17 pages
Model Evaluation of Classification Techniques
No ratings yet
Model Evaluation of Classification Techniques
9 pages
Machine Learning
No ratings yet
Machine Learning
9 pages
DL IT324a 4
No ratings yet
DL IT324a 4
52 pages
Unit3 7 Issues
No ratings yet
Unit3 7 Issues
24 pages
3 - Model Evaluation & Validation
No ratings yet
3 - Model Evaluation & Validation
47 pages
ML Lecture 11 Evaluation
No ratings yet
ML Lecture 11 Evaluation
17 pages
Notes 03
No ratings yet
Notes 03
38 pages
Unit6 - 7 Issues
No ratings yet
Unit6 - 7 Issues
53 pages
Classification and Decision Trees Overview
No ratings yet
Classification and Decision Trees Overview
50 pages
Machine Learning Evaluation Metrics Lecturer
No ratings yet
Machine Learning Evaluation Metrics Lecturer
30 pages
19-Performance Metrics
No ratings yet
19-Performance Metrics
23 pages
Lec5 Classification
No ratings yet
Lec5 Classification
27 pages
PROS - Ivanna Kristianti T - Predicting Receiver Operating Characteristic - Fulltext
No ratings yet
PROS - Ivanna Kristianti T - Predicting Receiver Operating Characteristic - Fulltext
5 pages
جلسه 13
No ratings yet
جلسه 13
76 pages
Lec09 Classifier Evaluation
No ratings yet
Lec09 Classifier Evaluation
185 pages
A10 Model Performance v2 2up
No ratings yet
A10 Model Performance v2 2up
11 pages
13-Module 5 - ROC Curve Analysis - Introduction and Motivation-26-09-2023
No ratings yet
13-Module 5 - ROC Curve Analysis - Introduction and Motivation-26-09-2023
8 pages
Machine Learning Model Evaluation
No ratings yet
Machine Learning Model Evaluation
11 pages
Lesson 6 Analytics Methods
No ratings yet
Lesson 6 Analytics Methods
12 pages
Binary Classification PDF
No ratings yet
Binary Classification PDF
27 pages
FALLSEM2024-25 BCSE334L TH VL2024250101768 2024-10-08 Reference-Material-I
No ratings yet
FALLSEM2024-25 BCSE334L TH VL2024250101768 2024-10-08 Reference-Material-I
18 pages
Unit 4
No ratings yet
Unit 4
20 pages
ML Metrics
No ratings yet
ML Metrics
9 pages
Evaluation in Ai
No ratings yet
Evaluation in Ai
25 pages
Performance Parameters
No ratings yet
Performance Parameters
14 pages
ML Model Evaluation Metrics
No ratings yet
ML Model Evaluation Metrics
8 pages
Classification Metrics
No ratings yet
Classification Metrics
39 pages
Machine Learning Project Report (Group 3) Shahbaz Khan
No ratings yet
Machine Learning Project Report (Group 3) Shahbaz Khan
11 pages
Chicco 2023
No ratings yet
Chicco 2023
23 pages
Chap3 Part1 Classification
No ratings yet
Chap3 Part1 Classification
38 pages
L22 KNN+Metrics
No ratings yet
L22 KNN+Metrics
18 pages
Analytics in Practice: Model Evaluation
No ratings yet
Analytics in Practice: Model Evaluation
40 pages
Iai&ml Unit-5
No ratings yet
Iai&ml Unit-5
15 pages
Unit 2 Chap 4
No ratings yet
Unit 2 Chap 4
14 pages
Guide To AUC ROC Curve in Machine Learning
No ratings yet
Guide To AUC ROC Curve in Machine Learning
10 pages
3-Performance Measures
No ratings yet
3-Performance Measures
35 pages
M.L L-9 Machine Learning Model Evaluation
No ratings yet
M.L L-9 Machine Learning Model Evaluation
20 pages
Auc Roc Curve Machine Learning
No ratings yet
Auc Roc Curve Machine Learning
12 pages
Performance Parameters
No ratings yet
Performance Parameters
23 pages
Ad3501-Dl-Unit 4 Notes
No ratings yet
Ad3501-Dl-Unit 4 Notes
16 pages
AUC ROC Curve for ML Enthusiasts
No ratings yet
AUC ROC Curve for ML Enthusiasts
5 pages
UNIT-1-2.Binary Classification and Related Tasks
No ratings yet
UNIT-1-2.Binary Classification and Related Tasks
22 pages
Day 6 Model Evaluation Generalization
No ratings yet
Day 6 Model Evaluation Generalization
49 pages
Classification Metrics Mod 6
No ratings yet
Classification Metrics Mod 6
8 pages
Exp7 MLAI2
No ratings yet
Exp7 MLAI2
8 pages
CS-6 Classification Evaluation Metrics
No ratings yet
CS-6 Classification Evaluation Metrics
26 pages
Data Mining: Class Imbalance Solutions
No ratings yet
Data Mining: Class Imbalance Solutions
56 pages
Ca 3 Merged
No ratings yet
Ca 3 Merged
275 pages
Tomato Disease Classification 1 3
No ratings yet
Tomato Disease Classification 1 3
3 pages
SupervisedLearning Classification
No ratings yet
SupervisedLearning Classification
20 pages
09 Class Advanced
No ratings yet
09 Class Advanced
64 pages
ML Model Evaluation Metrics
No ratings yet
ML Model Evaluation Metrics
11 pages
DUET Paper
No ratings yet
DUET Paper
8 pages
Mas Gen 08242023 1698729133510
No ratings yet
Mas Gen 08242023 1698729133510
130 pages
MOMENTUM: MetamOrphic Malware Exploration Techniques Using MSA Signatures
No ratings yet
MOMENTUM: MetamOrphic Malware Exploration Techniques Using MSA Signatures
6 pages
Test Review: Clinical Evaluation of Language Fundamentals - Fifth Edition (CELF-5)
67% (3)
Test Review: Clinical Evaluation of Language Fundamentals - Fifth Edition (CELF-5)
20 pages
A Systematic Review of Natural Language Processing For Knowledge
No ratings yet
A Systematic Review of Natural Language Processing For Knowledge
12 pages
Tampering Report
No ratings yet
Tampering Report
42 pages
Deteksi Spam Komentar Instagram Indonesia
No ratings yet
Deteksi Spam Komentar Instagram Indonesia
10 pages
Community Clinic Primary Care Roles
No ratings yet
Community Clinic Primary Care Roles
46 pages
Screening Case Study Exercises - Hannah Turner
100% (1)
Screening Case Study Exercises - Hannah Turner
4 pages
YOLO Based Object Detection Models: A Review and Its Applications
No ratings yet
YOLO Based Object Detection Models: A Review and Its Applications
40 pages
Unit - 3 Data Mining
No ratings yet
Unit - 3 Data Mining
25 pages
Nveo 9 (1) - 156 PDF
No ratings yet
Nveo 9 (1) - 156 PDF
14 pages
Tuberculosis: Seminar
No ratings yet
Tuberculosis: Seminar
13 pages
Fmicb 15 1372647
No ratings yet
Fmicb 15 1372647
8 pages
Internal Quality Control in Clinical Laboratories
50% (2)
Internal Quality Control in Clinical Laboratories
93 pages
Bio Stat Mid Term Final (Key)
No ratings yet
Bio Stat Mid Term Final (Key)
8 pages
Comparative Evaluation of CERES-Maize WOFOST-Maize and Ensemble of Models For Predicting Maize Phenology Growth and Grain Yield
No ratings yet
Comparative Evaluation of CERES-Maize WOFOST-Maize and Ensemble of Models For Predicting Maize Phenology Growth and Grain Yield
26 pages
MMP-7 as a Prognostic Biomarker in BA
No ratings yet
MMP-7 as a Prognostic Biomarker in BA
10 pages
Fortress Metal Phantom Detectors Manual
No ratings yet
Fortress Metal Phantom Detectors Manual
58 pages
Wearable Sensors Modalities Challenges and Prospects
100% (1)
Wearable Sensors Modalities Challenges and Prospects
33 pages
26XTDL Manual
No ratings yet
26XTDL Manual
84 pages
AMV Common Issues
No ratings yet
AMV Common Issues
35 pages
3D Machine Learning for Alzheimer's Classification
No ratings yet
3D Machine Learning for Alzheimer's Classification
2 pages
(IJCST-V12I2P14) :asst. Prof. Neethi Narayanan, Kalyani V Nair, Sreelakshmi A S, Sreelekha A, Harsha T K
No ratings yet
(IJCST-V12I2P14) :asst. Prof. Neethi Narayanan, Kalyani V Nair, Sreelakshmi A S, Sreelekha A, Harsha T K
5 pages
Part B - Chapter 8 - Evaluation
No ratings yet
Part B - Chapter 8 - Evaluation
35 pages
Questions and Answers
No ratings yet
Questions and Answers
6 pages
K-Nearest Neighbour KNN Algorithm Based Cooperative Spectrum Sensing in Cognitive Radio Networks
No ratings yet
K-Nearest Neighbour KNN Algorithm Based Cooperative Spectrum Sensing in Cognitive Radio Networks
6 pages
E Space
No ratings yet
E Space
6 pages
Accuracy of The American Association of Endodontists Diagnostic Criteria For Assessing Pulp Health in Primary Teeth
No ratings yet
Accuracy of The American Association of Endodontists Diagnostic Criteria For Assessing Pulp Health in Primary Teeth
12 pages
Project Report I
No ratings yet
Project Report I
52 pages

Week 05 Classification Performance

Uploaded by

Week 05 Classification Performance

Uploaded by

05-09-2024

Model validation: Holdout sample

• Avoid overfitting – customizing model to quirks of training data that

• Repeat with subsets 2, 3, …, k as testing sets

• Average performance over k runs (accuracy, …)

Comparing predicted to actual

Performance: sensitivity (recall)

Accuracy, precision, sensitivity and specificity

Accuracy (TP + TN) / (TP + TN + FP + FN)

In the Diabetes context

Accuracy (TP + TN) / (TP + TN + FP + FN) = 0.772

Jamovi output: Classification table

Accuracy of classification: Logistic Regression

Confusion Matrix: Logistic Regression

• b < 1 focuses on precision, while b > 1 emphasizes recall

MCC (Matthews correlation coefficient)

• It can be calculated from the confusion matrix as:

• A ROC plot is a two-dimensional graph, where the x-axis

Comparing classifiers using ROC Plot

• Here, C3 is best, and C2 is better than

Comparison of Area under the ROC curve (AUC)

Multiway Classification: The Iris dataset

SepalLength SepalWidth PetalLength PetalWidth Species

Multinomial Logistic Regression

Multiway classification (Weka)

Logistic Regression with ridge parameter of 1.0E-8

You might also like