Loss Functions and Transformers Notes

The document discusses various loss functions used in deep learning, particularly Binary Cross Entropy (BCE) and Log Loss for binary classification tasks, and their formulas. It also outlines loss functions for forecasting tasks with transformers, including MSE, MAE, Quantile Loss, and Cross Entropy, recommending MSE or MAE for standard forecasting. Additionally, it mentions Huber Loss as a useful option for handling outliers.

Uploaded by

mnikhilmnikki1997

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

14 views2 pages

Loss Functions and Transformers Notes

Uploaded by

mnikhilmnikki1997

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

Deep Learning Loss Functions &

Transformer Use Cases - Notes

1. Binary Cross Entropy (BCE)
Binary Cross Entropy is a loss function used for binary classification problems.
Formula:
BCE = -[y * log(p) + (1 - y) * log(1 - p)]
Where:
y = actual class label (0 or 1)
p = predicted probability (from sigmoid, between 0 and 1)
Usage:
- Classification tasks like spam detection, tumor detection (yes/no)
- Final layer uses sigmoid activation
- Used when outputs are binary or independent class probabilities

2. Log Loss
Log Loss is another name for Binary Cross Entropy.
- It uses logarithms to penalize wrong predictions harshly.
- Formula is the same as BCE.
- Commonly used in classification competitions and benchmarks.

3. Transformers for Forecasting - Loss Functions

The choice of loss function depends on the forecasting task:
1. Regression (predicting numeric values):
- MSE (Mean Squared Error): Penalizes large errors.
- MAE (Mean Absolute Error): More robust to outliers.
2. Probabilistic Forecasting (predicting uncertainty):
- Quantile Loss
- Negative Log-Likelihood (NLL)
3. Classification (binary output like up/down):
- Binary Cross Entropy
4. Multi-class Forecasting:
- Cross Entropy

Other Useful Losses:

- Huber Loss: Combination of MSE and MAE, useful for outliers with smooth gradients.

Recommendation: Start with MSE or MAE for standard forecasting tasks using transformers.

Cross Entropy Loss Explained
No ratings yet
Cross Entropy Loss Explained
21 pages
Loss Function in Deep Learning
No ratings yet
Loss Function in Deep Learning
15 pages
DeekshikaJadyada20 AP24LDS11
No ratings yet
DeekshikaJadyada20 AP24LDS11
4 pages
Comprehensive Guide to Loss Functions
No ratings yet
Comprehensive Guide to Loss Functions
8 pages
Loss Functions Types
No ratings yet
Loss Functions Types
11 pages
Lect 9 - Loss Functions
No ratings yet
Lect 9 - Loss Functions
28 pages
4-Loss Function
No ratings yet
4-Loss Function
8 pages
What Is A Loss Function
No ratings yet
What Is A Loss Function
3 pages
Deep Feedforward Neural Networks Guide
No ratings yet
Deep Feedforward Neural Networks Guide
97 pages
Loss Function
No ratings yet
Loss Function
5 pages
Deep Learning with Keras & TensorFlow
100% (1)
Deep Learning with Keras & TensorFlow
159 pages
Deep Learning Unit 2
No ratings yet
Deep Learning Unit 2
31 pages
Cross-Entropy Loss Function
No ratings yet
Cross-Entropy Loss Function
27 pages
Ch2-Training, Optimization and Regularization of DNN-new
No ratings yet
Ch2-Training, Optimization and Regularization of DNN-new
114 pages
Loss Function
No ratings yet
Loss Function
2 pages
Day 2 - Loss & Activation Functions
No ratings yet
Day 2 - Loss & Activation Functions
8 pages
Understanding Loss Functions in ML
No ratings yet
Understanding Loss Functions in ML
22 pages
Handwritten Notes - Unit 1,2
No ratings yet
Handwritten Notes - Unit 1,2
9 pages
DNN - M2 - Deep Feedforward NN 23dec
No ratings yet
DNN - M2 - Deep Feedforward NN 23dec
97 pages
Lec 04 Deep Networks 2
No ratings yet
Lec 04 Deep Networks 2
78 pages
Understanding Loss Functions in Machine Learning
No ratings yet
Understanding Loss Functions in Machine Learning
26 pages
Practical-5 - 2CEIT606 - Artificial Intelligence
No ratings yet
Practical-5 - 2CEIT606 - Artificial Intelligence
14 pages
8 Linear Classifiers HInge Loss 03-08-2024
No ratings yet
8 Linear Classifiers HInge Loss 03-08-2024
20 pages
Survey of Semantic Segmentation Loss Functions
No ratings yet
Survey of Semantic Segmentation Loss Functions
6 pages
Loss Functions in Deep Learning - MLearning - Ai
No ratings yet
Loss Functions in Deep Learning - MLearning - Ai
14 pages
Losses
No ratings yet
Losses
9 pages
3a Variations
No ratings yet
3a Variations
17 pages
APKA Report
No ratings yet
APKA Report
3 pages
Tutorial 1,2
No ratings yet
Tutorial 1,2
12 pages
Lesson 12
No ratings yet
Lesson 12
14 pages
Lect 8
No ratings yet
Lect 8
117 pages
Neural Networks
No ratings yet
Neural Networks
63 pages
Lecture 03 - Feedforward Networks - 4p
No ratings yet
Lecture 03 - Feedforward Networks - 4p
19 pages
Loss Functions
No ratings yet
Loss Functions
7 pages
Deep Learning Loss Functions
No ratings yet
Deep Learning Loss Functions
10 pages
CSD411 - Week 4 - MF, IT and Model 9
No ratings yet
CSD411 - Week 4 - MF, IT and Model 9
48 pages
Loss Functions
No ratings yet
Loss Functions
15 pages
Loss Function
No ratings yet
Loss Function
13 pages
Deep Neural Networks
No ratings yet
Deep Neural Networks
79 pages
FDL Module1
No ratings yet
FDL Module1
102 pages
Loss Functions
No ratings yet
Loss Functions
8 pages
Module 1 - Problems in Neural Network
No ratings yet
Module 1 - Problems in Neural Network
20 pages
UNIT 1 Introduction Part 1
No ratings yet
UNIT 1 Introduction Part 1
37 pages
3a Variations4
No ratings yet
3a Variations4
5 pages
DL Co-3 PPT 2
No ratings yet
DL Co-3 PPT 2
25 pages
Types of Neural Networks
No ratings yet
Types of Neural Networks
7 pages
7.losses and Activations
No ratings yet
7.losses and Activations
79 pages
ML Lec 10 ANN CrossEntropy Training
No ratings yet
ML Lec 10 ANN CrossEntropy Training
12 pages
Loss Functions in Deep Learning: A Comprehensive Review
No ratings yet
Loss Functions in Deep Learning: A Comprehensive Review
36 pages
Understanding Deep Learning Concepts
No ratings yet
Understanding Deep Learning Concepts
78 pages
AAI - Module 2 - Variational Autoencoders
No ratings yet
AAI - Module 2 - Variational Autoencoders
9 pages
Hyperparameter Tuning in DNNs
No ratings yet
Hyperparameter Tuning in DNNs
44 pages
ANN Analysis
No ratings yet
ANN Analysis
5 pages
Understanding Loss Functions in Deep Learning
No ratings yet
Understanding Loss Functions in Deep Learning
9 pages
Choosing Loss Functions for Neural Networks
No ratings yet
Choosing Loss Functions for Neural Networks
29 pages
Unit 2.1
No ratings yet
Unit 2.1
37 pages
Deep Learning Module-02 Search Creators
No ratings yet
Deep Learning Module-02 Search Creators
15 pages
FODL Question Bank
No ratings yet
FODL Question Bank
28 pages
Machine Learning (Deep Learning) - L2+ (Jun 2024)
No ratings yet
Machine Learning (Deep Learning) - L2+ (Jun 2024)
2 pages
My OOP Notes
No ratings yet
My OOP Notes
4 pages
Isekai Meikyuu de Dorei Harem Wo Vol 3
No ratings yet
Isekai Meikyuu de Dorei Harem Wo Vol 3
414 pages
Job Descriptiom-AIML-Offshore
No ratings yet
Job Descriptiom-AIML-Offshore
2 pages

Loss Functions and Transformers Notes

Uploaded by

Loss Functions and Transformers Notes

Uploaded by

Deep Learning Loss Functions &

Transformer Use Cases - Notes

3. Transformers for Forecasting - Loss Functions

Other Useful Losses:

You might also like