0% found this document useful (0 votes)

28 views6 pages

5 Low Bit Quantization 1

The document discusses low-bit quantization for deep learning models, highlighting its importance in reducing memory usage and improving inference speed. It covers various quantization methods, including post-training quantization and quantization aware training, as well as low-bit model architectures like Binary Neural Networks and Ternary Weight Networks. Additionally, it emphasizes the need for specialized hardware and software optimizations to support low-bit operations.

Uploaded by

shubham jha

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

28 views6 pages

5 Low Bit Quantization 1

Uploaded by

shubham jha

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Low-bit Quantization

for Deep Learning Models

PD Dr. Haojin Yang

Multimedia and Machine Learning Group
Hasso Plattner Institute
Low-bit Quantization

• Neural network consists of floating-point operations and parameters

• E.g., FP32 (32-bit) with the range [(2-2-23) x 2127, (223 -2) x 2127], the number of possible values
is approximately 232.

• Quantization in digital signal processing refers to approximating the continuous value of the
signal to a finite number of discrete values.
• Neural network quantization refers to the use of low-bit values and operations instead of
full-precision counterparts.
• E.g., A fixed-point expression e.g., INT8 (8-bit) with the range [-128, 127], the number of possible
values is approximately 28

23.04.2025 Efficient AI Techniques in the LLM Era Gregory Maxwell at English Wikipedia, CC BY-SA 3.0 2
Neural Network Quantization

• Why does quantization work for deep neural networks?

• Deep neural networks are likely overparameterized.
• The neural network's weights have a narrow distribution range and are close to
zero.
• Advantages of neural network quantization
• Significantly save memory and improve inference speed
• Support more applications of edge devices
• Type of quantization methods
• Post-training quantization (PTQ)
• Quantization aware training (QAT)

23.04.2025 Efficient AI Techniques in the LLM Era 3

Low-bit Model Architectures

• Binary Neural Networks (BNNs): Using 1-bit

weights and activations

• Ternary Weight Networks (TWNs): Using -1,

0, +1 weight values

• Quantized Neural Networks (QNNs): 2-8 bit

precision models

• Mixed-precision architectures: Different bit-

widths for different layers

23.04.2025 Efficient AI Techniques in the LLM Era Image source: [Link] 4

Computing Engines and Optimizers

• Specialized hardware accelerators for low-bit operations (TPUs, NPUs)

• Software frameworks optimized for quantized computations
• Bit-serial computation techniques for flexible precision
• Energy efficiency gains through custom computing engines
• Training optimizers designed for low-precision gradients
• Memory bandwidth reduction through computation-in-memory approaches

Google’s Cloud TPU Nvidia GPU

23.04.2025 Efficient AI Techniques in the LLM Era 5

Quantization Aware Training

• Ultra-low bit quantization (< 8-bit) will cause significant precision drop.
• Train a neural network using quantized weights and activations
• Upcoming video: We will explain how do we train binary neural networks (1-bit).

round((2𝑘 − 1) ∙ 𝑥)
Forward: 𝑟𝑜 =
2𝑘 − 1
𝜕𝑐 𝜕𝑐
Backward: =
𝜕𝑟𝑖 𝜕𝑟𝑜

23.04.2025 Efficient AI Techniques in the LLM Era 6

Integer Quantization in Deep Learning
No ratings yet
Integer Quantization in Deep Learning
20 pages
Quantization in Neural Networks: A Comprehensive Analysis of Theory and Practice
No ratings yet
Quantization in Neural Networks: A Comprehensive Analysis of Theory and Practice
15 pages
TinyML Quantization Techniques
No ratings yet
TinyML Quantization Techniques
82 pages
Efficient Neural Network Quantization
No ratings yet
Efficient Neural Network Quantization
10 pages
Training High-Performance and Large-Scale Deep Neural Networks With Full 8-Bit Integers
No ratings yet
Training High-Performance and Large-Scale Deep Neural Networks With Full 8-Bit Integers
14 pages
Quantization in Deep Learning
No ratings yet
Quantization in Deep Learning
2 pages
Honey, I Shrunk The LLM! A Beginner's Guide To Quantization - The Register
No ratings yet
Honey, I Shrunk The LLM! A Beginner's Guide To Quantization - The Register
11 pages
Model Quantization Guide
No ratings yet
Model Quantization Guide
48 pages
Tutorial On DNN 6 of 9 Network and Hardware Co Design
No ratings yet
Tutorial On DNN 6 of 9 Network and Hardware Co Design
60 pages
Quantization Noise for Model Compression
No ratings yet
Quantization Noise for Model Compression
25 pages
Low Precision Deep Network Training
No ratings yet
Low Precision Deep Network Training
12 pages
Quantization and Training of Neural Networks For Efficient Integer-Arithmetic-Only Inference
No ratings yet
Quantization and Training of Neural Networks For Efficient Integer-Arithmetic-Only Inference
14 pages
Data-Free Quantization Through Weight Equalization and Bias Correction
No ratings yet
Data-Free Quantization Through Weight Equalization and Bias Correction
13 pages
A Visual Guide To Quantization - by Maarten Grootendorst
No ratings yet
A Visual Guide To Quantization - by Maarten Grootendorst
31 pages
Neural Network Quantization Guide
No ratings yet
Neural Network Quantization Guide
32 pages
2.game AI 1
No ratings yet
2.game AI 1
268 pages
A Survey of Quantization Methods For Efficient Neural Network Inference
No ratings yet
A Survey of Quantization Methods For Efficient Neural Network Inference
33 pages
04 AIS421 Finetuning Part 2
No ratings yet
04 AIS421 Finetuning Part 2
50 pages
BRECQ
No ratings yet
BRECQ
16 pages
Introduction To Weight Quantization PDF
No ratings yet
Introduction To Weight Quantization PDF
9 pages
DAC'22 EBSP Bit Sparsity DNN
No ratings yet
DAC'22 EBSP Bit Sparsity DNN
6 pages
Deep Learning Turorial PDF
No ratings yet
Deep Learning Turorial PDF
301 pages
Deep Learning Techniques and Applications
100% (1)
Deep Learning Techniques and Applications
179 pages
Quantizaion LLM Globalisation
No ratings yet
Quantizaion LLM Globalisation
6 pages
Low Precision Networks For Efficient Inference On Fpgas White Paper
No ratings yet
Low Precision Networks For Efficient Inference On Fpgas White Paper
6 pages
Jungwok Choi - tinyML Asia 2023
No ratings yet
Jungwok Choi - tinyML Asia 2023
17 pages
Hardware for Deep Learning Efficiency
No ratings yet
Hardware for Deep Learning Efficiency
68 pages
Efficient Hardware For DNN
No ratings yet
Efficient Hardware For DNN
77 pages
Auto QNN
No ratings yet
Auto QNN
23 pages
Introduction to Deep Learning Techniques
No ratings yet
Introduction to Deep Learning Techniques
299 pages
BitNet: Efficient 1-Bit Transformers
No ratings yet
BitNet: Efficient 1-Bit Transformers
14 pages
Notes For Deep Learning
No ratings yet
Notes For Deep Learning
6 pages
Back To Simplicit - How To Train Accurate BNNs From Scratch
No ratings yet
Back To Simplicit - How To Train Accurate BNNs From Scratch
9 pages
Adaptive Floating-Point for DNN Quantization
No ratings yet
Adaptive Floating-Point for DNN Quantization
10 pages
Kim Improving Accuracy of Binary Neural Networks Using Unbalanced Activation Distribution CVPR 2021 Paper
No ratings yet
Kim Improving Accuracy of Binary Neural Networks Using Unbalanced Activation Distribution CVPR 2021 Paper
10 pages
NNQuant 3
No ratings yet
NNQuant 3
28 pages
Differentiable Quantization of Deep Neural Networks: Equal Contribution
No ratings yet
Differentiable Quantization of Deep Neural Networks: Equal Contribution
21 pages
FP4 Quantization for LLM Training
No ratings yet
FP4 Quantization for LLM Training
17 pages
Minimizing Gradient Issues in DNNs
No ratings yet
Minimizing Gradient Issues in DNNs
105 pages
Mixed-Precision Quantization-Aware Training For Photonic Neural Networks
No ratings yet
Mixed-Precision Quantization-Aware Training For Photonic Neural Networks
19 pages
Fundamentals of Deep Learning
No ratings yet
Fundamentals of Deep Learning
26 pages
Autoencoders in Deep Learning
No ratings yet
Autoencoders in Deep Learning
73 pages
SmoothQuant - Accurate and Efficient Post-Training Quantization For Large Language Models
No ratings yet
SmoothQuant - Accurate and Efficient Post-Training Quantization For Large Language Models
13 pages
19EEE362:Deep Learning For Visual Computing: Dr.T.Ananthan
No ratings yet
19EEE362:Deep Learning For Visual Computing: Dr.T.Ananthan
23 pages
Hardware-Aware Automated Quantization
No ratings yet
Hardware-Aware Automated Quantization
10 pages
RTN: Reparameterized Ternary Network: Yuhang Li, Xin Dong, Sai Qian Zhang, Haoli Bai, Yuanpeng Chen, Wei Wang
No ratings yet
RTN: Reparameterized Ternary Network: Yuhang Li, Xin Dong, Sai Qian Zhang, Haoli Bai, Yuanpeng Chen, Wei Wang
9 pages
Neural Network Loss & Regularization
No ratings yet
Neural Network Loss & Regularization
112 pages
LLM Compute Challenges & Solutions
100% (1)
LLM Compute Challenges & Solutions
1 page
Efficient Deep Learning (First Early Release) (Gaurav Menghani Naresh Singh) (Z-Library)
No ratings yet
Efficient Deep Learning (First Early Release) (Gaurav Menghani Naresh Singh) (Z-Library)
69 pages
Deep Learning Tutorial Complete (v3)
No ratings yet
Deep Learning Tutorial Complete (v3)
109 pages
2 DL Training
No ratings yet
2 DL Training
60 pages
DNN Cheat Sheet
No ratings yet
DNN Cheat Sheet
5 pages
Entropy-Weighted Quantization for LLMs
No ratings yet
Entropy-Weighted Quantization for LLMs
29 pages
CH 06 Introduction To Neural Networks
No ratings yet
CH 06 Introduction To Neural Networks
45 pages
Deep Learning Computer Vision
No ratings yet
Deep Learning Computer Vision
302 pages
NGW 1
No ratings yet
NGW 1
20 pages
Minor Project Mentor Allocation CSE 2,7 TH Sem
No ratings yet
Minor Project Mentor Allocation CSE 2,7 TH Sem
3 pages
CSE-3 Morning 7th Sem
No ratings yet
CSE-3 Morning 7th Sem
3 pages
HTI Final Interview List - Maharaja Surajmal Institute of Technology
No ratings yet
HTI Final Interview List - Maharaja Surajmal Institute of Technology
1 page
1.5 - Knowledge Graphs
No ratings yet
1.5 - Knowledge Graphs
21 pages
Video 14 - Binary Cross Entropy Loss
No ratings yet
Video 14 - Binary Cross Entropy Loss
16 pages
1.2 - Knowledge and How To Represent It
No ratings yet
1.2 - Knowledge and How To Represent It
12 pages
1.4 - Graphs and Triples
No ratings yet
1.4 - Graphs and Triples
16 pages
NGW 2
No ratings yet
NGW 2
20 pages
Video 18 - Transfer Learning and Fine-Tuning Pretrained Models
No ratings yet
Video 18 - Transfer Learning and Fine-Tuning Pretrained Models
14 pages
1.0 - Knowledge Representation With Graphs
No ratings yet
1.0 - Knowledge Representation With Graphs
5 pages
1.3 - The Art of Understanding
No ratings yet
1.3 - The Art of Understanding
13 pages
Video 19 - Class Activation Mapping CAM
No ratings yet
Video 19 - Class Activation Mapping CAM
15 pages
Video 15 - Skip Connections
No ratings yet
Video 15 - Skip Connections
12 pages
Video 6 - Matrix Multiplications Non-Linear Activations and Network Shape
No ratings yet
Video 6 - Matrix Multiplications Non-Linear Activations and Network Shape
13 pages
8 Challenges and Solutions For Efficient LLM Deployment
No ratings yet
8 Challenges and Solutions For Efficient LLM Deployment
6 pages
Video 7 - Building A Multilayer Feedforward Network For Classification in PyTorch
No ratings yet
Video 7 - Building A Multilayer Feedforward Network For Classification in PyTorch
18 pages
Anthropic MCP Server
100% (2)
Anthropic MCP Server
10 pages
Leetcode Slides
No ratings yet
Leetcode Slides
20 pages
Video 4 - Introduction To Neural Networks
No ratings yet
Video 4 - Introduction To Neural Networks
18 pages
Python Basics and Flow Control Guide
No ratings yet
Python Basics and Flow Control Guide
20 pages
DLCD Unit 1-4 Merged
No ratings yet
DLCD Unit 1-4 Merged
160 pages
Neetcode Blind 75
No ratings yet
Neetcode Blind 75
55 pages
Assignment Test 1
No ratings yet
Assignment Test 1
3 pages
SWAYAM Assignment 9
No ratings yet
SWAYAM Assignment 9
3 pages
ADA FILE SJ
No ratings yet
ADA FILE SJ
30 pages
BlockChain IITKGP
No ratings yet
BlockChain IITKGP
58 pages
OS Scheduling & Management Guide
No ratings yet
OS Scheduling & Management Guide
22 pages
Certifiedincybersecurity Isc2
No ratings yet
Certifiedincybersecurity Isc2
28 pages
F650GS-CS Maintenance Schedule
No ratings yet
F650GS-CS Maintenance Schedule
2 pages
A Jar of Dreams
No ratings yet
A Jar of Dreams
7 pages
BML Answer Key
No ratings yet
BML Answer Key
21 pages
Decadentism and Symbolism
No ratings yet
Decadentism and Symbolism
3 pages
Flavour Boat Menu - Varca
No ratings yet
Flavour Boat Menu - Varca
17 pages
Pex 06 04
100% (5)
Pex 06 04
6 pages
An Analysis of Slang Words Used in Social Media
No ratings yet
An Analysis of Slang Words Used in Social Media
5 pages
Theming Animal Farm 2025
No ratings yet
Theming Animal Farm 2025
19 pages
Risk Management (EDU-200) - Quick Reference Guide
No ratings yet
Risk Management (EDU-200) - Quick Reference Guide
7 pages
(2023) Behavioral Finance. Hippocrates Personality and Behavioral of Islamic Finance On Investment Decision Gen Z
No ratings yet
(2023) Behavioral Finance. Hippocrates Personality and Behavioral of Islamic Finance On Investment Decision Gen Z
16 pages
Primary Math Data Skills
No ratings yet
Primary Math Data Skills
9 pages
Linear Algebra Exam Questions 2008
No ratings yet
Linear Algebra Exam Questions 2008
2 pages
Cooking Method Recipes
No ratings yet
Cooking Method Recipes
8 pages
Piping Isometric Drawing for CK09
No ratings yet
Piping Isometric Drawing for CK09
1 page
Pneumonia Detection On X-Ray Image Using Improved Depthwise Separable Convolutional Neural Networks
No ratings yet
Pneumonia Detection On X-Ray Image Using Improved Depthwise Separable Convolutional Neural Networks
9 pages
Understanding Art Appropriation
No ratings yet
Understanding Art Appropriation
18 pages
Mineral
No ratings yet
Mineral
38 pages
Basic Stanza Forms of Poetry PDF
No ratings yet
Basic Stanza Forms of Poetry PDF
7 pages
6.1.3 Final Exam - Physics Semester 1 (Test)
No ratings yet
6.1.3 Final Exam - Physics Semester 1 (Test)
11 pages
ICC-ES-AC 86-0619-Alt
No ratings yet
ICC-ES-AC 86-0619-Alt
10 pages
Finals-12056452: (4.8/5.0 - 158 Downloads)
No ratings yet
Finals-12056452: (4.8/5.0 - 158 Downloads)
83 pages
College of Health Sciences and Technology, Tsafe
No ratings yet
College of Health Sciences and Technology, Tsafe
1 page
AC Delco Newsletter - Jan-Feb 2011
No ratings yet
AC Delco Newsletter - Jan-Feb 2011
8 pages
67D Series Pressure Reducing Regulators Instruction Manual en 125226 PDF
No ratings yet
67D Series Pressure Reducing Regulators Instruction Manual en 125226 PDF
12 pages
Bluetooth Technology Overview
No ratings yet
Bluetooth Technology Overview
8 pages
Class 10 Maths Chapters 1-3 Test Paper
100% (2)
Class 10 Maths Chapters 1-3 Test Paper
1 page
Research Methodology Syllabus Overview
No ratings yet
Research Methodology Syllabus Overview
111 pages
World-Class Warehousing and Material Handling Second Edition Frazelle Ready To Read
No ratings yet
World-Class Warehousing and Material Handling Second Edition Frazelle Ready To Read
66 pages
7ApplicationLetterSamplesFormat, ExamplesandHowToWrite APlusTopper 1689521444
No ratings yet
7ApplicationLetterSamplesFormat, ExamplesandHowToWrite APlusTopper 1689521444
10 pages
Hebrew Translation of Arthurian Tales
No ratings yet
Hebrew Translation of Arthurian Tales
21 pages

5 Low Bit Quantization 1

Uploaded by

5 Low Bit Quantization 1

Uploaded by

Low-bit Quantization

for Deep Learning Models

PD Dr. Haojin Yang

• Neural network consists of floating-point operations and parameters

• Why does quantization work for deep neural networks?

23.04.2025 Efficient AI Techniques in the LLM Era 3

• Binary Neural Networks (BNNs): Using 1-bit

• Ternary Weight Networks (TWNs): Using -1,

• Quantized Neural Networks (QNNs): 2-8 bit

• Mixed-precision architectures: Different bit-

23.04.2025 Efficient AI Techniques in the LLM Era Image source: [Link] 4

• Specialized hardware accelerators for low-bit operations (TPUs, NPUs)

Google’s Cloud TPU Nvidia GPU

23.04.2025 Efficient AI Techniques in the LLM Era 5

23.04.2025 Efficient AI Techniques in the LLM Era 6

You might also like