Finetuning Large Language Models - Short Course

Finetuning Large Language Models - Short course .

Uploaded by

suresc

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

159 views16 pages

Finetuning Large Language Models - Short Course

Finetuning Large Language Models - Short course .

Uploaded by

suresc

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

What does finetuning

do for the model?

● Lets you put more data into the model than what fits into
the prompt
● Gets the model to learn the data, rather than just get
access to it
What does finetuning
do for the model?

● Steers the model to more consistent outputs

● Reduces hallucinations
● Customizes the model to a specific use case
● Process is similar to the model's earlier training
Prompt Engineering vs. Finetuning

● No data to get started ● Nearly unlimited data fits

● Smaller upfront cost ● Learn new information
● No technical knowledge ● Correct incorrect information
needed ● Less cost afterwards if
● Connect data through smaller model
retrieval (RAG) ● Use RAG too

● Much less data fits ● More high-quality data

● Forgets data ● Upfront compute cost
● Hallucinations ● Needs some technical
● RAG misses, or gets knowledge, esp. data
incorrect data

Generic, side projects, prototypes Domain-specific, enterprise,

production usage, …privacy!
Benefits of finetuning your own LLM
Where finetuning fits in
Pretraining
● Model at the start:
○ Zero knowledge about the world
○ Can’t form English words
● Next token prediction
● Giant corpus of text data
● Often scraped from the internet:
“unlabeled”
● Self-supervised learning

● After Training
○ Learns language
○ Learns knowledge
Limitations of
pretrained base models
Finetuning after pretraining

● Finetuning usually refers to training further

○ Can also be self-supervised unlabeled data
○ Can be “labeled” data you curated
○ Much less data needed
○ Tool in your toolbox
● Finetuning for generative tasks is not well-defined:
○ Updates entire model, not just part of it
○ Same training objective: next token prediction
○ More advanced ways reduce how much to update
(more later!)
What is finetuning doing for you?
● Behavior change
○ Learning to respond more consistently
○ Learning to focus, e.g. moderation
○ Teasing out capability, e.g. better at conversation
● Gain knowledge
○ Increasing knowledge of new specific concepts
○ Correcting old incorrect information
● Both
First time finetuning
What is instruction finetuning?

● AKA "instruction-tuned" or "instruction-following" LLMs

● Teaches model to behave more like a chatbot
● Better user interface for model interaction
○ Turned GPT-3 into ChatGPT
○ Increase AI adoption, from thousands of
researchers to millions of people
Instruction-following datasets

Some existing data is ready as-is, online:

● FAQs
● Customer support conversations
● Slack messages
LLM Data Generation
Non-Q&A data can also be
converted to Q&A
● Using a prompt template
● Using another LLM

● ChatGPT (“Alpaca”)
● Open-source models
Instruction Finetuning Generalization
● Can access model's pre-existing knowledge
● Generalize following instructions to other data, not in
finetuning dataset
Overview of Finetuning
Different Types of Finetuning

Why Finetuning
No ratings yet
Why Finetuning
7 pages
Lecture 3 Finetuning Part 1
No ratings yet
Lecture 3 Finetuning Part 1
85 pages
LLM Fine-Tuning: Best Practices & Tools
100% (1)
LLM Fine-Tuning: Best Practices & Tools
13 pages
Fine Tuning Dictionary
No ratings yet
Fine Tuning Dictionary
17 pages
Full Fine-Tuning, PEFT, Prompt Engineering, or RAG
No ratings yet
Full Fine-Tuning, PEFT, Prompt Engineering, or RAG
23 pages
LLM Finetuning
No ratings yet
LLM Finetuning
11 pages
3 - Where Finetuning Fits
No ratings yet
3 - Where Finetuning Fits
7 pages
Fine-Tuning Models for Developers
No ratings yet
Fine-Tuning Models for Developers
24 pages
The Art of Fine-Tuning Large Language Models Explained in Depth
No ratings yet
The Art of Fine-Tuning Large Language Models Explained in Depth
15 pages
Session 7 LLMs Fine Tuning and RAG
No ratings yet
Session 7 LLMs Fine Tuning and RAG
21 pages
Unit 3 Tuning and Optimization Techniques
No ratings yet
Unit 3 Tuning and Optimization Techniques
5 pages
Chapter 4 - Fine-Tune Models and Training Algorithms
No ratings yet
Chapter 4 - Fine-Tune Models and Training Algorithms
26 pages
AI Frameworks and Fine-Tuning: An Overview
No ratings yet
AI Frameworks and Fine-Tuning: An Overview
10 pages
Instruction Fine-Tuning Techniques
No ratings yet
Instruction Fine-Tuning Techniques
6 pages
Fine-Tuning AI Models for Developers
100% (2)
Fine-Tuning AI Models for Developers
19 pages
Fine-Tuning Large Language Models 2
No ratings yet
Fine-Tuning Large Language Models 2
9 pages
Fine-Tuning LLMs Explained
No ratings yet
Fine-Tuning LLMs Explained
6 pages
PEC Generative AI Training - Week 04 Day 01 Tahir Ali Bhutto
No ratings yet
PEC Generative AI Training - Week 04 Day 01 Tahir Ali Bhutto
4 pages
Compact Vision-Language With Open Weights, Faster Learning, Diffusion in Few Steps, LLMs Aid Tutors
No ratings yet
Compact Vision-Language With Open Weights, Faster Learning, Diffusion in Few Steps, LLMs Aid Tutors
15 pages
Pretraining & Finetuning
No ratings yet
Pretraining & Finetuning
13 pages
Azure OpenAI Fine-Tuning Guide
No ratings yet
Azure OpenAI Fine-Tuning Guide
4 pages
Fine-Tuning The Model What Why and How
No ratings yet
Fine-Tuning The Model What Why and How
3 pages
LLM Lifecycle & Fine-Tuning Guide
No ratings yet
LLM Lifecycle & Fine-Tuning Guide
2 pages
LLM Fine-Tuning Techniques Explained
No ratings yet
LLM Fine-Tuning Techniques Explained
16 pages
2.6 Fine Tuning
No ratings yet
2.6 Fine Tuning
3 pages
Week 4 - LLM - FineTuning
No ratings yet
Week 4 - LLM - FineTuning
38 pages
LLM Fince-Tuning
No ratings yet
LLM Fince-Tuning
16 pages
LLM Fine-Tuning - Presentation
No ratings yet
LLM Fine-Tuning - Presentation
7 pages
Pre Training
No ratings yet
Pre Training
4 pages
Fine Tuning LLM For Enterprise: Practical Guidelines and Recommendations
No ratings yet
Fine Tuning LLM For Enterprise: Practical Guidelines and Recommendations
17 pages
Best Practices For Fine-Tuning and Prompt Engineering LLMs - Weights & Biases LLM Whitepaper
50% (2)
Best Practices For Fine-Tuning and Prompt Engineering LLMs - Weights & Biases LLM Whitepaper
21 pages
Fine-Tuning LLMs with PEFT & LoRa Techniques
No ratings yet
Fine-Tuning LLMs with PEFT & LoRa Techniques
25 pages
Genai Llms w2
No ratings yet
Genai Llms w2
114 pages
LLM Fine-Tuning - LLM Inference Handbook
No ratings yet
LLM Fine-Tuning - LLM Inference Handbook
4 pages
Lora
No ratings yet
Lora
31 pages
Predibase Fine-Tuning LLMs Ebook
No ratings yet
Predibase Fine-Tuning LLMs Ebook
20 pages
Deep Learning Basics Lecture 11 Practical Methodology
No ratings yet
Deep Learning Basics Lecture 11 Practical Methodology
25 pages
Mora: High-Rank PEFT Techniques
No ratings yet
Mora: High-Rank PEFT Techniques
98 pages
CS194 2324B Majestic Shawarma
No ratings yet
CS194 2324B Majestic Shawarma
6 pages
LLMs - Adapting Foundation Models - Notes
No ratings yet
LLMs - Adapting Foundation Models - Notes
3 pages
W S M LLM F: T E D, M F M: HEN Caling Eets Inetuning HE Ffect of ATA Odel and Inetuning Ethod
No ratings yet
W S M LLM F: T E D, M F M: HEN Caling Eets Inetuning HE Ffect of ATA Odel and Inetuning Ethod
20 pages
Fine-Tuning Representation Models For Classification
No ratings yet
Fine-Tuning Representation Models For Classification
72 pages
Fine-Tuning Large Language Models Guide
No ratings yet
Fine-Tuning Large Language Models Guide
6 pages
Fine-Tuning Risks in Language Models
No ratings yet
Fine-Tuning Risks in Language Models
45 pages
Customizing LLMs for Developers
No ratings yet
Customizing LLMs for Developers
52 pages
Fine-tuning Generative Models for Tasks
No ratings yet
Fine-tuning Generative Models for Tasks
14 pages
Fine-Tuning Techniques for LLaMA Models
No ratings yet
Fine-Tuning Techniques for LLaMA Models
16 pages
Adaptive Fine-Tuning Strategies For Domain-Specific Large Language Models in Industrial Applications
No ratings yet
Adaptive Fine-Tuning Strategies For Domain-Specific Large Language Models in Industrial Applications
8 pages
Week 11 Chats
No ratings yet
Week 11 Chats
5 pages
Fine-Tuning Large Language Models For Entity Matching: Aaron Steiner Ralph Peeters Christian Bizer
No ratings yet
Fine-Tuning Large Language Models For Entity Matching: Aaron Steiner Ralph Peeters Christian Bizer
9 pages
Beginner's Guide to LLM Fine-Tuning
No ratings yet
Beginner's Guide to LLM Fine-Tuning
9 pages
How To Generate and Use Synthetic Data For Finetuning
No ratings yet
How To Generate and Use Synthetic Data For Finetuning
20 pages
Cfs3 Containment Fil Station
No ratings yet
Cfs3 Containment Fil Station
30 pages
Food & Beverage: Analytical Methods Manual
No ratings yet
Food & Beverage: Analytical Methods Manual
55 pages
WebTech Ass 2
No ratings yet
WebTech Ass 2
12 pages
Wisdom Orayer - Google Search
No ratings yet
Wisdom Orayer - Google Search
1 page
MBA Dissertation Help: Social Media Focus
100% (2)
MBA Dissertation Help: Social Media Focus
7 pages
2457 of 2025 GUVNL vs. Juniper Green Energy Pvt. Limited Others
No ratings yet
2457 of 2025 GUVNL vs. Juniper Green Energy Pvt. Limited Others
4 pages
Komar University of Science and Technology Fall 2025: Basic Radiological Assessment
100% (1)
Komar University of Science and Technology Fall 2025: Basic Radiological Assessment
48 pages
PMP Exam Chapter 1 & 2
No ratings yet
PMP Exam Chapter 1 & 2
24 pages
E10 Assignment 1
No ratings yet
E10 Assignment 1
5 pages
About Me PDF Love Romance (Love)
No ratings yet
About Me PDF Love Romance (Love)
1 page
First Quarter Exam in English 10
100% (1)
First Quarter Exam in English 10
2 pages
Biology 1201A
No ratings yet
Biology 1201A
5 pages
World Economics Cup 2024 Overview
No ratings yet
World Economics Cup 2024 Overview
13 pages
CSE19 - Award Sheet
No ratings yet
CSE19 - Award Sheet
3 pages
Abstract Analysis Group 2
No ratings yet
Abstract Analysis Group 2
6 pages
How To Get Your Prayers Answered, 0892742151
No ratings yet
How To Get Your Prayers Answered, 0892742151
34 pages
Understanding Phobias and Their Types
No ratings yet
Understanding Phobias and Their Types
6 pages
Chef Wan's Malaysian Cuisine Menu
No ratings yet
Chef Wan's Malaysian Cuisine Menu
6 pages
Chennai Metro Phase II Socio-Economic Survey
No ratings yet
Chennai Metro Phase II Socio-Economic Survey
23 pages
Tray Dryer Unit Drying Rate Analysis
No ratings yet
Tray Dryer Unit Drying Rate Analysis
8 pages
LBS Class 28 - Course Review & Study Deck - SIMEONE Spring 25
No ratings yet
LBS Class 28 - Course Review & Study Deck - SIMEONE Spring 25
198 pages
RKWORLD
No ratings yet
RKWORLD
3 pages
AnnexB Sample Board Resolution
No ratings yet
AnnexB Sample Board Resolution
2 pages
101 Disney Songs Recorder Text
No ratings yet
101 Disney Songs Recorder Text
240 pages
Community Health Nursing Overview
No ratings yet
Community Health Nursing Overview
9 pages
STS Pointers
No ratings yet
STS Pointers
4 pages
Direct and Indirect Speech Quiz
No ratings yet
Direct and Indirect Speech Quiz
3 pages
Nepal Bridge Standards Overview
No ratings yet
Nepal Bridge Standards Overview
70 pages
GBEN4005 (Oct 23) Assignment Brief - Entrepreneurial Orgs
No ratings yet
GBEN4005 (Oct 23) Assignment Brief - Entrepreneurial Orgs
8 pages
Coffee Pot
No ratings yet
Coffee Pot
4 pages

Finetuning Large Language Models - Short Course

Uploaded by

Finetuning Large Language Models - Short Course

Uploaded by

What does finetuning

do for the model?

● Steers the model to more consistent outputs

● No data to get started ● Nearly unlimited data fits

● Much less data fits ● More high-quality data

Generic, side projects, prototypes Domain-specific, enterprise,

● Finetuning usually refers to training further

● AKA "instruction-tuned" or "instruction-following" LLMs

Some existing data is ready as-is, online:

You might also like