0% found this document useful (0 votes)

100 views35 pages

CRF Tutorial for Sequence Prediction

This tutorial document covers conditional random fields (CRFs) for sequence prediction. It discusses how CRFs model the conditional distribution to predict sequences and are log-linear on feature functions. Parameter estimation is done by maximum likelihood, which is convex and solved through gradient-based methods. The document also generalizes CRFs to hidden CRFs, factorized linear models, and structured SVMs. Finally, it applies hidden CRFs to the problem of object recognition using a part-based model with spatial dependencies between image patches.

Uploaded by

muhammadkhahfi

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

100 views35 pages

CRF Tutorial for Sequence Prediction

Uploaded by

muhammadkhahfi

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Tutorial on Conditional Random Fields

for Sequence Prediction

Ariadna Quattoni
RoadMap

Sequence Prediction Problem

CRFs for Sequence Prediction

Generalizations of CRFs

Hidden Conditional Random Fields (HCRFs)

HCRFs for Object Recognition

RoadMap

Sequence Prediction Problem

CRFs for Sequence Prediction

Generalizations of CRFs

Hidden Conditional Random Fields (HCRFs)

HCRFs for Object Recognition

Sequence Prediction Problem

Example: Part-of-Speech Tagging

He reckons the current account deficit will narrow significantly

[PRP] [VB] [DT] [JJ] [NN] [NN] [MD] [VB] [RB]

Gesture Recognition

[HTF] [HTF] [HTF] [HOF] [HOF] [HOS]

RoadMap

Sequence Prediction Problem

CRFs for Sequence Prediction

Generalizations of CRFs

Hidden Conditional Random Fields (HCRFs)

HCRFs for Object Recognition

Conditional Random Fields:
Modelling the Conditional Distribution

Model the Conditional Distribution:

To predict a sequence compute:

Must be able to compute it efficiently.

Conditional Random Fields:
Feature Functions

Feature Functions:
Feature Functions

Express some characteristic of the empirical distribution

that we wish to hold in the model distribution
Conditional Random Fields:: Distribution

Label sequence modelled as a normalized product of

feature functions:

The model is log-linear on the Feature Functions

Parameter Estimation:Maximum Likelihood

IID training samples:

(negative) Conditional Log-Likelihood:

Parameter Estimation: Maximum Likelihood

Maximum Likelihood Estimation

Set optimal parameters to be:

This function is convex, i.e. no local minimums

Parameter Estimation:Optimization

Let:

Differentiating the log-likelihood with respect to parameter

Observed Mean Expected Feature

Feature Value Value Under
The Model
Parameter Estimation: Optimization

Generally, it is not possible to find and analytic solution to the

previous objective.

Iterative techniques, i.e. gradient based methods.

Maximum Entropy Interpretation

Notice that at the optimal solution of:

We must have that:

Finding max-entropy distribution that

Maximizing log-likelihood satisfies the set of constraints
defined by the feature functions
CRFs Inference
Given a model, i.e. parameter values

Can we compute the following efficiently?

Best Label
Sequence

Expected
Values

Both can be computed using dynamic programming.

RoadMap

Sequence Prediction Problem

CRFs for Sequence Prediction

Generalizations of CRFs

Hidden Conditional Random Fields (HCRFs)

HCRFs for Object Recognition

Generalization I: CRFs Beyond Sequences
Predicting Trees: Application Constituent Parsing

NP VP
PP

D N V P D N

The boy smiled at the girl

Generalization II: Factorized Linear Models

To predict a sequence compute:

Linear Model

Objective: making accurate predictions on unseen data

The parameters of the linear model can be

optimized using other loss functions
Generalization II: Factorized Linear Models
Structured Hinge Loss

Let be the correct label sequence:

Structured SVM
RoadMap

Sequence Prediction Problem

CRFs for Sequence Prediction

Generalizations of CRFs

Hidden Conditional Random Fields (HCRFs)

HCRFs for Object Recognition

Hidden Conditional Random Fields

Sentiment Detection

This movie greatly appealed to me for many reasons - I loved it

+1 Positive Review

As dumb as history gets

-1 Negative Review
Hidden Conditional Random Fields
Object Recognition

+1 Car

A training sample
Hidden Conditional Random Fields
Model the conditional probability:

We introduce hidden variables:

Analogus to the standard CRF we define:

Maps a configuration to the reals.

Hidden Conditional Random Fields
Feature Functions
Parameter Estimation
Maximum Likelihood:

Find optimal parameters:

Iterative techniques, i.e. gradient based methods.

But now the function is not convex!!!

At test time make prediction:

Parameter Estimation
The derivative of the loss function
is given by:

The derivative can be expressed in terms of components:

that can be calculated using dynamic programming.

Similarly the argmax can also be computed efficiently.
RoadMap

Sequence Prediction Problem

CRFs for Sequence Prediction

Generalizations of CRFs

Hidden Conditional Random Fields (HCRFs)

HCRFs for Object Recognition

Application :: Object Recognition
SemiSupervised Part-based
Models
Motivation

Use a discriminative model.

Spatial dependencies between parts.
It is convenient to use an intermediate discrete hidden variable.
Potential of learning semantically-meaningful parts.
Framework for investigating which part structures emerge.
Graph Structure
Feature Functions

is a minimum spanning tree.

Weight (i, j)= distance between patches xi and xj

obtained with Lowes detector (textured regions)

SIFT features (describes the texture of the image region).
Patch description also includes relative location.
Viterbi Configuration
Learning Shape
Conclusions
Factorized Linear Models generalize linear prediction models to
the setting of structure prediction.

In standard linear prediction, finding the argmax and computing

gradients is trivial. In structure prediction it involves inference.

Factored representations allow for efficient inference algorithms

(most times based on dynamic programming)

Conditional Random Fields are an instance of this framework

Future Work
Better Algorithms for training HCRFs

Conditional Random Fields Guide
No ratings yet
Conditional Random Fields Guide
5 pages
Conditional Random Fields in Sequence Labeling
No ratings yet
Conditional Random Fields in Sequence Labeling
28 pages
Chap 3
No ratings yet
Chap 3
52 pages
CRF Klinger Tomanek
No ratings yet
CRF Klinger Tomanek
32 pages
Crftut FNT PDF
No ratings yet
Crftut FNT PDF
109 pages
NLP Summary
No ratings yet
NLP Summary
2 pages
Conditional Random Fields: An Introduction: 1 Labeling Sequential Data
No ratings yet
Conditional Random Fields: An Introduction: 1 Labeling Sequential Data
9 pages
Hidden Conditional Random Fields For Phone Recognition: Yun-Hsuan Sung and Dan Jurafsky
No ratings yet
Hidden Conditional Random Fields For Phone Recognition: Yun-Hsuan Sung and Dan Jurafsky
6 pages
Intro to Conditional Random Fields
No ratings yet
Intro to Conditional Random Fields
90 pages
CRF Models for Sequence Labeling
No ratings yet
CRF Models for Sequence Labeling
25 pages
Conditional Random Fields (CRFS)
No ratings yet
Conditional Random Fields (CRFS)
13 pages
Conditional Random Fields in NLP
No ratings yet
Conditional Random Fields in NLP
21 pages
8 CRF
No ratings yet
8 CRF
12 pages
Quantum Conditional Random Field: PACS Numbers
No ratings yet
Quantum Conditional Random Field: PACS Numbers
9 pages
Conditional Random Field Model (CRF)
No ratings yet
Conditional Random Field Model (CRF)
31 pages
HLT 2004
No ratings yet
HLT 2004
8 pages
Unit 4 Conditional Random Field
No ratings yet
Unit 4 Conditional Random Field
4 pages
Module 3
No ratings yet
Module 3
17 pages
Structured Prediction
No ratings yet
Structured Prediction
3 pages
Adv Ai
No ratings yet
Adv Ai
9 pages
Visual Recognition
No ratings yet
Visual Recognition
123 pages
Theoretical Foundations of Conformal Prediction 1732440976
100% (2)
Theoretical Foundations of Conformal Prediction 1732440976
179 pages
Conditional Random Fields in Music Analysis
No ratings yet
Conditional Random Fields in Music Analysis
133 pages
Flexcrfs
No ratings yet
Flexcrfs
34 pages
Physics & Computation Seminar
No ratings yet
Physics & Computation Seminar
42 pages
Research On CDR
No ratings yet
Research On CDR
24 pages
Semi-Markov Conditional Random Fields For Information Extraction
No ratings yet
Semi-Markov Conditional Random Fields For Information Extraction
8 pages
Partially Directed Graphs and Conditional Random Fields: Sargur Srihari Srihari@cedar - Buffalo.edu
No ratings yet
Partially Directed Graphs and Conditional Random Fields: Sargur Srihari Srihari@cedar - Buffalo.edu
43 pages
Introduction to Conditional Random Fields
No ratings yet
Introduction to Conditional Random Fields
41 pages
Hidden Markov Models For Gesture Recognition: Donald O. Tanguay, JR
No ratings yet
Hidden Markov Models For Gesture Recognition: Donald O. Tanguay, JR
52 pages
OCR with Hidden Markov Models
100% (1)
OCR with Hidden Markov Models
31 pages
Shallow Parsing With Conditional Random Fields
No ratings yet
Shallow Parsing With Conditional Random Fields
8 pages
Handwritten Digit Recognition Report
No ratings yet
Handwritten Digit Recognition Report
9 pages
Advances in Predicting Structured Data
No ratings yet
Advances in Predicting Structured Data
29 pages
Understanding Conditional Random Fields
No ratings yet
Understanding Conditional Random Fields
10 pages
hw3 Solution
No ratings yet
hw3 Solution
7 pages
Advanced ML for Researchers
No ratings yet
Advanced ML for Researchers
57 pages
Markov Random Fields in Vision
No ratings yet
Markov Random Fields in Vision
15 pages
Machine Learning Technique - Introduction To Graphical Models
No ratings yet
Machine Learning Technique - Introduction To Graphical Models
12 pages
Hidden Markov Models
No ratings yet
Hidden Markov Models
15 pages
Lectures 7 and 8
No ratings yet
Lectures 7 and 8
37 pages
6438 CombinedNotes
No ratings yet
6438 CombinedNotes
206 pages
Class Test 2 Answer Key
No ratings yet
Class Test 2 Answer Key
4 pages
Survey of Pretrained Foundation Models
No ratings yet
Survey of Pretrained Foundation Models
97 pages
Pattern Recognition
No ratings yet
Pattern Recognition
52 pages
Mnist Handwritten Digit Classification
No ratings yet
Mnist Handwritten Digit Classification
26 pages
Hidden Markov Model (HMM) Architecture
No ratings yet
Hidden Markov Model (HMM) Architecture
15 pages
Pretrained Models: From BERT to ChatGPT
No ratings yet
Pretrained Models: From BERT to ChatGPT
99 pages
Decision Tree Fields
No ratings yet
Decision Tree Fields
8 pages
AMP3 Bayes
No ratings yet
AMP3 Bayes
37 pages
CRFs for Language Processing
No ratings yet
CRFs for Language Processing
8 pages
A Modest Thesis Draft
No ratings yet
A Modest Thesis Draft
155 pages
24f 09 Hidden Markov Models
No ratings yet
24f 09 Hidden Markov Models
79 pages
AAI Lab Manual FH-25
No ratings yet
AAI Lab Manual FH-25
20 pages
Discriminative Fields For Modeling Spatial Dependencies
No ratings yet
Discriminative Fields For Modeling Spatial Dependencies
8 pages
Hidden Markovnikov Model
No ratings yet
Hidden Markovnikov Model
32 pages
II YEAR EEE Sem3
No ratings yet
II YEAR EEE Sem3
462 pages
Least Square Method
No ratings yet
Least Square Method
23 pages
Mathematics Rank Booster Course
No ratings yet
Mathematics Rank Booster Course
2 pages
Discrete Maths
No ratings yet
Discrete Maths
51 pages
A Tabu Search Algorithm
No ratings yet
A Tabu Search Algorithm
19 pages
CS 51500 Homework 2 Solutions
No ratings yet
CS 51500 Homework 2 Solutions
41 pages
REAL Analysis
No ratings yet
REAL Analysis
254 pages
Graphing Five Base Functions Guide
No ratings yet
Graphing Five Base Functions Guide
5 pages
Further Curve Sketching
No ratings yet
Further Curve Sketching
4 pages
Fourier Series for Math Students
No ratings yet
Fourier Series for Math Students
19 pages
03 - Quotient Rule
No ratings yet
03 - Quotient Rule
1 page
Math9 q1 Mod1of8 Illustrations-Of-Quadratic-Equations v2
No ratings yet
Math9 q1 Mod1of8 Illustrations-Of-Quadratic-Equations v2
24 pages
Class 12 Mathematics Sample Paper 041
No ratings yet
Class 12 Mathematics Sample Paper 041
2 pages
Jones HeckeAlgebraRepresentations 1987
No ratings yet
Jones HeckeAlgebraRepresentations 1987
55 pages
11 - SM - 2017 - Math - Eng Export PDF
No ratings yet
11 - SM - 2017 - Math - Eng Export PDF
5 pages
Putnam 2021 Competition Solutions
100% (2)
Putnam 2021 Competition Solutions
5 pages
Understanding Distance Functions in ML
No ratings yet
Understanding Distance Functions in ML
7 pages
Math 317 HW #2 Solutions
No ratings yet
Math 317 HW #2 Solutions
4 pages
Vertex Irregular Labeling of Graphs
100% (1)
Vertex Irregular Labeling of Graphs
9 pages
3.3 Adding and Subtracting Rational Expressions
No ratings yet
3.3 Adding and Subtracting Rational Expressions
4 pages
Algebra 1 Section 10
No ratings yet
Algebra 1 Section 10
76 pages
Find f(x) from f'' and Conditions
No ratings yet
Find f(x) from f'' and Conditions
8 pages
X Maths Mindmaps
No ratings yet
X Maths Mindmaps
15 pages
Triangle Inequality Theorems
No ratings yet
Triangle Inequality Theorems
3 pages
Equations
No ratings yet
Equations
12 pages
Understanding Variables in Mathematics
No ratings yet
Understanding Variables in Mathematics
16 pages
Solutions Manual of Geometry For Enjoyment and Challenge by Rhoad & Milauskas - New Edition PDF
No ratings yet
Solutions Manual of Geometry For Enjoyment and Challenge by Rhoad & Milauskas - New Edition PDF
12 pages
Combinatorial Analysis Guide
No ratings yet
Combinatorial Analysis Guide
25 pages
Chebyshev Polynomials
No ratings yet
Chebyshev Polynomials
9 pages
Average (English)
No ratings yet
Average (English)
11 pages

CRF Tutorial for Sequence Prediction

Uploaded by

CRF Tutorial for Sequence Prediction

Uploaded by

Tutorial on Conditional Random Fields

for Sequence Prediction

Sequence Prediction Problem

CRFs for Sequence Prediction

Hidden Conditional Random Fields (HCRFs)

HCRFs for Object Recognition

Sequence Prediction Problem

CRFs for Sequence Prediction

Hidden Conditional Random Fields (HCRFs)

HCRFs for Object Recognition

Example: Part-of-Speech Tagging

He reckons the current account deficit will narrow significantly

[PRP] [VB] [DT] [JJ] [NN] [NN] [MD] [VB] [RB]

[HTF] [HTF] [HTF] [HOF] [HOF] [HOS]

Sequence Prediction Problem

CRFs for Sequence Prediction

Hidden Conditional Random Fields (HCRFs)

HCRFs for Object Recognition

Model the Conditional Distribution:

To predict a sequence compute:

Must be able to compute it efficiently.

Express some characteristic of the empirical distribution

Label sequence modelled as a normalized product of

The model is log-linear on the Feature Functions

IID training samples:

(negative) Conditional Log-Likelihood:

Maximum Likelihood Estimation

Set optimal parameters to be:

This function is convex, i.e. no local minimums

Differentiating the log-likelihood with respect to parameter

Observed Mean Expected Feature

Generally, it is not possible to find and analytic solution to the

Iterative techniques, i.e. gradient based methods.

Notice that at the optimal solution of:

We must have that:

Finding max-entropy distribution that

Can we compute the following efficiently?

Both can be computed using dynamic programming.

Sequence Prediction Problem

CRFs for Sequence Prediction

Hidden Conditional Random Fields (HCRFs)

HCRFs for Object Recognition

The boy smiled at the girl

To predict a sequence compute:

Objective: making accurate predictions on unseen data

The parameters of the linear model can be

Let be the correct label sequence:

Sequence Prediction Problem

CRFs for Sequence Prediction

Hidden Conditional Random Fields (HCRFs)

HCRFs for Object Recognition

This movie greatly appealed to me for many reasons - I loved it

As dumb as history gets

We introduce hidden variables:

Analogus to the standard CRF we define:

Maps a configuration to the reals.

Find optimal parameters:

Iterative techniques, i.e. gradient based methods.

At test time make prediction:

The derivative can be expressed in terms of components:

that can be calculated using dynamic programming.

Sequence Prediction Problem

CRFs for Sequence Prediction

Hidden Conditional Random Fields (HCRFs)

HCRFs for Object Recognition

Use a discriminative model.

is a minimum spanning tree.

obtained with Lowes detector (textured regions)

In standard linear prediction, finding the argmax and computing

Factored representations allow for efficient inference algorithms

Conditional Random Fields are an instance of this framework

You might also like