0% ont trouvé ce document utile (0 vote)

69 vues21 pages

TD N°04 Huffman

Le document traite des techniques de codage à longueur variable, en se concentrant sur le codage de Huffman et le codage arithmétique. Le codage de Huffman, inventé en 1952, utilise des codes de longueur variable basés sur les probabilités d'apparition des symboles pour compresser les données sans perte. En revanche, le codage arithmétique, introduit en 1976, offre une compression plus efficace en représentant un message par des intervalles proportionnels aux probabilités des symboles.

Transféré par

Yasmine Chihab

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

69 vues21 pages

TD N°04 Huffman

Transféré par

Yasmine Chihab

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Le codage à longueur

variable
Introduction
 Contexte : codage ou compression des
données numériques

 Pourquoi : réduction de la quantité d ’éléments

binaires représentant l ’information
=> codage de source
Qté d'info. ima. originale [bit]
Taux de comp. =
Qté d'info. ima. compressée [ bit]

 Finalité : archivage ou transmission

2
 Codage Huffman (1952)
Le codage de Huffman est un algorithme de compression de données
sans perte. Le codage de Huffman utilise un code à longueur variable
pour représenter un symbole de la source (par exemple un caractère
dans un fichier).

Le code est déterminé à partir d'une estimation des probabilités

d'apparition des symboles de source, un code court étant associé aux
symboles de source les plus fréquents.

Il a été inventé par David Albert Huffman, et publié en 1952

3
Codage Huffman (1952)
 Algorithme de génération d’un code optimal symbole par symbole
 Codage à longueur variable : code long pour probabilités faibles

• Algorithme
1. Extraction des probabilités
2. Création de l’arbre
3. Création de la table de Huffman
4. Codage
On transmet la table + les codes en binaires

1. Lecture de la table de Huffman

2. Création de la table de décodage
3. Lecture séquentielle et décodage
4
 Codage Huffman, Principe : (1952)

L'arbre est créé suivant un principe simple : on associe à chaque fois

les deux nœuds de plus faibles poids, pour donner un nouveau nœud
dont le poids équivaut à la somme des poids de ses fils. On réitère ce
processus jusqu'à n'en avoir plus qu'un seul nœud : la racine. On
associe ensuite par exemple le code 0 à chaque embranchement
partant vers la gauche et le code 1 vers la droite.

5
Codage Huffman : Exemple 1
supposons que tous les messages envoyés d’une source à une
destination contiennent les lettres a, b, c, d et e representées par les
probabilités .05, .2, .4, .17 et .18, respectivement.
Notre but est d’encoder chaque caractère en une sequence de 1 et 0 de
manière a ce qu’aucun code representant un caractere ne représente le
prefix d’un autre.

Example: on ne peut pas avoir les codes “110” et “1101” car “110” est
un prefix de “1101”.

6
Codage Huffman : Exemple 1
Un noeud est représenté par :

lettre
probabilite

Gauche Droite

7
Solution
1
0 1 Code
c .6
.4 a= 100
0 1 b= 111
c= 0
.22 .38 d=101
0 1 0 1 e=110
a d e b
.05 .17 .18 .2
8
Codage de Huffman : Exemple 2

9
a
1
0.40
a
b 001 0.40 racine
0.18 b 1
0.18
c 011 c 001
0.10 0.10
011 (cefbdgh)
(cef)
d 0000 d 0.60
0.23
0.10 0.10 01 0
e 0100 (bdgh)
0.07 0.37
(ef) 00
f 0101 0.1 CODE
3010
0.06 Probabilité
(dgh) du regroupement DE LA
g 0.9 BRANCHE

0.05 00010 000

(gh) Codage de Huffman
h 00011 0.09
0.04 0001
a
1
a
b 001 1
b racine
c 011 c
001 0
011
(cefbdgh)
01
d 0000 d (cef)
00(bdgh)
e 0100
010
(ef) Boucle du décodage
f 0101 début à la racine ;
000
g (dgh) progression dans
le message jusqu’à
00010 0001 une feuille :
h (gh) lettre décodée.
00011
Le code de Huffman en pratique

Apparaît pratiquement partout…

 Dans les algorithmes de compression gzip, pkzip, winzip,bzip2.
 Les images compressées jpeg, png.
 L'audio compressée mp3.
Le code de Huffman en pratique
Limites

le codage de Huffman n'est pas adapté dans le cas d'une source
dont les propriétés statistiques évoluent au cours du temps,
puisque les probabilités des symboles se modifient et le codage
devient inadapté.
 La transmission de l'arbre de codage
 Chaque code est représenté par un nombre entier de bits.
 Codage Arithmétique (1976)

Le codage arithmétique est un codage entropique utilisé en

compression de données sans perte. Il permet une meilleure
compression que le codage de Huffman, sauf lorsque tous les poids
pour les feuilles/nœuds/racines de l'arbre de Huffman sont des
puissances de 2, auquel cas les deux méthodes sont équivalentes

14
 Codage Arithmétique (1976)
Le codage arithmétique (au même titre que le Codage de Huffman) est
un code à longueur variable, c'est-à-dire qu'un symbole de taille fixe
(en bits) sera codé par un nombre variable de bits, de préférence
inférieur ou égal à sa taille originale. On ne modifie donc pas la
densité de symboles mais leur codage afin de réduire l'espace qu'ils
occupent.

Ce qui différencie le codage arithmétique des autres codages sources

est qu'il code le message par morceaux (théoriquement il peut coder un
message entier de taille quelconque mais dans la pratique on ne peut
coder que des morceaux d'une quinzaine de symboles et représente
chacun de ces morceaux par un nombre n flottant.

15
 Codage Arithmétique, Compression (1976)
La compression demande un tableau statistique qui comprend :

La totalité des s symboles que l'on rencontre dans le message à

compresser.
Les probabilités p de rencontrer le symbole s dans le message.
L'intervalle [ 0 ; 1 [ découpé en intervalles proportionnel à la
probabilité p que le symbole s apparaisse dans le message (ex: si s a
50 % de chance d'apparaître, son intervalle fera 0,5).

Le but est d'appliquer une suite d'opérations à un intervalle donné

(couramment c'est l'intervalle [ 0 ; 1 [ ) afin de modifier ses bornes à
chaque ajout d'un symbole s et de restreindre au maximum le nombre
de possibilités du nombre de sortie.

16
 Codage Arithmétique, Compression (1976)
Voici les opérations à effectuer lors de l'ajout d'un symbole s :

On enregistre la différence entre la borne supérieure (BS) et la borne

inférieure (BI). On notera cette valeur BB.
La BS prend la valeur : BS=BI + BB * (BS_du_symbole_s)
La BI prend la valeur : BI=BI + BB * (BI_du_symbole_s)

17
 Codage Arithmétique, Décompression (1976)
Pour décompresser un fichier (représenté par un nombre n), il faut
utiliser la même table qui a été utilisée pour la compression puis
effectuer les étapes suivantes jusqu'à la fin du fichier :

Observer dans l'intervalle de quel symbole s se trouve le nombre,

ajouter s au fichier décompressé et garder en mémoire la probabilité p
de s ainsi que sa BI.

n prend la valeur n = ( n − B I ) / p .

Une fois le marqueur de fin atteint, l'algorithme s'arrête et le fichier est

considéré comme décompressé.

18
 Codage Arithmétique, Exemple (1976)
On appliquera ici l’algorithme de compression arithmétique sur le
texte "WIKI". On obtient dès lors le tableau suivant :
BS=BI + BB * (BS_du_symbole_s)
BI=BI + BB * (BI_du_symbole_s)

Par convention on initialise l'algorithme avec une borne inférieure

valant 0 et une borne supérieure valant 1. Il ne reste plus qu'à appliquer
la suite d'opérations vue précédemment à chaque ajout d'un caractère.

19
 Codage Arithmétique, Exemple (1976)

Donc, tout nombre compris dans intervalle [ 0 , 1640625 ; 0 , 1796875

sera une version compressée de la chaîne de caractère "WIKI". Le
nombre 0,17 étant compris dans cet intervalle, il peut convenir pour
représenter "WIKI" compressé. À l'inverse, 0,16 ou 0,1796875 n'étant
pas dans l'intervalle, ils ne conviendront pas et entraîneront des erreurs
lors du décodage.
 Codage Arithmétique, Exemple (1976)
Décompression
Supposons que l'on reçoive le message compressé 0,17, voici comment
il serait décodé : (On utilise évidemment le même tableau que
précédemment pour connaître les intervalles de chaque lettre et leurs
probabilités d'apparition). .

n=(n−BI)/p

On retrouve donc la bonne chaîne de caractères auparavant

compressée
21

Vous aimerez peut-être aussi

Codage Arithmétique : Compression Optimisée
Pas encore d'évaluation
Codage Arithmétique : Compression Optimisée
17 pages
Huffman
Pas encore d'évaluation
Huffman
23 pages
Algorithme de Compression de Huffman
100% (1)
Algorithme de Compression de Huffman
20 pages
Huffman
Pas encore d'évaluation
Huffman
18 pages
Techniques de Codage de Source en Télécommunication
Pas encore d'évaluation
Techniques de Codage de Source en Télécommunication
37 pages
Cours 2
Pas encore d'évaluation
Cours 2
4 pages
Compression et Codage de Données
Pas encore d'évaluation
Compression et Codage de Données
18 pages
Codage de Huffman
Pas encore d'évaluation
Codage de Huffman
5 pages
Codage de Huffman et Arithmétique
Pas encore d'évaluation
Codage de Huffman et Arithmétique
3 pages
Codage Entropique et Compression
Pas encore d'évaluation
Codage Entropique et Compression
9 pages
Compression de Images
Pas encore d'évaluation
Compression de Images
22 pages
Projet D Informatique M1BI - Compression Et Décompression de Texte. 1 Généralités Sur La Compression - Décompression de Texte
Pas encore d'évaluation
Projet D Informatique M1BI - Compression Et Décompression de Texte. 1 Généralités Sur La Compression - Décompression de Texte
6 pages
Cours 03 Théchniques de Codage
Pas encore d'évaluation
Cours 03 Théchniques de Codage
9 pages
CH 4 - Partie2 - CodageSource - 2324
Pas encore d'évaluation
CH 4 - Partie2 - CodageSource - 2324
32 pages
Compression de Huffman Diab - Copie
Pas encore d'évaluation
Compression de Huffman Diab - Copie
78 pages
TP5 Huffman
Pas encore d'évaluation
TP5 Huffman
4 pages
Codage Huffman et Compression des Données
Pas encore d'évaluation
Codage Huffman et Compression des Données
13 pages
Cours3 SM
Pas encore d'évaluation
Cours3 SM
44 pages
Introduction au Codage et Numération
Pas encore d'évaluation
Introduction au Codage et Numération
67 pages
File Temp 1260895409413625788
Pas encore d'évaluation
File Temp 1260895409413625788
57 pages
Cours 3 Compresssion
Pas encore d'évaluation
Cours 3 Compresssion
46 pages
Codage de Source A Longueur Variable - Compress
Pas encore d'évaluation
Codage de Source A Longueur Variable - Compress
13 pages
Codage Source Réseau
Pas encore d'évaluation
Codage Source Réseau
5 pages
Icc Serie 2.3
Pas encore d'évaluation
Icc Serie 2.3
4 pages
Compression et gestion des données
Pas encore d'évaluation
Compression et gestion des données
99 pages
TP 2 Théorie de L'information
Pas encore d'évaluation
TP 2 Théorie de L'information
7 pages
Sylia Converti PDF
Pas encore d'évaluation
Sylia Converti PDF
15 pages
TM Compression 2020
Pas encore d'évaluation
TM Compression 2020
24 pages
4 Huffman
Pas encore d'évaluation
4 Huffman
6 pages
Lecon 3 - Papier
Pas encore d'évaluation
Lecon 3 - Papier
14 pages
Compression de texte avec Huffman en C
Pas encore d'évaluation
Compression de texte avec Huffman en C
10 pages
Codage de Huffman et Alphabet
Pas encore d'évaluation
Codage de Huffman et Alphabet
12 pages
Compression de fichiers : méthodes et codes
Pas encore d'évaluation
Compression de fichiers : méthodes et codes
4 pages
Partie 2
Pas encore d'évaluation
Partie 2
68 pages
Huffman
Pas encore d'évaluation
Huffman
94 pages
Bac Blanc 2024 Sujet2
Pas encore d'évaluation
Bac Blanc 2024 Sujet2
20 pages
TIC Séance 5 - Codage Arithmétique (1) - Converti
Pas encore d'évaluation
TIC Séance 5 - Codage Arithmétique (1) - Converti
31 pages
BRHVR 2
Pas encore d'évaluation
BRHVR 2
17 pages
Codage Huffman pour Ingénieurs
Pas encore d'évaluation
Codage Huffman pour Ingénieurs
5 pages
Systèmes de numération et codage binaire
Pas encore d'évaluation
Systèmes de numération et codage binaire
29 pages
Codage Binaire et Systèmes Numériques
100% (1)
Codage Binaire et Systèmes Numériques
10 pages
Codage Huffman et Shannon-Fano en MATLAB
Pas encore d'évaluation
Codage Huffman et Shannon-Fano en MATLAB
11 pages
Chapitre2. Codage Des Informations
Pas encore d'évaluation
Chapitre2. Codage Des Informations
39 pages
Techniques de Codage et Compression
Pas encore d'évaluation
Techniques de Codage et Compression
2 pages
Logique combinatoire et systèmes de numération
Pas encore d'évaluation
Logique combinatoire et systèmes de numération
39 pages
Chapitre 2 - 2
Pas encore d'évaluation
Chapitre 2 - 2
8 pages
Compression de Données: Méthodes et Algorithmes
Pas encore d'évaluation
Compression de Données: Méthodes et Algorithmes
36 pages
Cours The Orie Information 2
Pas encore d'évaluation
Cours The Orie Information 2
38 pages
Compression numérique et trame 6x4
Pas encore d'évaluation
Compression numérique et trame 6x4
23 pages
Ds 2018
Pas encore d'évaluation
Ds 2018
4 pages
Série02 CC
Pas encore d'évaluation
Série02 CC
2 pages
Codage et Décodage Huffman en Matlab
Pas encore d'évaluation
Codage et Décodage Huffman en Matlab
9 pages
Huffman
Pas encore d'évaluation
Huffman
5 pages
Chapitre1 Systèmes de Numeration
Pas encore d'évaluation
Chapitre1 Systèmes de Numeration
32 pages
TP Codage Huffman sur MATLAB
50% (2)
TP Codage Huffman sur MATLAB
4 pages
Codage
Pas encore d'évaluation
Codage
32 pages
Chapitre 3 - Le Codage Et Représentation de L'information
Pas encore d'évaluation
Chapitre 3 - Le Codage Et Représentation de L'information
42 pages
Seance 1 - Chapitre 1 Codage
Pas encore d'évaluation
Seance 1 - Chapitre 1 Codage
38 pages
Chap4 Theorie de Info
Pas encore d'évaluation
Chap4 Theorie de Info
9 pages
Architecture Parallèle TD: Université Alger 1 2022/2023 Faculté Des Sciences Département MI M2 Rse
100% (1)
Architecture Parallèle TD: Université Alger 1 2022/2023 Faculté Des Sciences Département MI M2 Rse
2 pages
Chap4-Suite TAS L2-ASDA
Pas encore d'évaluation
Chap4-Suite TAS L2-ASDA
31 pages
Chapitre 1-Généralité
Pas encore d'évaluation
Chapitre 1-Généralité
64 pages
Support Cours MEPS 2022 FA
Pas encore d'évaluation
Support Cours MEPS 2022 FA
8 pages
Support Cours MEPS 2021 Chaines de Markov
100% (1)
Support Cours MEPS 2021 Chaines de Markov
9 pages
Chapitre 5 Capteur
Pas encore d'évaluation
Chapitre 5 Capteur
36 pages
Architectures MIMD : Définition et Types
Pas encore d'évaluation
Architectures MIMD : Définition et Types
13 pages
Série1.Cmtd Rse 2021-2022
Pas encore d'évaluation
Série1.Cmtd Rse 2021-2022
2 pages
Architecture MISD et VLIW en Informatique
Pas encore d'évaluation
Architecture MISD et VLIW en Informatique
10 pages
Persistance de Données
Pas encore d'évaluation
Persistance de Données
6 pages
Coherence de Cache
Pas encore d'évaluation
Coherence de Cache
22 pages
Introduction au Multithreading et Threads
Pas encore d'évaluation
Introduction au Multithreading et Threads
90 pages
Interface
Pas encore d'évaluation
Interface
16 pages
Architectures Paralleles
Pas encore d'évaluation
Architectures Paralleles
15 pages
Réseaux de Neurones
Pas encore d'évaluation
Réseaux de Neurones
27 pages
Stratégies et Techniques de Détection d'Intrusion
Pas encore d'évaluation
Stratégies et Techniques de Détection d'Intrusion
22 pages
Communications
Pas encore d'évaluation
Communications
116 pages
Sécurité Informatique à l'Université
Pas encore d'évaluation
Sécurité Informatique à l'Université
23 pages
Gestion des Risques Informatiques
100% (1)
Gestion des Risques Informatiques
15 pages
1 Introduction Enregistré Automatiquement
Pas encore d'évaluation
1 Introduction Enregistré Automatiquement
19 pages
2 Crypto
Pas encore d'évaluation
2 Crypto
38 pages
Métaheuristiques pour la coloration de graphes
Pas encore d'évaluation
Métaheuristiques pour la coloration de graphes
6 pages
TD Automates Partie 1 2019-2020 Solutions
100% (1)
TD Automates Partie 1 2019-2020 Solutions
28 pages
Article:: Résumé
Pas encore d'évaluation
Article:: Résumé
10 pages
TP3 - Ahmed Amine ESSABAR
Pas encore d'évaluation
TP3 - Ahmed Amine ESSABAR
6 pages
Conception D'Algorithmes DTL #1 (DPR: Diviser Pour Régner)
Pas encore d'évaluation
Conception D'Algorithmes DTL #1 (DPR: Diviser Pour Régner)
2 pages
Compte Rendu - TP02 1
Pas encore d'évaluation
Compte Rendu - TP02 1
12 pages
Exercices Crypto1
Pas encore d'évaluation
Exercices Crypto1
3 pages
Chapitre II Problème de Plus Court Chemin
Pas encore d'évaluation
Chapitre II Problème de Plus Court Chemin
12 pages
Avoce Jesutin Jonas 2021 Memoire
Pas encore d'évaluation
Avoce Jesutin Jonas 2021 Memoire
91 pages
Compte Rendu Du TP
Pas encore d'évaluation
Compte Rendu Du TP
18 pages
Chapitre 1 - Cours Asservissement Numérique
Pas encore d'évaluation
Chapitre 1 - Cours Asservissement Numérique
27 pages
Échantillonnage et Reconstruction des Signaux
Pas encore d'évaluation
Échantillonnage et Reconstruction des Signaux
8 pages
Méthodes Ensemble
Pas encore d'évaluation
Méthodes Ensemble
7 pages
Résolution de Systèmes Linéaires par Pivot de Gauss
Pas encore d'évaluation
Résolution de Systèmes Linéaires par Pivot de Gauss
3 pages
Chapitre 4
Pas encore d'évaluation
Chapitre 4
30 pages
Chp3 Les Techniques de Clustering
Pas encore d'évaluation
Chp3 Les Techniques de Clustering
40 pages
Cours 7-cnn
Pas encore d'évaluation
Cours 7-cnn
28 pages
SIrévision 1
Pas encore d'évaluation
SIrévision 1
6 pages
TD3: Plus Court Chemin PCC
Pas encore d'évaluation
TD3: Plus Court Chemin PCC
2 pages
Optimisation et Lagrangien
Pas encore d'évaluation
Optimisation et Lagrangien
13 pages
Compte Rendu TP 1: Analyse de Filtres Numériques Sous MATLAB
73% (11)
Compte Rendu TP 1: Analyse de Filtres Numériques Sous MATLAB
23 pages
La Méthode Du Grand M
0% (5)
La Méthode Du Grand M
5 pages
Evaluation Math Calcul Scientifique Exercices
Pas encore d'évaluation
Evaluation Math Calcul Scientifique Exercices
3 pages
Td1 TM IRS 2021
Pas encore d'évaluation
Td1 TM IRS 2021
3 pages
TD/TP 03 Conteneurs Et Boucles: 1 Travaux Dirigées
Pas encore d'évaluation
TD/TP 03 Conteneurs Et Boucles: 1 Travaux Dirigées
4 pages
PR Ése Ntation
Pas encore d'évaluation
PR Ése Ntation
55 pages
RNA - CH II - Perceptron
Pas encore d'évaluation
RNA - CH II - Perceptron
21 pages
05 Exercices Graphes
Pas encore d'évaluation
05 Exercices Graphes
2 pages
Introduction à la Programmation Linéaire
Pas encore d'évaluation
Introduction à la Programmation Linéaire
73 pages
Numérisation et Analyse de Signaux
Pas encore d'évaluation
Numérisation et Analyse de Signaux
4 pages