0% ont trouvé ce document utile (0 vote)
384 vues103 pages

Cours Multimedia

Le document présente un cours sur la technologie et les protocoles pour le multimédia, abordant l'historique, les applications, et les composants des systèmes multimédias. Il décrit les différents types de contenus multimédias tels que le texte, l'audio, l'image et la vidéo, ainsi que leurs caractéristiques techniques. Enfin, il souligne l'importance des avancées technologiques dans le domaine des télécommunications et de l'informatique pour le développement des systèmes multimédias modernes.

Transféré par

kika ssa
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
384 vues103 pages

Cours Multimedia

Le document présente un cours sur la technologie et les protocoles pour le multimédia, abordant l'historique, les applications, et les composants des systèmes multimédias. Il décrit les différents types de contenus multimédias tels que le texte, l'audio, l'image et la vidéo, ainsi que leurs caractéristiques techniques. Enfin, il souligne l'importance des avancées technologiques dans le domaine des télécommunications et de l'informatique pour le développement des systèmes multimédias modernes.

Transféré par

kika ssa
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Faculté de Technologie

Département Génie électrique


Master 2 Systèmes de Télécommunications

Cours: Technologie et protocoles pour le multimédia

Présenté par :

Dr BOULEDJFANE BADREDDINE ([Link]@[Link])

2022-2023
Introduction aux multimédias
Introduction aux multimédias


Introduction aux multimédias

 Historique des systèmes multimédias


Introduction aux multimédias

 La technologie multimédia actuelle est devenue possible grâce aux progrès


technologiques réalisés dans plusieurs domaines tels que : Télécommunications.
Informatique. Standards de codage audio, image et vidéo.
 Les industries de l’électronique grand public continuent de faire d’importants
progrès dans des domaines tels que les systèmes audio haute fidélité, les systèmes de
télévision, vidéo de haute qualité et les dispositifs de stockage (disques durs, CD, par
exemple).
 Les studios d’enregistrement en particulier ont sensiblement amélioré l’électronique
grand public, en particulier les équipements audio et vidéo de haute qualité.
 Les maisons d’édition ont contribué à l’élaboration de formats efficaces pour la
représentation des données. Notez que le langage de balisage hypertexte (HTML) du
WWW a été précédé par le développement de langages de balisage généralisés pour
la création de structures de document indépendantes de la machine.
Introduction aux multimédias

Classification :

 Perception: Exploiter nos cinq sens: entendre, voir, sentir, toucher et goûter. La plupart des systèmes
multimédia actuels n’utilisent que les sens audio et visuel.

 Représentation: Texte (code ASCII); Audio (PCM,wav); Image (jpeg;bmp);Vidéo(avi,mpeg).

 Présentation: Entrées ( clavier, souris, microphone et caméra). Sorties (papier, écran et les haut-

parleurs).

 Stockage: Le papier, les microfilms, les disquettes, les disques durs, les CD et les DVD.

 Transmission: Supports de transmission (Les fibres optiques, le câble coaxial et l'espace libre).

Protocoles de communications (Ethernet, TCP/IP,..).


Introduction aux multimédias
Introduction aux multimédias

Applications multimédias :
Vidéo à la demande (Video on Demand :VOD) : est utilisée pour le stockage, la transmission et l'affichage
de fichiers vidéo archivés dans un environnement en réseau. Exemple :Netflix, Hulu..

Streaming vidéo : YouTube est un site Web de partage de vidéos qui permet aux utilisateurs de
télécharger, d'afficher, de partager et d'évaluer le contenu généré par les utilisateurs.

Messagerie multimédia : Le courrier multimédia incorpore du texte, de l'audio, de la vidéo, etc. dans les
documents de courrier. L'extension Multimedia Internet Mail (MIME) est une norme Internet qui étend le
format de courrier électronique pour prendre en charge à la fois le texte et les pièces jointes non textuelles.

Conférence multimédia : est un ensemble de technologies de télécommunication interactives qui


permettent à deux ou plusieurs sites d'interagir via des transmissions vidéo et audio bidirectionnelles
simultanément. Il est également appelé collaboration visuelle ou un groupware.

Backbone de multidiffusion : est géré par un logiciel du domaine public. Les services comprennent: (1)
le transfert de données multimédias sur Internet et (2) la fourniture d'un réseau virtuel basé sur Internet.
Introduction aux multimédias

Applications multimédias :
Kiosques multimédia : est une structure physique comprenant un ordinateur multimédia qui affiche des
informations pour les passants. De plus, les utilisateurs peuvent interagir en utilisant des écrans tactiles et
des vidéos sonores et animées.

Télévision interactive (iTV) : permet un chemin de retour; en d'autres termes, les informations peuvent
circuler du diffuseur au téléspectateur et vice versa.

Applications éducatives : En raison de l'intégration de différents médias, l'e-learning a un meilleur


impact que l'apprentissage conventionnel : ClassRoom, CyberMath Scientific...

Archives multimédias et bibliothèques numériques : Les bibliothèques numériques sont des collections
stockées au format numérique et sont accessibles par ordinateur.

Des médias sociaux : utilise Internet pour connecter les utilisateurs à leurs amis, membres de leur famille
et connaissances. Les plateformes de médias sociaux les plus populaires sont Facebook, Twitter, LinkedIn
et Instagram.

Médias mobiles : Le contenu multimédia comme l'audio, les images et la vidéo peut être capturé et
partagé via les médias mobiles.
Introduction aux multimédias

Systèmes multimédias:

Un système multimédia typique se compose de cinq composants:

1)Connexion d'appareils.

2)Périphériques d'entrée.

3)Périphériques de sortie.

4)Périphériques de stockage.

5)Appareils de communication.
Introduction aux multimédias

Questions ?
1. Dans la préparation d'une présentation multimédia utilisant 2. Les utilisations du multimédia
des modes visuels, lesquels des éléments suivants sont comprennent:
impliqués? (a) le divertissement
(a) Parole, musique, effets sonores (b) le commerce électronique
(b) Parole, texte, vidéo (c) la présentation d'informations à l'aide de
(c) Images graphiques, animation, vidéo, texte différents éléments multimédias tels que des
(d) Parole, texte, audio images, des graphiques, de l'audio, de la vidéo
(e) Aucune de ces réponses et du texte
(d) le stockage et la transformation
d'informations
(e) tous
[Link] VOD est utilisée pour:
(a) Stockage
(b) Transmission
(c) Affichage
(d) a et b
(e) a, b et c
Contenus Multimédias
Contenus Multimédias

Texte :

 Le texte est la forme de base de la communication écrite.


 Il comprend des caractères tels que des lettres; Nombres; signe de ponctuation; et des
symboles spéciaux comme *, &, ^,%, etc.
 Ces caractères sont combinés en mots, phrases et paragraphes pour transmettre des
informations multimédias de base.
 Le contenu multimédia dépendent du texte pour de nombreuses choses:
 Le texte est la forme de communication la plus simple.
 La navigation dans l'application est facilitée par le texte.
 Le texte fournit les informations concernant l'application.
Contenus Multimédias

Texte : Polices de caractères

Exemples d’effets utilisés dans les polices de caractères :


Contenus Multimédias

Texte : Format du texte


 Le texte brut (Plain text): ASCII (American Standard Code for Information Interchange),
représente seulement les caractères contenus, sans leur apparence. Exemple : *.txt

 Le texte enrichi (Rich text) :incorpore des caractères de contrôle spéciaux dans le texte brut
pour fournir des fonctionnalités supplémentaires. Exemple : *.rtf

 L’hypertexte (Hypertext): est une amélioration du texte enrichi qui permet au lecteur
d’accéder aux différentes sections du document ou même d’accéder à un nouveau
document. Exemple : *.html
Contenus Multimédias

Texte : Format du texte


Contenus Multimédias

Texte : ASCII (7 bits ou 128 caractères)


Contenus Multimédias

Texte : Exemple
Prenons un livre de 800 pages. Chaque page a 40 lignes et chaque ligne a en moyenne 80
espaces (espaces compris). Si le livre est stocké sous forme numérique, combien d'espace de
stockage est requis ?

Le livre contient environ 800x40x80 ou 2,56 millions de caractères. En supposant que


chaque caractère soit représenté par huit bits (ou un octet), le livre nécessitera 2,56
millions d'octets ou 2,44 Mo.
Contenus Multimédias:Audio

Son :

 Le son est une onde qui se propage dans l’air et qui est perceptible grace au détecteur de
pression qui est le tympan, logé dans l’oreille.
 Ces vibrations sont ensuite converties en signaux transmis au cerveau par le nerf auditif.
Contenus Multimédias:Audio

Perception du son
Contenus Multimédias:Audio

Caractéristiques de l'audio :
Le son a des propriétés d'onde normales comme la réflexion, la réfraction et la diffraction.
Une onde sonore est caractérisée par les propriétés physiques suivantes :
Contenus Multimédias:Audio

Intensité du signal audio :


C’est l’intensité avec laquelle il est entendu par l’oreille humaine.
Intensité sonore (en dB) : 10 x log10(P/P0)
Contenus Multimédias:Audio

Fréquence (hauteur): la fréquence donne une mesure de la rapidité à laquelle se produisent


les variations périodiques de compression et de raréfaction et constitue une mesure de la
hauteur du son. Une tonalité aiguë correspond à un son haute fréquence, et inversement.
Contenus Multimédias:Audio

Timbre: Un ensemble de fréquences et leurs variations d’intensité permettent d’avoir une


signature sonore.
Contenus Multimédias:Audio

Canaux multiples :
 L'enregistrement et la reproduction du son : un seul canal audio.
 Le son reçu par les deux oreilles est décodé par le cerveau et les deux signaux résultants
déterminent la direction du son.
 Deux canaux audio pour produire un son stéréophonique.
 Quatre canaux audio (pour améliorer la qualité perçu par l’oreille) pour produire un son
quadriphoniques (surround 4.0).
Contenus Multimédias :Audio

Enregistrement audio multi-pistes :


Contenus Multimédias:Audio

Numérisation :
Contenus Multimédias:Audio

Échantillonnage :
Contenus Multimédias:Audio

Codage :
Contenus Multimédias:Audio

Erreur de
quantification
Contenus Multimédias:Audio

Débit d’information:
Contenus Multimédias:Audio

Critères de fidélité audio:

Qualité objective

Qualité subjective
Contenus Multimédias:Audio

Exemple:

Les CD ont 16 bits pour représenter chaque échantillon, totalisant ainsi 65


536 échantillons possibles sur un CD. Chaque canal est converti en bits à un
taux de 44 100 échantillons / s * 16 bits / échantillon = 705 600 bits / s.
Ainsi, 60 minutes * 60 secondes / min * 705 600 bits / sec * 2 canaux (stéréo)
= 5 080 320 000 bits = 605,62 Mo, ce qui correspond à la taille d'un CD.
Contenus Multimédias: image

Types d’images:
Image matricielle :
 Formée de pixel. Image vectorielle :
 Représente une image naturelle.  Formée de formules mathématiques.
 Image synthétique.

Problème de qualité : Problème de lecture :

Zoom , compression A chaque format un


logiciel.
Contenus Multimédias: image

Définir une image:


La définition: Le nombre de pixel dans une image : LxH La résolution :
C'est le nombre de points contenu dans une
longueur donnée (en pouce).
Pixel : abréviation
de
PICture Element

Les images fixes sont coûteuses en stockage :


 Résolution d’image : L (largeur) × H (hauteur)
 Codage des pixels : Ppixel (ex : RVB = 3 octets / pixels)
 Pimages = (L × H) × Ppixels
Contenus Multimédias: image

Définir une image:


Contenus Multimédias: image

Définir une image:


Contenus Multimédias: image

CODAGE DES COULEURS (ou profondeur des couleurs) :


Niveau de gris:
 Codage en 8 bits par pixel (bpp) => 28= 256 nuances.
 Codage en 16 bits par pixel (bpp) => 216= 65536 nuances.

Nuances de 256 gris Image niveau de gris à 8 bpp


Couleurs indexées : 256 couleurs
fixes, définies à l'avance dans une
palette.
Palette de 256 couleurs utilisées

Image en couleur indexées à 8 bpp


Contenus Multimédias: image

CODAGE DES COULEURS (ou profondeur des couleurs) :


Image RGB sur 24 bits

Rouge 8 bits Vert 8 Bleu 8 bits


bits
Contenus Multimédias: image

CODAGE DES COULEURS (ou profondeur des couleurs) :


RGB (24 bits)
Contenus Multimédias: image

CODAGE DES COULEURS (ou profondeur des couleurs) :


Contenus Multimédias: image

Formats :
Contenus Multimédias: image

Espace des couleurs :


Contenus Multimédias: image

Espace des couleurs :


RGB Color Images :

 En corrélation avec HSV.


 RGB est un système de couleurs additif.
 Vraie couleurs.
 Convient seulement à l’affichage.
 Introduction des fausses couleurs lors d’un traitement.
 Nécessité de passer vers un autre espace.

HS
YUV YI
V
Q
CM YCbC
Y r
Contenus Multimédias: image

Espace des couleurs : RG HS


B V
H représente la teinte; S signifie «saturation» d'une couleur; et V signifie «valeur», ce qui signifie la luminosité.
Le modèle de couleur HSV est couramment utilisé dans les logiciels de traitement et d'édition d'images.
Contenus Multimédias: image

Espace des couleurs : RG CM


B Y

Convient pour
l’impression
Contenus Multimédias: image

Espace des couleurs : YUV, YIQ et YCbCr


Contenus Multimédias: Vidéo

Vidéo numérique :

Frame

Contrairement aux signaux audio numériques échantillonnés dans le temps ou aux images numériques échantillonnées
dans le domaine spatial, un signal vidéo numérique est échantillonné à la fois dans l'espace et dans le temps.
Contenus Multimédias: Vidéo

Vidéo numérique :
 Les vidéos sont une succession de Nimages images fixes.

 Une vidéo est souvent accompagné de son : Pfilm = Pvidéo + Paudio

 Un signal vidéo numérique est défini par :


 Résolution d’image : L (largeur) × H (hauteur) .
 Codage des pixels : Ppixel (ex : RVB = 3 octets / pixels).
 Fréquence d’affichage : FPS (nombre d’images / seconde).
 Durée T (seconde).

 Poids d’une vidéo : Pvidéo = Pimages × Nimages = ((L × H) × Ppixel) × (T × FPS)

Exemple : Vidéo de 10 min à 24 fps, 640 x 480 pixels, 16 millions de couleurs (RVB) : Pvidéo = ((640 × 480) ×
3) × ((10 × 60) × 24) = 12 Go. Les données audio sont négligées.
Contenus Multimédias: Vidéo

Vidéo numérique :

La vidéo peut être affichée en mode entrelacée ou progressive. La vidéo entrelacée est une technique
permettant de doubler la fréquence d'images perçue introduite avec le signal vidéo utilisé avec la
télévision analogique sans consommer de bande passante supplémentaire. Étant donné que le signal
entrelacé contient deux champs d'une image vidéo prise à deux moments différents, il améliore la
perception du mouvement pour le spectateur et réduit le scintillement. Le balayage progressif est le
processus d'affichage, de stockage ou de transmission d'images animées dans lequel toutes les lignes de
chaque image sont dessinées en séquence.
Contenus Multimédias: Vidéo

Vidéo numérique :

Notation : Y (π ou i)/ f

Y = le nombre de lignes verticales dans le frame.

π = p (progressive) or i (entrelacée)

f = fréquence d'images.

Exemple: 1080p/50 représente un format progressif HD avec une résolution spatiale de 1920 × 1080 et
un échantillonnage temporel à 50 ips. De même 1080i/30 représente la même résolution spatiale, mais
cette fois entrelacée à 30 et 60 ips.
Contenus Multimédias: Vidéo

Les modes d’affichage :


Contenus Multimédias: Vidéo

Modèle de couleur :

L'œil humain est plus sensible au changement de luminosité qu'à la couleur. Ainsi, les composants Cb et Cr
peuvent être transmis à des taux inférieurs à ceux de la composante Y. Différents schémas d'échantillonnage sont
possible pour les composantes de chrominance Cb et Cr (grâce à la redondance).
Contenus Multimédias: Vidéo

Schémas d'échantillonnage :

Le schéma [Link] signifie que Le schéma [Link] les composantes Le schéma [Link] a une résolution
tous les composants sont Cb et Cr sont représentées avec quatre fois inférieure pour les
utilisés avec la pleine une résolution deux fois inférieure composants Cb et Cr par rapport à
résolution: chaque pixel à Y. En observant les quatre pixels, la composante Y.
contient les composants Y, on voit que pour 4 échantillons Y,
Cb et Cr. il y a 2 échantillons Cb et 2 Cr.
Contenus Multimédias: Vidéo

Schémas d'échantillonnage :

Schéma [Link] : tous les pixels contiennent trois composants (YCbCr), et si chacun d'eux nécessite 8 bits,
nous avons: 4 x 3 x 8 = 96 bits au total, soit 96/4 pixels = 24 bits / pixel.

Schéma [Link] : deux pixels contiennent trois composants et les deux autres pixels ne contiennent qu'un
seul composant. Par conséquent, le nombre moyen de bits par pixel est calculé comme suit:
(2 x 3 x 8 )+ (2 x 1 x 8 )= 64 bits au total, soit 64/4 pixel = 16 bits/pixel.

Schéma [Link] : Par analogie avec le cas précédent, on obtient:


(1 x 3 x 8) + (3 x 1 x 8) = 48 bits au total, c'est-à-dire 48/4 pixel = 12 bits / pixel.

L’exemple suivant illustre comment les schémas d'échantillonnage [Link] et [Link] influencent la quantité de
données. La taille d'image est de 352 x 288. Dans le premier cas ([Link]), nous avons: 352 x 288 pixels x 24
bits / pixel = 297 Ko. Dans le deuxième cas ([Link]): 352 x 288 pixels x 12 bits / pixel = 148,5 Ko.
Compression du Contenus Multimédias

 La compression des données est l'une des exigences les plus importantes dans le
développement du multimédia.

 Le besoin de compression des données est une conséquence des limites de la


capacité de stockage mémoire disponible et de la capacité de traitement.

 Le besoin de compression des données est également motivé par les trois facteurs
suivants:

[Link]ésentation des données multimédias.

[Link] et traitement des données.

[Link] d'informations multimédias.


Compression du Contenus Multimédias

Exemples :

 Une image en niveaux de gris de dimension 320 × 240 × 8 bits nécessite 77 Ko .

 Une image couleur de 1100 × 900 pixels et 24 bits couleur nécessite 3 Mo.

 Une vidéo couleur avec 640 × 480 et couleur 24 bits ayant une cadence d’affichage
de 30 ips nécessite 27,6 Mo.

 La télévision haute définition (HDTV; 1920 × 1080 pixels, couleur 24 bits, 30 ips)
nécessite 1,5 Gb / s

 Pour un son de qualité cinéma avec six canaux, la vitesse de transmission est
de 1 Go / heure.
Compression du Contenus Multimédias

La compression est une procédure permettant de réduire efficacement le nombre total


de bits nécessaires pour représenter certaines informations. La compression et la
récupération des données se déroulent en trois étapes:

• L'encodeur compresse les données d'entrée.

• Les données compressées sont ensuite stockées ou transmises via des réseaux.

• Le décodeur décompresse ensuite les données de sortie pour récupérer les données
d'origine.
Compression du Contenus Multimédias

Données et
informations :
 Les données et les informations n'ont pas la même connotation.

 Les données sont la manière dont les informations sont exprimées.

 Les données qui ne fournissent aucune information pertinente sont qualifiées de


données redondantes.

 L'objectif du codage ou de la compression d'image est de réduire la quantité


de données en réduisant la quantité de redondance.

Soit n1 = données et n2 = données - redondance ( après compression) :


CR (Taux de compression) = n1 / n2
RD (Redondance relative) = 1 - (1 / CR)
Compression du Contenus Multimédias

Données et informations :
Exemples
 Pour un manuel contenant 900 pages et une moyenne de 40 lignes par page,

chaque ligne contenant 75 caractères, espaces compris, la taille du fichier serait


de 900 × 40 × 75 = 2,7 millions de caractères. Si 8 bits (= 1 octet) sont nécessaires
par caractère, l'espace de stockage requis pour stocker le livre sous forme
numérique serait de 21,6 Mo, soit 2,7 millions d'octets. Ainsi, avec un modem 56
kbps, cela prendrait 6,5 minutes.

 Pour l'audio utilisant une fréquence d'échantillonnage de 44,1 kHz et 16 bits /


échantillon / canal et deux canaux stéréo, le débit binaire non compressé serait de
44100 × 16 × 2 bits par seconde, ce qui équivaut à 1,41 Mbps. Pour transmettre ce
signal via un modem à 56 kbps, un facteur de compression de 1,41 Mbps / 56 kbps
= 25,2 serait souhaitable.
Compression du Contenus Multimédias

Données et informations :
Exemples
 Pour une image couleur de 640 × 480 pixels avec une vraie couleur de 24 (8 × 3)
bits, l'espace requis serait de 640 × 480 × 8 × 3 bits, soit environ 7,37 Mo, et
prendrait 2,2 minutes pour être transmis via un Modem 56 kbps.

 Pour les vidéos affichant 30 de ces images par seconde, l'espace requis serait 30 fois
supérieur, soit environ 221 Mo par seconde.

Pour réaliser la compression, les redondances présentes dans ces éléments


multimédias doivent être supprimées lors du processus de codage.
Compression du Contenus Multimédias

Redondances :
 Redondances statistiques: désignent des probabilités non uniformes d'occurrences
des symboles de type multimédia.
 Redondances des connaissances: Le codeur ne transmet que les informations
nécessaires à la reconstruction. Pour les signaux musicaux, les noms des différents
instruments d'un orchestre et la manière dont ils sont joués peuvent être enregistrés.

 Redondances temporelles: pour les signaux variant dans le temps , il existe


souvent une forte corrélation entre les valeurs d'échantillons voisines. Cette
redondance inter-échantillons peut être supprimée par des techniques telles que le
codage prédictif et le codage par transformée.

 Redondances spatiales: dans les images et la vidéo, il existe une corrélation entre les
pixels voisins. Ceci est appelé redondance spatiale ou redondance interpixel. Il peut
être supprimé par codage prédictif et codage par transformée.
Compression du Contenus Multimédias

Redondances :
Redondances psychovisuelles: Le système visuel humain a une résolution limitée
(environ 32 niveaux de gris) et ne répond pas uniformément à toutes les informations
avec la même sensibilité. Les informations relativement moins importantes sont
appelées informations psychovisuelles redondantes et peuvent donc être éliminées
sans introduire de différence significative dans la perception visuelle.

La psychoacoustique : la perception sonore chez l'homme est basée sur le concept de


codage perceptuel. Le principe sous-jacent à ce codage est d'éliminer les informations
des signaux audio inaudibles à l'oreille humaine.
Compression du Contenus Multimédias

Bases de la théorie de
l'information :
 Considérons une source un alphabet S = {s1, s2,…, sk}, avec K symboles.

 Une séquence de caractères x [i] est constituée de N échantillons avec 1 ≤ i ≤ N.

 x est une variable aléatoire dont l'histogramme est une fonction discrète h [k] = nk,
nk étant le nombre de caractères représentés par le symbole sk.

 La fonction p[k] donne la probabilité d'occurrence du symbole sk et est définie


mathématiquement comme:

 La somme de toutes les probabilités d'occurrences de tous les symboles est l'unité :
Compression du Contenus Multimédias

Bases de la théorie de
l'information :
 Tous les symboles K ne sont pas également importants et certains sont utilisés plus

fréquemment que d'autres.


 L'information moyenne portée par un symbole est le log de la réciproque de sa
probabilité, c'est-à-dire le terme log(1/p[k]), qui désigne le nombre de bits nécessaires
pour coder sk.

 Entropie fournit une mesure du désordre dans un système.


Compression du Contenus Multimédias

Classification des algorithmes de compression :

La compression utilise essentiellement la redondance dans les données:


 Temporelle: dans les données 1D, les signaux 1D, l'audio, etc.

 Spatiale: corrélation entre pixels voisins ou éléments de données

 Spectrale: corrélation entre les composants de couleur ou de luminescence. Cela


utilise le domaine fréquentiel pour exploiter les relations entre la fréquence de
changement des données.

 Psycho-visuelle: exploiter les propriétés perceptives du système visuel humain.


Compression du Contenus Multimédias

Classification des algorithmes de compression :

La compression peut être classée de deux manières:

 Compression sans perte: où les données sont compressées et peuvent être


reconstituées (non compressées) sans perte de détails ou d'informations. Ceux-ci
sont également appelés systèmes de compression à préservation de bits ou
réversibles.

 Compression avec perte: où le but est d'obtenir la meilleure fidélité possible pour
un débit binaire donné ou de minimiser le débit binaire pour atteindre une mesure
de fidélité donnée. Les techniques de compression vidéo et audio sont les plus
adaptées à cette forme de compression.
Compression du Contenus Multimédias

Classification des algorithmes de compression :


 Si une donnée est compressée, elle doit clairement être décompressée (décodée)
avant de pouvoir être vue / écoutée.

 Cependant, certains traitements de données peuvent être possibles sous forme


codée.

 La compression sans perte implique souvent une forme de codage entropique et


est basée sur des techniques de théorie de l'information.

 La compression avec perte utilise des techniques de codage source qui peuvent
impliquer un codage par transformée, un codage différentiel ou une
quantification vectorielle.
Compression du Contenus Multimédias
Compression du Contenus Multimédias

Algorithmes de compression sans perte : Suppression de séquence répétitive

 Suppression de répétition
simple :
89400000000000000000000000000000000 nous pouvons remplacer par 894f32 où f est le drapeau pour zéro.

Suppression des zéros dans un fichier (suppression de longueur zéro) Silence dans les données audio,
pauses dans la conversation, etc. Bitmaps Blancs dans les fichiers texte ou source fond d’images.

 Run-length Encoding :

Séquence d'origine: 111122233333311112222 peut être encodé comme:

(1,4), (2,3), (3,6), (1,4), (2,4)


Compression du Contenus Multimédias

Algorithmes de compression sans perte : par substitution


 Ici, nous remplaçons un ou plusieurs motifs fréquemment répétés par un code. Le code est
plus court que le pattern qui nous donne la compression.

 Un schéma de substitution de motif simple pourrait utiliser du code prédéfini (par exemple,
remplacer toutes les occurrences de «The» par le code «&»).

 Plus généralement, les jetons sont attribués en fonction de la fréquence d'occurrences des
modèles:

 Compter l'occurrence des jetons

 Trier par ordre décroissant

 Attribuer des symboles aux jetons comptant le plus


Compression du Contenus Multimédias

Algorithmes de compression sans perte : codage entropique


Selon Shannon, l'entropie d'une source d'information S est définie comme:

Où pi est la probabilité que le symbole Si dans S.

 Log2 (1/pi) indique la quantité d'informations contenues dans Si, c'est-à-dire le nombre de
bits nécessaires pour coder Si.

 Par exemple, dans une image avec une distribution uniforme de l'intensité du niveau de gris,
c'est-à-dire pi = 1/256, alors le nombre de bits nécessaires pour coder chaque niveau de gris
est de 8 bits. L'entropie de cette image est de 8.

Que pensez-vous d'une image dans laquelle la moitié des pixels sont blancs (I = 220) et l'autre
moitié sont noirs (I = 10)?
Compression du Contenus Multimédias

Algorithmes de compression sans perte : codage entropique


 L'algorithme de Shannon-Fano :

1. Triez les symboles selon leurs fréquences / probabilités, par exemple ABCD.
2. Divisez récursivement en deux parties, chacune ayant environ le même nombre de comptes
Compression du Contenus Multimédias

Algorithmes de compression sans perte : codage entropique


 L'algorithme de Huffman :
Compression du Contenus Multimédias

Algorithmes de compression sans perte : codage entropique

 Codage adaptatif de Huffman.

 Codage arithmétique.

 Algorithme de Lempel-Ziv-Welch (LZW)


Compression du Contenus Multimédias

Algorithmes de compression avec perte :


 Le codage de la source est basé sur le contenu du signal d'origine est également appelé
codage basé sur la sémantique.

 Les taux de compression peuvent être élevés, mais cela représente un prix de perte
d'informations.

 De bons taux de compression peuvent être obtenus avec un codage source sans perte ou peu
de perte d'informations.
Compression du Contenus Multimédias

Algorithmes de compression avec perte :


Codage par transformation :
 Changement de l’espace de représentation.

 Chercher la redondance d’information.


Compression du Contenus Multimédias

Algorithmes de compression avec perte :


Codage par transformation :
Compression du Contenus Multimédias

Compression
d’images :
Compression du Contenus Multimédias

Compression
d’images :
Compression du Contenus Multimédias

Compression d’images : Codage d'image DCT et norme JPEG


Compression du Contenus Multimédias

Compression d’images : Codage d'image DCT et norme JPEG


Compression du Contenus Multimédias

Compression d’images :
Codage d'image DCT et
norme JPEG

Quantificatio
n
Compression du Contenus Multimédias

Compression d’images : Codage d'image DCT et norme JPEG

Zigzag ordering of quantized AC coefficients.


Compression du Contenus Multimédias

Compression d’images : Codage basée sur des ondelettes (JPEG 2000)

 L'étape de prétraitement est responsable de la mosaïque, de la conversion aux formats YCrCb et du décalage de niveau.

 La transformation en ondelettes discrètes :


Compression du Contenus Multimédias

Compression d’images : Codage basée sur des ondelettes (JPEG 2000)


Compression du Contenus Multimédias

Compression d’images : Codage basée sur des ondelettes (JPEG 2000)


Compression du Contenus Multimédias

Compression des vidéos :


Compression du Contenus Multimédias

Compression des vidéos : Redondance temporelle en


vidéo
Compression du Contenus Multimédias

Compression des
vidéos : Prédiction de
trame basée sur des blocs.
Compression du Contenus Multimédias

Compression des vidéos : Encodeur


Compression du Contenus Multimédias

Compression des vidéos : Décodeur


Compression du Contenus Multimédias

Compression des
vidéos : vecteurs de
mouvement
Compression du Contenus Multimédias

Compression audio :
Compression du Contenus Multimédias

Compression audio :
Compression du Contenus Multimédias

Compression audio : Méthodes de compression simples

 Les méthodes de compression sans perte traditionnelles (Huffman, LZW, etc.) ne


fonctionnent généralement pas bien sur la compression audio (la même raison que dans la
compression d'image).
 Voici quelques-unes des méthodes avec perte appliquées à la compression audio:

 Compression du silence - détecte le "silence", similaire au codage de longueur de série

 Modulation de code d'impulsion différentielle adaptative (ADPCM) :


(a) code la différence entre deux signaux consécutifs,
(b) s'adapte à la quantification afin que moins de bits soient utilisés lorsque la valeur est
plus petite.

 Le codage prédictif linéaire (LPC) ajuste le signal au modèle de parole, puis transmet les
paramètres du modèle.

 Code Excited Linear Predictor (CELP) fait le LPC, mais transmet également le terme
d'erreur - qualité d'audioconférence à 4,8 kbits / s.
Compression du Contenus Multimédias

Compression audio : Psychoacoustique

 La sensibilité de l'oreille n'est pas uniforme sur tout le spectre audio (20 Hz-20 KHz).
 L'oreille est plus sensible dans la gamme de fréquences 1-5 KHz.
 La sensibilité diminue à des fréquences de plus en plus élevées.
 Un signal tonal fort à une fréquence donnée peut masquer les signaux les plus faibles
correspondant aux fréquences voisines.
Tout signal audio dont
l'amplitude est inférieure au seuil
de masquage est inaudible à
l'oreille humaine. Cette
caractéristique du système auditif
peut être exploitée pour obtenir
une compression audio
supérieure.
Compression du Contenus Multimédias

Compression audio : Psychoacoustique


 Afin d'utiliser le modèle psychoacoustique, le signal audio est divisé en blocs de données de
courte durée. Le spectre de chaque bloc audio est ensuite estimé à l'aide de la transformée de
Fourier, et des seuils de masquage à différentes fréquences audio sont obtenus.

 L'allocation de bits de perception est alors effectuée. Le processus d'allocation de bits est
illustré sur la figure, avec un signal contenant plusieurs tonalités. En raison du seuil de
masquage, seules les tonalités Q, S et U seraient entendues, et les autres tonalités (P, R, T et V)
seraient masquées par les tonalités plus fortes.

 Puisque les tonalités P, R, T et V ne seraient pas entendues, ces signaux n'ont pas du tout
besoin d'être codés. Par conséquent, les bits sont attribués aux signaux correspondant aux
tonalités Q, S et U.

 Les bits alloués seraient proportionnels au niveau de signal au-dessus du seuil de masquage,
car les signaux plus forts sont généralement plus importants et doivent être codés plus
précisément.
Compression du Contenus Multimédias

Compression audio : Psychoacoustique


Compression du Contenus Multimédias

Compression audio : Psychoacoustique

 La technique de codage perceptuel peut être mise en œuvre efficacement dans le domaine
des sous-bandes. Ici, un signal audio passe à travers un banc de filtres numériques constitué
d'un banc de filtres passe-bas et passe-bande.
Compression du Contenus Multimédias

Compression audio : Psychoacoustique

 Le banc de filtres divise le signal en


plusieurs canaux à bande limitée
pour se rapprocher de la réponse
de bande critique de l'oreille
humaine. Les échantillons de
chaque sous-bande sont analysés et
comparés à un modèle
psychoacoustique. Ensuite, le
codeur quantifie de manière
adaptative les échantillons dans
chaque sous-bande sur la base du
seuil de masquage dans cette sous-
bande.
Compression du Contenus Multimédias

Compression audio : Psychoacoustique


 Chaque sous-bande est codée indépendamment avec plus ou moins de bits alloués aux
échantillons de la sous-bande.

 Le niveau de bruit de quantification introduit dans chaque sous-bande est déterminé par le
nombre de bits utilisés (plus de bits alloués produisent moins de bruit).

 L'allocation des bits est déterminée par le modèle psychoacoustique et l'analyse du signal lui-
même.

 Ces opérations sont répétées pour chaque sous-bande pour chaque nouveau bloc de données.
Les échantillons sont quantifiés dynamiquement en fonction de l'audibilité des signaux, et
l'ensemble du processus est très flexible.

 Le décodeur déquantifie les données quantifiées, qui sont ensuite passées à travers le banc de
filtres de synthèse résultant en la sortie audio reconstruite, qui peut ensuite être lue.
Compression du Contenus Multimédias

Vous aimerez peut-être aussi