0% ont trouvé ce document utile (0 vote)
85 vues39 pages

De l'analogique au numérique vidéo

Ce document décrit le passage de la vidéo analogique à la vidéo numérique. Il explique le fonctionnement des caméras vidéos analogiques et numériques, et détaille les standards vidéos analogiques et numériques.

Transféré par

lawson
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
85 vues39 pages

De l'analogique au numérique vidéo

Ce document décrit le passage de la vidéo analogique à la vidéo numérique. Il explique le fonctionnement des caméras vidéos analogiques et numériques, et détaille les standards vidéos analogiques et numériques.

Transféré par

lawson
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Université de Technologie de Belfort Montbéliard par S.

Lamrous

La vidéo numérique

1
Université de Technologie de Belfort Montbéliard par S. Lamrous

Ière partie : De l’analogique au


numérique
• Définition :
– La vidéo regroupe l'ensemble des techniques
permettant la visualisation ou l'enregistrement
d'images animées accompagnées de son, sur un
support électronique et, non de type pellicule
argentique.
– Le mot vidéo vient du latin video qui signifie « je
vois ». C'est un terme abréviatif de vidéophonie ou
vidéogramme.

2
Université de Technologie de Belfort Montbéliard par S. Lamrous

Les caméras vidéos


• Fonctionnement d’une caméra vidéo
– Première étape : La lumière issue de l’objectif est
décomposée en ses trois composantes primaires rouge, verte
et bleu
– Chaque composante est ensuite envoyé sur un capteur qui
réagit à l’énergie lumineuse reçue en émettant des électrons
• Le signal lumineux est transformé en signal électrique analogique
• Un peu d’histoire….
– Les premières caméras vidéo : utilisation de tubes
cathodiques à balayage pour convertir l’énergie lumineuse en
énergie électrique.
– Dans les années 50 :
• Un seul tube par caméra => des images en noir et blanc (niveaux de
gris)
– Plus tard, intégration de 3 tubes => réception et traitement 3

séparé du rouge, vert et du bleu


Université de Technologie de Belfort Montbéliard par S. Lamrous

4
Université de Technologie de Belfort Montbéliard par S. Lamrous

Les caméras vidéos


• Les premiers inconvénients
– Fragile
• fabrication en verre
• surface photosensible
– Phénomène de rémanence
• trainée lumineuse sur les zones fortement éclairées de la
scène lors des mouvements de caméra
– Sensibilité aux champs magnétiques
• une caméra ne fonctionnait que dans des environnements
exempt de tels champs
– Nécessite un réglage parfait des 3 tubes
5
Université de Technologie de Belfort Montbéliard par S. Lamrous

Les caméras vidéos


• Milieu des années 80 :
– Les capteurs CCD (Charge Couple Device, ou
détecteurs à couplage de charge)
• Un CCD = un réseau d’éléments sensibles à la lumière
(photosites)
• Un photosite génère une quantité d’électrons
proportionnelle à l’énergie lumineuse reçu
• Permet de résoudre les problèmes des tubes cathodiques
• 1 CCD pour les caméras et appareils photo grand public
• 3 CCD pour le matériel professionnel (améliore le
traitement de chaque composante primaire – Rouge, Vert,
Bleu)
6
Université de Technologie de Belfort Montbéliard par S. Lamrous

Le signal vidéo
• Application du principe de la photographie
numérique à la vidéo
– Une image = un ensemble de pixels
– Un pixel = des données RVB
– Une vidéo = un ensemble d’images
– Un exemple :
• Une vidéo d’une seconde, utilisant 25 images par
seconde
• Chaque image est composée de 720*576 pixels
codés en RVB (1 octet par composante)
 Soit une vidéo de 30 Mo/s  problèmes de transport
et de stockage des données 7
Université de Technologie de Belfort Montbéliard par S. Lamrous

Standards de la vidéo analogique


• Formats de diffusion vidéo liés à la télévision
analogique
• Chaque pays dispose de son format de
diffusion.
– NTSC (National Television Standards Committee)
• Continent Nord-américain et Japon
• Fréquence du courant électrique = 60 Hz
• Fréquence d’affichage du NTSC = 29,97 images par
seconde (ips) sur 525 lignes
– PAL/SECAM (Phase Alternating Line / SEquentiel
Couleur Avec Mémoire)
• En Europe
• Fréquence du courant électrique = 50 Hz 8

• Fréquence d’affichage = 25 ips sur 625 lignes


Université de Technologie de Belfort Montbéliard par S. Lamrous

Standards de la vidéo analogique


• Les perceptions de l’oeil humain
– Au moins 40 éclats par seconde  impression
d’éclairement continu à l’aide d’une source lumineuse
émettant de façon discontinue
– Une fréquence >20 et <40  impression de
scintillement
– Au–dessous de 20  éclairement saccadé
• Les trames
– PAL/SECAM : 25 ips
– Chaque image = deux demi-images (ou trames)
projetées successivement 50 éclats par seconde 
impression de continuité parfaite
– 1 image = 1 trame des lignes impaires + 1 trame des
9
lignes paires
Université de Technologie de Belfort Montbéliard par S. Lamrous

• Le signal vidéo analogique est donc découpé en 25 ou


29,97 images (frames) par seconde, elles-mêmes divisées
en 25x2=50 ou 29,97x2=59,94 trames (fields), celles-ci
étant à leur tour analysées en 312,5 ou 262,5 lignes
• Astuce de lignes incomplètes (début, fin) pour améliorer la
fluidité de l’affichage des images successives

+ =

Trame paire Trame impaire Image


Ligne incomplète (système PAL/SECAM) L’image complète obtenue
Pour le système NTSC situation inverse par entrelacement des 1
deux trames.
Université de Technologie de Belfort Montbéliard par S. Lamrous

Échantillonner la ligne
• En vidéo analogique, unité minimale = la ligne
• Nombre de lignes  standard utilisé (PAL/SECAM ou NTSC)
• Nombre de points par ligne
– Image télévisée standard : la largeur de l’image est 1,33 fois plus
grande que sa hauteur
• NTSC : 480 lignes  640 points par ligne
 Cette résolution théorique est à l’origine du célèbre affichage VGA de
640x480 sur les moniteurs informatique
• PAL/SECAM : 575 lignes  768 points par ligne
T (trame)

X (points par ligne)

11

Y (lignes)
Université de Technologie de Belfort Montbéliard par S. Lamrous

Standard de la vidéo numérique


• En 1970, prise de conscience de numériser la vidéo
• En 1982,
– Adoption d’un standard unique de la télévision numérique
de qualité broadcast, nommé Rec. 601 par l’UIT (Union
Internationale des Télécommunications).
• la qualité broadcast définit une vidéo dont la qualité technique
(couleur et luminosité du signal vidéo notamment) la rende
diffusable par une chaîne de télévision
• Les camescopes grand public ne sont pas de qualité broadcast
• Norme Rec. 601
– Nombre de points actifs par ligne = 720
– Nombre total de points par ligne
• NTSC : 858 et PAL/SECAM : 864 12
Université de Technologie de Belfort Montbéliard par S. Lamrous

Standard de la vidéo numérique


• Norme Rec. 601
– Nombre de points par secondes
• PAL : 625 lignes/s * 864 points/ligne * 25 ips
= 13 500 000 points/s
• NTSC : 525 lignes/s * 858 points/ligne * 29,97 ips
= 13 500 000 points/s
– En codage RVB,
• 13 500 000 points/s * 3 valeurs/points * 8 bits/valeur
= 324 Mbit/s soit environ 40 Mo/s
• Une vidéo de 90 minutes  210 Go / vidéo  44 DVD

13
Université de Technologie de Belfort Montbéliard par S. Lamrous

Principe des systèmes vidéo


analogiques
• Principe de la télévision noir et blanc
– Une caméra balaye l'image bidimensionnelle par un
faisceau d'électrons qui se déplace très rapidement de
gauche à droite et plus lentement de haut en bas,
produisant un signal électrique en fonction du temps.
– Elle enregistre l'intensité lumineuse
– A la fin du balayage, le faisceau revient à l'origine pour
recommencer.
– Le récepteur reçoit l’intensité en fonction du temps et
répète le processus de balayage pour reconstruire
l'image.
14
Université de Technologie de Belfort Montbéliard par S. Lamrous

La télévision couleur
• La télévision couleur utilise ce même principe
de balayage
• Au lieu de balayer l'image avec un seul
faisceau, elle en utilise trois, un par
composante primaire : Rouge, Vert et Bleu
• A l’émission, les signaux RVB sont combinés
linéairement en un signal de luminance et deux
signaux de chrominance, pour assurer la
compatibilité avec les téléviseurs ou les
émissions noir et blanc.
15
Université de Technologie de Belfort Montbéliard par S. Lamrous

Luminance et chrominances
• La luminance
– quantité de lumière = niveaux de gris
– symbole Y

– La somme des intensités lumineuses reçues et


transformées en courant électrique par les trois CCD dédiés
respectivement au rouge, au vert et au bleu.
– Non linéarité en luminance des tubes cathodiques 
fonction de transfert non linéaire : la correction gamma 
nouvelles valeurs R’,V’ et B’

– Pondération de ces valeurs par des coefficients déterminés


en fonction de la sensibilité variable de l’œil aux
différentes couleurs primaires.
16
Université de Technologie de Belfort Montbéliard par S. Lamrous

Luminance et chrominances
• Luminance
Y’ = 0,299R’+0,587V’+0,114 B’
Y’ ∈ [0; 255]
– Y’ = paramètre luma (luminance)
– Pour des besoins de synchronisation et de
traitement du signal, UIT Rec. 601 a réduit la plage
de ces valeurs à l’intervalle :
Y’ ∈ [16; 235]
– La formule de calcul de luminance devient :
Y’ = 219 (0,299 R’+0,587 V’+0,114 B’) + 16
– 220 niveaux :
• la valeur 16 correspond au noir (R’=V’=B’=0)
• la valeur 235 au blanc (R’=V’=B’=255) 17
Université de Technologie de Belfort Montbéliard par S. Lamrous

Luminance et chrominances
• Les chrominances
– Constituent les autres composantes du signal
– Informations concernant les couleurs
• chrominance rouge (CR)
• chrominance bleu (CB)
– (CR) et (CB) = la différence entre le signal de
luminance et les signaux des couleurs rouge et bleu.
– expressions des chrominances CB et CR (Standard
UIT-R Rec 601) :
CB=128+128*(1/0,886)*(B’-Y’)
CR=128+128*(1/0,701)*(R’-Y’)
CB ∈ [-128;128] et CR ∈ [-128;128]
18
Université de Technologie de Belfort Montbéliard par S. Lamrous

Luminance et chrominances

Image d’origine RVB YCRCB

R Y

V CR
"Monster Inc.", dessin
animé des Studios Pixar
© 2001 - Disney / Pixar
B CB
19
Université de Technologie de Belfort Montbéliard par S. Lamrous

Luminance et chrominances
• Avantages
– Permet à un téléviseur « Noir et Blanc » de recevoir les
émissions en couleur et inversement, à un téléviseur
couleur de diffuser les émissions en noir et blanc.

– Passage du signal RVB en composantes YCBCR 


autorise une réduction de flux d’informations
transitant dans les câbles ou sur une onde porteuse.

– Adaptation de la quantité d’information affectée à


chaque composante, en fonction des capacités et des
performances spécifiques de la vision humaine.
20
Université de Technologie de Belfort Montbéliard par S. Lamrous

Luminance et chrominances
• La perception des détails par l’œil humain
est plus fine en niveaux de gris qu’en
couleurs

• Or, la luminance  niveaux de gris et les


chrominances  les couleurs
– Le signal de luminance devra donc être riche
en information de détail;
– Il est inutile de donner autant de finesse aux
signaux de chrominances
21
Université de Technologie de Belfort Montbéliard par S. Lamrous

Norme [Link]
• La norme [Link] définit le
standard de production pour la
vidéo numérique de qualité
broadcast
– 100% de la luminance,
– 50% de CB et 50% de CR.
• Sans perte de qualité notable
• Réduction de 33% de la taille
des données
– 8bits/composante Codage des lignes
– 216 Mbit/s au lieu de 324 selon la norme [Link]
Mbit/s Luminance
22
Chrominance(CR, CB)
Université de Technologie de Belfort Montbéliard par S. Lamrous

Norme [Link]

• Les valeurs de
chrominance ne sont
enregistrées sur
chaque ligne que
pour un pixel sur
quatre
– 100% de luminance
– 25% de chaque
chrominance

23
Université de Technologie de Belfort Montbéliard par S. Lamrous

Norme [Link]
Disposition co-sited Disposition mid-sited

• La chrominance est codée 1 pixel sur 2, pour 1 ligne sur 2


• Co-sited : les chrominances sont situées entre 2 valeurs de
luminance, alignées sur la même colonne (exemple: MPEG-2)
• Mid-sited : chaque chrominance est entourée de 4 valeurs de
luminance 24
Université de Technologie de Belfort Montbéliard par S. Lamrous

Normes [Link] et [Link]


• Norme [Link] et [Link]
– Equivalentes en terme de quantité d’information totale
– Dans les deux cas la chrominance est divisée par 4

• Fréquence d’échantillonnage
– De la luminance : 13 500 000 points/s soit 13,5 MHz
– Chaque chrominance : 13 500 000 points/s * ¼ soit 3,375
MHz
– D’où : la fréquence d’échantillonnage requise par ces deux
normes est de :
13,5 MHz + 3,375 MHz + 3,375 MHz = 20,25 MHz

• Cette réduction de fréquence d’échantillonnage permet


une réduction du flux d’information
20 250 000 points * 8 bits/point = 162 Mbit/s
25
(débit total)
Université de Technologie de Belfort Montbéliard par S. Lamrous

Récapitulatif des différentes normes


en PAL/
Luminance Chrominances Débit Débit
SECAM
utile en total en
Résolution Résolutio Résolution Résolution
Normes
Horizontale n verticale Horizontale verticale
Mbit/s Mbit/s

[Link] 720 576 720 576 248 324

[Link] 720 576 360 576 166 216

[Link] 720 576 180 576 124 162

[Link] 720 576 360 288 124 162


26
Université de Technologie de Belfort Montbéliard par S. Lamrous

II e partie : La compression vidéo

• La compression d’un flux de données


numériques repose essentiellement sur
l’exploitation de la redondance, c’est-à-
dire « l’excès » d’information de type
– spatial,
– temporel

27
Université de Technologie de Belfort Montbéliard par S. Lamrous

La compression spatiale
• Principe :
– Exploite la similarité des pixels à l’intérieur d’une même image
– Images obtenues par ce type de compression nommées intra
– La 1ère image d’une séquence vidéo de type intra
• MJPEG (Motion JPEG)
– Extension du JPEG (Joint Photographic Experts Group)
– Idée : Appliquer à chacune des images d’une séquence vidéo les
techniques de compression utilisées pour les images fixes.
– Chaque image est traitée indépendamment
– Adopté par le format DV (Digital Video)

28
Université de Technologie de Belfort Montbéliard par S. Lamrous

La compression spatiale

29
Université de Technologie de Belfort Montbéliard par S. Lamrous

La compression temporelle
• Principe :
– Exploiter les similarités
existant entre des images
successives
– Identifier les informations
redondantes dans le temps,
même si leur position dans
l’image a changé

• Compression temporelle
unidirectionnelle Image courante (n) Différences Image
delta
– Similarités entre image
courante et image Flux
d’images
Image précédente
retardée (n-1)
précédente
– Image de différences =
images delta
30
Université de Technologie de Belfort Montbéliard par S. Lamrous

La compression temporelle
unidirectionnelle
• Compression d’une longue séquence vidéo
Images intra
– Une seule image intra suivie d’images delta
ou images de référence
• Pour afficher une image quelconque, à
(key frame)
partir de la première image intra, obligation
de calculer toutes les images successives
 il est impossible de commencer la lecture
d’une vidéo au milieu d’une séquence
• La solution proposée :
– Introduction d’images intra assez
fréquemment
– Compression de type Cinepak ou Indeo
(Intel Video)
• Une image référence intra suivies de 4 à Images delta
12 images delta
31
Université de Technologie de Belfort Montbéliard par S. Lamrous

La compression temporelle
bidirectionnelle
• Lors d’un déplacement de la caméra vers la droite,
– De nouveaux éléments apparaissent sur l’image.
– L’image n contient des éléments présents dans n-1
et n+1.
 pour minimiser la taille des données enregistrées, une
analyse bidirectionnelle permet de ne mémoriser ni les
éléments contenus sur l’image n-1 ni les éléments de n+1

32
n-1 n n+1
Université de Technologie de Belfort Montbéliard par S. Lamrous

La compensation de mouvement
• Mouvement des éléments => augmentation des différences

• Compensation de mouvement = enregistrement de ces


mouvements sous forme de vecteurs

• Compression bidirectionnelle et compensation de


mouvement sont utilisées par l’algorithme de compression
vidéo MPEG

33
Université de Technologie de Belfort Montbéliard par S. Lamrous

La norme MPEG
• Plusieurs spécifications MPEG
– MPEG-1 : vidéo numérique à bas débit (de 0,8 à
1,5 Mbit/s)
– MPEG-2 : amélioration de la qualité de la vidéo et
adaptation à des débits plus importants (de 6 à 40
Mbit/s)
– MPEG-4 : norme de compression pour les
applications ne disposant que de très faibles
débits (exemples: vidéophonie, multimédia mobile,
surveillance, etc.)
34
Université de Technologie de Belfort Montbéliard par S. Lamrous

MPEG-1
• Objectif :
– Permettre la restitution, à partir d’un CD, de 72
minutes de vidéo numérique plein écran (image et
son) au rythme de 25 ou 30 images par seconde
– Soit 1,44 Mbit/s (contre 166 Mbit/s en norme
[Link])
• Résultat :
– Qualité de la vidéo comparable à celle obtenue à
partir d’un magnétoscope VHS
– Pas de qualité broadcast
35
Université de Technologie de Belfort Montbéliard par S. Lamrous

MPEG-1
• 3 types d’images :
– Les images intra ou images de référence, notées I
• Redondances spatiales
• Ces images servent de référence pour le calcul des images P et B, ainsi que
pour le décodage.
• Une image sur 12 au moins doit être de type I
– Les images prédites P
• Construites à partir des images I à l’aide de vecteurs de mouvement et calcul
des différences
– Les images bidirectionnelles B

I B B P B B P B B
B P B I

36
1 2 3 4 5 6 7 8 9 10 11 12 13
Université de Technologie de Belfort Montbéliard par S. Lamrous

MPEG-1
• Agencement des images
– Décompression d’une image P
nécessite la présence en I I

mémoire d’une image I 1 13

– Décompression d’une image B P P P

4 7 10

exige la présence simultanée


dans la mémoire de 2 images: B B B B B B B B

• (I et P) pour les images 2 et 3 2 3 5 6 8 9 11 12

• (P et P) pour les images 5, 6, 8 et 9


• (P et I) pour les images 11 et 12.
37
Université de Technologie de Belfort Montbéliard par S. Lamrous

MPEG-2
• Compression spatiales et temporelles identique
au MPEG-1
• La différence essentielle = définition de plusieurs
niveaux de qualité
– Low level : 352 pixels par ligne, 288 lignes
– Main level : 720 * 576 pixels (résolution UIT-R, Rec
601)
– High-1440 level : premier format de haute définition,
soit 1440 * 1152 pixels
– High level : haute définition avec 1920 * 1152 pixels
38
Université de Technologie de Belfort Montbéliard par S. Lamrous

MPEG-4
• Beaucoup plus qu’une simple amélioration du
MPEG-1 et MPEG-2
• Objectif :
– Pour les applications de très bas débit (de 5 à 64 Kbit/s)
• Méthode :
– Nouvelle approche du codage et de la compression de
l’image animée et du son, fondée sur une analyse du
contenu en objets médias (visuels ou sonores)
hiérarchiquement structurés et susceptibles de
traitements spécifiques
– Un objet = une personne, un arbre, une voiture ou
encore une voix, une séquence musicale, un bruit, etc.
39

Vous aimerez peut-être aussi