CHAPITRE II
LE SON
Le son est une onde produite par la vibration mécanique d'un support fluide ou solide et
propagée grâce à l'élasticité du milieu environnant sous forme d'ondes longitudinales.
Un son est la sensation provoquée sur nos oreilles par de l'air en déplacement, c'est-à-dire des
vibrations d'air. Pour que l'air vibre il faut que quelque chose l'agite, c'est le rôle joué par la
source sonore.
I. CARACTERISTIQUES DU SON
Un son est caractérisé essentiellement par quatre paramètres : la fréquence, le timbre,
l’intensité et la vitesse.
a. Fréquence
La fréquence est le paramètre qui permet de différencier un son aigu d'un son grave. La
caractéristique d'un son aigu est qu'il fera vibrer l'air plus souvent qu'un son grave. On dit qu'un
son aigu a une fréquence élevée alors qu'un son grave a une fréquence basse.
La fréquence d'un son s'exprime en hertz, c'est-à-dire le nombre de vibrations par seconde.
Un son qui vibre à une fréquence de 1000 vibrations seconde à une fréquence de 1000 Hz.
L'oreille humaine répond aux fréquences allant de 20 Hz à 20 Khz.
On parle d’infrasons quand les fréquences sont inférieures à 20 Hz et d’ultrasons quand les
fréquences sont supérieures à 20 KHz.
Infrasons < plage audible (20HZ-20 KHZ) < Ultrasons.
b. Timbre
Le timbre est le paramètre qui permet de différencier un son d'un autre son.
Un piano a un timbre différent de celui d'un violon, peu importe la fréquence. Ceci nous permet
d'introduire la notion d'onde. L'onde est en quelque sorte la représentation graphique des
mouvements que fait notre tympan lorsqu'il est actionné par des vibrations d'air. La
hauteur d'un son a une influence directe sur la forme de son onde.
Toute onde, aussi complexe soit-elle, peut être décomposée en une somme d'ondes sinusoïdales
élémentaire qu'on appelle harmoniques. Toutes ces harmoniques additionnées donnent le timbre
d'un instrument. L'harmonique la plus grave se nomme fondamentale ou harmonique 1 et c'est
celle que retient l'oreille pour identifier la note jouée, les autres harmoniques servent à
l'habillage du son et à la personnalisation du timbre.
c. INTENSITE
L’intensité est la force avec laquelle l'air frappe le tympan. Sur une forme d'onde, il se
traduit par une amplitude plus grande :
L'amplitude (le volume) des différentes harmoniques constituant un son change au cours du
temps : le son peut être fort ou doux Dans l'air, l'amplitude correspond aux variations de
pression de l'onde.
En acoustique l'intensité se mesure en décibels (dB).
d. VITESSE DU SON
La vélocité (vitesse) du son varie suivant le milieu dans lequel il se propage. Le principal
facteur de la variation est la densité de ce milieu : dans un gaz, sa vitesse est plus faible que
dans un liquide. Par exemple, le son se propage approximativement à 343 m.s-1 dans l'air et à
1500 m.s-1 dans l'eau.
II. LE TRAITEMENT DIGITAL DU SON
Pour être traité par un ordinateur, un son doit être sous forme digitale, il faut procéder alors à
une conversion analogique – numérique : c’est l’acquisition ou numérisation. La conversion
est obtenue grâce à un circuit électronique intégré appelé Convertisseur Analogique-
Numérique(CAN).
Trois étapes permettent la numérisation : l’échantillonnage, la quantification et le codage.
Etapes de numérisation du son
a. Echantillonnage
La conversion s'effectue par échantillonnage : on prélève à des intervalles de temps réguliers
des échantillons du son et on les traduit en chiffres.
Un microphone convertit les variations de pressions de l'air en signaux électriques qui, reliées
à un convertisseur analogique-numérique (CAN) qui va numériser ce signal à pas régulier, le
transformer en une suite de nombres.
Deux paramètres caractérisent un son échantillonné : la qualité et la résolution.
La qualité est déterminée par la fréquence d'échantillonnage Fe; plus la fréquence est
élevée, plus on prélève d'échantillons et par conséquent meilleure est la qualité.
Il faut respecter le théorème de Shanon qui stipule que : Fe ≥ Fmax.
Exemple
Pour la musique, la fréquence maximale audible est de 20 kHz, en comptant très large. La
fréquence d'échantillonnage des CD-audio, de 44,1 kHz, respecte bien ce théorème.
Application à la voix en téléphonie : fréquence maximale : 3700 Hz. Quelle fréquence
d'échantillonnage minimale choisir ?
b. Quantification
Le rôle de la quantification est de donner une image binaire d’un signal analogique ; Le signal
échantillonné peut être converti sous forme binaire (numérique) pour être stocké. Ce codage
s'appelle la quantification. A Chaque valeur mesurée est associée une valeur binaire codée sur n
bits (nombre de bits de quantification) (sachant que N bits permettent de distinguer 2n niveaux de
tension entre –Vm et +Vm).
Le pas de quantification est obtenu par la formule :
c. Le codage
Le codage désigne le type de correspondance que l'on souhaite établir entre chaque valeur du
signal analogique et le nombre binaire qui représentera cette valeur. Il existe différents types de
codage : PCM - Différentiel (delta) - Prédictif - Adaptatif - etc.
Codage PCM (Pulse Coded Modulation) : En français, MIC : Modulation par Impulsions
Codées. Il s’agit de coder chaque échantillon à sa valeur réelle (contrairement à ce qui se fait
dans le codage différentiel).
Codage différentiel ou codage "delta" : Ce codage consiste à évaluer (coder) la différence
entre le niveau du signal à l'instant de l'échantillonnage et le niveau qu'il avait lors de
l'échantillonnage précédent.
III. COMPRESSION DE SON
a. Introduction
La compression consiste à trouver une séquence d'octets plus courte dont l'effet sonore soit
semblable à celui de la séquence initiale.
La compression permet :
Gain de place dans le cas d'un enregistrement,
Économie de bande passante dans le cas d'une transmission,
Gain de temps dans le cas d'un transfert de fichier (Internet)
Dans un format donné, les fichiers peuvent être déclinés en plusieurs taux de compression qui
induisent des niveaux de qualité sonore et des poids de fichier très différents. En théorie, plus
le taux de compression est haut, moins le fichier est comprimé. La qualité de ce fichier
comprimé s'approche de celle du fichier non comprimé. Par contre, plus le taux de compression
est bas, plus le rendu sonore perd de sa qualité.
b. Taux de compression
On calcule le taux de compression par la formule:
Taux de compression (%) = Taille compressé/ Taille originale
Exemple : C= 25/100= 0,25 soit 25 %
Exemple le CD audio est une succession d'échantillons à raison de 44100 échantillons par
seconde sur 16 bits de résolution.
IV. TAILLE D’UN FICHIER SON
On peut calculer la taille d’un fichier par la formule suivante:
Taille(en bits) = Fe * N * D * V
Avec :
Fe : Fréquence d’échantillonnage (8 KHz, 44,1 KHz, …etc)
N : nombre de bits de quantification (8 bits, 16 bits)
D : Durée(en s)
V : Nombre de voies (mono : 1 voie, stéréo : 2 voies, quadri, etc)
On peut aussi calculer le débit :
Débit (en bps)= Fe * N * V
V. ALGORITHMES DE COMPRESSION
On distingue les algorithmes de compression avec et sans perte.
a. Algorithmes de compression sans perte
La suite de bits obtenue après les opérations de compression et de décompression est strictement
identique à l’originale, cet algorithme est utilisé pour nombreux types de données (documents,
fichiers exécutables, fichiers textes).
On peut citer plusieurs exemples :
RLE (Run Length Encoding): Toute suite de bits ou de caractères identiques est remplacé par un
couple :(nombre d’occurrence, bit ou caractère répété)
Exemple : AAAAAAAAZZZEEEE devient 7A3Z4E.
LZW : Codage par dictionnaire (une table de données contenant des chaînes de caractères), peu
efficace pour les images et donne de bons résultats pour les textes et les données informatiques en
général (plus de 50 %).
FLAC: Le format FLAC (Free Lossless Audio Codec), est un format libre de compression audio
sans perte. Maintenu par la fondation [Link], il est apprécié pour conserver la qualité des fichiers
sonores originaux en alternative aux formats de compression avec perte type MP3. (Fichiers .oga,
.flac).
ALAC: L'ALAC (Apple Lossless Audio Codec), est un format de codage sans perte (lossless)
créé en 2004 par Apple.
b. Algorithme de compression avec perte
La suite de bits obtenue après les opérations de compression et de décompression est différente de
l’originale mais l’information reste sensiblement la même, utilisé pour les types de données :
images, sons et vidéos.
Les algorithmes utilisés pour le son sont principalement le MPEG (pour le format MP3), l’AAC
(MP3Pro), l’ATRAC (Sony Minidisc), le PASC (Philips DCC), et enfin les Dolby AC-1, AC-2 et
AC-3.
c. Etude d’un algorithme : MP3
Le MPEG-1/2 Audio Layer 3, plus connu sous son abréviation de MP3, est la spécification sonore
du standard MPEG-1/MPEG-2, du Moving Picture Experts Group (MPEG). C'est un algorithme de
compression audio capable de réduire sensiblement la quantité de données nécessaire pour restituer
de l'audio, mais qui, pour l'auditeur, ressemble à une reproduction du son original non compressé :
avec une bonne compression la différence de qualité devenant difficilement perceptible.
L'extension de nom de fichier est .mp3 et le type MIME (Internet media type)est audio/mpeg,
audio/MPA, audio/mpa-robust, ou audio/mp3 (dans les navigateurs Chrome/Chromium). Ce type
de fichier est appelé « fichier MP3 ».
Le codage MP3 s’effectue en trois phases :
Au début de la conversion le programme découpe le fichier audio en petit «paquets» de durée
égale, les chunks. La taille des chunks peut influencer sur la qualité de conversion.
Puis le programme analyse chaque chunk dans le domaine audible (analyse spectrométrique par
transformée de Fourier), cette opération ne produit pas de perte de qualité.
Ensuite, le programme utilise un profil psycho*acoustique pour supprimer les sons que l’oreille
humaine ne peut pas entendre, le choix du type de profil est déterminant pour la qualité finale.
Pour finir, les informations restantes sont codées dans le fichier MP3 en appliquant un algorithme
de Huffman, (algorithme de codage de type ZIP) cela permet de gagner encore presque 20% sur la
taille du fichier sans perte de qualité
A la fin des années 1990, les utilisateurs encodaient leurs CD audio en MP3 le plus souvent avec
un taux de 128 Kps . Aujourd’hui, il est considéré que pour des fichiers de qualité acceptable, on
peut choisir de les compresser selon un taux de 192 kbit/s voire 320 kbits/s
On peut améliorer la qualité de la compression MP3 en en utilisant un débit binaire variable (VBR
ou Variable Bit Rate par opposition à un débit constant Constant bit rate, CBR). Ainsi, les instants
peu complexes (contenant peu de fréquences), comme les silences par exemple, seront codés avec
un débit d'information plus faible (Par exemple 64 kbit/s au lieu de 128), réduisant ainsi la taille
totale du fichier tout en gardant une très bonne qualité lors des passages riches en harmoniques.
VI. LES FORMATS AUDIO
Il existe sur le marché plusieurs formats audio. Le tableau suivant en répertorie les plus connus.
Fin