0% ont trouvé ce document utile (0 vote)
88 vues3 pages

Comprendre Bits, Octets et Unicode

Un bit est l'unité de base de l'information en informatique, pouvant prendre les valeurs 0 ou 1, tandis qu'un octet, composé de 8 bits, représente 256 valeurs différentes. Le code ASCII attribue un code numérique de 7 bits à 128 caractères, tandis que Unicode est un système de codage standardisé permettant de représenter des caractères de presque toutes les langues et symboles. Unicode propose plusieurs encodages, couvre plus de 143 000 caractères et assure une interopérabilité internationale en informatique.

Transféré par

Orvens Juste
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
88 vues3 pages

Comprendre Bits, Octets et Unicode

Un bit est l'unité de base de l'information en informatique, pouvant prendre les valeurs 0 ou 1, tandis qu'un octet, composé de 8 bits, représente 256 valeurs différentes. Le code ASCII attribue un code numérique de 7 bits à 128 caractères, tandis que Unicode est un système de codage standardisé permettant de représenter des caractères de presque toutes les langues et symboles. Unicode propose plusieurs encodages, couvre plus de 143 000 caractères et assure une interopérabilité internationale en informatique.

Transféré par

Orvens Juste
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

Bit

Un bit (contraction de binary digit, ou chiffre binaire) est l'unité de base de l'information en informatique
et en théorie de l'information. Un bit peut prendre l'une des deux valeurs : 0 ou 1. Ces deux valeurs
représentent les états fondamentaux d'un système binaire, que l'on peut interpréter comme "vrai" ou
"faux", "allumé" ou "éteint", ou d'autres paires d'opposés en fonction du contexte.

En informatique :
Les bits sont combinés pour former des structures plus complexes. Par exemple, huit bits forment un octet
(ou byte en anglais), une unité souvent utilisée pour mesurer la mémoire et le stockage.
Plusieurs bits permettent de représenter un nombre plus grand de valeurs : par exemple, 2 bits peuvent
représenter 4 valeurs (00, 01, 10, 11), 3 bits en représentent 8, et ainsi de suite.
Dans les systèmes numériques :

Un bit peut aussi représenter un signal dans des circuits électroniques, où chaque état (0 ou 1) correspond
à un niveau de tension différent.
C'est aussi la base de la logique binaire, qui permet aux ordinateurs d'effectuer des calculs, de traiter et de
stocker des informations en utilisant uniquement deux états.

Octet
Un octet est une unité de mesure de la quantité d’information en informatique. Il est composé de 8 bits,
chaque bit pouvant prendre la valeur 0 ou 1, ce qui signifie qu'un octet peut représenter 256 valeurs
différentes (de 0 à 255 en décimal).

L'octet est couramment utilisé pour mesurer la taille de la mémoire et du stockage des données dans les
ordinateurs et autres appareils électroniques. Par exemple :

- Un caractère alphanumérique (comme une lettre ou un chiffre) est souvent représenté par un octet dans
les systèmes informatiques.
- La capacité d'une clé USB ou d'un disque dur est exprimée en multiples d'octets, tels que kilo-octets
(Ko), méga-octets (Mo), giga-octets (Go), etc.

En résumé, l'octet est une unité de base de mesure de données numériques qui permet de manipuler et de
stocker des informations.

Code ASCII
Le code ASCII (American Standard Code for Information Interchange) est un ensemble de caractères
représentant du texte dans les ordinateurs et autres dispositifs qui utilisent du texte. Il attribue un code
numérique de 7 bits à chaque lettre, chiffre, symbole et contrôle (comme des caractères de retour à la
ligne), ce qui donne un total de 128 caractères. Voici un aperçu du code ASCII pour quelques types de
caractères courants :

Codes ASCII pour les lettres majuscules et Codes ASCII pour les symboles courants
minuscules Caractère Code ASCII
Caractère Code ASCII ! 33
A 65 @ 64
B 66 # 35
C 67 $ 36
… … % 37
Z 90 & 38
a 97 * 42
b 98 ( 40
c 99 ) 41
… … - 45
z 122 + 43
= 61
Codes ASCII pour les chiffres [ 91
Caractère Code ASCII ] 93
0 48 { 123
1 49 } 125
2 50 ~ 126
… …
9 57

Codes ASCII pour les commandes de contrôle


Les commandes de contrôle sont utilisées pour des fonctions spécifiques, par exemple :
Nom Code ASCII Description
NUL 0 Null
BEL 7 Son de cloche
BS 8 Retour arrière
HT 9 Tabulation horizontale
LF 10 Saut de ligne
CR 13 Retour chariot
ESC 27 Échappement

Unicode
Unicode est un système de codage standardisé qui permet de représenter et de manipuler des caractères
de presque toutes les langues et de nombreux symboles. Créé pour remédier aux limitations des systèmes
de codage antérieurs comme ASCII. Son but est de permettre une représentation cohérente et sans
ambiguïté des textes dans les systèmes informatiques, quel que soit le langage ou les symboles utilisés.

Voici quelques points clés :


1. Codage universel : Unicode assigne un numéro unique (code point) à chaque caractère, quel que
soit le langage, le système d'écriture ou la plateforme.
2. Encodages : Unicode propose plusieurs encodages, dont :
- UTF-8 : Un encodage variable, qui utilise 1 à 4 octets par caractère. C'est l'encodage le
plus utilisé sur le web.
- UTF-16 : Utilise 2 ou 4 octets, couramment employé dans Windows.
- UTF-32 : Utilise 4 octets par caractère, ce qui rend l'accès aux caractères constant mais
consomme plus de mémoire.
3. Plages de caractères : Unicode couvre plus de 143 000 caractères, incluant les alphabets latin,
grec, cyrillique, les idéogrammes chinois, les symboles mathématiques, les émojis, etc.
4. Symboles et émojis : Unicode inclut aussi des symboles mathématiques, des icônes et des émojis.
Par exemple, l’émoji 😀 a pour code U+1F600.
5. Compatibilité : Unicode permet aux applications et systèmes d’exploitation de représenter et
d’échanger du texte dans plusieurs langues, et ce de manière universelle et standardisée.
6. Normalisation : Unicode définit plusieurs formes de normalisation (NFC, NFD, NFKC, NFKD)
pour gérer les caractères équivalents (par exemple, "é" peut être représenté comme un seul
caractère ou une combinaison de "e" + accent aigu).

Unicode permet ainsi une interopérabilité internationale en informatique, en assurant que les textes
s’affichent et se manipulent de la même façon partout.

Vous aimerez peut-être aussi