0% ont trouvé ce document utile (0 vote)

48 vues28 pages

1-Introduction Compilation

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

48 vues28 pages

1-Introduction Compilation

Transféré par

kotbalaa525

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

THEORIE DE LA

COMPILATION
DESCRIPTION DE LA PHASE
D’UN COMPILATEUR
Dr Souissi Abdelmoghit
SOMMAIRE
1. Introduction à la théorie de
compilation
2. Modèle en couche
3. Qu’est ce qu’un compilateur
4. Déroulement d’une compilation
5. Exemple code assembleur
6. Structure d’un compilateur
7. Outils théoriques et pratiques
8. Type de compilateurs
9. Analyse Lexicale
10. Token
11. Analyse Syntaxique
12. Analyse sémantique
13. Optimisation du code
Qu'est-ce que la Théorie de Compilation ?
Un compilateur est un programme informatique qui traduit un code source écrit dans un
langage de programmation de haut niveau (comme C, Java, etc.) en code machine ou un
langage intermédiaire compréhensible par l'ordinateur.

Ce processus est réalisé en plusieurs phases, chacune jouant un rôle spécifique dans la
compilation. Voici une description des principales phases d'un compilateur :

1. Analyse Lexicale : Divise le code source en tokens.

2. Analyse Syntaxique : Vérifie la structure grammaticale et crée un AST.
3. Analyse Sémantique : Vérifie les règles logiques (types, portée, etc.).
4. Génération de Code Intermédiaire : Produit un code intermédiaire abstrait.
5. Optimisation : Améliore l'efficacité du code sans changer son comportement.
6. Génération de Code : Traduit le code intermédiaire en code machine.
7. Assemblage et Linking : Génère le fichier exécutable final.
Modèle en couches

6 Programmes d'application
(Traitement de texte, PAO, Jeux, …)
5 Langages de programmation
(Fortran, Cobol, C, C++, Java, …)
4 Langage assembleur
(Langage natif symbolique de la machine)
3 Noyau du système d'exploitation
(Gestion des taches, des ressources : mémoire, I/Os,…)
2 Langage machine : jeu d’instructions
(Langage natif du processeur)
1 Langage de microprogrammation

0 Logique numérique
(Couche matérielle : circuits logiques, électroniques)
Qu'est-ce qu’un compilateur?

 Le reole de compilateur est la traduction de programmes d'un langage de haut

niveau vers un langage de bas niveau (langage machine) exécutable par
l'ordinateur.
Déroulement d’une compilation d’un programme écrit avec
le langage haut niveau
Programmeur
Code en langage évolué

Code en assembleur
section .data
num1 db 5
Traduction num2 db 10
result db 0
section .text
global _start
_start:
mov al, [num1]
mov bl, [num2]

Code en micro instruction

Linker 111011111111
R1 ← MEM[num1] 100111111011
R2 ← MEM[num2] 111111100011
R3 ← R1 + R2 : 100011111111
[Link][result] ← R3 :
Exemple d’un programme écrit avec le langage assembleur

section .data ; section des données

num1 db 5 ; première variable, valeur 5
num2 db 10 ; deuxième variable, valeur 10
result db 0 ; résultat initialisé à 0

section .text ; section de code

global _start ; point d'entrée pour l'exécution

_start:
; Charger les valeurs des variables dans les registres
mov al, [num1] ; charger la valeur de num1 dans le registre AL
mov bl, [num2] ; charger la valeur de num2 dans le registre BL

; Ajouter les deux registres

add al, bl ; AL = AL + BL (sommer num1 et num2)

; Stocker le résultat
mov [result], al ; stocker la somme dans la variable result

; Fin du programme
mov eax, 60 ; appel système pour terminer le programme (code 60)
xor edi, edi ; statut de retour 0
syscall ; exécuter l'appel système
Fonctionnement des compilateurs vs interpréteurs

Interpréteur

Compilateur

Compilateur
avec
machine
virtuelle
Compilateur Vs Traducteur

Compilateur: Il analyse tout le code source en une Interprète (ou traducteur) : Un interprète est un
programme qui traduit et exécute le code source
seule fois, puis le compile en un fichier binaire ligne par ligne, sans le transformer en un fichier
exécutable. Ensuite, exécutable indépendant.
Fonctionnement : Il lit chaque ligne du code
Avantages : Meilleure performance lors de source, la traduit en instructions machine, puis
l'exécution, car le programme est déjà traduit en l'exécute immédiatement avant de passer à la ligne
suivante.
code machine. Avantages :Facilite la détection rapide des erreurs,
Le code peut être optimisé pour améliorer les car elles sont détectées ligne par ligne pendant
l'exécution.
performances. Le code peut être modifié et exécuté
Inconvénients :Temps de compilation plus long. immédiatement sans recompiler l'ensemble.
Inconvénients :L'exécution est généralement plus
En cas d'erreur, il faut recompiler le programme lente, car chaque ligne de code doit être traduite à
après correction. chaque fois qu'elle est exécutée.
Le programme ne peut pas être exécuté sans
Exemples : Compilateur GCC (C/C++), javac (Java). l'interprète.
Exemples : Python, Ruby, PHP
Structure d’un compilateur/phase de compilation

Tous les mots appartiennent

au langage A

Vérifier le syntaxe

Compatibilité variable avec

affectation
Outils théoriques et pratiques

Phase de la compilation Outils théoriques

Phases d’analyse Analyse lexicale scanning Expressions régulières
(scanning) Automates à états finis
Analyse syntaxique Grammaires
(parsing)
Analyse sémantiques Traduction dirigée par la
syntaxe
Génération de code Traduction dirigée par la
syntaxe
PRINCIPE DE L’ANALYSE LEXICALE

Décompose le code source en symboles (tokens) représentant les éléments syntaxiques

du langage.
Le rôle d'un analyseur lexical:

L'analyseur lexical ou, aussi appelée « scanner» lit le code source caractère par caractère et le
divise en « tokens », qui sont des séquences de caractères avec une signification particulière
dans le langage (comme des mots-clés, des identifiants, des opérateurs, etc.).

- éliminer les blancs (espaces, tabulations, fin de lignes) et les commentaires.

- détecter les erreurs et associer des messages d'erreurs.

- Par exemple, pour le code i` nt a = 5;`, les tokens seraient : `int`, `a`, `=`, `5`, et `;`.
- Le résultat est un flux de tokens qui est transmis à la phase suivante.

**Exemple :**
int a = 5;
`
Tokens générés : `int`, `a`, `=`, `5`, `;`.
EXEMPLE D’UN LEXEME

Un léxème est une séquence finie de symboles de l’alphabet du langage

Quels sont les lexèmes du code C suivant?

While (ip <z)

ip++;

• While
• (
• Ip
• <
• Z
• )
• Ip
• ++
• ;
PRINCIPE DE JETON (TOKEN)
EXEMPLE D’UN JETON (token)
Analyse Syntaxique (Syntax Analysis)

Objectif : Vérifier que les tokens suivent la grammaire du langage de programmation.

- Cette phase, aussi appelée « analyseur syntaxique » ou « parser », organise les tokens
obtenus dans l'étape précédente en une « structure arborescente » appelée « arbre
syntaxique abstrait (AST) ».

- L'analyseur vérifie que les tokens respectent les règles grammaticales du langage. Si la
syntaxe est incorrecte, des erreurs de syntaxe sont générées.

- L'AST représente la structure hiérarchique du programme et reflète la façon dont les

instructions doivent être exécutées. Exemple :``int a = 2+3*4; `
AST produit : un nœud représentant une déclaration de variable `a` de type i` nt` avec
l’expression facteur + facteur * facteur
Analyse Sémantique (Semantic Analysis)

Objectif : Vérifier que les constructions syntaxiques ont un sens logique.

- Dans cette phase, le compilateur vérifie les « règles sémantiques » du langage, comme la
validité des types de données, la portée des variables et la compatibilité des opérateurs.
- Par exemple, l'analyseur sémantique vérifiera si une variable est utilisée avant d'être déclarée ou
si un opérateur est utilisé avec des types de données incorrects (par exemple, additionner un
entier avec une chaîne de caractères).

Exemple :

`int a = "test"; // Erreur sémantique

`
Erreur détectée : Incompatibilité de type (`int` ne peut pas être assigné à une chaîne de caractères).
Rôle de la table de symboles

La table de symboles est créée et maintenue par le compilateur afin :

Enregistrer les déclarations : Quand un identificateur est déclaré (comme une

variable ou une fonction), le compilateur stocke ses informations dans la table.

Assurer la portée et la visibilité : Elle aide à gérer les portées (scopes) des
identificateurs, garantissant qu'ils sont utilisés uniquement là où ils sont visibles.

Faciliter la vérification des types : Lorsqu'une variable ou une fonction est utilisée,
la table permet de vérifier que le type et l'utilisation correspondent à la
déclaration.

Aider à la génération de code : Les informations sur les identificateurs sont

utilisées lors de la génération du code machine ou du bytecode.
Structure de la table de symboles

La table de symboles est généralement implémentée comme une table de hachage

ou un arbre, où :

Les clés sont les noms des identificateurs (variables, fonctions, types).

Les valeurs sont des ensembles d'informations associées à chaque identificateur,

comme :
• Le type de l'identificateur (par exemple, int, float, string).
• La localisation en mémoire (ou adresse) pour une variable.
• La portée (scope) ou le contexte dans lequel l'identificateur est valide.
• Les attributs supplémentaires comme les paramètres d'une fonction, les
dimensions d'un tableau, etc.
Exemples
int x;float y;
int main() {
int z; x = 10; y = 3.14;
}

int x;int main() { Dans ce cas, la table de symboles doit avoir une
int x; // Une autre variable x, différente de la première hiérarchie pour comprendre que x dans le bloc main()
} est différent de x dans le contexte global.

Pour une fonction, la table de symboles stocke généralement :

• Le type de retour.
• La liste des paramètres avec leur type.
• Le bloc ou la portée dans laquelle la fonction est définie.

int add(int a, int b) {

return a + b;
}
Une grammaire context-free
(grammaire hors-contexte ou CFG, pour Context-Free Grammar en anglais) est un
concept central en théorie des langages formels et en compilation.
Il s'agit d'un type de grammaire formelle qui est utilisé pour définir la syntaxe des
langages de programmation ou des langages formels en général.
Voici une explication des concepts clés associés :

Définition Une grammaire context-free est une collection de règles de réécriture qui
produisent des chaînes de symboles. Elle est composée de quatre éléments :

1. N : Un ensemble de non-terminaux (ou variables), qui représentent des catégories

syntaxiques (par exemple, une expression arithmétique, une fonction).
2. Σ : Un ensemble de terminaux, c'est-à-dire les symboles du langage (par exemple,
des mots-clés, des opérateurs).
3. P : Un ensemble de règles de production, de la forme A → α, où A est un non-
terminal et α est une chaîne de terminaux et/ou de non-terminaux.
4. S : Un symbole de départ (un non-terminal particulier), à partir duquel la
génération de la syntaxe commence.
Règles de production
Les règles de production d'une grammaire context-free permettent de remplacer un non-
terminal par une séquence de symboles (terminaux et/ou non-terminaux). Le caractère "hors-
contexte" signifie que la réécriture d'un non-terminal ne dépend pas du contexte dans lequel il
apparaît, mais uniquement du non-terminal lui-même.
Une règle de production typique ressemble à : 𝐴→𝐵 𝐶 ∣𝑎 . Cela signifie que le non-terminal A
peut être réécrit soit comme la séquence des non-terminaux 𝐵 C, soit comme le terminal 𝑎.
Exemple :
Parse Tree ou arbre syntaxique concret

Un parse tree (ou arbre de dérivation, ou encore arbre syntaxique concret) est une structure de
données arborescente qui représente la manière dont une chaîne d'entrée (comme une
instruction ou un programme) est dérivée à partir des règles d'une grammaire.

Entrée à analyser :2+3∗4

Voici le parse tree pour cette expression
selon la grammaire donnée :

Les nœuds internes correspondent à des non-terminaux

de la grammaire.
Les feuilles (les nœuds les plus bas) représentent les
symboles terminaux du langage (comme des opérateurs,
des mots-clés, des variables, etc.).
La racine de l'arbre est généralement le symbole de
départ de la grammaire.
Les branches de l'arbre illustrent l'application des règles
de production de la grammaire.
Parse Tree vs l'arbre de syntaxe abstraite (AST),
Facilite l'analyse syntaxique : Le parse Parse Tree AST
tree montre explicitement la structure
hiérarchique d'une expression ou d'une
instruction en fonction des règles de la
grammaire.
Aide à la détection d'erreurs : En
analysant la structure du parse tree, le
compilateur peut identifier rapidement
des erreurs syntaxiques dans le
programme source.
Base pour la construction d'autres
structures :
Le parse tree est souvent une première
étape pour construire l'AST, qui est utilisé
pour des analyses plus poussées et pour
la génération du code.
Optimisation Intermédiaire (Intermediate Code Generation)

Objectif : Traduire le code source en un code intermédiaire.

- Le compilateur convertit le programme en un « langage intermédiaire » ou « code

intermédiaire » qui est plus simple et proche du code machine, mais indépendant de la
plateforme matérielle.

- Ce code est souvent plus abstrait et simplifié, et il facilite les optimisations.

- Ce code intermédiaire peut ensuite être optimisé avant d'être traduit en code machine.

Exemple

Code en C Code intermédiaire produit : `

int a = 5; Analyse LOADI 5, a
int b = a + 3; LOAD a, r1
` Lexicale, Syntaxique et sémantique ADDI r1, 3, b
Optimisation (Optimization)

Objectif : Améliorer l'efficacité du code sans changer son comportement.

- Le compilateur tente de rendre le code plus rapide, plus efficace ou moins gourmand en mémoire.
- Il peut s'agir de la « réduction des redondances », de la « réutilisation des calculs », de
« l 'élimination du code mort » (instructions inutiles), ou encore de la « fusion de boucles ».
- Les optimisations peuvent être de haut niveau (sur le code source) ou de bas niveau (sur le code
machine).

Exemple d'optimisation :

int a = 2 * 3; // Devient simplement

int a = 6;
`
Disposition de titre et de contenu avec graphique SmartArt

Phase Phase de
Traduction Link
analyse production
Génération du Programme cible
Programme en
Analyse lexicale code écrit en langage
Code binaire
intermédiaire B

______________
Analyse ____________
Optimisation Langage proche
syntaxique Exécutable
à la machine

_____________
Analyse
Sémantique Génération du
code
____________
intermédiaire

Construire l’arbre
syntaxique

Vous aimerez peut-être aussi

Dipo1 Compilation
Pas encore d'évaluation
Dipo1 Compilation
25 pages
Compilation
Pas encore d'évaluation
Compilation
90 pages
Théorie des langages et compilation
Pas encore d'évaluation
Théorie des langages et compilation
35 pages
Chapitre Intro 2022
Pas encore d'évaluation
Chapitre Intro 2022
29 pages
Cours AnalyseLexicale 1
Pas encore d'évaluation
Cours AnalyseLexicale 1
98 pages
Compilation Chap 1
Pas encore d'évaluation
Compilation Chap 1
25 pages
0 Introduction Aux Compilateurs-2021
Pas encore d'évaluation
0 Introduction Aux Compilateurs-2021
34 pages
Cours 1 Chap 1
Pas encore d'évaluation
Cours 1 Chap 1
35 pages
Introduction à la Compilation
Pas encore d'évaluation
Introduction à la Compilation
6 pages
Chap1 Introduction Aux Compilateurs
Pas encore d'évaluation
Chap1 Introduction Aux Compilateurs
8 pages
Compilation
Pas encore d'évaluation
Compilation
21 pages
Introduction aux Compilateurs et Phases
Pas encore d'évaluation
Introduction aux Compilateurs et Phases
24 pages
Chap1 Compil Gasmi
Pas encore d'évaluation
Chap1 Compil Gasmi
10 pages
Cours Licence Compilation Introduction
Pas encore d'évaluation
Cours Licence Compilation Introduction
4 pages
Introduction à la Compilation et Analyse des Compilateurs
Pas encore d'évaluation
Introduction à la Compilation et Analyse des Compilateurs
8 pages
Cours Théorie de LangagesonI Introduction PR Ouatik
Pas encore d'évaluation
Cours Théorie de LangagesonI Introduction PR Ouatik
18 pages
Compilation 2015 Chap Intro
Pas encore d'évaluation
Compilation 2015 Chap Intro
31 pages
Phases de Traduction
Pas encore d'évaluation
Phases de Traduction
7 pages
Chapitre 1 Compilation
Pas encore d'évaluation
Chapitre 1 Compilation
5 pages
Chapitre 1 Et 2
Pas encore d'évaluation
Chapitre 1 Et 2
25 pages
CH01 Introduction-Compilation
Pas encore d'évaluation
CH01 Introduction-Compilation
26 pages
Chapitre 1
Pas encore d'évaluation
Chapitre 1
34 pages
Chapitres 1-2 Compilation 3eme ING Informatique 2024-2025
Pas encore d'évaluation
Chapitres 1-2 Compilation 3eme ING Informatique 2024-2025
23 pages
Technique de Compilation - Introduction Générale
Pas encore d'évaluation
Technique de Compilation - Introduction Générale
18 pages
Cours 1 Introduction A La Compilation
Pas encore d'évaluation
Cours 1 Introduction A La Compilation
5 pages
Introduction à la compilation informatique
Pas encore d'évaluation
Introduction à la compilation informatique
9 pages
Introduction À La Compilation: Alexis Nasr Carlos Ramisch Sylvain Sené
Pas encore d'évaluation
Introduction À La Compilation: Alexis Nasr Carlos Ramisch Sylvain Sené
50 pages
Introduction à la compilation en informatique
Pas encore d'évaluation
Introduction à la compilation en informatique
6 pages
Introduction aux compilateurs
Pas encore d'évaluation
Introduction aux compilateurs
8 pages
Introduction à la Compilation
Pas encore d'évaluation
Introduction à la Compilation
6 pages
37 Chap1-2-3 Compi
Pas encore d'évaluation
37 Chap1-2-3 Compi
34 pages
Chap 1 Introduction Aux Compilateurs
Pas encore d'évaluation
Chap 1 Introduction Aux Compilateurs
9 pages
Chap 1 Introduction Aux Com Pilate Urs
Pas encore d'évaluation
Chap 1 Introduction Aux Com Pilate Urs
9 pages
Les Cours de Module Compilation Dr. MALEK
Pas encore d'évaluation
Les Cours de Module Compilation Dr. MALEK
34 pages
Cours 1
Pas encore d'évaluation
Cours 1
80 pages
CH2 Lexicale
Pas encore d'évaluation
CH2 Lexicale
3 pages
Chapitre1 Introduction À La Compilation
Pas encore d'évaluation
Chapitre1 Introduction À La Compilation
19 pages
Techniques de Compilation et Historique
Pas encore d'évaluation
Techniques de Compilation et Historique
61 pages
Introduction à la compilation et analyse lexicale
Pas encore d'évaluation
Introduction à la compilation et analyse lexicale
73 pages
Compilation
Pas encore d'évaluation
Compilation
41 pages
Resumé
Pas encore d'évaluation
Resumé
194 pages
Compilation 1
Pas encore d'évaluation
Compilation 1
37 pages
Chapitre1 Introduction À La Compilation
Pas encore d'évaluation
Chapitre1 Introduction À La Compilation
23 pages
Introduction à la Compilation en Informatique
Pas encore d'évaluation
Introduction à la Compilation en Informatique
3 pages
Introduction à la compilation informatique
Pas encore d'évaluation
Introduction à la compilation informatique
249 pages
Principes de Compilation Et Dassemblage (Notions de Base)
Pas encore d'évaluation
Principes de Compilation Et Dassemblage (Notions de Base)
2 pages
Comp I LGG Dation Site
Pas encore d'évaluation
Comp I LGG Dation Site
45 pages
Introduction aux principes de compilation
Pas encore d'évaluation
Introduction aux principes de compilation
28 pages
Introduction Copie
Pas encore d'évaluation
Introduction Copie
132 pages
Compil
Pas encore d'évaluation
Compil
106 pages
Compilation Chapitre1
Pas encore d'évaluation
Compilation Chapitre1
15 pages
Concepts de Base de la Compilation
0% (1)
Concepts de Base de la Compilation
48 pages
Cours de Compilation
Pas encore d'évaluation
Cours de Compilation
178 pages
Introduction à la compilation et analyse lexicale
Pas encore d'évaluation
Introduction à la compilation et analyse lexicale
58 pages
Compilation AL LL LR As-1
Pas encore d'évaluation
Compilation AL LL LR As-1
51 pages
Compilation Cours
Pas encore d'évaluation
Compilation Cours
41 pages
Downloadfile
Pas encore d'évaluation
Downloadfile
41 pages
Programmation Python
100% (3)
Programmation Python
26 pages
Cours Algorithmique 2ème SC (S)
100% (2)
Cours Algorithmique 2ème SC (S)
25 pages
tp2 Sirine
Pas encore d'évaluation
tp2 Sirine
8 pages
Apprendre Java : Guide Complet Débutant
100% (4)
Apprendre Java : Guide Complet Débutant
706 pages
Programmation Parallèle: Java & Simula
Pas encore d'évaluation
Programmation Parallèle: Java & Simula
44 pages
Technique Compilation 1-2
Pas encore d'évaluation
Technique Compilation 1-2
79 pages
Chapitre 1
Pas encore d'évaluation
Chapitre 1
13 pages
Algorithme 1
Pas encore d'évaluation
Algorithme 1
18 pages
Cours - USTM - 2017 Programmation Et Algorithmique
100% (1)
Cours - USTM - 2017 Programmation Et Algorithmique
186 pages
INF5171 Programmation Concurrente Et Parallèle Notes de Cours. Guy Tremblay
Pas encore d'évaluation
INF5171 Programmation Concurrente Et Parallèle Notes de Cours. Guy Tremblay
480 pages
Minoco Api & Grafcet
Pas encore d'évaluation
Minoco Api & Grafcet
19 pages
Le Langage Prolog
Pas encore d'évaluation
Le Langage Prolog
15 pages
Informatique 1 s1
Pas encore d'évaluation
Informatique 1 s1
144 pages
Cours BD Relationnelles MIAGE
Pas encore d'évaluation
Cours BD Relationnelles MIAGE
165 pages
Chapitre1 Metier Informatique
Pas encore d'évaluation
Chapitre1 Metier Informatique
5 pages
Langages Formels et Compilation
Pas encore d'évaluation
Langages Formels et Compilation
66 pages
Rapport Stage Isim
Pas encore d'évaluation
Rapport Stage Isim
38 pages
Cours Algorithmique - Excercices Corrigés
Pas encore d'évaluation
Cours Algorithmique - Excercices Corrigés
117 pages
"Jeunes Traducteurs et Pouvoir des Mots"
Pas encore d'évaluation
"Jeunes Traducteurs et Pouvoir des Mots"
60 pages
Automate Programmable Industriel API
Pas encore d'évaluation
Automate Programmable Industriel API
11 pages
Cours Algo C-L2 SPI
Pas encore d'évaluation
Cours Algo C-L2 SPI
68 pages
Apol1 Tentative 1 Corrigé
Pas encore d'évaluation
Apol1 Tentative 1 Corrigé
5 pages
Epreuve D'informatique Idep2
Pas encore d'évaluation
Epreuve D'informatique Idep2
6 pages
Cours 17
Pas encore d'évaluation
Cours 17
16 pages
Baccalauréat en Informatique - UQO 7833
Pas encore d'évaluation
Baccalauréat en Informatique - UQO 7833
7 pages
Introduction et Installation de PHP
Pas encore d'évaluation
Introduction et Installation de PHP
49 pages
Introduction A Blockly Games Une Approche Ludique Pour Apprendre A Coder
Pas encore d'évaluation
Introduction A Blockly Games Une Approche Ludique Pour Apprendre A Coder
10 pages
Oop 2005 Emsi Poo C++
Pas encore d'évaluation
Oop 2005 Emsi Poo C++
57 pages
Arduino: Guide Complet Programmation et Capteurs
Pas encore d'évaluation
Arduino: Guide Complet Programmation et Capteurs
20 pages