Département : Informatique
Filière : Cycle d’ingénieur Génie
Informatique
MODULE:
INTELLIGENCE ARTIFICIELLE
PRÉDICTION AVANCÉE DE LA
MÉTÉO
ENCADRÉ PAR: RÉALISÉ PAR:
PR. ZEROUAL IMAD MOSTAPHA ABDELMOULA
INTRODUCTION 01 MODÉLISATION 03
PRÉSENTATION DU PROJET ET DE SÉLECTION DES MODÈLES D'IA
SON CONTEXTE
OBJECTIFS DU PROJET MÉTHODES D'ENTRAÎNEMENT ET
D'ÉVALUATION
ANALYSE DES DONNÉES 02 ÉVALUATION DES PERFORMANCES 04
DESCRIPTION DES DONNÉES PERFORMANCE DES MODÈLES
PRÉTRAITEMENT DES DONNÉES MÉTRIQUES D'ÉVALUATION UTILISÉES
CONCLUSION 05
PLAN
3
INTRODUCTION
Présentation du projet et de son contexte
Ce projet de prédiction météorologique avancée se concentre sur
l'amélioration des prévisions, cruciales dans divers secteurs tels
que l'agriculture, l'aviation et la gestion des ressources naturelles.
Ces prévisions sont vitales pour la planification quotidienne, la
sécurité des vols, la gestion des cultures et la préparation aux
situations d'urgence. Cependant, la complexité des phénomènes
météorologiques et les limitations des modèles existants peuvent
entraver leur précision.
Ce projet vise à repousser ces limites en utilisant
01
des techniques de modélisation avancées, avec
pour objectif de fournir des prévisions plus
précises et fiables. En mettant l'accent sur
l'innovation et l'expérimentation, il cherche à
améliorer les services météorologiques et à
approfondir la compréhension des phénomènes
météorologiques complexes.
4
INTRODUCTION
Objectifs du projet
L'objectif principal de ce projet créer un modèle de
prédiction météorologique sophistiqué capable de
fournir des prévisions précises pour diverses
variables météorologiques sur différentes échelles
de temps. Les objectifs spécifiques incluent
l'exploration des données météorologiques
disponibles, le développement de modèles
02
prédictifs utilisant des techniques avancées,
l'évaluation de la performance des modèles
développés et l'exploration des possibilités
d'amélioration en utilisant des techniques telles
que le transfert d'apprentissage ou l'intégration de
données supplémentaires
5
ANALYSE DES DONNÉES
DESCRIPTION DES DONNÉES
Les données utilisées dans ce projet de prédiction météorologique sont
extraites des enregistrements
météorologiques de la ville d'Errachidia . Les données comprennent
plusieurs variables
météorologiques enregistrées à des intervalles de temps réguliers.
Date : Date de l'enregistrement des données.
Time : Heure de l'enregistrement des
données.
TempOut : Température extérieure.
HiTemp : Température maximale enregistrée.
03
LowTemp : Température minimale
enregistrée.
OutHum : Humidité extérieure.
WindSpeed : Vitesse du vent.
Wind.2Run : Distance parcourue par le vent
en 2 minutes.
Bar : Pression atmosphérique.
Rain : Quantité de pluie.
RainRate : Taux de précipitation.
In Temp : Température intérieure. InHum : 7
Humidité intérieure.
ANALYSE DES DONNÉES
PRÉTRAITEMENT DES DONNÉES
Création de la nouvelle colonne 'TempReparteur' Suppression des colonnes redondantes
Nous avons créé une nouvelle colonne appelée Une fois que la colonne 'TempReparteur' a été créée, nous
'TempReparteur' en calculant la moyenne des avons supprimé les colonnes 'TempOut', 'HiTemp',
températures enregistrées dans les colonnes 'TempOut', 'LowTemp' et 'In Temp' du jeu de données. Ces colonnes
'HiTemp', 'LowTemp' et 'In Temp'. Cette approche nous étaient redondantes car elles fournissaient des
permet de consolider les informations sur la température informations similaires sur la température, et en les
en un seul attribut, facilitant ainsi l'analyse ultérieure supprimant, nous réduisons la dimensionnalité du jeu de
données tout en conservant les informations essentielles
04 9
ANALYSE DES DONNÉES
PRÉTRAITEMENT DES DONNÉES
Suppression des colonnes non utilisées '
Nous avons supprimé les colonnes 'OutHum',
'WindSpeed', 'Wind.2Run', 'Bar', 'RainRate' et 'InHum' du
jeu de données, car elles n'étaient pas utilisées dans notre
analyse ou modélisation ultérieure. Ces colonnes étaient
jugées non pertinentes ou redondantes par rapport à
notre objectif de prédiction météorologique, et leur
suppression nous a permis de simplifier le jeu de données
et de réduire sa dimensionnalité. Cela nous permet de
nous concentrer sur les variables importantes et de
construire des modèles plus efficaces et interprétables
Correction de la colonne de Date
05
Pour corriger les erreurs présentes dans la colonne 'Date', nous
avons entrepris la création d'une nouvelle colonne de date exacte à
partir des données existantes. Après une analyse méticuleuse des
erreurs, incluant les formats incorrects, les valeurs aberrantes et les
données manquantes, nous avons utilisé des techniques de
nettoyage des données pour extraire les informations de date
précises et les avons stockées dans une nouvelle colonne . Une fois
cette tâche accomplie avec succès, nous avons procédé à la
suppression de la colonne 'Date' originale du jeu de données afin
9
d'éviter toute confusion ou redondance.s
ANALYSE DES DONNÉES
06
PRÉTRAITEMENT DES DONNÉES
Correction des valeurs manquantes dans la colonne 'Température'
Nous avons remarqué la présence de valeurs manquantes dans la colonne
'Température' de notre jeu de données. Pour corriger ces valeurs manquantes, nous
avons utilisé deux approches différentes :
REMPLACEMENT PAR LA MOYENNE DE LA REMPLACEMENT PAR LA MÊME VALEUR DE LA MÊME
TEMPÉRATURE DE LA MÊME JOURNÉE : JOURNÉE DE L'ANNÉE PRÉCÉDENTE :
Dans la deuxième méthode, nous avons remplacé les valeurs
Dans la première méthode, nous avons remplacé les
manquantes par la même valeur de température enregistrée
valeurs manquantes par la moyenne de la température 3
pour la même journée de l'année précédente. Cette approche
enregistrée pour la même journée. Cela permet de
prend en compte les variations saisonnières et annuelles des
conserver la tendance journalière des températures et de
températures, ce qui peut être important pour maintenir la
maintenir la cohérence temporelle des données. Cette cohérence des données sur une période plus longue.
approche est particulièrement utile lorsque les variations Cependant, cette méthode suppose que les conditions
de température sont significatives d'un jour à l'autre. météorologiques d'une année à l'autre sont similaires pour la
même période
10
ANALYSE DES DONNÉES
PRÉTRAITEMENT DES DONNÉES
Agrégation par jour
Afin de simplifier l'analyse et de réduire la
granularité des données, nous avons opté pour
l'agrégation des mesures de température et de
précipitations par jour plutôt que par intervalles de
demi-heure. Cette approche nous permet de
représenter les données de manière plus concise
et de mettre en évidence les tendances
07
quotidiennes de manière plus claire.
14
ANALYSE DES DONNÉES
08
PRÉTRAITEMENT DES DONNÉES
Visualisation de la température par date :'
Nous avons utilisé la fonction plotly.express.line pour créer un graphique linéaire représentant la
température en fonction de la date. Cette visualisation interactive nous permet d'explorer les
variations de température au fil du temps en survolant les points de données et en zoomant sur des
périodes spécifiques.
9
ANALYSE DES DONNÉES
09
PRÉTRAITEMENT DES DONNÉES
Visualisation des précipitations par date :'
Pour représenter les précipitations en fonction de la date, nous avons utilisé la fonction
plotly.express.bar pour créer un graphique de barres interactif. Ce graphique nous permet de
visualiser la quantité de précipitations enregistrée pour chaque jour et de comparer les niveaux de
précipitations sur différentes périodes.
9
MODÉLISATION
SÉLECTION DES MODÈLES D'IA
Nous avons opté pour les modèles de réseaux de neurones récurrents en
raison de leur capacité à capturer les dépendances temporelles dans les
séries temporelles, ce qui est crucial pour la prédiction des données
météorologiques. Les modèles LSTM, SimpleRNN et GRU sont
particulièrement adaptés à cette tâche en raison de leur architecture
récurrente, qui leur permet de prendre en compte les informations passées
pour faire des prédictions précises.
10 9
MODÉLISATION
MÉTHODES D'ENTRAÎNEMENT
ET D'ÉVALUATION
Nous avons utilisé la validation croisée pour évaluer les
performances de nos modèles en divisant les données en
ensembles d'entraînement et de test, et en utilisant des
métriques adaptées comme le RMSE et le MAE pour
mesurer la précision de nos prédictions. Ensuite, nous
avons entraîné nos modèles en divisant les données avec
train_test_split de scikit-learn, en réservant 80% des
données pour l'entraînement et 20% pour l'évaluation,
avec une graine aléatoire fixée à 42 pour assurer la
reproductibilité des résultats.
11 14
ÉVALUATION DES PERFORMANCES
ALGORITHME DE SIMPLE RNN :
Performance des modèles sur les données de test
:'
Nous avons évalué les performances de nos modèles sur les données de test en examinant les valeurs
de perte (loss) obtenues lors de l'entraînement et de l'évaluation. Voici les résultats de nos évaluations
:
12
Le graphique présenté est un diagramme linéaire
avec deux courbes distinctes.
La courbe rouge montre une diminution de la
perte au fil des époques, tandis que la courbe
bleue fluctue. Bien que le modèle s'améliore
globalement, son apprentissage n'est pas
uniforme, avec des périodes de progrès rapides et
d'autres plus lentes. De plus, la perte de validation
reste inférieure à la perte d'apprentissage,
indiquant une absence de surapprentissage. Les
pertes convergent vers une valeur minimale vers
l'époque 10, démontrant une précision
satisfaisante des prédictions. 9
ÉVALUATION DES PERFORMANCES
13
ALGORITHME DE SIMPLE RNN :
Métriques d'évaluation utilisées :'
Les résultats indiquent les performances d'un modèle de
prédiction ou de modélisation. Le RMSE (Root Mean Square
Error) mesure l'écart moyen entre les valeurs prédites et
réelles, tandis que le MAE (Mean Absolute Error) mesure la
différence moyenne absolue entre ces valeurs. Malgré des
valeurs légèrement plus élevées pour les données de test
par rapport à celles d'entraînement, le modèle semble
généraliser efficacement, avec des erreurs relativement
faibles pour les deux ensembles de données.
9
14
ÉVALUATION DES PERFORMANCES
ALGORITHME DE LSTM :
Performance des modèles sur les données de test
:'
Le graphique présenté illustre la courbe
d'apprentissage, mettant en évidence un cas de
sous-apprentissage. La perte d'entraînement et la
perte de validation sont toutes deux élevées et
diminuent de manière linéaire au fil du temps. Cette
constatation revêt une importance capitale compte
tenu de la nature particulièrement réaliste et
complexe du jeu de données.
9
ÉVALUATION DES PERFORMANCES
15
ALGORITHME DE LSTM :
Métriques d'évaluation utilisées :'
9
18
CONCLUSION
en conclusion, ce projet de prédiction météorologique a permis d'explorer diverses
techniques de modélisation, notamment les réseaux de neurones récurrents et
l'approche de forcasting. Les résultats ont montré que ces modèles peuvent fournir des
prévisions météorologiques fiables et précises, ouvrant ainsi la voie à des améliorations
significatives dans la capacité à anticiper les conditions météorologiques futures. Ce
travail offre une base solide pour des recherches futures et souligne l'importance
croissante de l'application de techniques de modélisation avancées dans le domaine de la
météorologie
19
Merci pour
votre
attention