1
0.INTRODUCTION
La sécurité alimentaire est un enjeu majeur en République démocratique du
Congo (RDC), où l'agriculture joue un rôle crucial dans l'économie et la subsistance de la
population. Dans la région du Kasaï Central, la production céréalière, essentielle à la nutrition
locale, est fortement tributaire des conditions météorologiques souvent imprévisibles et
variables.
Les variations de précipitations, de température et d'ensoleillement ont un
impact significatif sur les rendements, affectant la disponibilité des denrées alimentaires et la
stabilité économique des communautés agricoles. Prévoir avec précision ces rendements
permettrait aux agriculteurs, aux décideurs politiques et aux organismes humanitaires de
prendre des décisions éclairées pour améliorer la gestion des cultures, optimiser les
interventions et renforcer la résilience face aux aléas climatiques.
Mon mémoire se propose d'explorer l'utilisation de l'apprentissage
automatique, et plus précisément des arbres de décision, pour prédire le rendement céréalier
par hectare dans la zone précise , au Kasaï Central. L'objectif est de construire un modèle
prédictif robuste capable d'intégrer les données météorologiques historiques comme
principaux facteurs explicatifs. En utilisant des techniques de traitement et d'analyse de
données, ainsi que des algorithmes d'apprentissage supervisé, nous chercherons à développer
un outil pertinent pour la planification et la gestion agricole dans cette région. L'étude évaluera
la performance du modèle en termes de précision prédictive, en utilisant des métriques
appropriées telles que le RMSE
1. MÉTHODOLOGIE
La méthodologie de mon mémoire repose sur une approche quantitative et
expérimentale, visant à développer un modèle prédictif basé sur l'apprentissage automatique
pour améliorer la productivité agricole en RDC. Cette approche comprend les étapes suivantes :
Collecte de données: Rassembler des données agricoles pertinentes, telles que les
rendements des cultures, les conditions météorologiques, la qualité du sol et les
pratiques agricoles locales.
Prétraitement des données: Nettoyer, normaliser et transformer les données pour les
rendre adaptées à l'analyse.
Sélection des caractéristiques : Identifier les variables les plus influentes sur les
rendements agricoles.
Développement du modèle: Utiliser des algorithmes d'apprentissage automatique pour
créer un modèle prédictif.
Évaluation du modèle : Tester la précision et la fiabilité du modèle à l'aide de métriques
appropriées.
2. MÉTHODES ET TECHNIQUES UTILISÉES (AVEC ARBRE DE DÉCISION)
2
Pour atteindre les objectifs de mon étude, les méthodes et techniques
suivantes seront employées :
Algorithme choisi : Arbre de Décision (Decision Tree)
J'utiliserai cet algorithme car il est simple à interpréter, visuel, et très adapté
aux décisions agricoles où les critères (type de sol, pluviométrie, semence, etc.) influencent
clairement les résultats.
1. RAISONS DU CHOIX :
Il modélise des décisions sous forme de règles simples (si... alors...).
Il permet de comprendre les facteurs clés qui influencent les rendements.
Il gère à la fois les données numériques et catégorielles.
2. ÉTAPES :
Entraînement : J'entraînerai l’arbre de décision sur un jeu de données agricoles à
kananga.
Validation : À l’aide d’une validation croisée (par exemple K-fold), je mesurerai la
performance.
Évaluation :J' utiliseras des métriques comme la précision (accuracy), l'entropie
(information gain) et la profondeur de l’arbre.
3. FONCTIONNEMENT DE L’ALGORITHME : ARBRE DE DÉCISION
L’arbre de décision est un algorithme d’apprentissage supervisé. Il apprend à partir des
données d’entrée (caractéristiques agricoles) pour prédire une sortie (par exemple :
bon/mauvais rendement).
Il fonctionne comme un arbre avec :
Un nœud racine (la première question posée),
Des branches(les décisions possibles),
Des feuilles (les prédictions ou classes finales).
Exemple concret (simplifié)
But : Prédire si le rendement de maïs sera bon ou mauvais.
Variables utilisées :
1. Type de sol (argileux, sablonneux)
2. Quantité de pluie (faible, moyenne, élevée)
3. Utilisation d’engrais (oui/non)
L’arbre pourrait être :
Si engrais = non → Rendement = mauvais
3
Sinon :
Si pluie = faible → Rendement = mauvais
Si pluie = moyenne ou élevée :
Si sol = argileux→ Rendement = bon
Si sol = sablonneux→ Rendement = moyen
4. AVANTAGES
Facile à comprendre et à expliquer.
S’adapte bien aux petits jeux de données.
Permet d’identifier les critères les plus influents.
5. INCONVÉNIENTS
Risque de surapprentissage (si l’arbre est trop profond).
Moins performant que d’autres modèles sur des données complexes.
6. OUTILS :
Python avec librairie Scikit-learn ou Weka (je vais faire ça sans surtout coder).
Jupyter Notebook pour la documentation du processus.
3. RÉSULTATS ATTENDUS
Les résultats escomptés de cette étude incluent :
Un modèle prédictif fiable capable d'estimer les rendements agricoles en fonction de
diverses variables.
Une meilleure compréhension des facteurs influençant la productivité agricole à
kananga.
Des recommandations pratiques pour les agriculteurs et les décideurs politiques afin
d'optimiser les pratiques agricoles.
4. ÉTAT DE L'ART
L'application de l'apprentissage automatique en agriculture a connu une
croissance significative ces dernières années. Des études ont démontré l'efficacité de ces
techniques pour prédire les rendements, détecter les maladies des plantes et optimiser les
pratiques agricoles. Par exemple, une étude a utilisé des algorithmes d'apprentissage
automatique pour prédire les rendements des cultures au Mali, montrant des résultats
prometteurs.
En RDC, bien que l'application de ces technologies soit encore émergente, des
initiatives commencent à voir le jour, mettant en évidence le potentiel de l'apprentissage
automatique pour transformer le secteur agricole.