Premiere page
De nombreuses approches existent pour la prévision des débits dans les tronçons naturels des
rivières. La prévision des débits présente un intérêt significatif tant du point de vue de la recherche
que du point de vue opérationnel. Le choix des méthodes dépend de la disponibilité des données et
du type d'application.Bien que des efforts de recherche continus visent à améliorer notre capacité
prédictive pour le flux fluvial, nous sommes souvent confrontés au défi de faire de telles prédictions
dans des bassins mal ou pas du tout mesurés (Sivapalanetal ., 2003). Des estimations fiables et
précises des composants hydrologiques ne sont pas seulement importantes pour la planification et
la gestion des ressources en eau, mais elles sont de plus en plus pertinentes pour les études sur
l'environnement (Schröoder, 2006). Plusieurs études ont fait état de l'utilisation de descripteurs de
captage et de la régionalisation des paramètres de prévision du débit dans des bassins étalés.Parmi
ces dernières études, il y a des études récentes de Sefton et Howard (1998), Mwakalila (2003), Xu
(2003), MerzreetBl¨oschl, 2004), Mchardreet (2005). (2009) et Shaoetal. (2009). Dans le cadre de la
comparaison des régressions linéaires avec des réseaux neuronaux artificiels, Heuvelmansetal.
(2006) a indiqué que le choix bien informé de descripteurs de bassin physique était la première
condition pour une régionalisation réussie des paramètres. Chengetal. (2006) a rendu compte de
l'importance et de l'utilité de modèles parcimonieux pour une prévision à court terme indiquant un
environnement médiocre comme ces modèles sont caractérisés par quelques nombres de
paramètres. De nombreux auteurs ont également identifié la réduction de l'incertitude associée aux
prévisions dans les bassins non jaugés comme étant très importante (Uhlenbrook et Siebert, 2005;
Koutsoyiannis, 2005a, b; Zhangetal., 2008).Deuximen page
Deuxieme page
Dernièrement, Koutsoyiannis et al. (2008) ont indiqué l'utilisation de techniques de modélisation
analogique pour la prédiction de flux qui donnent des performances impressionnantes en raison des
progrès des systèmes dynamiques non linéaires (systèmes chaotiques) .Les principaux inconvénients
de ces approches sont qu'elles sont gourmandes en données et fonctionnent comme Les boîtes
noires, ne fournissent donc aucun aperçu des processus hydrologiques.Cet article présente les
approches de modélisation de régression linéaire et non linéaire pour la prédiction de débit dans un
bassin versant de taille moyenne de la région équatoriale du Nil (bassin de Semliki), où très peu de
données hydrométéorologiques sont disponibles. Ces approches tentent de fournir des estimations
de débit mensuel qui relient des attributs physiographiques similaires du bassin versant aux flux
générés.
2 Zone d'étude Ces analyses sont menées dans le bassin versant de la Semliki de la région
équatoriale du Nil (Fig.1) .Le bassin étudié couvre une superficie estimée de 7699 km2. Le bassin
versant reçoit une pluviométrie moyenne de 1245 mm par an, avec des pics en mai (95 mm / mois)
et en octobre (205 mm / mois). Un ruissellement local annuel moyen de 4,622 km3 a été estimé à
partir des relevés à Bweramule (Sutcliffe et Parks, 1999) .Les altitudes comprennent des zones plates
et des montagnes couvertes de glace, s'élevant jusqu'à 4862 m au-dessus du niveau de la mer. La
flore et la faune du bassin versant constituent l'un des écosystèmes uniques et distincts de la région
du Rift Albertine. La végétation comprend principalement des forêts sempervirentes humides de
moyenne altitude à semi-décidues. Cinq zones de végétation distinctes ont été documentées sous le
mont Ruwenzori et elles se produisent avec des changements d'altitude. Des informations détaillées
sur les attributs physiographiques du paysage sont rapportées dans Kileshye Onema et Taigbenu
(2009).
3 Données et méthodes Le paysage de tout bassin versant est constitué de plusieurs combinaisons
d'attributs physiographiques. Ces combinaisons sont généralement variables selon les bassins
versants, donnant lieu à des réponses hydrologiques différentes. Le bassin de Semliki a été délimité
en 21 sous-bassins (S3-S23) qui sont présentés sur la figure 2. Cette délimitation a été réalisée à
l'aide du modèle numérique d'élévation (DEM) de 90 m de la Shuttle Radar Topography Mission
(SRTM) avec des cartes traditionnelles. À partir de six attributs physiographiques, les 21 sous-
bassins ont été regroupés
Troisième page
en deux catégories en utilisant l'analyse en composantes principales (ACP) et l'analyse en grappes.
En partant de l'hypothèse que les variables physiographiques sont stationnaires, une prédiction
quasitemporelle du débit a été réalisée avec deux variables supplémentaires (NDVI et pluviométrie)
qui présentent à la fois une variation spatiale et temporelle Ces deux dernières variables ont été
générées pour le bassin versant à partir de la télédétection. Les caractéristiques physiographiques
de ces sous-bassins ont été identifiées par six variables, à savoir la longueur du cours d'eau (x1), la
densité de drainage (x2), la pente moyenne du cours d'eau (x3), l'élévation maximale (x4), l'élévation
minimale (x5) et l'élévation moyenne pondérée (x6). Les propriétés statistiques de ces variables
physiographiques sont présentées dans le tableau 1 et utilisées par la suite dans le regroupement de
ces sous-bassins. En prédisant les flux mensuels dans ces sous-bassins versants, on suppose que ces
variables sont stationnaires, constantes dans le temps mais pas dans l'espace. Deux variables
supplémentaires, générées pour ces sous-bassins versants, sont la pluviométrie mensuelle (x7) et le
NDVI (x8) qui présentent à la fois une variation spatiale et temporelle.Les données NDVI
télédétectées couvraient la période de 1982 à 2008 et ont été extraites du maximum décennal.
imagerie composite fournie par le radiomètre à très haute résolution avancé de la National Oceanic
and Atmospheric Administration-Advance (NOAA-AVHRR) et traitée avec le logiciel d'affichage et
d'analyse d'images WinDisp 5.1.Les données pluviométriques dérivées du satellite ont été fournies
par la National Oceanic and Atmospheric Administration (NOAA) via le réseau du système d'alerte
précoce contre la famine (FEWS-Net) pour la période 2001–2007, et ont été affinées par les seules
données de précipitations quotidiennes ponctuelles dans le bassin versant obtenues à partir d'une
station située à Beni qui couvrait la période de 1973 à 2008. Détails supplémentaires sur le
traitement des ensembles de données acquis par télédétection
Quatrième page
peuvent être trouvés dans Kileshye Onema et Taigbenu (2009). À la sortie du bassin versant de la
Semliki se trouve une station de jaugeage située à Bweramule (figure 2) qui a fourni des débits
mensuels historiques de 1950 à 1978 qui ont été utilisés pour l'étalonnage des modèles de
prédiction de débit linéaire et non linéaire qui sont décrits ultérieurement dans cet article Les
périodes de données disponibles sur les variables liées au climat, à savoir la pluviométrie et le NDVI,
qui peuvent être considérées comme causales au débit observé, sont présentées sur la figure 3. La
figure montre le défi posé dans la modélisation du débit de ce bassin qui, mis à part le manque de
données sur les débits dans les affluents de la rivière Semliki et les variables climatiques pour les 21
sous-bassins versants, les seules données pluviométriques ponctuelles disponibles de Beni, qui ne
sont pas représentatives de l'ensemble du bassin, chevauchent l'enregistrement du débit mensuel
mesures à Bweramule pendant seulement six ans de 1973 à 1978. Notre énoncé du problème exclut
donc l'utilisation de techniques de régionalisation basées sur des courbes de durée d'écoulement
(FDC) qui peut être construite par des approches statistiques ou paramétriques ou graphiques
(Castellarinetal., 2004; Quipo et al., 1983). Pour chaque sous-bassin, un volume moyen mensuel
historique de 28 ans a été calculé proportionnellement à la superficie du sous-bassin et a été qualifié
de «témoin». Cette approche historique est similaire à celle entreprise par Asadullah et al. (2008).
dans les régions où les données sont rares de l'Afrique centrale et de l'Est.
Sinquieme page
vers les régions arides et semi-arides, «les débits des cours d'eau augmentent vers l'aval, et la
répartition spatiale des précipitations moyennes mensuelles ou saisonnières est plus ou moins la
même d'une partie du bassin vers l'autre, d'où le ruissellement par unité de terre l'aire est supposée
constante dans l'espace. Dans ces situations, les débits estimés sont généralement basés sur les
zones du bassin versant, en tant que débit contribuant à ces sites, et les débits correspondants et les
zones de bassin versant au-dessus des sites de jauge les plus proches ou les plus représentatifs
»(Loucks et al., 1981; Loucks et VanBeek, 2005 ). En outre, les précipitations dans la région
équatoriale, l'un des principaux moteurs de la production de ruissellement, n'ont pas changé de
manière statistiquement significative depuis 1950 malgré les variations saisonnières et
interannuelles signalées (Nicholson et Entekhabi, 1987; Bigotetal., 1998; Lienouetal., 2008). Le
tableau 2 présente les attributs du paysage, leurs sources et les logiciels utilisés et guide tout travail
ultérieur qui entend suivre l'approche entreprise dans ce document. Les données générées à partir
des variables physiographiques des 21 sous-bassins ont été examinées afin d'explorer leurs
regroupements et les similitudes dans leur structure de données.Pour atteindre ces objectifs,
l'analyse en composantes principales (ACP) et l'analyse par grappes ont été utilisées comme
techniques exploratoires pour étudier les L'analyse PCA réalisée dans cette étude a utilisé la matrice
de corrélation invariante d'échelle des variables par opposition à la matrice de covariance Les
variables mises à l'échelle sont obtenues par l'expression: Xi = xi − µi σi (1) où Xi est la variable mise
à l'échelle de la variable d'origine xi, et µi et σi sont la moyenne et l'écart type de la variable
d'origine. La statistique de redondance de Glaeson-Staelin et le test de sphéricité de Bartlett ont été
effectués comme pré-requis à l’ACP. La statistique de redondance Glaeson-Staelin (φ) mesure le
niveau d'interrelation entre un groupe de variables (Magingxaa et al., 2009) avec une valeur nulle
indiquant des variables non corrélées et une unité indiquant une corrélation parfaite entre les
variables (Jolliffe, 2002). Le test de sphéricité est utilisé pour tester l'hypothèse nulle que les
variables de la matrice de corrélation ne sont pas corrélées (Sousa et al., 2007) .Lorsque les valeurs p
du test de Bartlett sont supérieures à 0,05, il n'est pas prudent de procéder à l'ACP ( Peres-Neto et
al., 2005) .Le critère de Kaiser a été utilisé pour identifier le nombre de composantes principales à
considérer comme fournissant une variance significative dans les données (Jolliffe, 2002) .La règle
générale suggérée associée à ce critère est de conserver les composantes principales avec une
valeur propre supérieure à 1 (Chen et Chen, 2003), et de considérer celles inférieures à 1 comme
triviales. Le ruissellement local mensuel du bassin versant a été prédit par des modèles de
régression linéaire et non linéaire qui utilisent les variables physiographiques et météorologiques et
sont décrits par les relations ci-dessous. Pour le modèle linéaire Q = a0 + ATixi (2) où Q représente
les flux mensuels, l'exposant T désigne la transposée, ao et ATi = {α1, α2, ... α8} sont les paramètres
de régression, et xTi = {x1 , x2, ... x8} .L'expression du flux par le modèle non linéaire est donnée par
Q = b0 + BTijzij où BTij = {β11, β21, ... β81 β12, β22, ... β82} etzTij = {x1, x2, ... x8 x21, x22, ... x28} (3)
(4) Pour évaluer les performances de ces deux modèles, l'efficacité de Nash Sutcliffe (NSE), le biais
en pourcentage (PBIAS) et le
Sixième page
Le rapport de l'écart type RMSE / observation (RSR) est utilisé. NSE est un indice anormalisé qui
définit l'amplitude relative de la variance résiduelle par rapport à celle de la mesure, et exprimé
comme (Nash et Sutcliffe, 1970) NSE = 1 − Ni = 1 (Qobsi − Qsimi) 2Ni = 1 (Qobsi − Qmeani) 2 (5) où
Qobsi et Qmeani sont respectivement le ième flux observé et sa moyenne, Qsimi est le ième flux
simulé, et N est le nombre d'observations. NSE a une plage comprise entre −∞ et 1, avec sa valeur
optimale de 1. Des valeurs négatives de NSE indiquent une mauvaise performance du modèle,
suggérant que la moyenne observée est un meilleur prédicteur des flux que ceux du modèle (Moriasi
et al., 2007) .Le PBIAS est exprimé comme PBIAS = Ni = 1 (Qobsi− Qsimi) Ni = 1 Qobsi × 100 (6) La
valeur optimale de PBIAS est 0, avec des valeurs de faible magnitude indiquant une bonne capacité
prédictive du modèle. Les valeurs positives indiquent une sous-estimation des flux observés par le
modèle, et inversement des valeurs négatives (Gupta et al., 1999) .Le rapport d'écart type (RSR)
RMSE-observation est une statistique d'erreur qui normalise le RMSE avec l'écart type du Il est
exprimé par RSR = RMSESTDEVobs = Ni = 1 (Qobsi − Qsimi) 2Ni = 1 (Qobsi − Qmeani) 2 (7) Le RSR est
un indice d'erreur normalisé qui utilise les avantages du RMSE qui est l'un des statistiques d'index
d'erreurs fréquemment utilisées. Une excellente performance du modèle produira une valeur nulle
de RSR ou RMSE (Moriasi et al., 2007) .4 Résultats et discussions 4.1 Analyse en composantes
principales (ACP) Les variables mises à l'échelle des variables physiographiques et météorologiques,
exprimées par l'équation (1), sont incorporés dans le PCA. De cette manière, la matrice de
corrélation des variables est invariante d'échelle. Les corrélations entre les variables sont résumées
dans le tableau 3. Les coefficients de corrélation en italique sont significatifs à un niveau de
confiance de 95% Il existe des corrélations élevées (supérieures à 0,5), ce qui implique qu'il existe
une structure de corrélation qui peut potentiellement être modélisée ou explorée plus avant à l'aide
de l'ACP. Le test de redondance Glaeson-Staelin donne une φ = 0,395, ce qui suggère qu'il y a une
complexité considérable dans les données de ces variables qui justifie un examen plus approfondi à
l'aide de l'ACP.La valeur p du test de sphéricité de Bartlett est de 0,00000, ce qui indique que
l'hypothèse nulle peut être rejetée et qu'il y a une force significative dans le relation entre les
variables pour justifier la réalisation d'une ACP Les valeurs propres des composantes principales sont
présentées dans le tableau 4, et l'utilisation du critère de Kaiser permet de retenir les trois
premières composantes principales qui représentent 76% de la variation des données. Les charges
factorielles de ces trois composantes principales reflètent les contributions et les rôles de ces
variables dans la corrélation o f les données. Les vecteurs propres des trois facteurs de chargement
sont présentés dans le tableau 5. Les chargements factoriels sont les corrélations entre les variables
et les facteurs. Le facteur 1 a montré la meilleure corrélation avec l'élévation maximale et
l'élévation moyenne, tandis que le facteur 3 a montré la meilleure corrélation avec le
Septième page
la pente moyenne et l'élévation minimale. La figure 4 fournit une illustration de la projection des
variables sur un plan factoriel en utilisant un critère alternatif pour l'ACP des variables. Chaque
quadrant représente un groupe similaire de variables. L'ACP est davantage utilisée pour identifier
les groupements de sous-bassins en évaluant la projection des cas sur le plan factoriel (figure 5) .La
figure établit quatre groupes de sous-bassins qui sont encore réduits à deux groupes principaux ou
catégories (Tableau 6) afin de simplifier les équations de prédiction de l'exécuteur, ce qui est
l'objectif principal de cet article. Les attributs physiographiques, à savoir la pente moyenne du cours
d'eau, l'élévation minimale, l'élévation maximale, l'élévation moyenne pondérée qui fournissent
cette catégorisation majeure à partir de l'ACP sont situés dans le premier quadrant de la figure 4.
Tous les sous-bassins du groupe I, à l'exception de S19, sont caractérisés par de faibles élévations,
tandis que ceux du groupe II sont généralement caractérisés par des altitudes élevées avec des
valeurs pondérées supérieures à 1122 m.
Huitième page
Les résultats de l'analyse des grappes d'arbres fournissent une tendance similaire à celle de l'ACP, à
l'exception de la divergence dans le regroupement de S21, S22 et S23 (figure 6). 4.2 Résultats des
simulations de modèles linéaires et non linéaires Comme indiqué précédemment, les six variables
physiographiques sont supposées stationnaires tandis que les deux variables météorologiques ont
des variations spatiales et temporelles (à pas de temps mensuel). Les paramètres de régression des
modèles sont évalués à l'aide des équations (2) et (3) à partir desquelles les estimations du
ruissellement local mensuel sont obtenues.Les débits prévus à partir des deux modèles sont d'un
ordre de grandeur comparable aux estimations fournies par Senay et al. (2009) dans leur tentative
de documenter la dynamique globale du bassin du Nil.Les hydrogrammes de débit mensuel moyen
typique pour le mois d'avril (considéré comme un mois de gel) sont présentés sur la figure 7 pour les
sous-bassins du groupe I de 2001 à 2007 et la figure .8 pour les sous-bassins versants du groupe II.
Les valeurs de «contrôle» des flux ont été calculées comme indiqué dans la section 3 du présent
document. Les valeurs des statistiques d'erreur de performance (NSE, PBIAS et RSR) présentées dans
le tableau 7 pour les flux mensuels prévus dans les sous-bassins indiquent une performance très
satisfaisante en les deux modèles, bien que le modèle non linéaire ait de meilleures performances
que le modèle linéaire, en particulier dans le groupe I des sous-bassins (figures 9 et 10). 5
Conclusions Cette étude rend compte de l'utilisation de deux approches de modélisation pour la
prévision des flux mensuels dans le bassin versant de Semliki, où les données sont rares, du Nil
équatorial. L'analyse en composantes principales a été réalisée pour identifier les variables
expliquant la majeure partie de la variance dans l'ensemble de données qui comprenait six variables
physiographiques et deux variables liées au climat. Des sous-bassins versants similaires ont été
regroupés en deux catégories sur la base de leurs attributs physiographiques, et le ruissellement
mensuel a ensuite été généré par les modèles de régression linéaire et non linéaire. Les statistiques
dimensionnelles (NSE, PBIAS et RSR) pour les deux modèles indiquent que le Le modèle non linéaire
surpasse le modèle linéaire, en particulier dans le premier groupe de sous-bassins caractérisés par
des élévations plus plates. Alors que ces deux modèles méso-échelle et déterministe ne traitent en
aucun cas directement les processus hydrologiques du bassin versant, ils fournissent une relation
statistique entre les attributs du paysage et les débits mensuels.L'ordre de grandeur de ces
estimations qui relient des attributs physiographiques similaires aux débits mensuels peut être utile
pour l'évaluation préliminaire des ressources en eau d'un bassin versant très mal jaugé comme le
Semliki. Les résultats des travaux en cours pourraient par la suite être complétés par une approche
hydrologique basée sur la physique qui prend explicitement en compte l'interaction entre les
attributs du paysage et les ressources en eau dans le bassin versant de la Semliki, mais qui exigerait
encore de bonnes données hydrométéorologiques. Remerciements.Le soutien du projet de
formation appliquée de l'Initiative du bassin du Nil (ATP / NBI) et de WaterNet est très apprécié. Les
auteurs expriment également leur gratitude aux relecteurs de la version initiale de ce manuscrit. Les
opinions et les résultats présentés dans cet article sont ceux des auteurs et ne représentent pas
nécessairement les donateurs ou les institutions participantes.