Soutenance de thèse de ETTALBI Mouad


Titre de thèse

Intégration de données multi-sources in situ et satellitaires en modélisation hydrologique distribuée

Integration of multi-source in situ and remote sensing data in distributed hydrological modelling

Date

20 juin 2025 à 9h30

Adresse

INRAE RECOVER Centre d'Aix-en-Provence, UMR RECOVER 3275 Route de Cézanne - CS 40061, Salle Cézanne

Ecole doctorale

Sciences de l'Environnement

Specialité

Sciences de l'environnement : Géosciences

Etablissement

Aix-Marseille Université

Mots clés

Hydrologie,Modélisation numérique,Apprentissage statistique,Assimilation de données,Méthodes hybrides,Données multi-sources,

Keywords

Hydrology,Numerical modelling,Statistical learning,Data assimilation,Hybrid methods,Multi-source data,

Jury

Jury de thèse
Qualité Nom Etablissement
Chargé de recherche M. GARAMBOIS Pierre-André Aix Marseille Université
Directeur de recherche M. CALVET Jean-Christophe CNRM (Université de Toulouse, Météo-France, CNRS)
Directeur de recherche M. MOUSSA Roger INRAE, UMR LISAH
Maître de conférences Mme DELENNE Carole Aix-Marseille Université
Chargé de recherche M. BOURGIN François INRAE, UR HYCAR
Directeur de recherche M. BAGHDADI Nicolas INRAE, UMR TETIS

Résumé de la thèse

Cette thèse explore des approches novatrices pour l'intégration des données multi-sources in-situ et satellitaire en modélisation hydrologique distribuée à travers trois études interconnectées. La recherche aborde des défis fondamentaux en sciences hydrologiques : l'estimation spatialement distribuée du débit des rivières et de l'humidité du sol, l'intégration de données multi-sources et l'efficacité computationnelle pour la modélisation distribuée hybride physique-intelligence artificielle.
La première étude développe une méthode pour la cartographie à haute résolution de l'humidité du sol dans les zones agricoles nues en utilisant les données SAR de Sentinel-1, éliminant ainsi le besoin d'informations météorologiques a priori. En entraînant des réseaux de neurones sur des données synthétiques générées à partir du modèle de rétrodiffusion radar IEM (Integral Equation Model) et en les validant sur des mesures terrain en France et en Tunisie, l'approche démontre que les signaux radar moyennés sur différentes échelles spatiales peuvent efficacement remplacer les intrants météorologiques traditionnels tout en maintenant la précision.
La deuxième étude améliore l'approche HDA-PR (Hybrid Data Assimilation and Parameter Regionalization), d'estimation régionale de paramètres du modèle hydrologique distribué SMASH, en intégrant des cartes d'humidité du sol dérivées du satellite (SMAP L4) aux côtés des observations de débit aux jauges. Appliqué aux bassins versants sujets aux crues rapides dans le Sud de la France, ce cadre modifié montre des améliorations significatives tant dans les simulations de débit que dans la représentation de l'humidité du sol, particulièrement pour les petits bassins versants et les conditions extrêmes. L'intégration d'une source de données supplémentaire, sous la forme de cartes d'humidité à assimiler, fournit des contraintes supplémentaires pour l'estimation spatialisée des paramètres du modèle, conduisant à des prédictions de débit plus robustes dans les zones jaugées et non jaugées.
La troisième étude aborde les limitations computationnelles dans la modélisation hydrologique distribuée numériquement différentiable en développant SMASH-Torch, une réimplémentation accélérée par GPU du cadre SMASH. En transformant les opérations de routage séquentielles de cellule à cellule en opérations tensorielles parallélisables, l'approche atteint des accélérations jusqu'à 30 fois pour les grands domaines tout en maintenant la cohérence numérique. Deux nouveaux algorithmes de routage fonctionnant comme des opérations de réduction permettent le traitement simultané de bassins versants entiers, facilitant les simulations à grande échelle et l'intégration harmonieuse de composants de réseaux de neurones.
Collectivement, ces études contribuent aux approches de modélisation hydrologique en explorant des méthodes pour utiliser les données d'observation de la Terre tout en abordant les défis computationnels. Des perspectives futures sont identifiées, notamment l'assimilation de données d'évapotranspiration dans le cadre de modélisation, l'intégration directe du réseau neuronal d'inversion de rétrodiffusion SAR dans SMASH, l'extension de la récupération d'humidité du sol aux surfaces végétalisées, et l'optimisation supplémentaire du cadre accéléré par GPU pour les environnements multi-GPU afin de permettre des simulations à plus grande échelle.


Thesis resume

This dissertation explores innovative approaches for integrating multi-source in-situ and satellite remote sensing data with distributed hydrological modeling through a collection of three interconnected studies. The research addresses fundamental challenges in hydrological sciences: soil moisture estimation, multi-source data integration, and computational efficiency in distributed modeling.
The first study develops a method for high-resolution soil moisture mapping in bare agricultural areas using Sentinel-1 SAR data that eliminates the need for a priori weather information. By training neural networks on synthetic data generated from the modified Integral Equation Model (IEM) and validating on field measurements from France and Tunisia, the approach demonstrates that radar signals averaged over different spatial scales can effectively replace traditional weather inputs while maintaining accuracy.
The second study enhances the Hybrid Data Assimilation and Parameter Regionalization (HDA-PR) approach by integrating satellite-derived soil moisture maps (SMAP L4) alongside discharge observations. Applied to flash-flood-prone catchments in Southern France, this modified framework shows significant improvements in both discharge simulations and soil moisture representation, particularly for small catchments and extreme conditions. The integration of multiple data sources provides additional constraints on model parameters, leading to more robust predictions in both gauged and ungauged areas.
The third study addresses computational limitations in distributed hydrological modeling by developing SMASH-Torch, a GPU-accelerated reimplementation of the SMASH framework. By transforming sequential cell-to-cell routing operations into parallel-enabled tensor operations, the approach achieves up to 30-fold speedups for large domains while maintaining numerical consistency. Two novel routing algorithms functioning as reduction operations enable simultaneous processing across entire watersheds, facilitating large-scale simulations and seamless integration of neural network components.
Collectively, these studies contribute to hydrological modeling approaches by exploring methods to utilize Earth observation data while addressing computational challenges. Future perspectives are identified, including the assimilation of evapotranspiration data into the modeling framework, direct integration of the SAR backscatter inversion neural network into SMASH, extension of soil moisture retrieval to vegetated surfaces, and further optimization of the GPU-accelerated framework for multi-GPU environments to enable larger-scale ensemble simulations.