Ecole Doctorale
Mathématiques et Informatique de Marseille
Spécialité
Mathématiques
Etablissement
Aix-Marseille Université
Mots Clés
Modèles de mélange,Données synthétiques,Détection de rupture,Phytoplancton,Niches écologiques,Forçage physique
Keywords
Mixture models,Data augmentation,Rupture detection,Phytoplankton,Ecological niches,Physical forcing
Titre de thèse
Méthodes neuronales et données mixtes: Vers une meilleure résolution spatio-temporelle des écosystèmes marins et du phytoplancton
Neural methods and mixed data: Towards a better spatio-temporal resolution of marine ecosystems and phytoplankton
Date
Vendredi 16 Septembre 2022 à 9:00
Adresse
Station Marine d'Endoume
Bâtiment 4
Chemin de la Batterie des Lions
13007 Marseille
Salle de conférence
Jury
Directeur de these |
M. Denys POMMERET |
Aix Marseille Université - Institut de Mathématiques de Marseille (I2M) |
Rapporteur |
M. Christophe BIERNACKI |
Université Lille 1 - Laboratoire Paul Painlevé |
Rapporteur |
Mme Emilie POISSON-CAILLAULT |
Université du Littoral Côte d'Opale (ULCO) - Laboratoire d'Informatique Signal et Image de la Côte d'Opale (LISIC) |
CoDirecteur de these |
Mme Melilotus THYSSEN |
Aix Marseille Université - Institut Méditerranéen dOcéanologie (MIO) |
Examinateur |
Mme Melika BAKLOUTI |
Aix Marseille Université - Institut Méditerranéen dOcéanologie (MIO) |
Examinateur |
M. Pierre LATOUCHE |
Université de Paris - Laboratoire MAP5, Ecole Polytechnique |
Examinateur |
M. Geoffrey MCLACHLAN |
University of Queensland - School of Mathematics and Physics |
Examinateur |
M. Mridul K. THOMAS |
University of Geneva - Dept. F.-A. Forel for Environmental and Aquatic Sciences |
Résumé de la thèse
Le phytoplancton constitue un des premiers maillons du réseau trophique et génère jusqu'à 50% de la production primaire mondiale. Létude du phytoplancton et de son environnement physique nécessite des observations ayant une résolution inférieure à la journée et au kilomètre, ainsi que la prise en compte des types hétérogènes de données impliquées et des structures de dépendance spatio-temporelles des écosystèmes marins.
Cette thèse sapplique à développer des méthodes statistiques dans ce contexte en sappuyant sur des technologies comme la cytométrie en flux automatisée. Les développements théoriques ont porté sur les modèles de mélanges gaussiens profonds (DGMM) introduits par Viroli et McLachlan (2019). Afin de mieux caractériser les niches écologiques du phytoplancton, nous avons étendu ces modèles aux données mixtes (présentant des variables continues et non continues) souvent présentes en océanographie. Une méthode de clustering a ainsi été proposée ainsi quun algorithme de génération de données mixtes synthétiques.
Concernant l'étude haute fréquence à proprement parler, des réseaux neuronaux convolutifs ont été introduits pour traiter les sorties de cytométrie en flux et étudier six groupes fonctionnels du phytoplancton en zone littorale et en océan ouvert. Des réactions différenciées et reproductibles de ces groupes ont été identifiées à la suite d'événements impulsionnels induits par le vent, soulignant l'importance du couplage entre la physique et la biologie. À cet égard, une méthode de détection de rupture a été proposée pour délimiter les zones épipélagique et mésopélagique, proposant ainsi une nouvelle base pour le calcul de budgets carbone mésopélagiques.
Thesis resume
Phytoplankton are one of the first links in the food web and generate up to 50% of the world's primary production. The study of phytoplankton and their physical environment requires observations with a resolution of less than a day and a kilometer, as well as the consideration of the heterogeneous types of data involved and the spatio-temporal dependency structures of marine ecosystems.
This thesis aims to develop statistical methods in this context by using technologies such as automated flow cytometry. Theoretical developments focused on Deep Gaussian Mixture Models (DGMM) introduced by Viroli and McLachlan (2019). To better characterize phytoplankton ecological niches, we extended these models to mixed data (exhibiting continuous and non-continuous variables) often found in oceanography. A clustering method has been proposed as well as an algorithm for generating synthetic mixed data.
Regarding the high-frequency study itself, convolutional neural networks have been introduced to process flow cytometry outputs and to study six functional groups of phytoplankton in the littoral zone and the open ocean. Differentiated and reproducible responses of these groups were identified following wind-induced pulse events, highlighting the importance of the coupling between physics and biology. In this regard, a change-point detection method has been proposed to delineate epipelagic and mesopelagic zones, providing a new basis for the calculation of mesopelagic carbon budgets.