Ecole Doctorale

Mathématiques et Informatique de Marseille

Spécialité

Mathématiques

Etablissement

Aix-Marseille Université

Mots Clés

Modèles de mélange,Données synthétiques,Détection de rupture,Phytoplancton,Niches écologiques,Forçage physique

Keywords

Mixture models,Data augmentation,Rupture detection,Phytoplankton,Ecological niches,Physical forcing

Titre de thèse

Méthodes neuronales et données mixtes: Vers une meilleure résolution spatio-temporelle des écosystèmes marins et du phytoplancton
Neural methods and mixed data: Towards a better spatio-temporal resolution of marine ecosystems and phytoplankton

Date

Vendredi 16 Septembre 2022 à 9:00

Adresse

Station Marine d'Endoume Bâtiment 4 Chemin de la Batterie des Lions 13007 Marseille Salle de conférence

Jury

Directeur de these M. Denys POMMERET Aix Marseille Université - Institut de Mathématiques de Marseille (I2M)
Rapporteur M. Christophe BIERNACKI Université Lille 1 - Laboratoire Paul Painlevé
Rapporteur Mme Emilie POISSON-CAILLAULT Université du Littoral Côte d'Opale (ULCO) - Laboratoire d'Informatique Signal et Image de la Côte d'Opale (LISIC)
CoDirecteur de these Mme Melilotus THYSSEN Aix Marseille Université - Institut Méditerranéen d’Océanologie (MIO)
Examinateur Mme Melika BAKLOUTI Aix Marseille Université - Institut Méditerranéen d’Océanologie (MIO)
Examinateur M. Pierre LATOUCHE Université de Paris - Laboratoire MAP5, Ecole Polytechnique
Examinateur M. Geoffrey MCLACHLAN University of Queensland - School of Mathematics and Physics
Examinateur M. Mridul K. THOMAS University of Geneva - Dept. F.-A. Forel for Environmental and Aquatic Sciences

Résumé de la thèse

Le phytoplancton constitue un des premiers maillons du réseau trophique et génère jusqu'à 50% de la production primaire mondiale. L’étude du phytoplancton et de son environnement physique nécessite des observations ayant une résolution inférieure à la journée et au kilomètre, ainsi que la prise en compte des types hétérogènes de données impliquées et des structures de dépendance spatio-temporelles des écosystèmes marins. Cette thèse s’applique à développer des méthodes statistiques dans ce contexte en s’appuyant sur des technologies comme la cytométrie en flux automatisée. Les développements théoriques ont porté sur les modèles de mélanges gaussiens profonds (DGMM) introduits par Viroli et McLachlan (2019). Afin de mieux caractériser les niches écologiques du phytoplancton, nous avons étendu ces modèles aux données mixtes (présentant des variables continues et non continues) souvent présentes en océanographie. Une méthode de clustering a ainsi été proposée ainsi qu’un algorithme de génération de données mixtes synthétiques. Concernant l'étude haute fréquence à proprement parler, des réseaux neuronaux convolutifs ont été introduits pour traiter les sorties de cytométrie en flux et étudier six groupes fonctionnels du phytoplancton en zone littorale et en océan ouvert. Des réactions différenciées et reproductibles de ces groupes ont été identifiées à la suite d'événements impulsionnels induits par le vent, soulignant l'importance du couplage entre la physique et la biologie. À cet égard, une méthode de détection de rupture a été proposée pour délimiter les zones épipélagique et mésopélagique, proposant ainsi une nouvelle base pour le calcul de budgets carbone mésopélagiques.

Thesis resume

Phytoplankton are one of the first links in the food web and generate up to 50% of the world's primary production. The study of phytoplankton and their physical environment requires observations with a resolution of less than a day and a kilometer, as well as the consideration of the heterogeneous types of data involved and the spatio-temporal dependency structures of marine ecosystems. This thesis aims to develop statistical methods in this context by using technologies such as automated flow cytometry. Theoretical developments focused on Deep Gaussian Mixture Models (DGMM) introduced by Viroli and McLachlan (2019). To better characterize phytoplankton ecological niches, we extended these models to mixed data (exhibiting continuous and non-continuous variables) often found in oceanography. A clustering method has been proposed as well as an algorithm for generating synthetic mixed data. Regarding the high-frequency study itself, convolutional neural networks have been introduced to process flow cytometry outputs and to study six functional groups of phytoplankton in the littoral zone and the open ocean. Differentiated and reproducible responses of these groups were identified following wind-induced pulse events, highlighting the importance of the coupling between physics and biology. In this regard, a change-point detection method has been proposed to delineate epipelagic and mesopelagic zones, providing a new basis for the calculation of mesopelagic carbon budgets.