Soutenance de thèse de BERTHELOT Loris

Titre de thèse

Apprentissage profond pour la détection des filaments interstellaires Galactiques

Deep learning for Galactic interstellar filament detection

Date

21 January 2026 à 9h00

Adresse

Laboratoire d'Astrophysique de Marseille, 38 rue F. Joliot-Curie 13388 Marseille CEDEX 13, France, amphithéâtre

Ecole doctorale

Mathématiques et Informatique de Marseille

Specialité

Informatique

Etablissement

Aix-Marseille Université

Mots clés

Apprentissage profond,Big Data,Astrophysique,

Keywords

Deep learning,Big data,Astrophysics,

Jury

Jury de thèse
Qualité	Nom	Etablissement
Professeur des universités	M. ARTIERES Thierry	Centrale Méditerranée
Professeure des universités	Mme ZAVAGNO Annie	Aix Marseille Université
Professeur des universités	M. GALLINARI Patrick	Sorbonne University
Professeure des universités	Mme OFFNER Stella	The University of Texas at Austin
Professeur	Mme CAPPONI Cécile	Aix Marseille Université
Assistant professor	M. LECHERVY Alexis	Université de Caen Normandie
Assistant professor	M. HUERTAS-COMPANY Marc	Instituto de Astrofísica de Canarias
Assistant professor	M. DUPé François-Xavier	Aix Marseille Université

Résumé de la thèse

Dans les galaxies, la formation des étoiles se déroule dans des filaments composés de gaz (principalement d'hydrogène) et de poussières (petites particules solides composées principalement de carbone). Ces filaments se forment dans le milieu interstellaire des galaxies (milieu situé entre les étoiles) et évoluent en fonction des conditions physiques environnantes et de la formation stellaire qu'ils hébergent. Ces structures sont observées avec des instruments (au sol ou spatiaux) ainsi qu'étudiées à travers des simulations numériques. Leur détection dans les données (d'observations et de simulations) est un pré-requis nécessaire à l'étude des toutes premières phases de la formation des étoiles.
De nombreux algorithmes ont été développés pour détecter ces filaments. Ces algorithmes reposent sur des paramètres décrivant les propriétés des filaments recherchés, en particulier leur contraste par rapport à l'émission environnante. Les résultats montrent qu'il est difficile de détecter tous les filaments. En particulier les filaments faibles (en contraste par rapport à l'émission du milieu environnant et/ou en densité de matière) sont souvent omis par les algorithmes, conduisant à une détection biaisée vers des filaments brillants ou des filaments plus faibles se trouvant dans des zones à faible émission. De plus, ces méthodes sont sensibles aux réglages de leurs paramètres qui dépendent fortement des données. Face à ce constat, l'exploration du potentiel de l'apprentissage profond a été proposée. C'est dans ce cadre que cette thèse interdisciplinaire est réalisée.
La première partie de ce travail présente les contributions centrées sur l'apprentissage et l'application de réseaux de neurones à une très grande image du Plan de notre Galaxie, dans le cadre d'une tâche de segmentation sémantique. Une stratégie de découpage spatial de l'image a été mise en place, combinée à une technique d'apprentissage semi-supervisé afin de traiter les spécificités (taille des données, larges variations d'intensité, de contraste, vérité terrain non complète) des données astrophysiques. Par ailleurs, une nouvelle variante du modèle U-Net a été proposée, appelée PE-UNet. Celle-ci intègre explicitement la position galactique de chaque exemple comme information supplémentaire au cours de l'apprentissage. Les expériences menées montrent que le PE-UNet améliore significativement les performances de segmentation par rapport aux architectures étudiées, conclusions validées par une étude astrophysique approfondie des cartes de segmentations produites par les différents modèles.
Parce que les filaments faibles ne sont pas détectés par les algorithmes actuels et que leurs résultats sont utilisés comme base d'apprentissage pour les réseaux neurones, il est impossible d'utiliser pour l'apprentissage comme pour l'évaluation ces filaments, biaisant fortement les résultats obtenus. C'est pourquoi la seconde partie repose sur la modélisation physique des filaments à l'aide du profil radial de Plummer, et sur la génération d'un jeu de données synthétique basé sur ce modèle pour pallier le biais présent dans les données d'observation. Un jeu de données synthétique a été construit permettant l'évaluation de diverses méthodes de détection de filaments — allant des algorithmes classiques jusqu'aux modèles de segmentation sémantique et d'instance. Il a également servi à analyser plusieurs biais d'apprentissage typiquement rencontrés lorsque les modèles sont entraînés sur les observations avec leurs biais. Enfin, ce jeu de données a permis de concevoir une chaîne de traitement capable d'estimer la vraisemblance qu'une prédiction donnée corresponde réellement à un filament, en s'appuyant sur des connaissances physiques a priori. Cette chaîne de traitement explore le Physics-Informed Neural Networks qui a pour objectif d'introduire des connaissances physiques au sein des réseaux de neurones. Elle est exploitée dans deux approches différentes.

Thesis resume

In galaxies, stars form within filaments made of gas (primarily hydrogen) and dust (small solid particles composed mainly of carbon). These filaments arise in the interstellar medium (the space between stars) and evolve according to the surrounding physical conditions and the star formation they host. They are observed with ground- and space-based instruments and studied through numerical simulations. Detecting these structures in data—both observational and simulated—is a necessary prerequisite for investigating the very earliest phases of star formation.
Many algorithms have been developed to detect such filaments. They rely on parameters that describe the properties of the target filaments, in particular their contrast with respect to the surrounding emission. Results show that it is difficult to detect all filaments. In particular, low-contrast and/or low-density filaments are often missed, leading to a detection bias toward brighter filaments or toward fainter filaments that happen to lie in regions of low background emission. Moreover, these methods are sensitive to parameter settings that depend strongly on the data. In light of this, exploring the potential of deep learning has been proposed—this is the context in which the present interdisciplinary PhD was carried out.
The first part of this work presents contributions focused on training and applying neural networks to a very large image of the Galactic Plane of the Milky Way for a semantic segmentation task. We implemented a spatial tiling strategy combined with semi-supervised learning to address astrophysical data specificities (data volume, large variations in intensity and contrast, and incomplete ground truth). In addition, we proposed a new U-Net variant, called PE-UNet, which explicitly incorporates the galactic position of each example as auxiliary information during training. Experiments show that PE-UNet significantly improves segmentation performance over the studied architectures, conclusions that are supported by an in-depth astrophysical analysis of the segmentation maps produced by the different models.
Because current algorithms fail to detect faint filaments—and their outputs are used as training labels for neural networks—it becomes impossible to use these undetected filaments for either training or evaluation, which strongly biases the results. For this reason, the second part of the thesis relies on the physical modeling of filaments using the Plummer radial profile, and on generating a synthetic dataset based on this model to counter the biases present in observational data. This synthetic dataset enables the evaluation of a wide range of filament-detection methods—from classical algorithms to semantic and instance segmentation models. It also serves to analyze several learning biases typically encountered when models are trained on biased observations. Finally, the dataset makes it possible to design a processing pipeline that estimates the likelihood that a given prediction truly corresponds to a filament, by leveraging prior physical knowledge. This pipeline explores Physics-Informed Neural Networks (PINNs) with the goal of injecting physical knowledge into neural networks, and proposes two different approaches to do so.