Ecole Doctorale

Physique et Sciences de la Matière

Spécialité

PHYSIQUE & SCIENCES DE LA MATIERE - Spécialité : ASTROPHYSIQUE ET COSMOLOGIE

Etablissement

Aix-Marseille Université

Mots Clés

objet transitoire,traitement d'images,détection,mesure,calcul,astrophysique

Keywords

transient,image processing,detection,measure,calculation,astrophysics

Titre de thèse

Traitement d'images astronomiques provenant de grands sondages photométriques du ciel pour la détection et la mesure d'objets transitoires
Astronomical image processing from large all-sky photometric surveys for the detection and the measurement of transients

Date

Jeudi 23 Mai 2019 à 10:00

Adresse

CPPM. 163 Avenue de Luminy, 13009 Marseille, France. amphitheatre

Jury

Directeur de these M. Dominique FOUCHEZ Université d'Aix-Marseille
CoDirecteur de these Mme Marcela HERNáNDEZ HOYOS Universidad de los Andes
Rapporteur M. Philippe GRIS Université Blaise Pascal
Rapporteur M. Jaime FORERO ROMERO Universidad de los Andes
Examinateur Mme Anne EALET Institut de Physique Nucléaire de Lyon
Examinateur M. Cristinel DIACONU Centre de Physique des Particules de Marseille

Résumé de la thèse

Avec l'émergence des volumes plus grands des données pour les relevés astronomiques plus récents, la nécessité des outils et des stratégies pour étudier le cosmos a beaucoup augmentée. Particulièrement, l’étude des Supernovas pour comprendre notre univers a une nouvelle relevance au fur et à mesure que ces phénomènes se révèlent comme liés à plusieurs éléments de la cosmologie moderne. Cette thèse présente plusieurs contributions au software développé pour le traitement d’images dans le cadre du Large Synoptic. Le projet LSST est un relevé ambitieux qui sera capable de générer un volume d’images ne jamais vu avant, avec une quantité d’information sans précédent. Nos contributions tournent autour de la détection des Supernovae Ia dans les images du télescope. Notre objectif est celui d’améliorer le code et les algorithmes existants avec des modifications et des additions pour créer un pipeline dédié à la détection de Supernovae en temps-réel. Nous cherchons à proposer des méthodes avec une haute précision; même que capables de générer des lots de données utilisables pour entraîner et valider des algorithmes de machine learning. La détection de supernovae requiert un type spécial de traitement. Nous utilisons la soustraction d’images Alard-Lupton, un algorithme qui utilise des images composées des expositions provenant de différents moments du temps, ou coadditions, et que nous appelons les images de référence et les images de science. Cela sert à produire une différence d’images entre ces deux entrées et détecter les variabilités entre celles-là. Après, nous avons besoin d'étudier le comportement à travers du temps de ces objets et par conséquent nous devons construire de courbes de lumière qui représentent le cycle de vie de l’objet exprimé en termes des intensités de lumière pour les différents détections chaque nuit d’acquisition. Finalement, pour analyser un grand lot de candidates, Nous avons besoin des méthodes qui sortent et identifient automatiquement les courbes de lumière : Ces méthodes font partie du domaine des techniques connues comme Machine Learning. La première contribution concerne le développement des taches de coaddition automatisée adaptées pour construire des images de référence et de science avec un haut rapport signal-sur-bruit. Nous proposons une méthode pour sélectionner les meilleures images pour fabriquer une coaddition de référence et une coaddition par jour d’observation de haute qualité. La contribution suivante est lié à l’addition de mesures et l’étude de résidus des images d’analyse de différence, y compris la sélection des seuils adaptés et l'étiquetage basé sur les valeurs quantitatives des résidus pour identifier les mauvaises détections, les artéfacts et les flux vestigiaux significatifs. Ces étiquettes aident à l’identification de candidates, même que fournissent des caractéristiques pour la classification automatique des courbes de lumière. Après, un algorithme pour sélectionner et générer les courbes de lumière candidates est aussi proposé. Cet algorithme fonctionne en choisissant les détections récurrentes dans le temps et pour chaque différente bande de couleur pour un même objet. Ces critères sont utilisés pour améliorer la relevance et la qualité du lot final de données. Ces courbes de lumière contiennent de Supernovae Ia et d’autre types de transients qui servent à tester l’étape finale des contributions. Finalement, on applique une classification machine learning pour trouver des Supernovae Ia en utilisant la méthode random forest. Pour cette classification automatique on utilise des caractéristiques géométriques, des mesures d’ajustement de courbe liées aux modèles de supernovae et des étiquettes calculées lors de la détection. Ces résultats ont permis l’identification des Supernovae IA simulées et réelles parmi les candidates avec une haute précision. Ces résultats sont encourageants et ouvrent des nouvelles possibilités pour l’avenir de ce type de recherche.

Thesis resume

With the emergence of higher volumes of data from recent astronomical surveys, the necessity of having more effective tools and strategies to study the cosmos has increased. In this regard, the study of supernovae as a way to understand our universe acquires special importance, as these phenomena are intrinsically related to the nature of the expansion of the universe, dark matter and other mysteries of modern cosmology. The Large Synoptic Survey Telescope, or LSST, is an ambitious survey whose objective is to provide an unprecedented volume of images and information, using the biggest ground camera of its kind and being capable of fully scanning the night sky each four nights. This thesis will present several contributions to the software developed for the LSST telescope with the purpose of contributing to the detection of Supernovae Ia. More specifically, it will focus on the transient detection for the LSST, on the aforementioned type of supernovae. Our objective is to improve the existing code and algorithms through modifications and additions, in order to create a Supernovae Ia detection dedicated pipeline. It will be capable of finding these specific type of transients in real-time with high accuracy, while applicating the results to create better machine learning training and validation sets. Since detecting supernovae requires a special type of processing, we use a technique known as Alard-Lupton image subtraction which implies the construction of composite images, or coadditions, at different moments of time (a reference and a science image), and the subtraction between them to detect any variability. Afterwards, we study the behavior of the different objects through time and build light curves that represent their life cycle in terms of the light intensity of each detection on several nights. Lastly, in order to analyze an excessive amount of candidates, we require employing methods that allow us to sort, learn the varied patterns automatically and identify what curves are more probable to be Supernovae Ia. Here is where Machine Learning algorithms come into play. We contribute to the software developments of the LSST at different moments of the processing. The first contribution concerns the development of adapted and automatized coaddition tasks for building high signal-to-noise reference and science images. The algorithm that builds them takes into account the origin and quality of the input images and, in the case of the reference deep coaddition images, the date of observation. The next contribution is related to the addition of measurements and study of the residuals on difference image analysis, including the selection with adapted thresholding and the assignation of labels, which is based on the quantitative values of the residuals to sort between the bogus detections, the artifacts and the actual significant residuals. These labels help the identification of future strong candidates, in the same way that they provide features for the automatic classification when dealing with the light curves. We also propose an algorithm to select and generate the different candidate light curves through the selection of objects with recurrent detections through time and in the different bandpasses. As these criteria are used to improve the relevance of the final set, said light curves contain Supernovae Ia and other types of transient that we can use for the final contribution. Finally, we apply the Machine Learning classification approach to find Supernovae Ia by means of using a random forest classifier and based strictly on geometrical features that are present in the light curves, as well as the detection labels obtained from the difference image analysis phase. Our results allowed us to identify with high precision and recall Supernovae Ia among the candidates for a simulated test set and a real set. These results are encouraging and they certainly open new meeting points for research in the future.