Ecole Doctorale
Physique et Sciences de la Matière
Spécialité
PHYSIQUE & SCIENCES DE LA MATIERE - Spécialité : ASTROPHYSIQUE ET COSMOLOGIE
Etablissement
Aix-Marseille Université
Mots Clés
objet transitoire,traitement d'images,détection,mesure,calcul,astrophysique
Keywords
transient,image processing,detection,measure,calculation,astrophysics
Titre de thèse
Traitement d'images astronomiques provenant de grands sondages photométriques du ciel pour la détection et la mesure d'objets transitoires
Astronomical image processing from large all-sky photometric surveys for the detection and the measurement of transients
Date
Jeudi 23 Mai 2019 à 10:00
Adresse
CPPM.
163 Avenue de Luminy, 13009 Marseille, France. amphitheatre
Jury
Directeur de these |
M. Dominique FOUCHEZ |
Université d'Aix-Marseille |
CoDirecteur de these |
Mme Marcela HERNáNDEZ HOYOS |
Universidad de los Andes |
Rapporteur |
M. Philippe GRIS |
Université Blaise Pascal |
Rapporteur |
M. Jaime FORERO ROMERO |
Universidad de los Andes |
Examinateur |
Mme Anne EALET |
Institut de Physique Nucléaire de Lyon |
Examinateur |
M. Cristinel DIACONU |
Centre de Physique des Particules de Marseille |
Résumé de la thèse
Avec l'émergence des volumes plus grands des données pour les relevés astronomiques plus récents, la nécessité des outils et des stratégies pour étudier le cosmos a beaucoup augmentée. Particulièrement, létude des Supernovas pour comprendre notre univers a une nouvelle relevance au fur et à mesure que ces phénomènes se révèlent comme liés à plusieurs éléments de la cosmologie moderne.
Cette thèse présente plusieurs contributions au software développé pour le traitement dimages dans le cadre du Large Synoptic. Le projet LSST est un relevé ambitieux qui sera capable de générer un volume dimages ne jamais vu avant, avec une quantité dinformation sans précédent. Nos contributions tournent autour de la détection des Supernovae Ia dans les images du télescope.
Notre objectif est celui daméliorer le code et les algorithmes existants avec des modifications et des additions pour créer un pipeline dédié à la détection de Supernovae en temps-réel. Nous cherchons à proposer des méthodes avec une haute précision; même que capables de générer des lots de données utilisables pour entraîner et valider des algorithmes de machine learning.
La détection de supernovae requiert un type spécial de traitement. Nous utilisons la soustraction dimages Alard-Lupton, un algorithme qui utilise des images composées des expositions provenant de différents moments du temps, ou coadditions, et que nous appelons les images de référence et les images de science. Cela sert à produire une différence dimages entre ces deux entrées et détecter les variabilités entre celles-là. Après, nous avons besoin d'étudier le comportement à travers du temps de ces objets et par conséquent nous devons construire de courbes de lumière qui représentent le cycle de vie de lobjet exprimé en termes des intensités de lumière pour les différents détections chaque nuit dacquisition. Finalement, pour analyser un grand lot de candidates, Nous avons besoin des méthodes qui sortent et identifient automatiquement les courbes de lumière : Ces méthodes font partie du domaine des techniques connues comme Machine Learning.
La première contribution concerne le développement des taches de coaddition automatisée adaptées pour construire des images de référence et de science avec un haut rapport signal-sur-bruit. Nous proposons une méthode pour sélectionner les meilleures images pour fabriquer une coaddition de référence et une coaddition par jour dobservation de haute qualité.
La contribution suivante est lié à laddition de mesures et létude de résidus des images danalyse de différence, y compris la sélection des seuils adaptés et l'étiquetage basé sur les valeurs quantitatives des résidus pour identifier les mauvaises détections, les artéfacts et les flux vestigiaux significatifs. Ces étiquettes aident à lidentification de candidates, même que fournissent des caractéristiques pour la classification automatique des courbes de lumière.
Après, un algorithme pour sélectionner et générer les courbes de lumière candidates est aussi proposé. Cet algorithme fonctionne en choisissant les détections récurrentes dans le temps et pour chaque différente bande de couleur pour un même objet. Ces critères sont utilisés pour améliorer la relevance et la qualité du lot final de données. Ces courbes de lumière contiennent de Supernovae Ia et dautre types de transients qui servent à tester létape finale des contributions.
Finalement, on applique une classification machine learning pour trouver des Supernovae Ia en utilisant la méthode random forest. Pour cette classification automatique on utilise des caractéristiques géométriques, des mesures dajustement de courbe liées aux modèles de supernovae et des étiquettes calculées lors de la détection. Ces résultats ont permis lidentification des Supernovae IA simulées et réelles parmi les candidates avec une haute précision. Ces résultats sont encourageants et ouvrent des nouvelles possibilités pour lavenir de ce type de recherche.
Thesis resume
With the emergence of higher volumes of data from recent astronomical surveys, the necessity of having more effective tools and strategies to study the cosmos has increased. In this regard, the study of supernovae as a way to understand our universe acquires special importance, as these phenomena are intrinsically related to the nature of the expansion of the universe, dark matter and other mysteries of modern cosmology.
The Large Synoptic Survey Telescope, or LSST, is an ambitious survey whose objective is to provide an unprecedented volume of images and information, using the biggest ground camera of its kind and being capable of fully scanning the night sky each four nights. This thesis will present several contributions to the software developed for the LSST telescope with the purpose of contributing to the detection of Supernovae Ia. More specifically, it will focus on the transient detection for the LSST, on the aforementioned type of supernovae.
Our objective is to improve the existing code and algorithms through modifications and additions, in order to create a Supernovae Ia detection dedicated pipeline. It will be capable of finding these specific type of transients in real-time with high accuracy, while applicating the results to create better machine learning training and validation sets.
Since detecting supernovae requires a special type of processing, we use a technique known as Alard-Lupton image subtraction which implies the construction of composite images, or coadditions, at different moments of time (a reference and a science image), and the subtraction between them to detect any variability. Afterwards, we study the behavior of the different objects through time and build light curves that represent their life cycle in terms of the light intensity of each detection on several nights. Lastly, in order to analyze an excessive amount of candidates, we require employing methods that allow us to sort, learn the varied patterns automatically and identify what curves are more probable to be Supernovae Ia. Here is where Machine Learning algorithms come into play.
We contribute to the software developments of the LSST at different moments of the processing. The first contribution concerns the development of adapted and automatized coaddition tasks for building high signal-to-noise reference and science images. The algorithm that builds them takes into account the origin and quality of the input images and, in the case of the reference deep coaddition images, the date of observation.
The next contribution is related to the addition of measurements and study of the residuals on difference image analysis, including the selection with adapted thresholding and the assignation of labels, which is based on the quantitative values of the residuals to sort between the bogus detections, the artifacts and the actual significant residuals. These labels help the identification of future strong candidates, in the same way that they provide features for the automatic classification when dealing with the light curves.
We also propose an algorithm to select and generate the different candidate light curves through the selection of objects with recurrent detections through time and in the different bandpasses. As these criteria are used to improve the relevance of the final set, said light curves contain Supernovae Ia and other types of transient that we can use for the final contribution.
Finally, we apply the Machine Learning classification approach to find Supernovae Ia by means of using a random forest classifier and based strictly on geometrical features that are present in the light curves, as well as the detection labels obtained from the difference image analysis phase. Our results allowed us to identify with high precision and recall Supernovae Ia among the candidates for a simulated test set and a real set. These results are encouraging and they certainly open new meeting points for research in the future.