Ecole Doctorale
Sciences de la Vie et de la Santé
Spécialité
Biologie-Santé - Spécialité Recherche Clinique et Santé Publique
Etablissement
Aix-Marseille Université
Mots Clés
MALDI-TOF,Surveillance épidémiologique,MIDaS,Panspectrome,Analyse de clusters,Sous-population bactérienne
Keywords
MALDI-TOF,Epidemiological surveillance,MIDaS,Panspectrome,Cluster analysis,Species subgrouping
Titre de thèse
La surveillance épidémiologique basée sur les données du laboratoire de microbiologie clinique- Intérêt et possibilité de lutilisation de la spectrométrie de masse MALDI-TOF
Epidemiological surveillance based on clinical laboratory data - Interest and ability of MALDI-TOF mass spectrometry
Date
Jeudi 1 Juillet 2021 à 16:30
Adresse
IHU Méditerranée Infection
19-21 Boulevard Jean Moulin
13005 Marseille Amphithéatre
Jury
Directeur de these |
M. Hervé CHAUDET |
Aix-Marseille Université |
Rapporteur |
Mme Audrey MERENS GONTIER |
École du Val-de-Grâce |
Rapporteur |
M. Loic JOSSERAN |
Université de Versailles-Saint-Quentin-en-Yvelines |
CoDirecteur de these |
M. Gaetan TEXIER |
École du Val-de-Grâce |
Examinateur |
M. Pierre-Édouard FOURNIER |
Aix-Marseille Université |
Examinateur |
M. Raymond RUIMY |
Université Côte d'Azur |
Résumé de la thèse
Les systèmes de surveillance épidémiologique jouent un rôle crucial dans le contrôle et la gestion des maladies infectieuses. Au sein de notre institut, le système de surveillance MIDaS, basé sur les données du laboratoire de microbiologie et de virologie clinique, concerne les identifications faites principalement au niveau de lespèce. Cependant, lidentification à léchelle de lespèce est aujourdhui insuffisante pour identifier une épidémie et faire des analyses épidémiologiques. Tous les agents infectieux nont en effet pas le même potentiel épidémique, et celui-ci peut fortement varier au sein dune même espèce, ce qui complique la mise en place des stratégies de santé publique. La recherche de marqueurs génétiques spécifiques ou la réalisation dantibiogrammes permet de détecter ce type dépidémies, mais demande des délais supplémentaires pour leur obtention. Lidentification bactérienne de routine est maintenant le plus souvent réalisée par spectrométrie de masse MALDI-TOF. De nombreuses études ont démontré lutilité de cette technique dans linvestigation épidémiologique. Lobjectif principal de la thèse est de compléter la surveillance épidémiologique bactérienne déjà en place par une filière de traitement des spectres MALDI-TOF et ainsi faciliter par ailleurs la pré-investigation épidémiologique in-silico. Avant de répondre à cet objectif principal, il était nécessaire de savoir si la diversité des spectres MALDI-TOF était suffisante pour y répondre. Une étude descriptive sur la variabilité des spectres au sein dune même espèce a été menée en explorant les diversités d'expression des pics des spectres MALDI-TOF par lutilisation des nombres de Hill, les courbes de raréfaction et le regroupement des pics. Les résultats ont permis dapporter des éléments de compréhension sur lorganisation latente des pics co-occurrents en distinguant des pics communs despèce et des pics secondaires soutenant la discrimination de sous-populations. A lissu, un nouveau concept a été créé pour représenter cette diversité protéique : le panspectrome (ensemble des pics protéiques distincts dune espèce). Suite à ces éléments, une nouvelle filière de traitement des spectres MALDI-TOF a ainsi pu être construite. Son objectif est de rechercher l'existence de clusters présentant une proximité protéique dans une même temporalité. Ce processus s'appuie sur plusieurs méthodes spécifiques visant à contraster et à regrouper les spectres, à présenter graphiquement les résultats pour une interprétation épidémiologique facile, et à déterminer les pics spectraux discriminants avec leur possible identification à l'aide de bases de données de référence telles que UniProt. La filière fournit ainsi des informations essentielles sur une situation potentiellement épidémique en apportant des informations précieuses pour la prise de décision épidémiologique et pour décider de la poursuite de linvestigation, en particulier lutilisation de ressources supplémentaires coûteuses pour confirmer ou infirmer l'alarme.
Thesis resume
Epidemiological surveillance systems play a crucial role in the control and management of infectious diseases. In our institute, the MIDaS surveillance system, based on data from the microbiology and clinical virology laboratory, makes identifications mainly at species level. However, species-wide identification is currently insufficient to identify an epidemic and conduct epidemiological analyzes. All infectious agents do not have the same epidemic potential, and this can vary greatly within the same species, which complicates the implementation of public health strategies. Searching for specific genetic markers or performing antibiograms can detect this type of epidemics, but clearly require additional time. Currently, routine bacterial identification is most often performed by MALDI-TOF mass spectrometry. Several studies have demonstrated the ability of this technique for epidemiological investigation. The main objective of the thesis is to supplement the bacterial epidemiological surveillance already in place by a MALDI-TOF spectra analysis pipeline and thus facilitate the in-silico epidemiological pre-investigation. Before fulfilling this main objective, it was necessary to know whether the diversity of MALDI-TOF spectra was sufficient to it. We carried out a descriptive study on the variability of the spectra within the same species by exploring the diversity of MALDI-TOF spectra peak expressions by the use of Hill numbers, rarefaction curves and peak grouping. The results showed the latent organization of co-occurring peaks by distinguishing between species specific peaks and secondary peaks supporting the discrimination of subspecies. As a result, a new concept was created to represent this protein diversity: the panspectrome (set of distinct protein peaks of a species). Following these elements, a new process for analyzing MALDI-TOF spectra was thus able to be built. Its objective is to seek the existence of clusters of spectra presenting a protein proximity and appeared at the same time. This process relies on several specific methods aimed at contrasting and grouping the spectra, graphically presenting the results for easy epidemiological interpretation, and searching for the discriminating spectral peaks with their possible identification using reference databases, such as UniProt. This process aims at providing essential information on a potentially epidemic situation by giving valuable information for epidemiological sensemaking and helping the decision-making on the continuation or not of the epidemiological investigation, in particular the use of costly additional resources to assess the alarm.