Ecole Doctorale

Sciences de la Vie et de la Santé

Spécialité

Biologie-Santé - Spécialité Recherche Clinique et Santé Publique

Etablissement

Aix-Marseille Université

Mots Clés

MALDI-TOF,Surveillance épidémiologique,MIDaS,Panspectrome,Analyse de clusters,Sous-population bactérienne

Keywords

MALDI-TOF,Epidemiological surveillance,MIDaS,Panspectrome,Cluster analysis,Species subgrouping

Titre de thèse

La surveillance épidémiologique basée sur les données du laboratoire de microbiologie clinique- Intérêt et possibilité de l’utilisation de la spectrométrie de masse MALDI-TOF
Epidemiological surveillance based on clinical laboratory data - Interest and ability of MALDI-TOF mass spectrometry

Date

Jeudi 1 Juillet 2021 à 16:30

Adresse

IHU Méditerranée Infection 19-21 Boulevard Jean Moulin 13005 Marseille Amphithéatre

Jury

Directeur de these M. Hervé CHAUDET Aix-Marseille Université
Rapporteur Mme Audrey MERENS GONTIER École du Val-de-Grâce
Rapporteur M. Loic JOSSERAN Université de Versailles-Saint-Quentin-en-Yvelines
CoDirecteur de these M. Gaetan TEXIER École du Val-de-Grâce
Examinateur M. Pierre-Édouard FOURNIER Aix-Marseille Université
Examinateur M. Raymond RUIMY Université Côte d'Azur

Résumé de la thèse

Les systèmes de surveillance épidémiologique jouent un rôle crucial dans le contrôle et la gestion des maladies infectieuses. Au sein de notre institut, le système de surveillance MIDaS, basé sur les données du laboratoire de microbiologie et de virologie clinique, concerne les identifications faites principalement au niveau de l’espèce. Cependant, l’identification à l’échelle de l’espèce est aujourd’hui insuffisante pour identifier une épidémie et faire des analyses épidémiologiques. Tous les agents infectieux n’ont en effet pas le même potentiel épidémique, et celui-ci peut fortement varier au sein d’une même espèce, ce qui complique la mise en place des stratégies de santé publique. La recherche de marqueurs génétiques spécifiques ou la réalisation d’antibiogrammes permet de détecter ce type d’épidémies, mais demande des délais supplémentaires pour leur obtention. L’identification bactérienne de routine est maintenant le plus souvent réalisée par spectrométrie de masse MALDI-TOF. De nombreuses études ont démontré l’utilité de cette technique dans l’investigation épidémiologique. L’objectif principal de la thèse est de compléter la surveillance épidémiologique bactérienne déjà en place par une filière de traitement des spectres MALDI-TOF et ainsi faciliter par ailleurs la pré-investigation épidémiologique in-silico. Avant de répondre à cet objectif principal, il était nécessaire de savoir si la diversité des spectres MALDI-TOF était suffisante pour y répondre. Une étude descriptive sur la variabilité des spectres au sein d’une même espèce a été menée en explorant les diversités d'expression des pics des spectres MALDI-TOF par l’utilisation des nombres de Hill, les courbes de raréfaction et le regroupement des pics. Les résultats ont permis d’apporter des éléments de compréhension sur l’organisation latente des pics co-occurrents en distinguant des pics communs d’espèce et des pics secondaires soutenant la discrimination de sous-populations. A l’issu, un nouveau concept a été créé pour représenter cette diversité protéique : le panspectrome (ensemble des pics protéiques distincts d’une espèce). Suite à ces éléments, une nouvelle filière de traitement des spectres MALDI-TOF a ainsi pu être construite. Son objectif est de rechercher l'existence de clusters présentant une proximité protéique dans une même temporalité. Ce processus s'appuie sur plusieurs méthodes spécifiques visant à contraster et à regrouper les spectres, à présenter graphiquement les résultats pour une interprétation épidémiologique facile, et à déterminer les pics spectraux discriminants avec leur possible identification à l'aide de bases de données de référence telles que UniProt. La filière fournit ainsi des informations essentielles sur une situation potentiellement épidémique en apportant des informations précieuses pour la prise de décision épidémiologique et pour décider de la poursuite de l’investigation, en particulier l’utilisation de ressources supplémentaires coûteuses pour confirmer ou infirmer l'alarme.

Thesis resume

Epidemiological surveillance systems play a crucial role in the control and management of infectious diseases. In our institute, the MIDaS surveillance system, based on data from the microbiology and clinical virology laboratory, makes identifications mainly at species level. However, species-wide identification is currently insufficient to identify an epidemic and conduct epidemiological analyzes. All infectious agents do not have the same epidemic potential, and this can vary greatly within the same species, which complicates the implementation of public health strategies. Searching for specific genetic markers or performing antibiograms can detect this type of epidemics, but clearly require additional time. Currently, routine bacterial identification is most often performed by MALDI-TOF mass spectrometry. Several studies have demonstrated the ability of this technique for epidemiological investigation. The main objective of the thesis is to supplement the bacterial epidemiological surveillance already in place by a MALDI-TOF spectra analysis pipeline and thus facilitate the in-silico epidemiological pre-investigation. Before fulfilling this main objective, it was necessary to know whether the diversity of MALDI-TOF spectra was sufficient to it. We carried out a descriptive study on the variability of the spectra within the same species by exploring the diversity of MALDI-TOF spectra peak expressions by the use of Hill numbers, rarefaction curves and peak grouping. The results showed the latent organization of co-occurring peaks by distinguishing between species specific peaks and secondary peaks supporting the discrimination of subspecies. As a result, a new concept was created to represent this protein diversity: the panspectrome (set of distinct protein peaks of a species). Following these elements, a new process for analyzing MALDI-TOF spectra was thus able to be built. Its objective is to seek the existence of clusters of spectra presenting a protein proximity and appeared at the same time. This process relies on several specific methods aimed at contrasting and grouping the spectra, graphically presenting the results for easy epidemiological interpretation, and searching for the discriminating spectral peaks with their possible identification using reference databases, such as UniProt. This process aims at providing essential information on a potentially epidemic situation by giving valuable information for epidemiological sensemaking and helping the decision-making on the continuation or not of the epidemiological investigation, in particular the use of costly additional resources to assess the alarm.