Ecole Doctorale

Sciences de la Vie et de la Santé

Spécialité

Biologie-Santé - Spécialité Maladies Infectieuses

Etablissement

Aix-Marseille Université

Mots Clés

Capture par hybridation,Déplétion de la contamination de l’hôte,Métagénomique par séquençage direct,Microbial enrichment,Maladies infectieuses,Découverte de pathogène

Keywords

Hybridization capture,Host depletion,shotgun metagenomic,Microbial enrichment,Infectious,Pathogen discovery

Titre de thèse

Déplétion de la contamination de l’hôte utilisant la technique de capture par hybridation sur sondes spécifiques pour l'identification de pathogènes humains par métagénomique en séquençage direct.
Human RNA bait library depletion for human pathogen discovery using shotgun metagenomic sequencing.

Date

Vendredi 23 Novembre 2018 à 13:00

Adresse

MEPHI - (Microbes, Evolution, Phylogeny and Infection) Aix-Marseille Université, IRD, AP-HM, CNRS IHU Méditerranée Infection 19-21 Bd Jean Moulin 13005 Marseille salle numéro 1

Jury

Directeur de these Mme Christelle DESNUES Institut Hospitalo-Universitaire MÉDITERRANÉE INFECTION
Rapporteur M. Bruno POZZETTO CHU de Saint-Etienne - Hôpital Nord
Rapporteur M. Philippe ROUMAGNAC CIRAD
Examinateur M. Philippe COLSON Institut Hospitalo-Universitaire MÉDITERRANÉE INFECTION

Résumé de la thèse

Le développement des techniques de séquençage de nouvelle génération (NGS) a révolutionné la recherche et le diagnostic dans le domaine des maladies infectieuses humaines. En virologie clinique, la métagénomique virale qui repose sur le séquençage aléatoire de type shotgun de l’ensemble des génomes viraux d’un échantillon (le virome), est une approche prometteuse pour la détection et l’identification sans a priori de potentiels nouveaux pathogènes. Cependant, son utilisation reste encore marginale en raison de l’importante contamination des viromes par les séquences nucléiques de l’hôte qui masque le signal viral, limite la reconstruction de génomes viraux et requiert une profondeur importante de séquençage, générant ainsi un cout élevé. Ces dernières années, de nombreux protocoles reposant principalement sur des étapes de filtration/centrifugation et digestions enzymatiques, ont été développés pour diminuer cette contamination humaine avec un succès limité notamment dans le cas de biopsies cliniques. Dans ce contexte, ce travail de thèse avait pour objectif d’améliorer l’approche de métagénomique pour le diagnostic clinique de maladies infectieuses virales en augmentant le ratio de séquences pathogène/hôte par déplétion des acides nucléiques humains. Le premier chapitre de cette thèse consiste en une synthèse bibliographique des approches de métagénomique virale en recherche clinique et des challenges à relever dans ce domaine. Cette synthèse bibliographique inclut également une revue sur les approches de capture/séquençage ciblées de certains pathogènes dans le domaine des maladies infectieuses humaines. Le deuxième chapitre de cette thèse propose une mise au point méthodologique permettant d’enrichir les métagénomes en séquences non-humaines basée sur l’hybridation et la capture de l’ensemble des acides nucléiques de l’hôte après hybridation avec des sondes ARN humaines biotinylées. La déplétion des acides nucléiques humains a été optimisée et vérifiée sur un métagénome viral artificiel constitué de proportions variables d’acides nucléiques humains et viraux (Herpes simplex virus 1). Nous avons ensuite validé son application en démontrant une réduction de plus de 90% de la contamination humaine par PCR quantitative en temps réel. Les résultats après séquençage NGS confirment un enrichissement moyen en séquences non humaines de 99,4 fois et de 64 fois en séquences virales. Le troisième chapitre de cette thèse est divisé en deux sous-chapitres qui proposent l’application de ce protocole à la détection d’agents potentiellement impliqués (1) dans un cas fatal d’encéphalite et (2) dans un cas énigmatique d’endocardite infectieuse à hémoculture négative. Dans le premier cas, le génome complet d’un nouveau gemycircularvirus de 2134 pb a pu être reconstruit à partir d’un échantillon de biopsie cérébrale tandis que dans le second, nous avons pu identifier une nouvelle souche de Moraxella osloensis à partir d’un échantillon de valve mitrale et reconstruire un génome quasi-complet avec une couverture moyenne > 200X. Enfin, dans un quatrième chapitre, l’approche méthodologique que nous avons développée est discutée et les résultats sont replacés dans un contexte élargi d’émergence des maladies infectieuses et de lien de causalité entre l’agent détecté et la pathologie observée.

Thesis resume

The development of Next Generation Sequencing (NGS) techniques has revolutionized research and diagnostic in the field of human infectious diseases. In clinical virology, viral metagenomics, which is based on the random shotgun sequencing of all viral genomes present in a sample, is a promising approach for blind detection and identification of potential new pathogens. Its use is however still marginal because of the large proportion of human nucleic sequences which masks the viral signal, limits the reconstruction of viral genomes and requires a ultra-deep sequencing, thus generating a higher sequencing costs. In recent years, numerous protocols based on filtration/centrifugation and nuclease digestion steps have been developed to reduce human contamination with limited success particularly in the case of clinical biopsies. In this context, this thesis work aims at improving the metagenomic approach for the clinical diagnosis of viral infectious diseases by increasing the ratio of pathogen-to-host sequences trough depletion of human nucleic acids from the samples. The first chapter of this thesis consists of a bibliographic synthesis of viral metagenomic approaches in clinical research and the challenges we faced in this field. This bibliographic overview also includes a review article on targeted-enrichment sequencing approaches for pathogen detection in the field of human infectious diseases. The second chapter of this thesis proposes a methodological development allowing the enrichment of non-human sequences from metagenomes through hybridization and capture of human nucleic acids with biotinylated human RNA probes. Depletion of human nucleic acids was optimized and verified on a mock viral metagenome consisting of varying proportions of human and viral nucleic acids (Herpes simplex virus 1). We then validated its application by reducing human contamination by more than 90% as revealed by real-time quantitative PCR. The results after NGS sequencing confirm an average enrichment for non-human sequences of 99.4-fold and 64-fold for viral sequences. The third chapter of this thesis is divided into two sub-chapters that propose the application of this protocol to the detection of putative pathogens in (1) a fatal case of encephalitis and (2) an enigmatic case of blood-culture negative infectious endocarditis. In the first case, the 2,134 bp complete genome of a new gemycircularvirus was reconstructed from a cerebral biopsy sample while in the second, we identified a new strain of Moraxella osloensis from a mitral valve sample and reconstructed its nearly-complete genome with an average coverage >200X. The methodological approach developed during this work is finally discussed in a fourth chapter which also replaces the results obtained in the broader context of emerging infectious diseases and validation of the causal link between the agent detected and the observed pathology.