Ecole Doctorale
Sciences de la Vie et de la Santé
Spécialité
Biologie-Santé - Spécialité Maladies Infectieuses
Etablissement
Aix-Marseille Université
Mots Clés
Capture par hybridation,Déplétion de la contamination de lhôte,Métagénomique par séquençage direct,Microbial enrichment,Maladies infectieuses,Découverte de pathogène
Keywords
Hybridization capture,Host depletion,shotgun metagenomic,Microbial enrichment,Infectious,Pathogen discovery
Titre de thèse
Déplétion de la contamination de lhôte utilisant la technique de capture par hybridation sur sondes spécifiques pour l'identification de pathogènes humains par métagénomique en séquençage direct.
Human RNA bait library depletion for human pathogen discovery using shotgun metagenomic sequencing.
Date
Friday 23 November 2018 à 13:00
Adresse
MEPHI - (Microbes, Evolution, Phylogeny and Infection)
Aix-Marseille Université, IRD, AP-HM, CNRS
IHU Méditerranée Infection
19-21 Bd Jean Moulin
13005 Marseille salle numéro 1
Jury
Directeur de these |
Mme Christelle DESNUES |
Institut Hospitalo-Universitaire MÉDITERRANÉE INFECTION |
Rapporteur |
M. Bruno POZZETTO |
CHU de Saint-Etienne - Hôpital Nord |
Rapporteur |
M. Philippe ROUMAGNAC |
CIRAD |
Examinateur |
M. Philippe COLSON |
Institut Hospitalo-Universitaire MÉDITERRANÉE INFECTION |
Résumé de la thèse
Le développement des techniques de séquençage de nouvelle génération (NGS) a révolutionné la recherche et le diagnostic dans le domaine des maladies infectieuses humaines. En virologie clinique, la métagénomique virale qui repose sur le séquençage aléatoire de type shotgun de lensemble des génomes viraux dun échantillon (le virome), est une approche prometteuse pour la détection et lidentification sans a priori de potentiels nouveaux pathogènes. Cependant, son utilisation reste encore marginale en raison de limportante contamination des viromes par les séquences nucléiques de lhôte qui masque le signal viral, limite la reconstruction de génomes viraux et requiert une profondeur importante de séquençage, générant ainsi un cout élevé. Ces dernières années, de nombreux protocoles reposant principalement sur des étapes de filtration/centrifugation et digestions enzymatiques, ont été développés pour diminuer cette contamination humaine avec un succès limité notamment dans le cas de biopsies cliniques. Dans ce contexte, ce travail de thèse avait pour objectif daméliorer lapproche de métagénomique pour le diagnostic clinique de maladies infectieuses virales en augmentant le ratio de séquences pathogène/hôte par déplétion des acides nucléiques humains.
Le premier chapitre de cette thèse consiste en une synthèse bibliographique des approches de métagénomique virale en recherche clinique et des challenges à relever dans ce domaine. Cette synthèse bibliographique inclut également une revue sur les approches de capture/séquençage ciblées de certains pathogènes dans le domaine des maladies infectieuses humaines.
Le deuxième chapitre de cette thèse propose une mise au point méthodologique permettant denrichir les métagénomes en séquences non-humaines basée sur lhybridation et la capture de lensemble des acides nucléiques de lhôte après hybridation avec des sondes ARN humaines biotinylées. La déplétion des acides nucléiques humains a été optimisée et vérifiée sur un métagénome viral artificiel constitué de proportions variables dacides nucléiques humains et viraux (Herpes simplex virus 1). Nous avons ensuite validé son application en démontrant une réduction de plus de 90% de la contamination humaine par PCR quantitative en temps réel. Les résultats après séquençage NGS confirment un enrichissement moyen en séquences non humaines de 99,4 fois et de 64 fois en séquences virales.
Le troisième chapitre de cette thèse est divisé en deux sous-chapitres qui proposent lapplication de ce protocole à la détection dagents potentiellement impliqués (1) dans un cas fatal dencéphalite et (2) dans un cas énigmatique dendocardite infectieuse à hémoculture négative. Dans le premier cas, le génome complet dun nouveau gemycircularvirus de 2134 pb a pu être reconstruit à partir dun échantillon de biopsie cérébrale tandis que dans le second, nous avons pu identifier une nouvelle souche de Moraxella osloensis à partir dun échantillon de valve mitrale et reconstruire un génome quasi-complet avec une couverture moyenne > 200X.
Enfin, dans un quatrième chapitre, lapproche méthodologique que nous avons développée est discutée et les résultats sont replacés dans un contexte élargi démergence des maladies infectieuses et de lien de causalité entre lagent détecté et la pathologie observée.
Thesis resume
The development of Next Generation Sequencing (NGS) techniques has revolutionized research and diagnostic in the field of human infectious diseases. In clinical virology, viral metagenomics, which is based on the random shotgun sequencing of all viral genomes present in a sample, is a promising approach for blind detection and identification of potential new pathogens. Its use is however still marginal because of the large proportion of human nucleic sequences which masks the viral signal, limits the reconstruction of viral genomes and requires a ultra-deep sequencing, thus generating a higher sequencing costs. In recent years, numerous protocols based on filtration/centrifugation and nuclease digestion steps have been developed to reduce human contamination with limited success particularly in the case of clinical biopsies. In this context, this thesis work aims at improving the metagenomic approach for the clinical diagnosis of viral infectious diseases by increasing the ratio of pathogen-to-host sequences trough depletion of human nucleic acids from the samples.
The first chapter of this thesis consists of a bibliographic synthesis of viral metagenomic approaches in clinical research and the challenges we faced in this field. This bibliographic overview also includes a review article on targeted-enrichment sequencing approaches for pathogen detection in the field of human infectious diseases.
The second chapter of this thesis proposes a methodological development allowing the enrichment of non-human sequences from metagenomes through hybridization and capture of human nucleic acids with biotinylated human RNA probes. Depletion of human nucleic acids was optimized and verified on a mock viral metagenome consisting of varying proportions of human and viral nucleic acids (Herpes simplex virus 1). We then validated its application by reducing human contamination by more than 90% as revealed by real-time quantitative PCR. The results after NGS sequencing confirm an average enrichment for non-human sequences of 99.4-fold and 64-fold for viral sequences.
The third chapter of this thesis is divided into two sub-chapters that propose the application of this protocol to the detection of putative pathogens in (1) a fatal case of encephalitis and (2) an enigmatic case of blood-culture negative infectious endocarditis. In the first case, the 2,134 bp complete genome of a new gemycircularvirus was reconstructed from a cerebral biopsy sample while in the second, we identified a new strain of Moraxella osloensis from a mitral valve sample and reconstructed its nearly-complete genome with an average coverage >200X.
The methodological approach developed during this work is finally discussed in a fourth chapter which also replaces the results obtained in the broader context of emerging infectious diseases and validation of the causal link between the agent detected and the observed pathology.