Ecole Doctorale

Sciences de la Vie et de la Santé

Spécialité

Biologie-Santé - Spécialité Maladies Infectieuses

Etablissement

Aix-Marseille Université

Mots Clés

Virus,génomes,Quasi-espèces,Diversité,

Keywords

Virus,genomes,Quasi-species,Diversity,

Titre de thèse

Caractérisation de la diversité et des quasi-espèces des génomes viraux à partir de prélèvements cliniques
Characterization of the diversity and quasi-species of viral genomes from clinical samples

Date

Vendredi 25 Novembre 2022 à 9:00

Adresse

IHU méditerannée infection 19-21 Boulevard jean moulin 13005 Marseille salle 8

Jury

Directeur de these M. Philippe COLSON IHU Méditerannée infection, Aix Marseille Université
Rapporteur M. Vincent FOULONGNE Pathogenèse et contrôle des infections chroniques et émergentes, UMR 1058, Université de Montpellier, France/ CHU de Montpellier, Établissement français du sang, Inserm, Université des Antilles, Montpellier, France
Rapporteur Mme Sylvie PILLET GIMAP (Groupe Immunité des Muqueuses et Agents Pathogènes) EA-3064, Medicine Faculty of Saint-Etienne, Campus Santé-Innovations of Saint-Etienne, 42270 Saint-Priest-en-Jarez, France. Laboratory of Infectious agents and Hygiene, University Hospital of Saint-Étienne, 42000 Saint-Étienne, France.
Examinateur M. Anthony LEVASSEUR IHU Méditerannée infection, Aix Marseille Université
CoDirecteur de these M. Romain LOTTE CHU de Nice

Résumé de la thèse

Depuis son émergence fin 2019, le SARS-CoV-2, le septième coronavirus humain connu, a été dans le monde un agent infectieux humain majeur et a occupé une place prépondérante en virologie. Sa variabilité génétique importante a généré les différents clades, dont certains ont été classés comme des variants préoccupants à l’échelle internationale, et dont l’émergence et la propagation ont pu être influencées par des pressions de sélection notamment celles liée aux réponses immunitaires stimulées par les infections SARS-CoV-2 antérieures ou par les vaccinations. La variabilité génétique du SARS-CoV-2 est causée principalement par les erreurs de l’ARN polymérase ARN dépendante virale, connue par sa faible fidélité, et par des recombinaisons génétiques. Ceci génère lors de la réplication virale des « quasi-espèces ». Ces quasi-espèces sont l’ensemble des virus mutants détectables chez un même patient ou dans un même prélèvement ; ils sont liés et génétiquement très proches, et pour beaucoup très minoritaires au sein de la population virale globale. Les quasi-espèces sont peu étudiées et caractérisées, malgré leur importance biologique dans l’émergence de nouveaux mutants ou variants significatifs sur les plans virologique, épidémiologique ou clinique. Leur étude peut ainsi permettre de détecter de manière précoce de telles émergences. Cependant la large majorité des travaux analysent les séquences consensus qui sont les sommes des différentes séquences obtenues à partir d’un prélèvement. Cette thèse a porté sur l’étude des quasi-espèces SARS-CoV-2 rendues accessibles par les techniques de séquençage de nouvelle génération, à partir d’échantillons nasopharyngés diagnostiqués SARS-CoV-2-positifs par PCR. Elle a concerné différents variants, et a compris 3 axes principaux. Dans un premier temps, nous avons étudié les quasi-espèces parmi les séquences obtenues par séquençage direct de nouvelle génération par la technologie Illumina et ayant permis d’assembler 114 génomes consensus de variants SARS-CoV-2 ayant circulés à Marseille en 2020-2021. Cette étude a notamment montré des hot-spots de diversité génétique incluant à des positions mutées chez des variants ayant prédominé mondialement. Dans un deuxième temps, nous avons réalisé une analyse à plus large échelle des quasi-espèces SARS-CoV-2 lors d’infections par le variant Marseille-4, qui a prédominé à Marseille pendant plus de 6 mois en 2020 et 2021, après un séquençage plus profond lié à une amplification par PCR avant séquençage. Nous avons notamment pu observer deux pics de diversité dans les gènes ORF1a et ORF1b et de la diversité dans une région S2m retrouvée dans trois autres familles virales par ailleurs divergentes. Finalement, nous avons étudié et comparé les quasi-espèces SARS-CoV-2 chez des patients sévèrement immunodéprimés avant et après l’administration d’anticorps monoclonaux dirigés contre la protéine de spicule du SARS-CoV-2 utilisés en thérapeutique. Cette étude a montré une modification significative des quasi-espèces virales notamment dans le gène codant pour cette protéine. Parallèlement, nous avons caractérisé les quasi-espèces virales dans deux cas d’infection, par un astrovirus d’une part, et par un adénovirus d’autre part, afin d’apprécier le caractère universel de l’existence d’une telle diversité génétique chez un même individu. Au total, l’ensemble de ces travaux montre que les séquences consensus des génomes ne sont qu’une représentation incomplète et imparfaite de l’ensemble de la population virale infectant un hôte.

Thesis resume

Since its emergence at the end of 2019, SARS-CoV-2, the seventh known human coronavirus, has been a major human infectious agent worldwide and has occupied a prominent place in virology. Its significant genetic variability has generated different clades, some of which have been classified as variants of concern at the world scale, and whose emergence and spread may have been influenced by selection pressures, in particular those linked to immune responses stimulated by previous SARS-CoV-2 infections or by vaccinations. The genetic variability of SARS-CoV-2 is caused mainly by errors in the viral RNA dependent-RNA polymerase, known for its low fidelity, and by genetic recombinations. This generates, during viral replication, “quasi-species”. These quasi-species are all the mutant viruses detectable in a same patient or in a same sample; they are related and genetically very close, and for many very minority within the global viral population. Quasi-species are scarcely studied and characterized, despite their biological importance in the emergence of new mutants or variants of virological, epidemiological or clinical significance. Their study can thus make it possible to detect such emergences at an early stage. However, the vast majority of studies analyze consensus sequences, which are the sums of the different sequences obtained from a sample. This thesis focused on the study of SARS-CoV-2 quasispecies made accessible by next-generation sequencing techniques, from nasopharyngeal samples diagnosed SARS-CoV-2-positive by PCR. It implicated different variants, and included 3 main axes. First, we studied the quasi-species among the sequences obtained by direct next-generation sequencing using Illumina technology and which made it possible to assemble 114 consensus genomes of SARS-CoV-2 variants having circulated in Marseille in 2020-2021. This study notably showed hotspots of genetic diversity including at mutated positions in variants that have predominated worldwide. In a second step, we carried out a larger scale analysis of SARS-CoV-2 quasi-species during infections by the Marseille-4 variant, which predominated in Marseille for more than 6 months in 2020 and 2021, after deeper sequencing due to PCR amplification before sequencing. In particular, we were able to observe two peaks of diversity in the ORF1a and ORF1b genes and some diversity in an S2m region found in three other otherwise divergent viral families. Finally, we studied and compared SARS-CoV-2 quasi-species in severely immunocompromised patients before and after the administration of monoclonal antibodies directed against the SARS-CoV-2 spike protein used in therapy. This study showed a significant modification of the viral quasi-species, particularly in the gene coding for this protein. At the same time, we characterized the viral quasi-species in two cases of infection, by an astrovirus on the one hand, and by an adenovirus on the other hand, in order to appreciate the universal character of the existence of such genetic diversity in the same individual. Overall, these works show that consensus genome sequences are only an incomplete and imperfect representation of the entire viral population infecting a host.