Ecole Doctorale

Sciences de la Vie et de la Santé

Spécialité

Biologie-Santé - Spécialité Maladies Infectieuses

Etablissement

Aix-Marseille Université

Mots Clés

Séquençage,Virus,Respiratoire,Humain,Epidémies,Développement

Keywords

Sequencing,Viruses,Respiratory,Human,Epidemics,Development

Titre de thèse

Développement d'un système de séquençage pour caractériser les génomes des Virus parainfluenza Humains afin d’étudier les épidémies.
Development of a sequencing system to characterize the genomes of Human Parainfluenza Viruses in order to study epidemics.

Date

Jeudi 31 Octobre 2024 à 14:00

Adresse

IHU Méditerranée Infection, Timone hospital, 19-21 Bd Jean Moulin, 13005 Marseille, France Amphithéâtre

Jury

Directeur de these M. Bernard LA SCOLA Aix-Marseille Université
Examinateur Mme Florence FENOLLAR Aix-Marseille Université
Rapporteur Mme Sylvie PILLET Université de St Etienne
Rapporteur M. Vincent FOULONGNE CHU de Montpellier

Résumé de la thèse

Titre thèse : Développement d'un système de séquençage pour caractériser les génomes des Virus parainfluenza Humains afin d’étudier les épidémies. Les pathogènes viraux infectant les voies respiratoires sont omniprésent dans toutes les sociétés. Parmi eux, les espèces des Orthorubulavirus Humain et des Respirovirus Humain sont aussi connue sous le nom de Parainfluenza Virus Humain (HPIV). Ils comportent 4 sous-familles allant de 1 à 4, et ils constitueront la première étape de ce projet de thèse. Ils sont responsables aux USA de 22 555 hospitalisations annuelles chez les enfants de moins de 5 ans pour des cas de bronchiolite, croup, et de pneumonie. Les coûts d’hospitalisations s’élevant approximativement à 43, 58, et 158 millions de dollars respectivement (Abedi GR, et al. - 2016 - J Pediatric Infect Dis Soc.). Malgré cela, la quantité de données sur ces virus est très limitée comme l’on suggéré, vis-à-vis du HPIV4, P.Petit, et al. de l’IHU Méditerranée en 2020 en indiquant que sa prévalence était « probablement sous-estimée » (Petit, et al. – 2020 - 21es Journées Nationales d’Infectiologie). On comptabilise en tout 540 génomes complets de HPIV, le premier ayant été enregistré en 1997, ce qui contraste avec le nombre de génomes complet du SARS-CoV-2 s’élevant à plus de 11 le 06 Juillet 2022. Ces constats justifient le développement d’une technologie permettant la construction d’une banque de données conséquente. Ce projet de thèse se base sur l’émergence de la détection des variants à partir de séquençage complet qui a été mis en avant par la pandémie de SARS-CoV-2. Il se base sur le principe de la Polymerase Chain Reaction (PCR), en l’étendant au génome complet, avec un nombre de couples d’amorces suffisant et réparties en deux mélanges réactionnels. Ce projet est aussi permis par le matériel d’analyse génomique de pointe accessible au sein de l’IHU Méditerranée qui nous permettra le criblage d’un grand nombre d’échantillons. Du fait de la grande homologie entre les différents virus respiratoire, il est difficile de construire un système entier permettant l’amplification d’une espèce spécifique sans produire des amplicons non désirer. De plus, la taille des produits de PCR est limitée afin de ne pas produire d’amplicon porteur d’erreur d’élongation. Dans ce contexte, cette thèse a pour objectif de (1) mettre en place un système d'amplification du génome complet de l’HPIV2 en trois pools de PCR, (2) détecter des variants significatifs, (3) établir des hypothèses sur l’impact de ces variants basé sur la chronologie des prélèvements, (4) et étendre ces analyses aux autres virus respiratoire, notamment le SARS-CoV-2.

Thesis resume

Thesis title: Development of a sequencing system to characterize the genomes of human parainfluenza viruses in order to study epidemics. Viral pathogens infecting the respiratory tract are ubiquitous in all societies. Among them, the Orthorubulavirus and Respirovirus species are also known as Human Parainfluenza Viruses (HPIV). They comprise 4 subfamilies ranging from 1 to 4, and will form the first stage of this thesis project. In the USA, they are responsible for 22,555 annual hospitalizations in children under 5 for bronchiolitis, croup and pneumonia. Hospitalization costs amounting to approximately 43, 58, and 158 million dollars respectively (Abedi GR, et al. - 2016 - J Pediatric Infect Dis Soc.). Despite this, the amount of data on these viruses is very limited, as suggested with regard to HPIV4 by P.Petit, et al. of the IHU Méditerranée in 2020, indicating that its prevalence was "probably underestimated" (Petit, et al. - 2020 - 21es Journées Nationales d'Infectiologie). In all, there are 540 complete HPIV genomes, the first of which was recorded in 1997. This contrasts with the number of complete SARS-CoV-2 genomes, which stood at over 11 on July 06, 2022. These observations justify the development of a technology enabling the construction of a substantial database. This thesis project is based on the emergence of variant detection based on complete sequencing, as highlighted by the SARS-CoV-2 pandemic. It is based on the principle of Polymerase Chain Reaction (PCR), extending it to the complete genome, with a sufficient number of primer pairs distributed in two reaction mixtures. This project is also supported by the state-of-the-art genomic analysis equipment available at the IHU Méditerranée, which will enable us to screen a large number of samples. Due to the high degree of homology between different respiratory viruses, it is difficult to construct a complete system for the amplification of a specific species without producing unwanted amplicons. In addition, the size of PCR products is limited so as not to produce amplicons carrying elongation errors. In this context, the aim of this thesis is to (1) set up a complete genome amplification system for HPIV2 in three PCR pools, (2) detect significant variants, (3) establish hypotheses on the impact of these variants based on the chronology of samples, (4) and extend these analyses to other respiratory viruses, notably SARS-CoV-2.