Ecole Doctorale
Sciences de la Vie et de la Santé
Spécialité
Biologie-Santé - Spécialité Bioinformatique et Génomique
Etablissement
Aix-Marseille Université
Mots Clés
Bio informatique,Biostatistique,génome microbien,,
Keywords
Bioinformatics,Biostatistics,Microbial Genome,,
Titre de thèse
Étude Bio informatiques et Biostatistiques des Structures mosaïques des génomes microbiens
Bioinformatics and Biostatistics Study of the Mosaic Structure of the Microbial Genome
Date
Vendredi 27 Novembre 2020 à 10:00
Adresse
Méditerranée Infection
Service du Pr Raoult
19-21 Boulevard Jean Moulin
13 385 Marseille Cedex 5 Salle 1
Jury
Directeur de these |
M. Anthony LEVASSEUR |
AMU |
Rapporteur |
Mme Nathalie CASSE |
Université du Maine |
Rapporteur |
M. Raymond RUIMY |
Faculté de Médecine, Université Côte dAzur, Nice |
Examinateur |
Mme FENOLLAR FLORENCE |
AMU |
Résumé de la thèse
RESUME
Lavènement des nouvelles technologies de séquençage a ouvert de nouvelles perspectives de
recherche en biologie évolutive. Le séquençage de nouveaux clades microbiens et la profondeur
de séquençage fournie par les nouveaux séquenceurs permettent détudier en profondeur les
mécanismes dévolution de ces génomes. En particulier, la mosaïcité des génomes a pu être
mise en évidence et lorigine du contenu génomique a pu être décryptée via la génération de
« buissons évolutifs » ou rhizomes [1]. Cette approche consiste à intégrer lensemble des
séquences codantes et den déterminer leur origine (mise en évidence des HGT, horizontal gène
transfert). Par ailleurs, des structures mosaïques au sein des séquences ont aussi pu être mises
en évidence (horizontal séquence transfert). Au-delà du transfert de gènes, le transfert de
séquences remet donc en question les critères actuels de la taxonomie. En effet, lutilisation de
marqueurs moléculaires individuels pour la taxonomie ne prend pas en compte la mosaïcité des
séquences exploitées [2]. De plus, lutilisation de plusieurs marqueurs concaténés biaise
davantage le signal phylogénétique. Cette thèse se focalisera sur la recherche et létude des
structures mosaïques des génomes microbiens (transferts de gènes et de séquences). Limpact
des transferts sur la classification phylogénétique sera évalué et replacé au sein de larbre de la
vie. La corrélation statistique entre les échanges de séquences et les communautés microbiennes
au sein des écosystèmes sera établie (le modèle amibe en tant quhôte sera particulièrement
ciblé). A terme, nous serons amenés à maitriser les différents outils bio-informatiques de
détection de transfert de séquences ainsi que les langages de programmation R et Perl
notamment pour les statistiques. Et enfin nous serons amenés à manipuler les données brutes
de séquençage des génomes de nouvelles espèces isolées au laboratoire (assemblage, annotation
structurale et fonctionnelle, mosaïcité
). Une synthèse bibliographique portant sur la
mosaïcité des génomes microbiens sera réalisée sous la forme dune revue pendant cette thèse.
Mots clés : Bioinformatique, Biostatistique et génome microbien
Thesis resume
The advent of new sequencing technologies has opened up new research perspectives in
evolutionary biology. The sequencing of new microbial clades and the depth of sequencing
provided by new sequencers make it possible to study in depth the mechanisms of evolution of
these genomes. In particular, the mosaic nature of the genomes has been demonstrated and the
origin of the genomic content has been deciphered via the generation of "evolutionary bushes"
or rhizomes [1]. This approach consists in integrating all the coding sequences and determining
their origin (highlighting HGT, horizontal gene transfer). In addition, mosaic structures within
the sequences could also be highlighted (horizontal sequence transfer). Beyond gene transfer,
sequence transfer thus calls into question the current criteria of taxonomy. Indeed, the use of
individual molecular markers for taxonomy does not take into account the mosaic structure of
the sequences used [2]. Moreover, the use of several concatenated markers further biases the
phylogenetic signal. This thesis will focus on the research and study of the mosaic structures of
microbial genomes (gene and sequence transfers). The impact of transfers on phylogenetic
classification will be evaluated and placed within the tree of life. The statistical correlation
between sequence exchanges and microbial communities within ecosystems will be established
(the amoeba model as a host will be particularly targeted). Eventually, we will be led to master
the various bioinformatics tools for sequence transfer detection as well as the R and Perl
programming languages, particularly for statistics. And finally, we will have to manipulate the
raw data of genome sequencing of new species isolated in the laboratory (assembly, structural
and functional annotation, mosaicism...). A bibliographical synthesis on the mosaicity of
microbial genomes will be carried out in the form of a review during this thesis.
Keywords: Bioinformatics, Biostatistics and Microbial Genome.