Ecole Doctorale

Sciences de la Vie et de la Santé

Spécialité

Biologie-Santé - Spécialité Bioinformatique et Génomique

Etablissement

Aix-Marseille Université

Mots Clés

Bio informatique,Biostatistique,génome microbien,,

Keywords

Bioinformatics,Biostatistics,Microbial Genome,,

Titre de thèse

Étude Bio informatiques et Biostatistiques des Structures mosaïques des génomes microbiens
Bioinformatics and Biostatistics Study of the Mosaic Structure of the Microbial Genome

Date

Vendredi 27 Novembre 2020 à 10:00

Adresse

Méditerranée Infection Service du Pr Raoult 19-21 Boulevard Jean Moulin 13 385 Marseille Cedex 5 Salle 1

Jury

Directeur de these M. Anthony LEVASSEUR AMU
Rapporteur Mme Nathalie CASSE Université du Maine
Rapporteur M. Raymond RUIMY Faculté de Médecine, Université Côte d’Azur, Nice
Examinateur Mme FENOLLAR FLORENCE AMU

Résumé de la thèse

RESUME L’avènement des nouvelles technologies de séquençage a ouvert de nouvelles perspectives de recherche en biologie évolutive. Le séquençage de nouveaux clades microbiens et la profondeur de séquençage fournie par les nouveaux séquenceurs permettent d’étudier en profondeur les mécanismes d’évolution de ces génomes. En particulier, la mosaïcité des génomes a pu être mise en évidence et l’origine du contenu génomique a pu être décryptée via la génération de « buissons évolutifs » ou rhizomes [1]. Cette approche consiste à intégrer l’ensemble des séquences codantes et d’en déterminer leur origine (mise en évidence des HGT, horizontal gène transfert). Par ailleurs, des structures mosaïques au sein des séquences ont aussi pu être mises en évidence (horizontal séquence transfert). Au-delà du transfert de gènes, le transfert de séquences remet donc en question les critères actuels de la taxonomie. En effet, l’utilisation de marqueurs moléculaires individuels pour la taxonomie ne prend pas en compte la mosaïcité des séquences exploitées [2]. De plus, l’utilisation de plusieurs marqueurs concaténés biaise davantage le signal phylogénétique. Cette thèse se focalisera sur la recherche et l’étude des structures mosaïques des génomes microbiens (transferts de gènes et de séquences). L’impact des transferts sur la classification phylogénétique sera évalué et replacé au sein de l’arbre de la vie. La corrélation statistique entre les échanges de séquences et les communautés microbiennes au sein des écosystèmes sera établie (le modèle amibe en tant qu’hôte sera particulièrement ciblé). A terme, nous serons amenés à maitriser les différents outils bio-informatiques de détection de transfert de séquences ainsi que les langages de programmation R et Perl notamment pour les statistiques. Et enfin nous serons amenés à manipuler les données brutes de séquençage des génomes de nouvelles espèces isolées au laboratoire (assemblage, annotation structurale et fonctionnelle, mosaïcité…). Une synthèse bibliographique portant sur la mosaïcité des génomes microbiens sera réalisée sous la forme d’une revue pendant cette thèse. Mots clés : Bioinformatique, Biostatistique et génome microbien

Thesis resume

The advent of new sequencing technologies has opened up new research perspectives in evolutionary biology. The sequencing of new microbial clades and the depth of sequencing provided by new sequencers make it possible to study in depth the mechanisms of evolution of these genomes. In particular, the mosaic nature of the genomes has been demonstrated and the origin of the genomic content has been deciphered via the generation of "evolutionary bushes" or rhizomes [1]. This approach consists in integrating all the coding sequences and determining their origin (highlighting HGT, horizontal gene transfer). In addition, mosaic structures within the sequences could also be highlighted (horizontal sequence transfer). Beyond gene transfer, sequence transfer thus calls into question the current criteria of taxonomy. Indeed, the use of individual molecular markers for taxonomy does not take into account the mosaic structure of the sequences used [2]. Moreover, the use of several concatenated markers further biases the phylogenetic signal. This thesis will focus on the research and study of the mosaic structures of microbial genomes (gene and sequence transfers). The impact of transfers on phylogenetic classification will be evaluated and placed within the tree of life. The statistical correlation between sequence exchanges and microbial communities within ecosystems will be established (the amoeba model as a host will be particularly targeted). Eventually, we will be led to master the various bioinformatics tools for sequence transfer detection as well as the R and Perl programming languages, particularly for statistics. And finally, we will have to manipulate the raw data of genome sequencing of new species isolated in the laboratory (assembly, structural and functional annotation, mosaicism...). A bibliographical synthesis on the mosaicity of microbial genomes will be carried out in the form of a review during this thesis. Keywords: Bioinformatics, Biostatistics and Microbial Genome.