Ecole Doctorale

Sciences de la Vie et de la Santé

Spécialité

Biologie-Santé - Spécialité Maladies Infectieuses

Etablissement

Aix-Marseille Université

Mots Clés

Génomique comparative,Génome bactérien,Taxonomie,Microbiologie,Definition d’espèce,Rickettsia

Keywords

Comparative genomics,Bacterial genome,Taxonomy,Microbiology,Species definition,Rickettsia

Titre de thèse

L'analyse des séquences de génomes bactériens en tant que source d'information taxonomique.
Analysis of bacterial genome sequences as a source of taxonomic information.

Date

Jeudi 5 Juillet 2018 à 9:00

Adresse

IHU - Méditerranée Infection 19-21 Bd Jean Moulin Salle N° 8

Jury

Directeur de these M. Pierre-Edouard FOURNIER UMR VITROME, Aix-Marseille Université, IRD, SSA, AP-HM, IHU - Méditerranée Infection
Examinateur Mme Christelle DESNUES UMR MEPHI, Aix-Marseille Université, IRD, AP-HM, IHU - Méditerranée Infection
Rapporteur M. Laurent BOYER UMR INSERM U1065/Université de Nice-Sophia Antipolis
Rapporteur M. Raymond RUIMY CHU NICE, Hôpital de l'Archet, Service de Bacteriologie

Résumé de la thèse

L’Identification rapide et la classification microbienne précise sont cruciales en microbiologie médicale pour la surveillance de la santé humaine et animale, établir un diagnostic clinique approprié et choisir des mesures thérapeutiques et de contrôle optimales. Initialement, la classification taxonomique des espèces bactériennes était basée sur des caractéristiques phénotypiques. Cependant, de nombreux outils génotypiques ont été mis au point pour compléter progressivement la définition des espèces bactériennes de façon plus fiable et precise dans une approche polyphasique intégrant les caractéristiques phénotypiques, l’analyse de la similarité et la phylogénie des séquences du gène de l’ARN ribosomique 16S (ARNr 16S), la teneur en G + C de l ‘ADN (G+C%) ainsi que l'hybridation ADN-ADN (DDH). Même si ces outils sont largement utilisés, ils présentent plusieurs limites et inconvénients. En effet, les seuils universels de similarité de séquence de l'ARNr 16S (95% et 98,65% aux rangs du genre et de l’espèce, respectivement), de différence en G+C % (>5% entre deux espèces) et de DDH (<70% entre deux espèces) utilisés pour la définition des espèces ne sont pas applicables à de nombreux genres bactériens. C'est notamment le cas des espèces du genre Rickettsia, alpha-protéobactéries strictement intracellulaires qui expriment peu de caractéristiques phénotypiques. Ainsi, la définition des espèces au sein du genre Rickettsia a longtemps fait l'objet de débat. Mais en 2003, l'introduction d'un outil moléculaire basé sur l'analyse des séquences de cinq gènes a révolutionné la caractérisation et la classification taxonomique des rickettsies et constitue la base de leur classification à ce jour. En dépit de tous ces efforts, la taxonomie des membres du genre Rickettsia est restée un sujet de débat. Au cours des deux dernières décennies, les progrès remarquables de la technologie et de l'application du séquençage de l'ADN ont permis l’accès aux séquences génomiques complètes, permettant un accès sans précédant à des données précieuses pour une classification taxonomique plus précise des prokaryotes. Plusieurs outils taxonomiques basés sur les séquences génomiques ont été développés. Compte tenu de la disponibilité des séquences génomiques de près de 100 génomes de Rickettsia, nous avons voulu évaluer une gamme de paramètres taxonomiques basés sur l’analyse des séquences génomiques afin de mettre au point des recommandations pour la classification des isolats au niveau de l’espèce et du genre. Nous avons également utilisé la genomique pour la caractérisation et la description des nouveaux isolats bactériens isolés par la méthode de "culturomique bactérienne" à partir de divers échantillons cliniques. En comparant le degré de similarité des séquences de 78 génomes de Rickettsia et 61 génomes de 3 genres étroitement apparentés (Orientia, 11 génomes, Ehrlichia, 22 génomes et Anaplasma, 28 génomes) en utilisant plusieurs paramètres génomiques (hybridation ADN-ADN, dDDH; l'identité nucléotidique moyenne par orthologie, OrthoANI et AGIOS; ou l'identité moyenne des séquences protéiques AAI, nous avons montré que les outils taxonomiques basés sur les séquences génomiques sont simples à utiliser et rapides, et permettent une classification taxonomique fiable et reproductible des isolats au sein des espèces du genre Rickettsia, avec des seuils spécifiques. Les résultats obtenus nous ont permis d'élaborer des lignes directrices pour la classification des isolats de rickettsies au niveau du genre et de l'espèce. À l'aide de la taxono-génomique, nous avons également pu décrire 17 nouvelles espèces bactériennes associées à l'homme sur la base d'une combinaison de l'analyse génomique et des propriétés phénotypiques. L'utilisation des outils génomiques est donc parfaitement adaptée à la classification taxonomique et peut changer radicalement notre vision de la taxonomie et de l'évolution bactérienne à l'avenir.

Thesis resume

Rapid identification and precise microbial classification are crucial in medical microbiology for human and animal health monitoring, appropriate clinical diagnosis and selection of optimal therapeutic and control measures. Initially, the taxonomic classification of bacterial species was based on phenotypic characteristics. However, many genotypic tools have been developed to progressively supplement the definition of bacterial species more reliably and accurately in a polyphasic approach incorporating phenotypic characteristics, analysis of similarity and phylogeny of sequences of the 16S ribosomal RNA gene (16S rRNA), the G + C content of DNA (G+C%), and DNA-DNA hybridization (DDH). Although these tools are widely used, they have several limitations and disadvantages. Indeed, the universal 16S rRNA sequence similarity thresholds (95% and 98.65% at the genus and species ranks, respectively), difference in G+C% (> 5% between two species) and DDH (< 70% between two species) used for the definition of species are not applicable to many bacterial genera. This is particularly true of species of the genus Rickettsia which are strictly intracellular alpha-proteobacteria that express few phenotypic characteristics. Thus, the definition of species within the genus Rickettsia has long been a matter of debate. But in 2003, the introduction of a molecular tool based on the analysis of five genes has revolutionized the characterization and taxonomic classification of rickettsiae and is the current basis for their classification. Despite these efforts, the taxonomy of members of the genus Rickettsia remained a subject of debate. Over the past two decades, the remarkable advances in DNA sequencing technologies have allowed access to complete genomic sequences, allowing unprecedented access to valuable data for a more accurate taxonomic classification of prokaryotes. Several taxonomic tools based on genomic sequences have been developed. Given the availability of genomic sequences of nearly 100 rickettsial genomes, we wanted to evaluate a range of taxonomic parameters based on genomic sequence analysis, to develop guidelines for the classification of Rickettsia isolates at the genus and species levels. We have also used genomic sequences for the characterization and description of new bacterial isolates isolated by the "bacterial culturomics" method from various clinical specimens. By comparing the degree of similarity of the sequences of 78 genomes from Rickettsia species and 61 genomes from 3 closely related genera (Orientia, 11 genomes; Ehrlichia, 22 genomes; and Anaplasma, 28 genomes) using several genomic parameters (DNA-DNA hybridization, dDDH; the mean nucleotide identity by orthology, OrthoANI and AGIOS; or the mean identity of protein sequences AAI, we have shown that genome-based taxonomic tools are simple to use and fast, and allow for a reliable and reproducible taxonomic classification of isolates within species of the genus Rickettsia, with specific thresholds. The obtained results enabled us to develop guidelines for classifying rickettsial isolates at the genus and species levels. Using taxono-genomics, we have also been able to describe 17 new human-associated bacterial species on the basis of a combination of genomic analysis and phenotypic properties. The use of genomic tools is therefore perfectly adapted to taxonomic classification and can dramatically change our vision of taxonomy and bacterial evolution in the future.