Ecole Doctorale

Sciences de la Vie et de la Santé

Spécialité

Biologie-Santé - Spécialité Bioinformatique et Génomique

Etablissement

Aix-Marseille Université

Mots Clés

réseaux d'interactions,interactions protéine-ARN,interactions protéine-protéine,fonction des ARNlnc,fonction des 3'UTRs,multifonctionnalité des protéines

Keywords

interaction networks,protein-RNA interactions,protein-protein interactions,lncRNA function,3'UTR function,protein multifunctionality

Titre de thèse

Découverte du rôle des interactions protéine-ARN dans la multifonctionnalité des protéines et la complexité cellulaire
Discovery of the role of protein-RNA interactions in protein multifunctionality and cellular complexity

Date

Mercredi 5 Décembre 2018 à 14:00

Adresse

Campus de Luminy, 163 Avenue de Luminy, 13009 Marseille Amphithéâtre Oceanomed, Institut Méditerranéen d'Océanologie

Jury

Directeur de these Mme Christine BRUN Aix-Marseille Université, Inserm, TAGC U1090
Rapporteur M. Ulrich STELZL University of Graz
Rapporteur M. Didier AUBOEUF ENS de Lyon
CoDirecteur de these M. Gian GAETANO TARTAGLIA Centre for Genomic Regulation
Examinateur Mme Anne-Marie FRANçOIS-BELLAN Aix Marseille Université, CNRS, CRN2M-UMR7286
Examinateur M. Jacques VAN HELDEN Aix-Marseille Université, Inserm, TAGC U1090

Résumé de la thèse

Au fil du temps, la vie a évolué pour produire des organismes remarquablement complexes. Pour faire face à cette complexité, les organismes ont développé une pléthore de mécanismes régulateurs. Par exemple, pour chaque ARN messager (ARNm) codant une protéine, des régions non traduites (UTR; untranslated regions en anglais) potentiellement régulatrices sont aussi présentes. De plus, les organismes supérieurs transcrivent des milliers d'ARN longs non codants (ARNlnc), accroissant ainsi la capacité régulatrice de leurs cellules. Cependant, la plupart des ARNlnc sont-ils fonctionnels? Le cas échéant, par quels mécanismes peuvent-ils agir? Le rôle d’échafaudage des ARNlnc, formant des ribonucléoprotéines et rapprochant ainsi physiquement les protéines est un concept émergent. Toutefois, la prévalence de ce mécanisme reste encore à déterminer. De plus, au lieu d'ajouter de nouveaux composants pour augmenter la complexité, les cellules peuvent réutiliser certaines protéines pour exécuter plusieurs fonctions distinctes. C'est le cas des protéines moonlighting. Ces protéines exercent souvent des fonctions distinctes dans des environnements différents et peuvent donc être régulées par un changement de localisation cellulaire. Par la formation de complexes protéiques en cours de traduction, les régions 3' non traduites (3’UTRs) peuvent réguler la localisation cellulaire et la fonction de la protéine synthétisée à partir des transcrits auxquels elles appartiennent. Néanmoins, la fréquence ce mécanisme et son rôle dans la régulation des diverses fonctions des protéines moonlighting reste à aborder. Cette thèse a pour objectif de découvrir et comprendre systématiquement deux mécanismes de régulation méconnus impliquant la partie non codante du transcriptome humain. Concrètement, l'assemblage de complexes protéiques promus par les ARNlnc et les 3'UTRs est étudié avec des données d’interactions protéines-protéines et protéines-ARN prédites et expérimentales, à grande échelle. Ceci a permis (i) de prédire le rôle de plusieurs centaines d'ARNlnc comme molécules d'échafaudage pour plus de la moitié des complexes protéiques connus, ainsi que (ii) d’inférer plus d’un millier de complexes 3'UTR-protéines, dont des cas permettant d’expliquer la localisation cellulaire de protéines moonlighting. Ces résultats obtenus à l’échelle du protéome et du transcriptome indiquent qu'une proportion élevée d'ARNlnc et de 3'UTRs pourrait réguler la fonction des protéines en augmentant ainsi la complexité du vivant.

Thesis resume

Over time, life has evolved to produce remarkably complex organisms. To cope with this complexity, organisms have evolved a plethora of regulatory mechanisms. For instance, for every messenger RNA (mRNA) encoding a protein, regulatory untranslated regions (UTRs) are also present. Additionally, higher organisms transcribe thousands of long non-coding RNAs (lncRNAs), presumably expanding the regulatory capacity of their cells. However, it is questionable whether most lncRNAs are functional, and even though many lncRNAs interact with other cellular components, is yet unclear through which mechanisms they may act. An emerging concept is that lncRNAs can serve as protein scaffolds, forming ribonucleoproteins and bringing proteins in proximity, but the prevalence of this mechanism is yet to be determined. Besides adding new components to increase complexity, cells can reuse proteins to perform several unrelated functions. Such is the case of the moonlighting proteins. These proteins are often found to perform distinct functions under different environments, and may thus be regulated by a change of cellular localisation. Interestingly, through the formation of protein-complexes during translation, 3’UTRs have been found to regulate the cellular localisation and function of the protein synthesized from their transcript. Yet, if this mechanism is common, and if used to regulate the several functions of moonlighting proteins, remains to be addressed. This thesis aims to systematically discover and provide insights into two ill-known regulatory mechanisms involving the non-coding portion of the human transcriptome. Concretely, the assembly of protein complexes promoted by lncRNAs and 3’UTRs is investigated using computationally predicted, as well as experimentally determined, large-scale datasets of protein-protein and protein-RNA interactions. This enabled to (i) predict hundreds of lncRNAs as possible scaffolding molecules for more than half of the known protein complexes, as well as (ii) infer more than a thousand distinct 3’UTR-protein complexes, including cases likely to regulate the cellular localisation of moonlighting proteins. These large-scale results indicate that a high proportion of lncRNAs and 3’UTRs may be employed in regulating protein function, potentially playing a role both as regulators and as components of complexity.