Ecole Doctorale

Physique et Sciences de la Matière

Spécialité

PHYSIQUE & SCIENCES DE LA MATIERE - Spécialité : PHYSIQUE THEORIQUE ET MATHEMATIQUE

Etablissement

Aix-Marseille Université

Mots Clés

ARN,Modélisation par processus,Protéine,,

Keywords

Process-based Modelling,Protein,RNA,,

Titre de thèse

Modélisation par processus des interactions entre ARN et protéines: une approche formelle
Process-based Modelling of RNA and Protein Interactions: A Formal Approach

Date

Lundi 28 Décembre 2020 à 15:00

Adresse

Virtual room of the PhD program in Computer Science of the University of Camerino https://unicam.webex.com/meet/dottorato.cs https://unicam.webex.com/meet/dottorato.cs

Jury

CoDirecteur de these M. Marco PETTINI Aix Marseille Université
Directeur de these Mme Emanuela MERELLI Univerity of Camerino
Examinateur M. Andrea OMICINI Università di Bologna
Examinateur Mme Éléna FLORIANI Aix Marseille Université
Examinateur Mme Sandra PUCCIARELLI University of Camerino
Rapporteur M. Paul BOURGINE Institut des Systèmes Complexes de Paris – CNRS

Résumé de la thèse

Notre compréhension d'un processus biologique est souvent freinée par l'enchevêtrement des interactions à sa base, car la relation entre ces connexions locales et le processus dans son ensemble semble floue dans une « top-down » perspective; le comportement global d'un système n'est compréhensible qu'en tant que propriété émergente du système lui-même. L'émergence peut être identifiée à différents niveaux dans les systèmes biologiques. Dans ce manuscrit, nous analysons le comportement caractérisant les macromolécules biologiques, depuis les étapes qui les amènent à atteindre leurs conformations tridimensionnelles, à la façon dont elles interagissent les unes avec les autres. Nous prouvons que la complexité des fonctions ARN peut être attribuée à la potentialité interne de chaque nucléotide à interagir avec les autres dans la même séquence. Ce résultat est obtenu en comparant le repliement de l'ARN avec celui réalisé par les protéines, afin d'identifier un niveau d'abstraction auquel ces deux classes de molécules présentent la même complexité structurelle et fonctionnelle. Nous nous référons à ce niveau comme niveau de congruence. Atteindre un tel objectif a été possible grâce à l'expressivité des algèbres de processus, grâce auxquelles nous avons modélisé à la fois le repliement de l'ARN et des protéines. Par la suite, nous nous concentrons sur une classe de pathologies qui affecte les processus de repliement pour étudier comment les différences entre les composants structurels des protéines et des ARN provoquent une réponse différente à une modification de la voie de repliement correcte. Nous décrivons formellement comment la mutation d'un seul gène (mutation ponctuelle) peut modifier la conformation finale d'une protéine tout en étant inoffensive pour la structure des ARN. Nous montrons comment une pathologie bien connue affectant l'hémoglobine, la drépanocytose, peut être considérée comme un comportement émergent des interactions entre les acides aminés ainsi que les nucléotides. Nous faisons un autre pas en avant, en émettant l'hypothèse des fonctions qui caractérisent le niveau de congruence mentionné ci-dessus et en explorant plus avant l'applicabilité des algèbres de processus dans la modélisation des processus biologiques associés. Les modèles résultants constitueront à terme la base d'une simulation « multi-agents ». Nous proposons un simulateur « multi-agents » développé pour étudier les interactions moléculaires caractérisant les voies métaboliques, et analyser l'émergence de propriétés globales à partir d'interactions locales. Nous explorons ses capacités à faire face aux interactions électrodynamiques à longue distance qui façonnent le comportement des systèmes bimoléculaires et analysons leur effet sur l'évolution d'une voie métabolique, telle que la glycolyse de la levure. Des études in vitro ont montré que des forces à longue portée peuvent être activées entre deux macromolécules biologiques, puisqu'elles se comportent comme des dipôles oscillants. Notre objectif est de fournir un support in silico pour ces expériences. Pour représenter dans son ensemble la dynamique des agents caractérisant une réaction métabolique, nous définissons un nouveau paradigme de visualisation basé sur le concept d'interaction-comme-perception: chaque fois qu'une molécule en perçoit une autre avec laquelle interagir, un lien potentiel entre les deux est établi. De cette manière, nous pouvons dériver le graphique des perceptions à une étape donnée; sur ces graphiques, nous appliquons l'analyse des données topologiques pour capturer les interactions à 3 corps à travers l'interprétation des 2-simplices comme des structures observables, qui sont des coques convexes de trois points. Nous utilisons la formation 2-simplex comme sémantique valide pour représenter la dynamique globale du système.

Thesis resume

Our understanding of a biological process is often held back by the entanglement of interactions at its basis, since the relation between these local connections and the process as a whole appears blurred from a top-down perspective; the global behaviour of a system is comprehensible only as an emergent property of the system itself. Emergence can be identified at various level in biological systems. In this manuscript, we analyse the behaviour characterising biological macromolecules, from the steps that lead them to reach their three-dimensional conformations, to the way they interact with one another. We prove that the complexity of RNA functions can be traced back to the inner potentiality of each nucleotide to interact with the others in the same sequence. This result is obtained by comparing the RNA folding with that performed by proteins, in order to identify an abstraction level at which these two classes of molecules show the same structural and functional complexity. We refer to this level as congruence level. Reaching such a goal was possible thanks to the expressiveness of process algebras, through which we modelled both RNA and protein folding. Subsequently, we concentrate on a class of pathologies that affects the folding processes to study how the differences between the structural components of proteins and RNAs cause a dissimilar response to an alteration of the correct folding pathway. We formally describe how the mutation of even a single gene (point mutation) can alter the final conformation of a protein while, at the same time, it is harmless for the structure of RNAs. We show how a well-known pathology affecting haemoglobin, the sickle-cell anaemia, can be considered as an emerging behaviour of the interactions among amino acids as well as nucleotides. We move another step forward, by hypothesising the functions that characterise the congruence level mentioned above and further exploring the applicability of process algebras in modelling the related biological processes. The resulting models will eventually form the basis of a multiagent simulation. In an agent-based simulation, agents are discrete software elements whose interactions correspond to those performed by the components of the modelled system, quite faithfully to the actual behaviour of a biological process. In process algebras, processes are concurrent, autonomous and reactive; all these properties are also shared by agents populating a multiagent environment, making process algebras suitable specification languages for multiagent systems. We propose a multiagent simulator developed to study the molecular interactions characterising metabolic pathways, and analyse the emergence of global properties from local interactions. We explore its capabilities to deal with the long-distance electrodynamic interactions that shape the behaviour of bimolecular systems, and analyse their effect on the evolution of a metabolic pathway, such as the yeast glycolysis. In vitro studies showed that long-range forces may be activated between two biological macromolecules, since they behave like oscillating dipoles. Our aim is to provide an in silico support for these experiments. To represent as a whole the agent dynamics characterising a metabolic reaction, we define a new visualisation paradigm based on the concept of interaction-as-perception: whenever a molecule perceives another one to interact with, a potential link between the two is established. In this way we can derive the graph of perceptions at a given step; on those graphs, we apply the topological data analysis to capture the 3-body interactions through the interpretation of 2-simplices as observable structures, which are convex hulls of three points. We use the 2-simplex formation as a valid semantic to represent the global dynamics of the system.