Ecole Doctorale

SCIENCES CHIMIQUES - Marseille

Spécialité

Sciences Chimiques

Etablissement

Aix-Marseille Université

Mots Clés

Polymères à séquence définie,Synthèse,Energie de dissociation,Spectrométrie de masse,Codage,RPE

Keywords

Sequence-defined Polymers,Synthesis,Bond dissociation energy,Mass spectrometry,Coding,EPR

Titre de thèse

Synthèse de nouveaux espaceurs alcoxyamine pour la préparation de polymères encodés
Synthesis of new alkoxyamine spacers for the elaboration of encoded polymers.

Date

Mardi 3 Novembre 2020 à 9:00

Adresse

Faculté des Sciences Site St Jérôme Aix Marseille Université 52 Avenue Escadrille Normandie Niemen 13013 Marseille Grande Salle

Jury

Directeur de these M. Didier GIGMES CNRS
Rapporteur Mme Tanja JUNKERS Monash University
Rapporteur M. Remzi BECER University of Warwick
Examinateur Mme Laurence CHARLES Aix-Marseille Université
CoDirecteur de these M. Jean-Louis CLéMENT Aix-Marseille Université
Examinateur M. Jean-François LUTZ CNRS

Résumé de la thèse

Le monde numérique est en croissance permanente, ce qui nécessite de plus en plus d’espace de stockage. Les données numériques sont stockées sur des supports dont la durée de vie n’excède généralement pas quelques dizaines d’années. De plus, leur densité atteint ses limites et la quantité de données produites chaque année risque de dépasser l’espace de stockage disponible dans les années à venir. Ainsi, certaines entreprises leaders du monde numérique comme Microsoft, ont engagé des efforts dans la production de systèmes de stockage basés sur de l’ADN. Ce polymère possède de nombreux avantages, dont sa capacité à tirer profit des avancées liées à l’ADN dans le monde des biotechnologies mais souffre également d’un désavantage majeur : sa structure est fixée par la biologie. A l’inverse, la structure de polymères synthétiques peut être choisie et ajustée en fonction des besoins de l’utilisateur en termes d’écriture et de lecture. Cette thèse s’inscrit dans un projet mettant en jeu le stockage d’informations digitales sur des poly(phosphodiester)s qui ont démontré leur capacité à produire des chaînes de taille comparable à celle de brins d’ADN synthétiques. Ces polymères sont séquencés en spectrometrie de masse par la dissociation des liaisons phosphodiester, ce qui permet de retrouver l’emplacement d’origine des bits par lecture du signal issu de leur fragmentation dans des experiences de MS/MS (MS2). Cependant les chaînes les plus longues subissent trop de voies de dissociation, ce qui compromet la lisibilité du signal. Des espaceurs alcoxyamine ont donc été inclus dans les chaînes de poly(phosphodiester)s pour les séparer en sous-segments plus courts. Une base d’ADN a été assignée à chaque sous-segment pour décaler leurs signaux une fois séparés. La faible energie de dissociation de l’espaceur a favorisé sa fragmentation, devant celle de toutes les autres liaisons, durant une première étape d’activation. Les oligo(phosphodiester)s de chaque sous-segment ont ensuite été fragmentés séparément durant une seconde étape d’activation (pseudo-MS3) pour retrouver la séquence de chaque sous-segment. Les séquences ont ensuite été assemblées en fonction de l’ordre des bases de l’ADN. Cette stratégie a permis récemment de décoder 144 bits d’information stockés dans une seule chaîne, mais a nécessité l’identification manuelle des fragments en pseudo-MS3. En effet, la flexibilité de la chaîne était telle qu’elle offrait la possibilité de réactions parasites induites par le radical carboné issu de la rupture de la liaison alcoxyamine. Ces réactions ont provoqué plusieurs voies de dissociation qui ont conduit à l’émergence de plusieurs pics indésirables qui ont abaissé l’intensité relative des pics d’intérêt. Deux stratégies ont été poursuivies dans cette thèse pour éviter ces réactions secondaires : réduire la réactivité du radical et rigidifier le squelette du polymère. En conséquence, plusieurs monomères alcoxyamines d’énergies de dissociation de liaison adéquates ont été conçus dans cette thèse, fonctionnalisés pour la synthèse nucléotidique et inclus dans la synthèse de poly(phosphodiester)s. La première stratégie s’est avérée insuffisante pour atteindre notre objectif, mais la seconde stratégie a conduit à un dérivé permettant une couverture complète de la séquence. Cependant, l’espaceur a réagi pendant la synthèse du polymère et plusieurs impuretés ont été détectées dans le spectre de masse du polymère. Cette expérience en masse a permis une compréhension plus approfondie de la réactivité de l’espaceur, de sorte que les travaux de recherche se sont concentrés sur une autre structure qui a été impliquée avec succès dans la synthèse de polymères et a permis un séquençage complet et automatisé de longs poly(phosphodiester)s.

Thesis resume

The constant growth of the digital world requires more and more storage space. Data is mainly stored on silicon-based devices, optical discs, and magnetic tapes but their life-times are counted in decades at best. Furthermore, their density is reaching its limit and the data produced each year may soon overcome the data storage available. Therefore, leading companies of the digital world like Microsoft have engaged efforts to produce DNA-based storage systems. This polymer presents several advantages, including its ability to leverage related biotechnology advances but also suffers from a major disadvantage: its structure is fixed by biology. Conversely, the structure of synthetic polymers can be chosen and adjusted to fit the user’s requirements in terms of writing and reading. This thesis is included in a project involving digital storage of information on poly(phosphodiester)s which proved able to produce polymer chains of size comparable to man-made DNA strands. These polymers are sequenced in mass spectrometry by dissociation of the phosphodiester bonds which allows retrieval of the original bits location by reading of the signal issued from fragmentation in MS/MS (or MS2) experiments. Yet, the longest chains underwent too many dissociation routes which jeopardized the signal readability. Alkoxyamine spacers were thus included to separate the poly(phosphodiester)s into shorter sub-segments. A DNA-base was assigned as tag to each sub-segment to shift their signal once separated. The spacer presented a low dissociation energy which favored its fragmentation in a first activation stage (MS/MS) over the fragmentation of all other bonds. The oligo(phosphodiester)s of each sub-segment were then dissociated individually in a second activation stage (pseudo-MS3) to retrieve the sequence of each sub-segment. The sequences were then assembled based on the order of the mass tags. This strategy recently allowed retrieval of 144 bits of information in a single chain but required manual identification of the fragments in pseudo-MS3. Indeed, the flexibility of the chain was so that the highly reactive carbon-radical issued from alkoxyamine fragmentation induced several undesired dissociation pathways leading to the emergence of several undesired peaks that lowered the relative abundance of interesting peaks. Two strategies were pursued in this thesis to prevent these side reactions: reducing the radical reactivity and increasing the stiffness of the backbone structure. Consequently, several alkoxyamine monomers of adequate bond dissociation energies were designed in this thesis, functionalized for nucleotidic synthesis, and included in poly(phosphodiester)s synthesis. The first strategy proved insufficient to meet our objective, but the second strategy led to a derivative which allowed full sequence coverage. Yet, the spacer reacted during the polymer synthesis and several impurities were detected in the MS signal of the polymer. This MS experiment allowed a deeper understanding of the reactivity of the spacer, so research work was focused on another structure which was successfully involved in polymer synthesis and allowed complete, automated sequencing of long poly(phosphodiester)s.