Soutenance de thèse de SERGENT Isaure


Titre de thèse

Apport de la Spectrométrie de Mobilité Ionique au Décodage de Polymères Numériques

Exploring Benefits of Ion Mobility Spectrometry for Digital Polymer Sequencing

Date

26 septembre 2024 à 9h30

Adresse

Bâtiment TD (DLV), Faculté des Sciences, Site St Jérôme, Aix Marseille Université, 52 Avenue Escadrille Normandie Niemen, 13013 Marseille, Salle des thèses

Ecole doctorale

Sciences Chimiques - Marseille

Specialité

Sciences Chimiques

Etablissement

Aix-Marseille Université

Mots clés

Spectrométrie de Masse,Spectrométrie de Mobilité Ionique,Modélisation Moléculaire,Polymères Numériques,Séquençage en série,poly(phosphodiesters),

Keywords

Mass Spectrometry,Ion Mobility Spectrometry,Molecular Modeling,Digital Polymers,Serial Sequencing,poly(phosphodiesters),

Jury

Jury de thèse
Qualité Nom Etablissement
Professeur des universités Mme CHARLES Laurence Aix Marseille Université
Professeure des universités Mme GABELICA Valérie Université de Genève
Maîtresse de conférences Mme LAVANANT Hélène Université de Rouen
Maître de conférences M. CHIROT Fabien Université Claude Bernard Lyon 1
Directeur de recherche M. LUTZ Jean-François Université de Strasbourg
Maîtresse de conférences Mme GAUDEL-SIRI Anouk Aix Marseille Université

Résumé de la thèse

Cette thèse avait pour objectif d'accélérer le processus de lecture de polymères numériques (ou digitaux), récemment proposés comme une alternative aux média traditionnels pour le stockage de données froides. Dans ces polymères synthétiques, une séquence contrôlée de comonomères utilisés comme les lettres d'un alphabet permet d'écrire des informations qui peuvent être lues par séquençage MS/MS. A ce jour, les poly(phosphodiester)s (PPDEs) sont les polymères les plus prometteurs pour le stockage massif de données à l'échelle moléculaire. La structure à blocs de ces PPDEs a été conçue pour faciliter la lecture de chaines dont la taille dépasse les limites analytiques de la MS/MS. En plaçant des espaceurs clivables toutes les huit unités, de longues chaines peuvent être déconstruites en blocs plus courts, donc séquençables. Un système de marquage des blocs basé sur la masse permet de retrouver leur position initiale dans la chaine. Cette architecture implique une méthodologie de lecture multi-étape avec une première activation (MS²) pour libérer les blocs et autant d'expériences MS3 que de blocs à séquencer. Ce processus de lecture permet le décodage sans erreur des informations mais reste peu efficace pour des analyses à haut débit.
Pour accélérer le décodage de ces polymères digitaux, la stratégie élaborée dans ces travaux de thèse a consisté à transformer cette procédure multi-étape en une seule expérience où les blocs libérés de la chaine initiale sont séquencés en ligne grâce à une séparation par mobilité ionique avant leur injection dans la cellule de collision. Le rôle principal des polymères digitaux étant d'être lus, leurs éléments structuraux peuvent être adaptés aux exigences de la lecture. Dans ce contexte, l'idée a été d'exploiter les marqueurs de position pour modifier la conformation des blocs et ainsi assurer la séparation IMS indispensable au séquençage en série. Les propriétés conformationnelles pouvant être modélisées, une approche prédictive des sections efficaces de collision (CCS) par calculs théoriques a été adoptée pour éviter une démarche couteuse d'essai-erreur. Pour ce faire, la fiabilité des calculs devait être préalablement validée par comparaison avec des données expérimentales dont la robustesse reposait exclusivement sur la qualité de la calibration de l'instrument TWIMS utilisé, procédure d'étalonnage d'autant plus complexe que les analytes étudiés sont des polyanions. Ce premier verrou a été levé avec la mise en œuvre, en mode négatif, du logiciel IMSCal et l'utilisation de composés modèles a permis d'établir un protocole de simulation optimal. L'étude détaillée du comportement IMS d'une chimiothèque de PPDEs a montré la faisabilité du séquençage en série et un outil de composition des messages a été élaboré. Cependant, la nature des informations décodables reste limitée car la composition comonomérique des blocs influence également leur CCS. Pour répondre au besoin de marqueurs supplémentaires, l'approche prédictive a été mise en œuvre pour la conception de nouvelles structures. A cet effet, les réactifs utilisés en synthèse pour introduire les marqueurs ont pu être exploités comme modèles simplifiés des blocs, permettant une réduction significative du coût et de la complexité des calculs. La combinaison d'expériences IMS et MS/MS avec la modélisation moléculaire a également permis de rationaliser l'influence de l'état de charge des blocs sur leur comportement dissociatif, phénomène révélé au cours de ces travaux de thèse.


Thesis resume

The aim of this thesis was to accelerate the reading process of digital polymers, recently proposed as an alternative to traditional media for cold data storage. In these synthetic polymers, a controlled sequence of co-monomers used as the letters of an alphabet allows writing of information that can be read by MS/MS sequencing. To date, poly(phosphodiester)s (PPDEs) are the most promising polymers for massive data storage at the molecular scale. The block structure of these PPDEs has been designed to facilitate the reading of chains whose size exceeds the analytical limits of MS/MS. By placing cleavable spacers every eight units, long chains can be deconstructed into shorter, sequencable blocks. A mass-based block tagging system enables the initial position of each block in the chain to be retrieved. This architecture implies a multi-stage reading methodology, with a first activation (MS²) to release the blocks and as many MS3 experiments as blocks to be sequenced. This reading process enables error-free decoding of the information but is poorly efficient for high-throughput analysis.
To speed up the decoding process of these digital polymers, the strategy developed in this thesis involves transforming this multi-stage procedure into a single experiment in which blocks released from the initial chain are sequenced on-line by performing ion mobility separation before their injection in the collision cell. As the sole purpose of digital polymers is to be read, their structural features can be tuned to address requirements of the reading process. In this context, the idea was to exploit location mass-tags to also modify block conformation and thus ensure the IMS separation required for serial sequencing. As conformational properties can be modeled, a predictive approach to collision cross-sections (CCS) using theoretical calculations was adopted to avoid a costly trial-and-error approach. To do this, the reliability of the calculations had to be validated with experimental data, the robustness of which depends exclusively on the quality of the calibration of the TWIMS instrument. This calibration procedure that was all the more complex as the analytes studied were polyanions. This first challenge was overcome with the implementation, in the negative ion mode, of the IMSCal software, and the use of model compounds enabled us to establish an optimal simulation protocol. A detailed study of the IMS behavior of a PPDE library permitted to demonstrate the feasibility of serial sequencing, and a tool to properly compose messages was developed. However, the type and amount of information that can be decoded remain limited, as the comonomeric composition of the blocks also influences their CCS. To propose additional markers, the predictive approach was used to design new structures. To this end, the reagents used in PPDE synthesis to introduce the mass-tags could be usefully employed as simplified models of the blocks, enabling a significant reduction in the cost and complexity of the calculations. Combining IMS and MS/MS experiments with molecular modeling also allowed us to rationalize the influence of the block charge state on their dissociative behavior, a phenomenon revealed during this thesis work.