Ecole Doctorale

SCIENCES CHIMIQUES - Marseille

Spécialité

Sciences Chimiques

Etablissement

Aix-Marseille Université

Mots Clés

Spectrométrie de masse,Polymères encodés,Séquençage,MS/MS,Polymères synthétiques à séquence contrôlée,

Keywords

Mass Spetrometry,Encoded polymers,Sequencing,MS/MS,Sequence-controlled synthetic polymers,

Titre de thèse

Méthodologies de séquençage MS/MS de polymères encodés
MS/MS sequencing methodologies of encoded polymers

Date

Jeudi 5 Septembre 2019 à 10:00

Adresse

Aix Marseille Université Campus Scientifique St Jérôme Avenue Escadrille Normandie Niemen 13397 Marseille Cedex 20, France Amphi Ponte

Jury

Directeur de these Mme Laurence CHARLES Aix Marseille Université
Rapporteur M. Chrys WESDEMIOTIS The University of Akron
Rapporteur M. Frédéric AUBRIET Université de Lorraine
Examinateur Mme Christine ENJALBAL Université de Montpellier
Examinateur Mme Trang N.T. PHAN Aix Marseille Université
Examinateur M. Jean-François LUTZ Institut Charles Sadron

Résumé de la thèse

Ces travaux de thèse avaient pour objectif de développer des stratégies de séquençage par spectrométrie de masse pour décoder des messages binaires inscrits dans des polymères synthétiques à séquence contrôlée. Ces polymères digitaux sont constitués de chaînes monodisperses dans lesquelles la séquence contrôlée des co-monomères, définis comme les lettres d’un alphabet, est utilisée pour stocker des messages à l’échelle moléculaire. Lire de tels messages est typiquement un exercice de séquençage qui peut être réalisé par spectrométrie de masse en tandem à condition d’atteindre une couverture de séquence totale. Pour remplir cette condition, la dissociation des chaînes doit se produire par rupture de liaisons du squelette polymérique mais ne pas générer de trop nombreux fragments pour éviter une dilution du signal. Parce que le comportement dissociatif d’un polymère est dicté par la nature de ses liaisons chimiques, une approche classique consiste à ne retenir que les candidats pour lesquels la simplicité des spectres MS/MS obtenus pour des chaînes courtes constitue un élément prometteur pour le séquençage de longues chaînes. Cette méthodologie permet de rationaliser les efforts de synthèse mais reste une approche par essais et erreurs. Ces travaux de thèse ont permis de proposer une stratégie plus efficace, où les données MS/MS sont utilisées pour optimiser la structure de longs polymères afin d’améliorer leur lisibilité. Ce concept de “design assisté par MS/MS” a été appliqué au cas des poly(phosphodiester)s qui restaient difficiles à séquencer au delà de 50 unités du fait de la complexité dissociative des groupements phosphates. Leur structure a donc été modifiée en plaçant des liaisons alcoxyamines, de faible énergie dissociative, entre chaque unité (ou bit), ce qui a permis de grandement simplifier les données spectrales en rendant toute autre liaison muette en MS/MS. Seules les capacités résolutives instrumentales ont limité le séquençage à des chaînes d’environ 40 unités, ce qui correspond en fait à 80 bits d’information lorsque l’alcoxyamine est aussi utilisée comme un second segment codant pour augmenter la densité de stockage. Ce premier design moléculaire a contribué à l’élaboration de polymères encore plus efficients, les poly(alcoxyamine phosphodiester)s à blocs, dans lesquels une liaison alcoxyamine est placée entre chaque octet (8 bits) d’information. La lecture de longs messages a été réalisée dans des expériences MS3, où les fragments contenant un seul octet et générés pendant la première étape d’activation sont séquencés individuellement au cours de la seconde étape. L’utilisation d’un système de marqueurs pour déterminer la localisation initiale de chaque octet permet la restitution de la séquence complète.

Thesis resume

This thesis work aimed at developing sequencing strategies based on mass spectrometry to read binary messages encoded in sequence-controlled synthetic polymers. These digital polymers are monodisperse chains where the controlled sequence of co-monomers, defined as letters of an alphabet, is used to store information at the molecular level. Reading such messages is a sequencing task that can be performed by tandem mass spectrometry, providing that full sequence coverage is achieved. To fulfill this requirement, dissociation reactions should proceed via efficient backbone bond cleavages but the number of fragment series must be limited to avoid signal dilution. Because dissociation behavior of polymers is dictated by the types of bonds composing their skeleton, one usual approach consists of selecting only those candidates that yield simple MS/MS spectra for short chains as a promising condition for sequencing longer ones. This methodology permits to rationalize synthesis efforts on the way to long encoded polymers but highly relies on trials and errors. This thesis work proposed a more efficient strategy, where MS/MS data are used to re-engineer the molecular structure of long polymers for best readability. This “MS/MS-assisted design” concept was applied to poly(phosphodiester)s that could hardly be sequenced above DP ≈ 50 due to complex dissociation of phosphate groups. Their structure was then modified by placing low dissociation energy alkoxyamine linkages between each unit (or bit), which made any other chemical bonds MS/MS-silent and greatly simplified spectral data. Due to instrumental resolution capabilities, the upper sequencing limit was 40 units, which actually corresponded to 80 bits of information when using the alkoxyamine moiety also as a second coding segment to increase storage density. This first design paved the way to the development of byte-truncated poly(alkoxyamine phosphodiester)s, a more MS/MS-efficient structure in which alkoxyamine bonds were placed between each byte (8 bits) of information. Long messages could be read in MS3 experiments, where single-byte containing fragments released during the first activation stage were further dissociated for sequencing. The whole sequence was readily re-constructed thanks to a mass tagging system used to determine the original location of each byte in the polymer chain