Soutenance de thèse de MESBAH Ismahene


Titre de thèse

Décodage des plis structurels, séquences et motifs structurels des protéines pour la stabilité mécanique des protéines

Decoding protein structural folds, sequence and structural motifs for the mechanical stability of proteins

Date

25 septembre 2025 à 14h00

Adresse

163 boulevard de Luminy 13009, Amphi 10

Ecole doctorale

Sciences du Vivant

Specialité

SCIENCES DU VIVANT Biochimie Structurale

Etablissement

Aix-Marseille Université

Mots clés

stabilité mécanique,plis proteine,motifs de séquence et de structure,microscopie à force atomique,

Keywords

mechanical stability,protein folds,sequence and structural motifs,atomic force microscopy,

Jury

Jury de thèse
Qualité Nom Etablissement
Professeur M. RICO Felix INSERM, Aix-Marseille Université
Professeur Mme DOUGAN Lorna University of Leeds
Directeur de recherche M. PELLEQUER Jean-Luc Institut de Biologie structurale de grenoble
Directeur de recherche Mme HABERMANN Bianca CNRS, Aix-Marseille
Professeur Mme GRäTER Frauke Max Planck Institute
Directeur de recherche M. REGUERA Juan AFMB, INSERM, AIx-Marseille Université

Résumé de la thèse

es forces mécaniques jouent un rôle déterminant dans la fonction des protéines,
avec des motifs de séquence spécifiques et des repliements structuraux ayant évolué pour
résister au stress mécanique dans des contextes biologiques variés. Bien qu'il soit établi
que les protéines composées de feuillets β présentent généralement une stabilité
mécanique supérieure à celle des structures α-hélicoïdales, prédire les forces nécessaires
au dépliement d'une protéine à partir de sa seule séquence ou de son repliement structural
demeure un défi majeur. Ce travail a porté sur l'élucidation des liens entre séquence,
structure et stabilité mécanique en intégrant des expériences de spectroscopie de force,
des simulations moléculaires et des analyses bioinformatiques. La sélection des protéines
cibles: le domaine I27 de la titin, le quatrième domaine d'ICAM-1, le deuxième domaine
de VCAM-1 et le premier domaine extracellulaire de la Cadherin-23, a été guidée par
MechanoProDB, une ressource soigneusement annotée des propriétés mécaniques des
protéines, qui a permis une priorisation et une sélection rationnelle des domaines
candidats. En utilisant l'alignement des matrices de distances (DALI) et des
comparaisons de séquences, un court motif conservé, [NE][LI][KQR]V, a été identifié
dans les brins β terminaux de ces protéines comme un élément critique pour la stabilité
mécanique, en accord avec les connaissances préalables sur le rôle de cette région dans le
dépliement du domaine I27.
Les simulations de dynamique moléculaire dirigée (SMD) effectuées sur les
protéines de type sauvage et sur des mutants ciblés ont révélé que les résidus de ce motif
contribuent à la stabilité mécanique des protéines étudiées. Ces simulations, qui
reproduisent les expériences de traction par microscopie à force atomique (AFM) avec
une résolution atomique, ont fourni des informations détaillées sur les positions
atomiques, les profils d'extension, les forces de rupture et les transitions structurales sous
contrainte. De manière essentielle, des expériences de spectroscopie de force par AFM
ont été réalisées sur les protéines de type sauvage afin de valider les prédictions issues
des simulations SMD. Pour garantir une analyse rigoureuse et la reproductibilité des
résultats, un logiciel dédié et librement accessible a été développé pour le traitement
automatisé des données de spectroscopie de force AFM, permettant une détection précise
et une caractérisation des événements de dépliement sur divers instruments et formats de
fichiers, sans nécessiter de compétences en programmation. En parallèle, une interface
d'analyse basée sur Python a été mise en place pour traiter les résultats des simulations
SMD, avec une quantification des relations force-extension, du travail apparent et des
perturbations structurales. Associée à MechanoProDB, qui offre une plateforme
centralisée et accessible en ligne pour la curation et l'exploration interactive des données
mécaniques issues de la littérature, cette infrastructure permet une comparaison
systématique des séquences, des structures et des comportements mécaniques des
protéines. En combinant simulations et validations expérimentales, ce travail apporte de
nouveaux éclairages mécanistiques sur la manière dont des éléments de séquence
spécifiques gouvernent la stabilité mécanique des protéines.


Thesis resume

Mechanical forces play a critical role in shaping protein function, with specific
sequence motifs and structural folds evolved to resist mechanical stress in diverse
biological contexts. While it is established that β-sheet proteins generally exhibit greater
mechanical stability than α-helical structures, predicting unfolding forces based solely on
sequence or structural fold remains a significant challenge. This work focused on
elucidating the relationship between sequence, structure, and mechanical stability by
integrating experimental force spectroscopy, molecular simulations, and bioinformatics
analysis.
The selection of target proteins: the I27 domain of titin, the fourth domain of
ICAM-1, the second domain of VCAM-1, and the first extracellular domain of
Cadherin-23, was guided by MechanoProDB, a curated resource of protein mechanical
properties developed during this thesis that enabled rational prioritization and selection of
protein domains candidates. Using distance matrix alignment (DALI) and sequence
comparisons, a conserved short motif, [NE][LI][KQR]V, was identified in the terminal
β-strands of these proteins as a critical candidate for mechanical stability, consistent with
prior knowledge about the role of this region in I27 unfolding. A key finding of this
thesis is the contribution of hydrophobic residues within the motif to the mechanical
stability of these protein domains and, likely, of most Ig folds.
Steered molecular dynamics (SMD) simulations of wild-type proteins and
targeted mutants revealed that residues within this motif contribute to mechanical
stability of the selected proteins. These simulations, which mimic atomic force
microscopy (AFM) pulling experiments at atomic resolution, provided detailed insights
into atomic positions, extension profiles, rupture forces, and structural transitions under
force. Importantly, AFM force spectroscopy experiments were conducted on wild-type
proteins to widen the dynamic pulling range and to validate the SMD predictions. To
support rigorous analysis and reproducibility, a dedicated, freely accessible software
package (PyFMSpec) was developed for the automated processing of AFM force
spectroscopy data, enabling accurate detection and characterization of unfolding events
across various instruments and file formats without requiring coding expertise. In
parallel, a Python-based analysis interface (PySteMoDA) was established to analyze
SMD simulation outputs, quantifying force-extension relationships, apparent work, and
structural perturbations. Together with MechanoProDB, which provides a centralized,
web-accessible platform for the curation and interactive exploration of mechanical data
from literature, these resources enable systematic comparison of sequence, structure, and
mechanical behavior across proteins.
By combining simulation and experimental validation, this work provides new
mechanistic insights into how specific sequence elements govern protein mechanical
stability