Soutenance de thèse de DE OLIVEIRA BISPO Matheus


Titre de thèse

intégration complète des techniques d'apprentissage automatique avec des simulations de dynamique moléculaire non aradiabatique

full integration of machine learning techniques with nonadiabatic molecular dynamics simulations

Date

7 November 2025 à 9h00

Adresse

Batiment Administratif, Faculté des Sciences Site St Jérôme, Aix Marseille Université, 52 Avenue Escadrille Normandie Niemen, 13013 Marseille, Amphithéâtre De Saporta

Ecole doctorale

Sciences Chimiques - Marseille

Specialité

Sciences Chimiques

Etablissement

Aix-Marseille Université

Mots clés

Apprentissage automatique,dynamique non adiabatique,État excitée,

Keywords

Machine Learning,Non-adiabatic dynamics,Excited State,

Jury

Jury de thèse
Qualité Nom Etablissement
Professeur M. BARBATTI Mario Aix Marseille Université, ICR
Professeur M. FRIEDERICH Pascal Karlsruhe Institute of Technology, AiMat
Professeur M. VARNEK Alexandre Université de Strasboug, CMC UMR 7140
Maîtresse de conférences Mme WESTERMAYR Julia Leipzig Universität
Maîtresse de conférences Mme CANNUCCIA Elena Aix-Marseille Université, PIIM
Professeur M. HUMBEL Stéphane Aix-Marseille Université, iSm2

Résumé de la thèse

Les simulations de dynamique moléculaire non adiabatique (NAMD) sont largement utilisées pour explorer l'évolution temporelle de systèmes moléculaires photo-excités, susceptibles d'accéder à plusieurs surfaces d'énergie potentielle au cours de la dynamique. Les récents progrès de l'apprentissage automatique (Machine Learning, ML) ont permis d'accélérer la NAMD grâce à des méthodes supervisées capables de prédire les énergies et les forces nécessaires à la propagation des trajectoires. Cette accélération ouvre la voie à une meilleure description statistique des réactions photochimiques, en augmentant le nombre de trajectoires simulées. L'un des principaux obstacles à l'adoption du ML en NAMD réside toutefois dans l'absence de protocoles et d'outils logiciels clairement établis pour l'entraînement et le déploiement de potentiels ML, ce qui freine leur diffusion. Pour répondre à ce besoin, je propose un flux de travail complet pour la NAMD avec potentiels ML, allant de l'échantillonnage des géométries et de l'entraînement des modèles via l'apprentissage actif, jusqu'à l'analyse des trajectoires et des propriétés par apprentissage non supervisé, permettant la caractérisation des mécanismes réactionnels et des photoproduits. Ce flux de travail est conçu pour être flexible et robuste, applicable à différents systèmes moléculaires et capable de traiter des jeux de données complexes et volumineux. Il est implémenté dans deux logiciels libres et open-source en Python : MELTS, dédié à l'apprentissage actif, et ULaMDyn, dédié à l'apprentissage non supervisé, tous deux intégrés à la suite Newton-X.


Thesis resume

Nonadiabatic Molecular Dynamics (NAMD) simulations are widely used for exploring the time evolution of photoexcited molecular systems, which are able to access multiple potential energy surfaces during dynamics. Recent advancements in Machine Learning (ML) enabled the acceleration of NAMD using supervised learning methods to predict the necessary energies and forces for driving these simulations. This, in turn, can be exploited for improving statistical descriptions of photochemical reactions by increasing the number of trajectories being propagated. One significant challenge facing the adoption of ML techniques in NAMD simulations is the lack of clear protocols and software for training and deploying ML potentials, which hinders their widespread adoption. To address this challenge, I present a comprehensive end-to-end workflow for NAMD simulations with ML potentials, from geometry sampling and model training using active learning to the analysis of trajectories and properties using unsupervised learning, allowing the characterization of reaction mechanisms and photoproducts. This workflow is designed to be flexible and robust, applicable to different molecular systems and capable of handling large and complex datasets. It is implemented in two free and open source Python packages: MELTS for active learning and ULaMDyn for unsupervised learning, both integrated within the Newton-X software suite.