Soutenance de thèse de DE OLIVEIRA BISPO Matheus
Titre de thèse
intégration complète des techniques d'apprentissage automatique avec des simulations de dynamique moléculaire non aradiabatique
full integration of machine learning techniques with nonadiabatic molecular dynamics simulations
Résumé de la thèse
Les simulations de dynamique moléculaire non adiabatique (NAMD) sont largement utilisées pour explorer l'évolution temporelle de systèmes moléculaires photo-excités, susceptibles d'accéder à plusieurs surfaces d'énergie potentielle au cours de la dynamique. Les récents progrès de l'apprentissage automatique (Machine Learning, ML) ont permis d'accélérer la NAMD grâce à des méthodes supervisées capables de prédire les énergies et les forces nécessaires à la propagation des trajectoires. Cette accélération ouvre la voie à une meilleure description statistique des réactions photochimiques, en augmentant le nombre de trajectoires simulées. L'un des principaux obstacles à l'adoption du ML en NAMD réside toutefois dans l'absence de protocoles et d'outils logiciels clairement établis pour l'entraînement et le déploiement de potentiels ML, ce qui freine leur diffusion. Pour répondre à ce besoin, je propose un flux de travail complet pour la NAMD avec potentiels ML, allant de l'échantillonnage des géométries et de l'entraînement des modèles via l'apprentissage actif, jusqu'à l'analyse des trajectoires et des propriétés par apprentissage non supervisé, permettant la caractérisation des mécanismes réactionnels et des photoproduits. Ce flux de travail est conçu pour être flexible et robuste, applicable à différents systèmes moléculaires et capable de traiter des jeux de données complexes et volumineux. Il est implémenté dans deux logiciels libres et open-source en Python : MELTS, dédié à l'apprentissage actif, et ULaMDyn, dédié à l'apprentissage non supervisé, tous deux intégrés à la suite Newton-X.
Thesis resume
Nonadiabatic Molecular Dynamics (NAMD) simulations are widely used for exploring the time evolution of photoexcited molecular systems, which are able to access multiple potential energy surfaces during dynamics. Recent advancements in Machine Learning (ML) enabled the acceleration of NAMD using supervised learning methods to predict the necessary energies and forces for driving these simulations. This, in turn, can be exploited for improving statistical descriptions of photochemical reactions by increasing the number of trajectories being propagated. One significant challenge facing the adoption of ML techniques in NAMD simulations is the lack of clear protocols and software for training and deploying ML potentials, which hinders their widespread adoption. To address this challenge, I present a comprehensive end-to-end workflow for NAMD simulations with ML potentials, from geometry sampling and model training using active learning to the analysis of trajectories and properties using unsupervised learning, allowing the characterization of reaction mechanisms and photoproducts. This workflow is designed to be flexible and robust, applicable to different molecular systems and capable of handling large and complex datasets. It is implemented in two free and open source Python packages: MELTS for active learning and ULaMDyn for unsupervised learning, both integrated within the Newton-X software suite.