Soutenance de thèse de NGO Nicolas


Titre de thèse

Modélisation conjointe et prédiction dynamique du risque de survenue de troubles du rythme cardiaque

Joint modelling and dynamic prediction of the risk of occurence of heart rhythm disorders

Date

3 décembre 2025 à 14h00

Adresse

27 Bd Jean Moulin 13005 MARSEILLE, Salle de visioconférence

Ecole doctorale

Recherches Biomédicales

Specialité

RECHERCHES BIOMEDICALES Santé publique

Etablissement

Aix-Marseille Université

Mots clés

Modélisation conjointe,Prédiction dynamique,Fibrillation atriale,Intelligence artificielle,

Keywords

Joint modelling,Dynamic prediction,Atrial fibrillation,Artificial intelligence,

Jury

Jury de thèse
Qualité Nom Etablissement
Professeur des universités - praticien hospitalier M. GIORGI Roch Aix Marseille Université - APHM
Professeur des universités - praticien hospitalier M. RESCHE-RIGON Matthieu Université Paris Cité - APHP
Directrice de recherche Mme RONDEAU Virginie INSERM, Université de Bordeaux
Professeure des universités - praticienne hospitalière Mme MAUCORT-BOULCH Delphine Université Claude Bernard Lyon 1
Professeur des universités - praticien hospitalier M. MOLINARI Nicolas Université et CHU de Montpellier

Résumé de la thèse

La fibrillation atriale (FA) est l'arythmie cardiaque la plus fréquente et elle est associée à un risque d'accident vasculaire cérébral multiplié par cinq. Sa prévalence augmente dans le monde entier avec le vieillissement des populations, ce qui en fait un enjeu majeur de santé publique. Les épisodes de FA pouvant être asymptomatiques et se terminer spontanément, le diagnostic est souvent retardé, et la prédiction de la survenue des épisodes de FA demeure un défi important pour la prise en charge des patients. Dans ce contexte, il est essentiel de développer des approches statistiques
robustes et fiables, capable d'appuyer les stratégies de surveillances et de favoriser des interventions rapides et adaptées. Cette thèse aborde ces enjeux selon deux perspectives : la détection et la prédiction. Premièrement, nous avons étudié des méthodes de sélection de variables pour la détection de la FA à partir des intervalles R-R, en nous concentrant sur une mesure de séparabilité, la γ-metric. Nous avons évalué ses performances comme score d'importance univarié, puis nous l'avons étendue à la sélection multivariée de sous-ensembles de variables, et enfin, nous avons présenté une version pénalisée de la γ-metric. Bien que cette formulation pénalisée reste préliminaire, des premiers tests empiriques ont montré des résultats prometteurs. Ces approches ont été validées grâce à des études de simulation et appliquées à des enregistrements d'Holter, recueillis à l'Hôpital de La Timone (Marseille, France), où elles ont obtenu de bonnes performances par rapport aux méthodes de sélection de variables standards. Ces contributions soulignent l'apport de la γ-metric pour obtenir une détection efficace de la FA à partir d'ensembles de variables de grande dimension.
Deuxièmement, nous avons exploré la prédiction de la survenue d'épisodes de FA à l'aide de modèles conjoints et de biomarqueurs longitudinaux extraits de signaux électrocardiographiques. Après avoir présenté les aspects théoriques des modèles conjoints et les difficultés pratiques liées à l'identification et l'utilisation de bases de données adaptées, nous avons appliqué ces modèles à la base de données IRIDIA-AF. En utilisant le sample entropy calculé sur les intervalles R-R comme biomarqueur longitudinal, plusieurs modèles conjoints ont été développés et comparés. Durant ces
travaux, la validation par bootstrap a montré que des spécifications longitudinales plus flexibles permettaient d'obtenir une meilleure sensibilité, au prix de la spécificité plus faible, tandis que des modèles plus simples s'avéraient plus performants pour écarter les faux positifs. Surtout, cette méthodologie nous a permis de fournir des prédictions individualisées et mise-à-jour dans le temps, illustrant comment une modélisation dynamique peut être complémentaire des approches basées sur le machine learning ou encore les scores de risques cliniques.
Dans l'ensemble, cette thèse met en évidence le potentiel des approches statistiques pour améliorer la surveillance de la FA, qu'il s'agisse de méthodes de sélection de variables favorisant une détection robuste ou de modèles conjoints permettant une prédiction dynamique du risque. Cette thèse insiste également sur le rôle essentiel de la qualité des données, de leur annotation et du prétraitement. Les futurs travaux devraient mettre l'accent sur la validation de la γ-metric pénalisée, sur la construction de plus grandes bases de données annotées via les outils développés ou des bases publiques et sur l'extension des modèles conjoints pour intégrer plusieurs biomarqueurs longitudinaux ainsi que des covariables cliniques.


Thesis resume

Atrial fibrillation (AF) is the most common sustained cardiac arrhythmia and is associated with a five-fold increased risk of stroke. Its prevalence is rising worldwide with aging populations, making it a major public health concern. Because AF episodes can be asymptomatic and self-terminating, diagnosis is often delayed, and early detection and prediction remain challenges for patient care management. Reliable statistical approaches are therefore needed to support monitoring strategies and timely interventions.
This thesis addresses these challenges from two perspectives: detection and prediction. First, we investigated feature selection methods for AF detection from R-R interval data, with a focus on separability-based measure, the γ-metric. We evaluated its performance as a univariate ranking criterion, extended it to a multivariate feature subset selection, and introduced a penalized variant. While the penalized formulation remains preliminary, empirical tests showed promising results. These approaches were validated through extensive simulation studies and applied to clinical Holter
recordings collected at La Timone University Hospital (Marseille, France), where they demonstrated competitive performance compared with standard feature selection measures. Together, these contributions highlight the usefulness of separability-based indices for guiding efficient AF detection from high-dimensional feature sets.
Second, we explored AF onset prediction by applying joint modeling to longitudinal ECG-derived biomarkers. After reviewing theoretical aspects of joint models and the practical challenges of identifying suitable datasets, we applied the framework to the publicly available IRIDIA-AF database. Using sample entropy computed from R-R intervals as a longitudinal biomarker, several joint models were developed and benchmarked. Bootstrap-based validation showed that more flexible longitudinal specifications achieved higher sensitivity at the cost of specificity, while simpler models performed better at ruling out future AF events. Importantly, the framework provided individualized, time-updated risk predictions, illustrating how dynamic modeling can complement existing machine learning and risk score approaches.
Overall, this thesis demonstrates the potential of statistical approaches for improving AF monitoring, from feature selection methods supporting robust detection to joint models enabling dynamic risk prediction. It also emphasizes the critical role of data quality, annotation, and preprocessing. Future work should focus on validating the penalized γ-metric, building larger annotated datasets through preprocessing pipelines or public databases, and extending joint models to incorporate multiple
longitudinal biomarkers and clinical covariates.