Soutenance de thèse de SEMEUX-BERNIER Aurore

Titre de thèse

Estimation non-invasive par magnétoencéphalographie de la zone
épileptogène : une approche par apprentissage automatique

Non-invasive estimation of the epileptogenic zone with magnetoencephalography: a
machine learning approach

Date

1 octobre 2025 à 14h00

Adresse

Aix-Marseille Université 27 bd Jean Moulin 13005 Marseille, salle de thèse N°2

Ecole doctorale

Recherches Biomédicales

Specialité

RECHERCHES BIOMEDICALES Neurologie, imagerie et santé mentale

Etablissement

Aix-Marseille Université

Mots clés

Magnétoencephalographie,Epilepsie pharmacorésistante,nalyse en composante indépendante.,Traitement du signal,Apprentissage automatique,Classification déséquilibrée,

Keywords

Magnetoencephalography,Drug-resistant epilepsy,Independent component analysis,Signal processing,Machine learning,Imbalanced classification,

Jury

Jury de thèse
Qualité	Nom	Etablissement
Directeur de recherche	M. BENAR Christian	Aix Marseille Université, INSERM, INS
Chargé de recherche	M. MOREAU Thomas	INRIA, CEA, Université Paris-Saclay
Professeure des universités - praticienne hospitalière	Mme GAVARET Martine	Université Paris Cité,
Associate Professor	M. HILLEBRAND Arjan	Université d'Amsterdam, UMC,
Chargée de recherche	Mme MERLET Isabelle	Univiversité de Rennes, INSERM, LTSI
Professeur des universités	M. RICHARD Frédéric	Aix Marseille Université
Directrice de recherche	Mme ACHARD Sophie	Université Grenoble Alpes, INRIA CNRS, LJK, STATIFY

Résumé de la thèse

L'épilepsie pharmacorésistante concerne environ 30% des patients. Pour rendre ces patients libres de crises, il est nécessaire de réséquer les zones du réseau épileptique qui génèrent l'activité pathologique. La méthode de référence pour cette évaluation préchirurgicale est l'électroencéphalographie (EEG) intracérébrale (stereotactic-EEG, SEEG), une opération lourde et invasive. Développer des techniques non-invasives pour le diagnostic de l'épilepsie serait donc une avancée majeure pour les patients.
La magnétoencéphalographie (MEG) est une méthode non-invasive performante qui permet d'enregistrer les décharges épileptiques (IEDs) survenant entre les crises (période intercritique). Cependant, son analyse est fastidieuse car elle demande l'identification visuelle de chaque IED dans un signal comportant plus de 200 canaux. Les IEDs sont d'ailleurs souvent superposées à des activités cérébrales provenant de différentes sources, ce qui complique leurs localisations. L'analyse en composantes indépendantes (ACI) permet de séparer au niveau des capteurs les différentes sources. Pour retrouver le réseau intercritique il s'agit par cette projection de sélectionner les composantes indépendantes (CI) contenant les IEDs.
Notre objectif dans ce projet de thèse est d'utiliser des méthodes de traitement du signal et d'apprentissage machine pour classer automatiquement les CIs en fonction de leurs activités sous-jacentes. Parallèlement à cela, nous voulons aussi évaluer la reproductibilité du réseau intercritique d'une transformation ACI à une autre sur quelques enregistrements.
Pour la classification, nous explorons d'abord l'utilisation de méthodes classiques d'apprentissage automatique, en se basant sur des caractéristiques du signal calculées à priori. Puis, nous testons des méthodes d'apprentissage profond censées retrouver les caractéristiques optimales pour séparer les différentes classes. Dans les deux cas, l'ACI a été calculée et chaque CI a été labélisée par un expert. Les modèles sont évalués par validation croisée en utilisant le F1-score, une métrique adaptée aux problèmes de classification déséquilibrés.
Suite à l'étude de la reproductibilité du réseau intercritique dans l'ICA, nous proposons des métriques liées à sa stabilité. Grâce aux études de classification nous montrons qu'il est possible de retrouver le réseau intercritique dans l'ACI avec un F1-score supérieur à 0.5 pour la moitié des sujets avec les méthodes d'apprentissage machine classique et pour les deux-tiers des sujets avec les méthodes d'apprentissage profond. En particulier, nous proposons un nouveau protocole se basant sur l'utilisation des méthodes de regroupements automatique d'événements préalablement détectés dans les CIs. Nous montrons l‘intérêt de la transformée en ondelettes, qui permet de diminuer le nombre de paramètres à apprendre des modèles tout en capturant dans le signal des informations multi-échelles. De façon intéressante, nous trouvons des moyens pour quantifier la différence faites par les experts entre les CIs ayant une activité épileptique évidente - pour laquelle aucun doute n'est soulevé – et, celles ayant des décharges épileptiques moins claires. Nous pouvons aussi classer avec des F1-score très élevés (supérieur à 0.9 pour 90% des sujets) les composantes artéfactuelles, en utilisant un modèle assez simple de forêt aléatoire.
Dans leur ensemble, les travaux de cette thèse démontrent le potentiel des méthodes d'apprentissage automatique dans l'évaluation pré-chirurgicale des signaux MEG. En effet, elles facilitent le travail visuel des cliniciens, pour l'instant très fastidieux. Ces techniques pourraient aussi permettre la création d'un indice d'épilepsie sur des données non-invasive. Toutefois, au vu des questions éthiques, il est essentiel que des études à plus grande échelles (multicentriques), qui prennent en compte les problématiques légales (protection des données), soient conduites.

Thesis resume

Drug-resistant epilepsy affects around 30% of patients. To render these patients seizure-free, it is necessary to resect the areas of the epileptic network that generate the pathological activity. The reference method for this pre-surgical assessment is intracerebral electroencephalography (EEG) (stereotactic-EEG, SEEG), a cumbersome and invasive operation. Developing non-invasive techniques for epilepsy diagnosis would therefore be a major step forward for patients.
Magnetoencephalography (MEG) is a high-performing, non-invasive method for recording epileptic discharges (IEDs) occurring between seizures (inter-ictal period). However, its analysis is tedious, requiring visual identification of each IED in a signal comprising over 200 channels. Moreover, IEDs are often superimposed on brain activity from different sources, complicating their localization. Independent Component Analysis (ICA) is used to separate the different sources at sensor level. To recover the inter-ictal network, the independent components (ICs) containing the IEDs can be selected.
Our aim in this thesis project is to use signal processing and machine learning methods to automatically classify ICs according to their underlying activities. In parallel, we also want to assess the reproducibility of the inter-ictal network from one ICA decomposition to another on several recordings.
For classification, we first explore the use of classical machine learning methods, based on signal characteristics calculated a priori. Then, we test deep learning methods designed to find the optimal characteristics for separating the different classes. In both cases, the ICA has been calculated, and each IC has been labeled by an expert. The models are evaluated by cross-validation using the F1-score, a metric adapted to imbalanced classification problems.
Following the study of the reproducibility of the inter-ictal network in ICA, we propose metrics related to its stability. Thanks to classification studies, we show that it is possible to retrieve the inter-ictal network in the ICA with an F1-score above 0.5 for half of the subjects with classical machine learning methods and for two-thirds of the subjects with deep learning methods. In particular, we propose a new protocol based on the use of automatic clustering methods for events previously detected in ICs. We demonstrate the value of the wavelet transform, which reduces the number of parameters to be learned from the models, while capturing multi-scale information in the signal. Interestingly, we find ways to quantify the difference made by experts between ICs with obvious epileptic activity - for which no doubt is raised - and those with less clear epileptic discharges. We can also classify artifactual components with very high F1-scores (above 0.9 for 90% of subjects), using a simple random forest model.
Taken as a whole, the work in this thesis demonstrates the potential of machine learning methods in the pre-surgical evaluation of MEG signals. Indeed, they facilitate the visual work of clinicians, which is currently very time-consuming. These techniques could also enable the creation of an epilepsy index on non-invasive data. However, in view of the ethical issues involved, it is essential that larger-scale (multicentre) studies are carried out, taking into account legal issues (data protection).