Soutenance de thèse de BOULIF Abir
Titre de thèse
Apport de l'Intelligence Artificielle au diagnostic automatisé des arythmies
Artificial intelligence for Arrhythmia diagnosis
Résumé de la thèse
Selon le rapport 2023 de la World Heart Federation (WHF), les maladies cardiovasculaires (MCV) représentent une menace globale pour la population, puisque les décès dus aux MCV ont augmenté de 60 % dans le monde au cours des 30 dernières années. En 2020, les maladies cardiovasculaires étaient la deuxième cause de mortalité en France, avec 134 763 décès, selon Drees - Ministère des Solidarités et de la Santé, ce qui représente 20.2 % de l'ensemble des décès de cette année-là. Pour contribuer à faire baisser le taux de mortalité par les MCV, il est essentiel de mettre en place en priorité des outils de prévention des infarctus du myocarde (IDM) et des accidents vasculaires cérébraux (AVC) prématurés, puisque 80 % d'entre eux peuvent être évités.
Les arythmies étant un facteur de risque des crises cardiaques, leur détection précoce revêt une importance majeure dans le domaine médical. Cependant, ce processus peut être chronophage en raison du temps considérable nécessaire pour analyser manuellement les enregistrements d'électrocardiogramme (ECG), souvent perturbés par du bruit et des artefacts, ce qui complique davantage l'interprétation des données.
Différentes méthodes traditionnelles d'apprentissage automatique (Machine Learning, ML) ont été mises en œuvre pour le diagnostic des arythmies, montrant des résultats prometteurs mais également certaines limitations. Parmi celles-ci, la phase d'extraction manuelle des caractéristiques constitue un point critique. Cette étape dépend fortement de la qualité des caractéristiques sélectionnées, ce qui peut entraîner des biais et une efficacité limitée si les caractéristiques importantes ne sont pas correctement identifiées.
De plus, les signaux ECG contiennent souvent du bruit provenant de diverses sources. Les algorithmes de ML classiques sont sensibles à ces perturbations, bien qu'elles puissent être atténuées par des techniques de filtrage lors du prétraitement. Les approches classiques de ML, telles que les arbres de décision ou les régressions logistiques, peuvent également être limitées dans leur capacité à capturer des relations complexes ou non linéaires présentes dans les signaux ECG. En outre, ces méthodes peuvent rencontrer des difficultés dans le traitement de grandes bases de données en raison de leur complexité algorithmique.
Le déséquilibre des classes dans les ensembles de données complique davantage l'entraînement des modèles, rendant difficile la reconnaissance des arythmies rares sans augmenter le nombre de faux positifs. En somme, ces limitations peuvent compromettre la robustesse de la classification.
Deux contributions majeures sont proposées dans cette thèse. Tout d'abord, une nouvelle variante de la technique d'augmentation des données SMOTE est développée, pour augmenter le nombre de battements cardiaques appartenant aux classes rares, en trouvant les battements voisins les plus similaires, à l'aide de la mesure de similarité DTW. Ensuite, ce travail s'est appuyé sur des architectures avancées du Deep Learning, incluant et fusionnant plusieurs types des réseaux de neurones. Des blocs de Modulation Focale sont appliqués aux signaux ECG pour la première fois dans ce travail. Ils permettent au modèle de classification de se concentrer de manière sélective sur des parties spécifiques des entrées, tout en s'appuyant sur des opérations plus légères. Ce processus repose d'abord sur une agrégation des informations, suivie d'une interaction entre les différentes parties agrégées de l'entrée. Cet ordre permet au modèle de se focaliser mieux sur les parties pertinentes de l'information.
En comparaison avec d'autres méthodes rapportées dans la littérature, les résultats obtenus témoignent d'une amélioration notable de la détection des arythmies grâce aux méthodes proposées.
Thesis resume
According to the 2023 report of the World Heart Federation (WHF), cardiovascular diseases (CVD) represent a global threat to the population, since deaths due to CVD have increased by 60% worldwide in the past 30 years. In 2020, cardiovascular diseases were the second leading cause of death in France, with 134,763 deaths, according to Drees - Ministère des Solidarités et de la Santé, this represents 20.2% of all deaths in that year. To help bring down the rate of CVD mortality, it is essential to prioritize implementing tools to prevent premature myocardial infarction (MI) and strokes since 80% of these can be avoided.
As arrhythmias are a risk factor for heart attacks, their early detection is of major medical importance. However, this process can be time-consuming due to the considerable amount of time required to manually analyse electrocardiogram (ECG) recordings, which are often disturbed by noise and artefacts, further complicating data interpretation.
Various traditional machine learning (ML) methods have been used to diagnose arrhythmias, showing promising results but also certain limitations. Among these, the manual feature extraction phase is a critical point. This stage is highly dependent on the quality of the features selected, which can lead to bias and limited effectiveness if important features are not correctly identified. In addition, ECG signals often contain noise from a variety of sources. Conventional ML algorithms are sensitive to these disturbances, although they can be mitigated by filtering techniques during pre-processing. Classical ML approaches, such as decision trees or logistic regressions, may also be limited in their ability to capture complex or non-linear relationships present in ECG signals. Moreover, these methods may encounter difficulties in processing large databases due to their algorithmic complexity. Class imbalance in datasets further complicates model training, making it difficult to recognise rare arrhythmias without increasing the number of false positives. In conclusion, these limitations can compromise the robustness of classification.
Two major contributions are proposed in this thesis. First, a new variant of the SMOTE data augmentation technique is developed, to increase the number of heartbeats belonging to rare classes, by finding the most similar neighboring beats, using the DTW similarity measure. Next, this thesis relied on advanced Deep Learning architectures, including and merging several types of neural networks. Focal Modulation blocks are applied to ECG signals for the first time in this work. They allow the classification model to focus selectively on specific parts of the inputs while relying on lightweight operations. This process is based firstly on an aggregation of the information, followed by an interaction between the different aggregated parts of the input. This order allows the model to focus more effectively on the relevant parts of the information.
Experimental results revealed that the new variant of the SMOTE method significantly improved the accuracy of heartbeat diagnosis compared with the conventional SMOTE method. In addition, the two deep learning approaches developed achieved accuracy values of 98.99% and 98.61%, as well as F1-scores of 94.77% and 94.08%, respectively, and a classification time of 0.0002 s per sample for the second approach. Furthermore, compared with other methods reported in the literature, the results obtained show a significant improvement in arrhythmia detection using the proposed methods.