Ecole Doctorale

Sciences de la Vie et de la Santé

Spécialité

Biologie-Santé - Spécialité Recherche Clinique et Santé Publique

Etablissement

Aix-Marseille Université

Mots Clés

Détection,Epidémies,Séries temporelles,Surveillance épidémiologique,Analyse,

Keywords

Detection,Outbreak,Time series,Health surveillance,Analysis,

Titre de thèse

Place des outils d’analyse des séries temporelles dans la surveillance épidémiologique pour la détection des épidémies et leur analyse.
Developing tools for analyzing time series data in health surveillance for outbreak detection and analysis.

Date

Lundi 17 Décembre 2018 à 14:00

Adresse

Faculté de Médecine, 27 bd Jean Moulin - 13385 Marseille cedex 5 Salle de thèse numéro 2 Salle des thèses n02

Jury

Directeur de these M. Jean-Baptiste MEYNARD Centre d'épidémiologie et de Santé Publique des armées
Rapporteur M. Jean-Paul BOUTIN Service de Santé des Armées
Rapporteur M. Rémy MICHEL Service de Santé des Armées
CoDirecteur de these Mme Aurélie MAYET Centre d'épidémiologie et de Santé Publique des Armées
Examinateur M. Jean GAUDART AMU / SESSTIM
Examinateur M. Yann LE STRAT Santé Publique France

Résumé de la thèse

La surveillance épidémiologique est le recueil systématique et continu d'informations sur l'état de santé des populations, leur analyse, leur interprétation et leur diffusion à tous les décideurs ayant besoin d'être informés. Un de ses objectifs est la détection des événements inhabituels, i.e. des épidémies, nécessitant la mise en place rapide de contre-mesures. De nombreuses méthodes permettent de détecter une épidémie : expérience de l'épidémiologiste en charge du système de surveillance, analyse graphique des données ou analyses statistiques. La détection des épidémies à partir des données de surveillance est un véritable enjeu de santé publique et de nombreuses équipes de recherche se sont lancées dans le développement d'outils statistiques spécifiques, chacune proposant une méthode d’évaluation. De plus, une fois les épidémies détectées, l’identification des déterminants de l'épisode passe par une investigation épidémiologique étiologique afin de guider la mise en place de contre-mesures spécifiques. Pourtant, les dispositifs de surveillance épidémiologique permettent parfois le recueil d'informations suffisantes pour caractériser ces épidémies et permettre d'en déterminer les causes, à condition d'utiliser des outils statistiques adaptés, en complément ou à la place de l'investigation de l'épidémie. Les objectifs de ce travail de thèse sont : (i) d’évaluer les principales méthodes statistiques de détection des épidémies publiées et communément employées dans différents systèmes de surveillance épidémiologique, (ii) de proposer une nouvelle approche reposant sur la combinaison optimale de méthodes de détection statistique des épidémies et la comparer aux autres méthodes et (iii) de développer une nouvelle méthode statistique d'analyse étiologique d'une épidémie à partir des données de surveillance épidémiologique collectées en routine par le système. Pour atteindre ces objectifs, dans un premier temps, nous évaluons les principales méthodes statistiques de la littérature, implémentées pour la plupart dans le Package R « Surveillance », à partir d'un jeu publié de données simulées de surveillance épidémiologiques. Les méthodes statistiques sont été dans un objectif opérationnel, selon le paramétrage unique tel que proposé par l'auteur de chaque méthode (et sans reparamétrage systématique selon les événements). Des indicateurs de sensibilité et de spécificité adaptés à ces outils sont proposés. Puis nous proposons une approche originale pour la détection des épidémies sur le principe de la combinaison de méthodes sélectionnées lors de l'étape précédente. Les performances de cette approche sont comparées aux précédentes selon la méthodologie utilisée à la première étape. Enfin, nous proposons une méthode d'analyse étiologique d’une épidémie à partir des données de surveillance en employant des modèles statistiques adaptés aux séries chronologiques. A partir de l'exemple d'une épidémie de foyers de toxi-infections alimentaires collectives en France entre 1996 et 2010, cette méthode a permis de mettre en évidence les déterminants de cette augmentation du nombre de foyers observés et de faire la part entre une augmentation réelle et un biais de surveillance sans avoir recours à une enquête épidémiologique complémentaire.

Thesis resume

Public health surveillance is the ongoing, systematic collection, analysis, interpretation, and dissemination of data for use in public health action to reduce morbidity and mortality of health-related events and to improve health. One of its objectives is the detection of unusual events, i.e. outbreaks, requiring the rapid implementation of countermeasures. There are numerous methods for outbreak detection: experience of the epidemiologist in charge of the surveillance system, graphical analysis of data or statistical analysis. The outbreak detection from surveillance data is a real public health issue and many research teams have embarked on the development of specific statistical tools, each proposing a method of evaluation. In addition, once the outbreaks have been detected, the identification of the determinants of the episode requires an etiological epidemiological investigation to guide the implementation of specific countermeasures. However, the epidemiological surveillance systems sometimes allow the collection of sufficient information to characterize these outbreaks and to determine their causes, if using appropriate statistical tools, in addition to or instead of the investigation of the outbreak. The objectives of this work are: (i) to evaluate the main published statistical methods for outbreak detection commonly implemented in different public health surveillance systems, (ii) to propose a new approach based on the optimal combination of statistical methods for outbreak detection and benchmark it to other methods; and (iii) develop a new statistical method for the etiological analysis of an outbreak from public health surveillance data routinely collected by the system. To achieve these objectives, as a first step, we evaluate the main statistical methods, mostly implemented in the "Surveillance" R Package, from a published set of simulated public health surveillance data. Statistical methods have been evaluated for an operational purpose: for all simulated time series, we used the tuning parameters recommended by their authors for each algorithm when available and proposed by default in the package « Surveillance ». We propose sensitivity and specificity metrics suitable for these tools. Then we propose an original approach for outbreak detection based on combination of methods selected in the previous step. The performance of this approach is compared to the previous ones according to the methodology implemented in the first step. Finally, we propose a method for the etiological analysis of an outbreak from surveillance data by using statistical models suitable for time series analysis. Starting from the example of an increase of foodborne disease outbreak incidence in France from 1996 to 2010, this method allowed to highlight the determinants of this increase in the number of observed events and to make the difference between a real increase and a surveillance bias without implementing a supplementary epidemiological study.