Ecole Doctorale

Mathématiques et Informatique de Marseille

Spécialité

Mathématiques

Etablissement

Aix-Marseille Université

Mots Clés

Approche mecanistico-statistique,Equations aux dérivées partielles,Inférence Bayésienne,Bayesian model-averaging,Invasions Biologiques,Xylella fastidiosa

Keywords

Mechanistic-statistical Approach,Partial differential equations,Bayesian inference,Bayesian model-averaging,Biological Invasions,Xylella fastidiosa

Titre de thèse

Inférer et Prédire Les Dynamiques D'espèces Invasives - Focus sur Xylella fastidiosa
Inferring and Predicting Invasive Species Dynamics - Focus on Xylella fastidiosa

Date

Mercredi 11 Décembre 2019 à 9:00

Adresse

Université d'Avignon 74 Rue Louis Pasteur, 84029 Avignon Salle des Thèses

Jury

Rapporteur Mme Anne GéGOUT-PETIT Université de Lorraine, Institut Elie Cartan.
Rapporteur Mme Sophie DONNET UMR518 AgroParisTech/INRA Team MORSE
Examinateur Mme Florence HUBERT Aix Marseille Université
Examinateur M. Jimmy GARNIER LAMA, UMR CNRS 5127
Examinateur M. Samuel SOUBEYRAND UR INRA Biostatistique et Processus Spatiaux
CoDirecteur de these M. Eric PARENT UMR AgroParisTech/INRA 518 Team MORSE & French National Institute for Rural Engineering,Water and Forest Management

Résumé de la thèse

L’invasion de territoires par des espèces allogènes a toujours été un sujet attrayant pour les mathématiciens aussi bien que pour les biologistes. En particulier, de nombreux travaux sont menés afin de reconstruire la dynamique passée d’espèces envahissantes. Fondamentalement, le projet de thèse porte sur la recherche d’une méthodologie générique (i.e. adaptable à diverses espèces invasives), permettant l’amélioration des prédictions d’une invasion biologique pour laquelle on ne dispose pas de modèle spécifique et dont les conditions initiales (i.e. la date et le lieu d’introduction de l’espèce invasive) sont inconnues. Pour atteindre cet objectif, on procède suivant deux axes de recherche complémentaires. Dans le premier axe, on s’intéresse à l’inférence des invasions biologiques à partir d’un modèle spatio-temporel de propagation et de données collectées, en suivant une approche mécanistico-statistique. Cette méthode permet d’estimer d’une façon jointe le point d’introduction (date et site de l’arrivée de l’espèce invasive) et d’autres paramètres de la dynamique reliés à la diffusion, la reproduction et la mortalité. Elle repose sur (i) une équation au dérivée partielle (EDP) offrant une représentation phénoménologique et concise d’une dynamique qui envahit un domaine hétérogène, (ii) un modèle stochastique représentant le processus d’observation permettant d’ajuster l’EDP aux données et (iii) une méthode d’inférence statistique Bayésienne, l’adaptive multiple importance sampling algorithm, pour estimer les paramètres du modèle. Pour gagner en réalisme, le modèle phénoménologique déterministe peut être remplacé par un modèle stochastique, comme par exemple une équation aux dérivées partielles stochastique ou un processus de points spatio-temporel. Cependant, de tels modèles peuvent induire des difficultés d’estimation du fait des paramètres supplémentaires et des variables latentes. Des modèles dérivés du cadre des processus de Markov déterministes par morceaux (PDMP) peuvent constituer une alternative intéressante en permettant un compromis entre réalisme du modèle et facilité d’estimation. Dans le cadre d’étude décrit ci-dessus, l’utilisation de modèles "tout-terrain" a été privilégiée puisque les déterminants de propagation d’une espèce localement nouvelle dans un nouvel environnement sont généralement incertains. Cependant, les prédictions pouvant être tirées de ces modèles ne sont pas optimales puisqu’elles dépendent fortement des hypothèses sous-jacentes au modèle et qu’elles ne prennent pas en compte les incertitudes pouvant l’entourer. Ma deuxième ligne de recherche consiste à proposer une approche permettant de prendre en compte les incertitudes entourant chaque modèle. La technique que j’emploie est celle du Bayesian model-averaging. Cette technique consiste à combiner les prédictions des modèles en compétition d’une façon à obtenir une prédiction unifiée améliorée. Cette technique a souvent été utilisée en sciences environnementales. Toutefois, elle n’est pas répandue dans le domaine de l’épidémiologie. L’un des buts méthodologiques de la thèse est d’en évaluer l’intérêt pour l’épidémiologie prédictive. Le cas d’étude de ma thèse est celui de la bactérie phytopathogène Xylella fastidiosa pour laquelle des données de surveillance spatio-temporelles et binaires post-introduction ont été collectées à partir d’un plan de surveillance intense qui a été mis en place par l'État suite à la première détection du cette bactérie en Corse en 2015. Ce pathogène de quarantaine, qui a significativement impacté la production d’olives en Italie et présente un risque de modification drastique de l’environnement du fait de sa capacité à atteindre de nombreuses espèces végétales, a le potentiel de causer en France une crise sanitaire majeure en santé végétale, à l’image de celle qu’elle cause depuis 2013 en Italie où les impacts socio-économiques sont conséquents.

Thesis resume

The spread of invasive alien species to new areas has always been an appealing research topic for mathematicians as well as for biologists. In particular, many investigations are carried out to reconstruct the past dynamics of the alien species and to predict its future spread. In essence, the thesis research aims to provide a generic methodology (i.e. scalable to various invasive species) that improves the predictions of an invasive species dynamics for which no dedicated model is available and whose initial conditions (i.e. date and location of the introduction of invasive species) are unknown. In order to achieve this goal, we proceed in two complementary lines of research. The first one is to propose a model&data-based inference method of biological invasions, in the framework of the so-called mechanistic-statistical approach. This method allows us to jointly estimate the introduction point (date and location of the invasive species arrival) and other parameters of the dynamics related to diffusion, reproduction and death. It is hinged on (i) a partial differential equation (PDE) that offers a phenomenological and concise description of the invasive species dynamics in a heterogeneous domain, (ii) a stochastic model that represents the observation process, which allows to fit the PDE to the data and (iii) a statistical Bayesian inference procedure, the adaptive multiple importance sampling algorithm, for estimating model parameters. To gain in realism, the phenomenological deterministic model could be replaced by a stochastic model, as for example a stochastic partial differential equation or spatio-temporal point process. However, such models may induce additional difficulties in estimation because of the supplementary parameters and latent variables. Models issued from the framework of Piecewise-deterministic Markov Process (PDMP) model could be an appealing and interesting alternative to balance the trade-off between model realism and estimation easiness. In the framework presented above, preference was given to the use of generic spatio-temporal propagation models since the main processes underlying the spread of an alien species are usually unknown. However, predictions that can be drawn from those models are not optimal because they are affected by the assumptions made in the corresponding models, and do not take into account the uncertainty about the model form. The approach I use to overcome this problem is the so-called Bayesian model-averaging. This method consists of combining predictions drawn from competing models in order to obtain a unique and ameliorated prediction. This technique has been previously used in environmental sciences. Nevertheless, it is not widespread in the field of epidemiology. One of the methodological goals of the PhD is to investigate its application and usefulness in predictive epidemiology. The case study of my thesis is the phytopathogenic bacterium Xylella fastidiosa for which abundant spatio-temporal and binary post-introduction surveillance data were collected from an intensive surveillance plan implemented by governmental agencies after the first pathogen detection in Corsica in 2015. This quarantine pathogen that has significantly impacted olive production in Italy and that presents a drastic risk of change to the environment for its ability to reach a large variety of plants, is susceptible to cause in France a major sanitary crisis, as the one caused in Italy since 2013 where the socio-economical impacts are considerable.