Soutenance de thèse de DE GAETANO Alessandro
Titre de thèse
Comportements protecteurs et contacts sociaux en épidémiologie : de la collecte de données aux modèles basés sur les données
Protective behaviors and social contacts in epidemiology:
from data collection to data-driven models
Résumé de la thèse
La pandémie de COVID-19 a intensifié des défis épidémiologiques de longue date : le besoin de données comportementales opportunes, l'intégration de ces données dans des modèles mécanistes, et la tâche d'identifier par audit les données et les composantes des modèles qui influencent le plus les résultats. Cette thèse aborde ces trois domaines interconnectés à travers un parcours de recherche cohérent, allant de la collecte de données à la modélisation guidée par les données et à l'audit systématique des modèles.
La première partie se concentre sur les données empiriques. Des enquêtes originales ont étudié la sensibilisation et les comportements du public face à la dengue en Europe, ainsi que le relâchement comportemental suite à la vaccination contre la COVID-19. Ceci a été complété par une analyse des données de contacts sociaux en Italie (étude CoMix) pour quantifier l'impact des interventions non pharmaceutiques sur les schémas de contact et le taux de reproduction ($R_0$). Ces études ont constamment souligné le rôle central de la perception du risque, des facteurs sociodémographiques et des pressions externes dans la formation des comportements de protection.
La seconde partie traduit ces observations empiriques en modèles mathématiques. Des méthodologies pour construire des matrices de contact stratifiées et temporellement variables ont été développées pour faire le pont entre données et modélisation. Un modèle à compartiments a été construit, intégrant une boucle de rétroaction entre la perception du risque et la dynamique de l'épidémie. Un second modèle a été développé pour auditer l'impact spécifique des données stratifiées par genre — incluant les comportements et la susceptibilité biologique — sur la mortalité de la COVID-19. Le rôle des différentes données d'entrée et hypothèses de modèle a été systématiquement évalué.
Les principaux résultats révèlent que les dynamiques comportementales, comme le relâchement des mesures de protection par une minorité ayant une faible perception du risque, peuvent impacter significativement les trajectoires épidémiques. Le processus d'audit a démontré que si les taux de létalité spécifiques au genre étaient essentiels pour modéliser la mortalité par genre, l'intégration de schémas de contact genrés améliorait également le réalisme des modèles désagrégés uniquement par âge.
Ce travail conclut qu'une relation symbiotique existe entre les données empiriques et la modélisation : les données ancrent les modèles dans la réalité, tandis que les modèles testent l'importance des comportements observés sur les dynamiques épidémiques, orientant ainsi les futures collectes de données. Il souligne que l'hétérogénéité est un moteur fondamental de la propagation épidémique et que l'objectif devrait être de développer des modèles adaptés à un objectif spécifique plutôt qu'un unique « meilleur » modèle. Finalement, cette thèse plaide pour une approche épidémiologique intégrée qui place la mesure et la modélisation du comportement humain au centre de la démarche, afin de construire des outils de santé publique plus efficaces et équitables face aux menaces futures.
Thesis resume
The COVID-19 pandemic has intensified long-standing epidemiological challenges, namely: the need for timely behavioral data, the integration of such data into mechanistic models, and the task of auditing which data and model components most influence outcomes. This thesis addresses these three interconnected areas through a cohesive research path from data collection to data-driven modeling and systematic model auditing.
The first part focuses on empirical data. Original surveys investigated public awareness and behavior concerning dengue in Europe and behavioral relaxation following COVID-19 vaccination. This was complemented by an analysis of Italian social contact data (CoMix study) to quantify the impact of non-pharmaceutical interventions on contact patterns and the reproduction number ($R_0$). These studies consistently highlighted the central roles of risk perception, sociodemographics, and external pressures in shaping protective behaviors.
The second part translates these empirical insights into mathematical models. Methodologies for constructing stratified, time-varying contact matrices were developed to bridge data and modeling. A compartmental model was built incorporating a feedback loop between risk perception and disease dynamics. A second model was developed to audit the specific impact of gender-stratified data—including behaviors and biological susceptibility—on COVID-19 mortality. The role of different data inputs and model assumptions was systematically evaluated throughout.
Key findings reveal that behavioral dynamics, such as the relaxation of protective measures by a minority with low risk perception, can significantly impact epidemic trajectories. The audit process demonstrated that while gender-specific fatality ratios were essential for modeling mortality by gender, incorporating gendered contact patterns also improved the realism of models disaggregated only by age.
This work concludes that a symbiotic relationship exists between empirical data and modeling: data grounds models in reality, while models test the importance of observed behaviors on epidemic dynamics, informing the direction of future data collections. It underscores that heterogeneity is a core driver of epidemic spread and that the goal should be developing models "fit for purpose" rather than a single "best" model. Ultimately, this thesis argues for an integrated epidemiological approach that centers the measurement and modeling of human behavior to build more effective and equitable public health tools for future threats.