Soutenance de thèse de GHANNOU Omar


Titre de thèse

Fouille de Données de Trajectoires : Application à la Découverte et à l'Étiquetage des Zones d'Intérêt Maritimes

Trajectory Data Mining: Application to the Discovery and Labelling of Maritime Zones of Interest

Date

12 décembre 2025 à 10h00

Adresse

LIS UMR 7020 CNRS Aix Marseille Université – Campus de Saint Jérôme – Bat. Polytech 52 Av. Escadrille Normandie Niemen 13397 Marseille Cedex 20, Amphithéâtre Gérard Jaume, campus Saint-Jérôme

Ecole doctorale

Mathématiques et Informatique de Marseille

Specialité

Informatique

Etablissement

Aix-Marseille Université

Mots clés

Fouille de données de trajectoires,Zone d'intérêt,Transport maritime,données spatio-temporelles,trajectoire sémantique,

Keywords

Trajectory Data Mining,Zone Of Interest,Maritime Transport,Spatio-Temporal Data,Semantic trajectory,

Jury

Jury de thèse
Qualité Nom Etablissement
Professeur des universités M. BOUCELMA Omar Aix Marseille Université
Directrice de recherche Mme OLTEANU-RAIMOND Ana-Maria Univ. Gustave Eiffel - IGN/ENSG
Chargé de recherche M. AKBARINIA Reza INRIA - LIRMM
Maître de conférences M. DE RUNZ Cyril Université de Tours - IUT de Blois
Professeure des universités Mme FRYDMAN Claudia Aix-Marseille Université - LIS
Professeure émérite Mme LIBOUREL Thérèse Université de Montpellier
Maître de conférences M. THUILLIER Etienne Aix-Marseille Université - LIS

Résumé de la thèse

L'objectif de cette thèse est de faire progresser la compréhension de la mobilité maritime à travers l'analyse des données issues du Système d'Identification Automatique (AIS). Devenu une source essentielle pour l'étude des mouvements de navires en mer, l'AIS fournit des données à échantillonnage irrégulier, hétérogènes selon les types de navires et dépourvues d'attributs sémantiques, limitant ainsi leur exploitation analytique directe. Cette thèse répond à ces défis en se concentrant sur l'identification et l'étiquetage des Zones d'Intérêt (ZOI), c'est-à-dire des régions spatiales où les navires présentent des comportements récurrents ou significatifs, porteurs d'une valeur opérationnelle et contextuelle.
L'approche proposée s'articule autour d'une méthodologie orientée « événements d'arrêt ». Un algorithme dédié, D-STEPS (Density-aware Spatio-Temporal Events Pattern Segmentation), détecte au niveau des trajectoires les événements d'arrêt et de ralentissement à l'aide de paramètres adaptatifs, tenant compte de la diversité des navires et des irrégularités d'échantillonnage. Ces événements sont ensuite agrégés sur l'ensemble des trajectoires pour extraire les ZOI candidates par regroupement spatial et agrégation, aboutissant à des représentations géométriques de zones pertinentes pour la mobilité maritime.
Afin d'assurer l'interprétabilité, les ZOI candidates sont caractérisées par des métadonnées issues du mouvement, puis enrichies à l'aide d'informations géographiques volontaires (VGI). Deux sources sont exploitées : OpenSeaMap pour les zones hauturières et OpenStreetMap pour les zones côtières. Pour ces dernières, des méthodes de traitement du langage naturel (NLP) sont appliquées afin d'améliorer la récupération des objets liés au domaine maritime et de classer ces objets selon des catégories opérationnelles pertinentes. Ce processus produit des ZOI contextuellement enrichies reliant les motifs de mouvement observés à leurs caractéristiques opérationnelles et contextuelles.
Les ZOI enrichies deviennent ainsi des marqueurs persistants de la pertinence opérationnelle au sein des trajectoires, plutôt que de simples zones spatiales isolées. Cette observation motive un passage du concept de trajectoire comme suite de points vers celui de trajectoire multi-aspect (Multi-Aspect Trajectory, MAT) introduit dans la littérature. En s'appuyant sur ce paradigme, la thèse propose MarMAT, le Maritime Multi-Aspect Trajectory model, dédié au domaine maritime, où la ZOI constitue un aspect central. D'autres aspects incluent la trajectoire spatio-temporelle, les arrêts et ralentissements, les sous-trajectoires délimitées par les ZOI, ainsi que les segments sensibles aux conditions météorologiques.
Les résultats méthodologiques de ce travail — événements d'arrêt, ZOI et modèle MarMAT — sont concrétisés dans MobilityDB, une base de données spatio-temporelle. À partir des données AIS de la mer Baltique, ces composantes sont intégrées dans un système unifié où les trajectoires brutes, les événements dérivés et leurs représentations de plus haut niveau peuvent être stockés et interrogés conjointement.
Les contributions de ce travail sont quadruples :
1. La conception de D-STEPS, un algorithme de détection des événements d'arrêt et de ralentissement dans les trajectoires maritimes.
2. Une chaîne de traitement complète pour l'extraction, la caractérisation et l'enrichissement contextuel des ZOI.
3. La proposition du modèle MarMAT, un modèle de trajectoire multi-aspect maritime intégrant les différents aspects de la mobilité maritime, dont les ZOI.
4. Une implémentation expérimentale dans MobilityDB.


Thesis resume

The objective of this thesis is to advance the understanding of maritime mobility through the analysis of Automatic Identification System (AIS) data. AIS has become a primary source for studying vessel movements at sea, but the data are irregular in sampling, heterogeneous across vessel types, and lack semantic attributes, which limits their direct analytical use. This thesis addresses these challenges by focusing on the identification and labeling of Zones of Interest (ZOIs), that is, spatial regions where vessels exhibit recurrent or significant behavior and which hold operational and contextual relevance.
The proposed approach is structured around a stop-based methodology. A dedicated event-detection algorithm, Density-aware Spatio-Temporal Events Pattern Segmentation (D-STEPS), identifies stop and slowdown events at the trajectory level, using trajectory-adaptive parameters to account for vessel diversity and sampling irregularities. These events are then aggregated across multiple trajectories, and candidate ZOIs are extracted through clustering and spatial aggregation, resulting in geometric representations of mobility-relevant zones.
To provide interpretability, ZOI candidates are characterized using motion-derived metadata and further enriched through Volunteered Geographic Information (VGI). Two VGI sources are employed: OpenSeaMap for offshore zones and OpenStreetMap for coastal zones. For the latter, Natural Language Processing (NLP) methods are applied to improve the retrieval of maritime domain–specific features and to classify the retrieved features into operational categories based on their metadata. This process yields contextually enriched ZOIs that link observed movement patterns with operational and contextual characteristics.
Enriched ZOIs thus become persistent markers of operational relevance within trajectories rather than standalone spatial zones. This observation motivates a shift from trajectories as mere sequences of points to the concept of Multiple Aspect Trajectory (MAT), proposed in the literature. Building on the MAT model, this thesis introduces MarMAT, the Maritime Multi-Aspect Trajectory model dedicated to the maritime domain, with the ZOI concept as a central aspect. Other aspects include the spatio-temporal path, stops and slowdowns, ZOI-delimited sub-trajectories, and weather-aware segments.
The methodological outcomes of this work—stop events, Zones of Interest, and the MarMAT model—find concrete realization through MobilityDB, a spatio-temporal database system. Based on AIS data from the Baltic Sea, these components are integrated into a unified system where raw trajectories, derived events, and higher-level representations can be jointly stored and queried.
The contributions of this work are fourfold:
1. The design of D-STEPS, an algorithm for the detection of stop and slowdown events in maritime trajectories.
2. A pipeline for extracting, characterizing, and contextually enriching ZOIs.
3. The proposal of MarMAT, a maritime Multiple Aspect Trajectory model that encompasses maritime mobility aspects, including ZOIs.
4. A MobilityDB-based prototype implementation.