Ecole Doctorale
Mathématiques et Informatique de Marseille
Spécialité
Informatique
Etablissement
Aix-Marseille Université
Mots Clés
l'étiquetage des rôles spatiaux,extraction de relation spatial,apprentissage profond,
Keywords
Spatial Role Labeling,spatial information extraction,deep learning,
Titre de thèse
Etiquetage de rôles spatiaux par apprentissage profond basé sur une représentation vectorielle enrichie
Spatial role labeling based on Deep learning with an enriched vector representation
Date
Mardi 5 Décembre 2023 à 14:00
Adresse
École Nationale des Sciences de l'Informatique (ENSI)
Campus Universitaire de la Manouba، Manouba 2010 Salle de conférence
Jury
Rapporteur |
M. Imed Riadh FARAH |
Institut Supérieur des Arts Multimédia de la Manouba |
Rapporteur |
M. Christian SALLABERRY |
Université de Pau et des Pays de lAdour |
Directeur de these |
M. Bernard ESPINASSE |
Aix-Marseille Université (AMU) |
CoDirecteur de these |
M. Sami FAIZ |
École Nationale des Sciences de l'Informatique (ENSI) |
Président |
Mme Nadia ESSOUSSI |
Institut Supérieur de Gestion de Tunis |
Examinateur |
M. Ali-Chérif ARAB |
Université de vincennes paris 8 |
Résumé de la thèse
L'une des fonctions essentielles du langage naturel concerne lévocation de relations spatiales entre objets. Des constructions linguistiques peuvent notamment exprimer des relations spatiales entre objets ainsi que des modèles de mouvement de ces objets dans l'espace. La compréhension de ces énoncés spatiaux est un problème majeur dans de nombreux domaines, comme la robotique, la navigation, la gestion du trafic et les systèmes de réponse aux requêtes. Létiquetage des rôles spatiaux (Spatial Role Labelling SpRL en anglais), propose des schémas d'annotation indépendant de la langue consistant en un ensemble de rôles spatiaux dans le but de couvrir tous les aspects des concepts spatiaux notamment les relations spatiales statiques et dynamiques. La plupart des systèmes automatiques de SpRL permettant dextraire automatiquement les rôles spatiaux dun texte sont des systèmes basés sur des méthodes dapprentissage traditionnelles, principalement statistiques. Dans le cadre de cette thèse nous à lextraction automatiquement de ces rôles spatiaux par lapprentissage profond (Deep Learning). Après un état de lart sur d'étiquetage automatique de rôles spatiaux (SpRL), les systèmes automatique SpRL existants, et les corpus de références permettant de les évaluer, nous proposons plusieurs systèmes SpRL à base dapprentissage profond que nous évaluons sur ces corpus de références et comparons leurs performances avec celles dautres systèmes existants. Le premier système proposé sappuie sur une représentation vectorielle du texte à analyser et adopte une approche d'apprentissage par transfert basée sur l'intégration de mots pour SpRL, en utilisant des vecteurs de mots avec des balises POS et des représentations au niveau des caractères basées sur CNN et enfin un modèle d'apprentissage profond BiLSTM-CRF résiduel pour identifier les rôles spatiaux. Le deuxième système proposé utilise une représentation vectorielle du texte obtenu par un plongement de mots spécifique, alternatif au modèle sac de mots appliqué aux plongements de mots classique et permettant de prendre en compte la syntaxe du texte dans la représentation vectorielle. Le dernier système adopte une approche basée sur les « Transformer » mettant en uvre un mécanisme dattention permettant de tenir compte de la combinaison de tous les mots du contexte, en pondérant chacun dentre eux. Les modèles de plongement de mots obtenus permettent de créer des modèles « contextualisés » notamment avec BERT (Bidirectional Encoder Representations from Transformers) capables de produire des représentations de mots qui dépendent du contexte.
Thesis resume
One of the essential functions of natural language concerns the evocation of spatial relations between objects. In particular, linguistic constructs can express spatial relationships between objects and patterns of movement of these objects in space. Understanding these spatial statements is a significant problem in many domains, such as robotics, navigation, traffic management, and query response systems. Spatial Role Labeling (SpRL) provides language-independent annotation schemes consisting of a set of spatial roles to cover all aspects of spatial concepts, including static and dynamic spatial relationships. However, most automatic SpRL systems that automatically extract spatial roles from a text are based on traditional, mainly statistical, learning methods. In this thesis, we focus on the automatic extraction of these spatial roles using Deep Learning. After state of the art on automatic Spatial Role Labeling (SpRL), existing automatic SpRL systems, and reference corpora allowing to evaluate them, we propose several deep learning-based SpRL systems that we evaluate on these reference corpora and compare their performances with those of other existing systems. The first proposed system relies on a vector representation of the text to be analyzed and adopts a transfer learning approach based on word embedding for SpRL, using word vectors with POS tags and character-level representations based on CNN and finally, a residual BiLSTM-CRF deep learning model to identify spatial roles. The second proposed system uses a vector representation of the text obtained by a specific word embedding as an alternative to the bag-of-words model applied to classical word embeddings and allowing to take into account the syntax of the text in the vector representation. The last system adopts a "Transformer" based approach implementing an attention mechanism that allows the combination of all the words in the context by weighting each of them. The resulting word embedding models allow the creation of "contextualized" models, particularly BERT (Bidirectional Encoder Representations from Transformers), capable of producing context-dependent word representations.