Ecole Doctorale
Mathématiques et Informatique de Marseille
Spécialité
Informatique
Etablissement
Aix-Marseille Université
Mots Clés
analyse de sentiments,traitement automatique du langage naturel,recherche dinformation,fouille de texte,apprentissage automatique,information affective,
Keywords
sentiment analysis,natural language processing,information extraction,text mining,machine learning,affective computing,
Titre de thèse
Recommandation automatique, temps réel, et adaptative d'émojis
Emojis' automatic, real time, and adaptative recommandation
Date
Vendredi 24 Mai 2019 à 14:00
Adresse
Aix Marseille Université Campus de Saint Jérôme Bat. Polytech
52 Av. Escadrille Normandie Niemen
13397 Marseille Cedex 20 Gérard Jaumès
Jury
Directeur de these |
M. Patrice BELLOT |
Aix-Marseille Université |
Rapporteur |
M. Horacio SAGGION |
Universitat Pompeu Fabra |
Rapporteur |
Mme Chloé CLAVEL |
Télécom ParisTech |
Examinateur |
Mme Béatrice DAILLE |
Université de Nantes |
Examinateur |
M. Frédéric LANDRAGIN |
LATTICE - ENS - UMR 8094 |
Examinateur |
M. Pierre LISON |
Norsk Regnesentral - Norwegian Computing Center |
CoDirecteur de these |
Mme Magalie OCHS |
Aix-Marseille Université |
Résumé de la thèse
Depuis leur apparition en 1999, les emojis ont une popularité grandissante dans les systèmes de communication. Ces petites images pouvant représenter une idée, un concept ou une émotion, se retrouvent disponibles aux utilisateurs dans de nombreux contextes logiciels : messagerie instantanée, courriel, forums et autres réseaux sociaux en tout genre. Leur usage, en hausse constante, a entraîné l'apparition récurrente de nouveaux emojis, allant jusqu'à 2 789 emojis standardisés en fin d'année 2018.
Le parcours de bibliothèques d'emojis ou l'utilisation de moteur de recherche intégré n'est plus suffisant pour permettre à l'utilisateur de maximiser leur utilisation ; une recommandation d'emojis adaptée est nécessaire. Pour cela nous présentons nous travaux de recherche axés sur le thème de la recommandation d'emojis. Ces travaux ont pour objectifs de créer un système de recommandation automatique d'emojis adapté à un contexte conversationnel informel et privé. Ce système doit améliorer l'expérience utilisateur et la qualité de la communication, en plus de pouvoir prendre en compte d'éventuels nouveaux emojis créés.
Dans le cadre de cette thèse, nous contribuons tout d'abord en montrant les limites d'usage réel d'une prédiction d'emojis ainsi que la nécessité de prédire des notions plus générales. Nous vérifions également si l'usage réel des emojis représentant une expression faciale d'émotion correspond à l'existant théorique. Enfin, nous abordons les pistes d'évaluation d'un tel système par l'insuffisance des métriques, et l'importance d'une interface utilisateur dédiée.
Pour ce faire, nous utilisons une approche orientée apprentissage automatique à la fois supervisée et non supervisée, ainsi que la conception de modèles de langues ou, plus précisément, de plongements lexicaux. Plusieurs composantes de ce travail ont donné lieu à des publications nationales et internationales, dont le prix du meilleur logiciel reproductible, ainsi que celui du meilleur poster pour la catégorie des médias sociaux.
Thesis resume
The first emojis were created in 1999. Since then, their propularity constantly raised in communication systems. Being images representing either an idea, a concept, or an emotion, emojis are available to the users in multiple software contexts: instant messaging, emails, forums, and other types of social medias. Their usage grew constantly and, associated to the constant addition of new emojis, there are now more than 2,789 standard emojis since winter 2018.
To access a specific emoji, scrolling through huge emoji librairies or using a emoji search engines is not enough to maximize their usage and their diversity. An emoji recommendation system is required. To answer this need, we present our research work facused on the emoji recommendation topic. The objectives are to create an emoji recommender system adapted to a private and informal conversationnal context. This system must enhance the user experience, the communication quality, and take into account possible new emerging emojis.
Our first contribution is to show the limits of a emoji prediction for the real usage case, and to demonstrate the need of a more global recommandation. We also veifie the correlation between the real usage of emojis representing facial expressions and a related theory on facial expressions. We also tackle the evaluation part of this system, with the metrics' limits and the importance of a dedicated user interface.
The approach is based on supervised and unsupervised machine learning, associated to language models such as word embeddings. Several parts of this work were published in national and international conferences, including the best software award and best poster award for its social media track.