Ecole Doctorale

Mathématiques et Informatique de Marseille

Spécialité

Informatique

Etablissement

Aix-Marseille Université

Mots Clés

analyse de sentiments,traitement automatique du langage naturel,recherche d’information,fouille de texte,apprentissage automatique,information affective,

Keywords

sentiment analysis,natural language processing,information extraction,text mining,machine learning,affective computing,

Titre de thèse

Recommandation automatique, temps réel, et adaptative d'émojis
Emojis' automatic, real time, and adaptative recommandation

Date

Vendredi 24 Mai 2019 à 14:00

Adresse

Aix Marseille Université – Campus de Saint Jérôme – Bat. Polytech 52 Av. Escadrille Normandie Niemen 13397 Marseille Cedex 20 Gérard Jaumès

Jury

Directeur de these M. Patrice BELLOT Aix-Marseille Université
Rapporteur M. Horacio SAGGION Universitat Pompeu Fabra
Rapporteur Mme Chloé CLAVEL Télécom ParisTech
Examinateur Mme Béatrice DAILLE Université de Nantes
Examinateur M. Frédéric LANDRAGIN LATTICE - ENS - UMR 8094
Examinateur M. Pierre LISON Norsk Regnesentral - Norwegian Computing Center
CoDirecteur de these Mme Magalie OCHS Aix-Marseille Université

Résumé de la thèse

Depuis leur apparition en 1999, les emojis ont une popularité grandissante dans les systèmes de communication. Ces petites images pouvant représenter une idée, un concept ou une émotion, se retrouvent disponibles aux utilisateurs dans de nombreux contextes logiciels : messagerie instantanée, courriel, forums et autres réseaux sociaux en tout genre. Leur usage, en hausse constante, a entraîné l'apparition récurrente de nouveaux emojis, allant jusqu'à 2 789 emojis standardisés en fin d'année 2018. Le parcours de bibliothèques d'emojis ou l'utilisation de moteur de recherche intégré n'est plus suffisant pour permettre à l'utilisateur de maximiser leur utilisation ; une recommandation d'emojis adaptée est nécessaire. Pour cela nous présentons nous travaux de recherche axés sur le thème de la recommandation d'emojis. Ces travaux ont pour objectifs de créer un système de recommandation automatique d'emojis adapté à un contexte conversationnel informel et privé. Ce système doit améliorer l'expérience utilisateur et la qualité de la communication, en plus de pouvoir prendre en compte d'éventuels nouveaux emojis créés. Dans le cadre de cette thèse, nous contribuons tout d'abord en montrant les limites d'usage réel d'une prédiction d'emojis ainsi que la nécessité de prédire des notions plus générales. Nous vérifions également si l'usage réel des emojis représentant une expression faciale d'émotion correspond à l'existant théorique. Enfin, nous abordons les pistes d'évaluation d'un tel système par l'insuffisance des métriques, et l'importance d'une interface utilisateur dédiée. Pour ce faire, nous utilisons une approche orientée apprentissage automatique à la fois supervisée et non supervisée, ainsi que la conception de modèles de langues ou, plus précisément, de plongements lexicaux. Plusieurs composantes de ce travail ont donné lieu à des publications nationales et internationales, dont le prix du meilleur logiciel reproductible, ainsi que celui du meilleur poster pour la catégorie des médias sociaux.

Thesis resume

The first emojis were created in 1999. Since then, their propularity constantly raised in communication systems. Being images representing either an idea, a concept, or an emotion, emojis are available to the users in multiple software contexts: instant messaging, emails, forums, and other types of social medias. Their usage grew constantly and, associated to the constant addition of new emojis, there are now more than 2,789 standard emojis since winter 2018. To access a specific emoji, scrolling through huge emoji librairies or using a emoji search engines is not enough to maximize their usage and their diversity. An emoji recommendation system is required. To answer this need, we present our research work facused on the emoji recommendation topic. The objectives are to create an emoji recommender system adapted to a private and informal conversationnal context. This system must enhance the user experience, the communication quality, and take into account possible new emerging emojis. Our first contribution is to show the limits of a emoji prediction for the real usage case, and to demonstrate the need of a more global recommandation. We also veifie the correlation between the real usage of emojis representing facial expressions and a related theory on facial expressions. We also tackle the evaluation part of this system, with the metrics' limits and the importance of a dedicated user interface. The approach is based on supervised and unsupervised machine learning, associated to language models such as word embeddings. Several parts of this work were published in national and international conferences, including the best software award and best poster award for its social media track.