Ecole Doctorale
Mathématiques et Informatique de Marseille
Spécialité
Automatique
Etablissement
Aix-Marseille Université
Mots Clés
réseaux sociaux,maximisation d'influence,modèles à cascades indépendantes,,
Keywords
social network,influence maximization,Independent Cascade model,,
Titre de thèse
Maximisation d'Influence dans les Réseaux Sociaux
Influence Maximization in Social Networks
Date
Vendredi 29 Novembre 2019
Adresse
LIS UMR 7020 CNRS / AMU / UTLN
Aix Marseille Université Campus de Saint Jérôme Bat. Polytech
52 Av. Escadrille Normandie Niemen
13397 Marseille Cedex 20 salle de commission
Jury
Directeur de these |
M. ALESSANDRO GIUA |
MOFED-LIS |
CoDirecteur de these |
M. Leonardo BRENNER |
MOFED-LIS |
Rapporteur |
M. Dimitri LEFEBVRE |
GREAH Normandy University |
Rapporteur |
Mme Mariagazia DOTOLI |
Department of Electrical Engineering and Information, Polytechnic of Bari |
Examinateur |
M. Paolo FRASCA |
Univ. Grenoble Alpes, CNRS, Inria, Grenoble INP, GIPSALab, Grenoble, France |
Résumé de la thèse
Récemment, un grand nombre de sites de réseaux sociaux (Facebook et LinkedIn, par
exemple) ont apparu pour relier les personnes et les groupes. Les réseaux sociaux sont bon outils pour obtenir des informations et communiquer des idées. Influence de la propagation dans les réseaux sociaux a attiré dintér ets dans les domaines des réseaux complexes, de lexploration de données et des théories algorithmiques.
La propagation dinfluence se produit lorsque les opinions ou les comportements
dun individu changent en conséquence des interactions avec les autres. Par exemple, on peut adopter une information ou partager une vidéo sur Facebook sous linfluence de ses connaissances. Un effet viral est enfin déclenché à tout le réseau. Cest appellé leffet de bouche à oreille. Une stratégie marketing qui profite de leffet est appelé marketing viral. Il est largement appliqué dans les entreprises et en ligne logiciels. Le problème de la maximisation de linfluence vise à identifier un sous-ensemble dadopteurs initiaux dans un réseau social afin de maximiser la propagation de linfluence. Il est un problème algorithmique pour le marketing viral.
Deux modèles progressifs sont principalement utilisés dans lanalyse des réseaux
sociaux, à savoir le modèle à cascade indépendante et le modèle à seuil linéaire. Le modèle cascade indépendante suppose quun individu adopte une innovation avec une certaine probabilité si au moins un de ses voisins la adoptée. Autrement, le modèle à seuil linéaire suppose quun individu adopte une innovation si un certain ratio de ses voisins lavons déjà adopté. Nous appliquons le modèle à cascade indépendante dans notre thèse.
La thèse aborde trois problèmes différents liés à la maximisation de linfluence dans les réseaux sociaux: lestimation de linfluence, la maximisation de linfluence par la sélection des semences et la maximisation de linfluence par lactivation des liens. Dabord, lestimation dinfluence consiste à calculer la probabilité que chaque point puisse etre activé par un certain ensemble dadoptants initiaux. Cest une étape préliminaire pour la réalisation
de la maximisation de linfluence. Nous proposons la méthode du chemin pour donner
un résultat exact, lalgorithme SSS-Noself et lalgorithme SSS-Bounded-Path pour donner un résultat approximatif. Deuxièmement, la maximisation de linfluence par la sélection des semences consiste à maximiser linfluence finale obtenue par un certain nombre des semences. Nous combinons nos approches pour lestimation dinfluence avec différentes heuristiques pour la sélection des semences afin datteindre lobjectif de maximisation dinfluence. Troisièmement, nous proposons initialement le problème de la maximisation de linfluence par lactivation des liens. Il consiste à activer les liens les plus efficaces dans un budget limité pour maximiser linfluence. Diverses propriétés de ce problème et certaines solutions sous-optimales telles que lalgorithme Cost-Degree et lalgorithme Inf-Degree sont données.
Thesis resume
In recent years, a large number of social network sites (e.g., Facebook and LinkedIn) have appeared to connect people and groups together. Networks have been proven to be a good tool to share information and communicate ideas. Influence propagation in social networks has attracted substantial interests from the fields of complex networks, data mining and algorithmic theories.
Influence propagation occurs when an individuals opinions or behaviors change as a result of interactions with others. For example, one may adopt an information or share a video on Facebook under the influence of his acquaintances and a viral effect is finally triggered through the whole network. It is called the word-of-mouth effect. A marketing strategy that takes advantage of the effect, which is applied extensively in companies and online softwares, is called viral marketing. The influence maximization problem, aiming to identify a subset of initial adopters in a social network to maximize the influence propagation, is an algorithmic problem for viral marketing.
There are two progressive models most used in the analysis of social networks, namely the Independent Cascade model and the Linear Threshold model. As a type of epidemic models, the Independent Cascade model assumes that an individual adopts an innovation with a certain probability if at least one of its in-neighbors has adopted it. Differently, the Linear Threshold model assumes that an individual adopts an innovation if a certain ratio of its in-neighbors have already adopted it. We apply the Independent Cascade model in the thesis.
The thesis addresses three different problems related to influence maximization in social networks: influence propagation computation, influence maximization by seed selection and influence maximization by link activation. Firstly, the influence propagation computation consist in computing the probability that each node can be activated given a certain set of initial adopters. It is a preliminary step for the subsequent achievement of influence maximization. WeproposethePathMethod to
give an exact result, theSSS-Noself algorithm
and the SSS-Bounded-Path algorithm to give an approximate result. Secondly, the influence maximization by seed selection consist in maximizing the final influence propagation by targeting a seed set of certain cardinality. We combine our approaches for influence propagation computation with different heuristics for seed selection to reach the goal of influence maximization. Thirdly, we initially propose the problem of influence maximization by link activation, which is to activate the most effective links within a limited budget to achieve influence maximization. Various properties of this problem and some sub-optimal solutions such as Cost-Degree algorithm and Inf-Degree algorithm are given.