Ecole Doctorale

Mathématiques et Informatique de Marseille

Spécialité

Informatique

Etablissement

Aix-Marseille Université

Mots Clés

Système complexe,modèle graphique probabiliste,réseau bayésien,modèle causal,apprentissage de structure,connaissance,

Keywords

complex system,probabilistic graphical model,Bayesian network,causal model,structure learning,knowledge,

Titre de thèse

Apprentissage de réseaux bayésiens et réseaux causaux avec savoirs incertains d'experts
Bayesian networks and causal networks learning with experts' uncertain knowledge

Date

Lundi 6 Mars 2023 à 10:30

Adresse

52 Avenue Escadrille Normandie Niemen, 13013 Marseille salle Gérard Jaumes

Jury

Directeur de these M. Christophe GONZALES Aix Marseille Université
CoDirecteur de these M. Ahmed MABROUK Engie
Rapporteur M. Philippe LERAY Nantes Université
Rapporteur M. Salem BENFERHAT Université d'Artois
Examinateur Mme Véronique DELCROIX Université Polytechnique Hauts-de-France
Examinateur M. Pierre-Henri WUILLEMIN Sorbonne Université
Président M. Djamal HABET Aix-Marseille Université

Résumé de la thèse

Dans cette thèse, nous nous intéressons à l'apprentissage de la structure de réseaux bayésiens et de modèles causaux. Ces derniers sont une classe de modèles graphiques probabilistes permettant de modéliser efficacement des systèmes complexes. Il existe principalement trois catégories d'algorithme pour l'apprentissage de la structure de réseaux bayésiens : les algorithmes sous contraintes, qui utilisent des tests d'indépendance, les algorithmes à base de score et les algorithmes hybrides. Ces techniques d'apprentissage automatique utilisent des données récupérées sur les systèmes que l'on souhaite modéliser. Cependant, pour un système donné, les experts du domaine peuvent également fournir d'importantes informations. Ces dernières viennent avec les incertitudes naturelles de l'expert qu'il faut alors intégrer à l'apprentissage pour une utilisation optimale. Le travail de cette thèse porte sur l'intégration des connaissances d'expert incertaines dans l'apprentissage de la structure des réseaux bayésiens. Selon la nature des connaissances et l'approche d'apprentissage utilisée, cette intégration peut revêtir de nombreuses formes. Nous nous intéresserons ici à deux cas. Le premier concerne des connaissances sur les indépendances entre les variables avec des algorithmes sous contraintes. Nous verrons qu'il est possible d'intégrer les connaissances incertaines directement dans les tests d'indépendances. Le deuxième cas concerne l'apprentissage de réseaux bayésiens causaux, dans lesquels le graphe représente un schéma causal complet en plus des indépendances conditionnelles. Nous verrons qu'il est possible d'intégrer des connaissances causales dans le cadre d'un apprentissage hybride. Dans les deux cas, des expérimentations permettent de comprendre le comportement des nouveaux algorithmes proposés ainsi que de montrer leur intérêt dans l'écosystème des algorithmes déjà existants.

Thesis resume

In this thesis, we are interested in learning the structure of Bayesian and causal networks. Bayesian networks are a class of probabilistic graphical models that can be used to efficiently model complex systems. There are mainly three categories of algorithms for learning the structure of Bayesian networks: constraint-based algorithms, which use independence tests, score-based algorithms, and hybrid algorithms. These machine learning techniques use data generated by the systems we wish to model. Moreover, in a given system, the experts of the domain can also provide important information. However, this information comes with the natural uncertainties of the expert that must be integrated into the learning process for an optimal use. The work in this thesis focuses on the integration of uncertain expert knowledge into Bayesian network structure learning. Depending on the nature of the knowledge and the learning approach used, this integration can take many forms. We will focus here on two cases. The first one concerns knowledge about the independence between random variables of the probability distribution using constraint-based algorithms. We prove that it is possible to intelligently integrate the knowledge and its uncertainties directly into the independence tests. The second case concerns the learning of causal Bayesian networks, in which the graph represents a complete causal scheme in addition to conditional independences. We will show that it is possible to integrate causal knowledge into hybrid learning while allowing to optimize the elicitation of the expert knowledge. In both cases, experiments are conducted including comparisons with other algorithms in the literature to understand the behavior of the proposed new algorithms as well as to show their utility in the ecosystem of already existing algorithms.