Qinna Wang PhD Defense

Détection de communautés recouvrantes dans des réseaux de terrain dynamiques

12 avril 2012 à 14h00 à l’ENS Lyon en Amphi B Site Monod

Le jury sera composé de :

-Madame Anne-Marie KERMARREC 

Directeur de Recherches, Inria Rennes-Bretagne Atlantique, rapporteur

- Monsieur Matthieu LATAPY 

Directeur de Recherche, CNRS / UPMC, rapporteur- Monsieur Pablo JENSEN 

 Directeur de Recherches, CNRS / ENS de Lyon, examinateur

- Monsieur Bertrand JOUVE

Professeur, Université Lumière Lyon 2, examinateur

- Monsieur Christophe PRIEUR

Maître de conférence, Université de  Paris Diderot, examinateur
 - Monsieur. Eric Fleury,

Professeur, ENS Lyon, Directeur de thèse

Résumé :
***********************

Dans le contexte des réseaux complexes, la structure communautaire du réseau devient un sujet important pour plusieurs domaines de recherche. Les communautés sont en général vues comme des groupes intérieurement denses. La détection de tels groupes offre un éclairage intéressant sur la structure du réseau. Par exemple, une communauté de pages web regroupe des pages traitant du même sujet. La définition de communautés est en général limitée à une partition de l’ensemble des nœuds. Cela exclut  par définition qu’un nœud puisse appartenir à plusieurs communautés, ce qui pourtant est naturel dans de nombreux (cas des réseaux sociaux par exemple). Une autre question importante et sans réponse est l’étude des réseaux et de leur structure communautaire en tenant compte de leur dynamique.  Cette thèse porte sur l’étude de réseaux dynamiques et la détection de communautés recouvrantes.
Nous proposons deux méthodes différentes pour la détection de communautés recouvrantes. La première méthode est appelée optimisation
  de clique. L’optimisation de clique vise à détecter les nœuds  recouvrants granulaires.  La méthode de l’optimisation de clique est une approche à grain fin.  La seconde  méthode est nommée détection floue (fuzzy detection).  Cette méthode est à grain plus grossier et vise à identifier les groupes recouvrants. Nous   appliquons ces deux méthodes à des réseaux synthétiques et réels. Les résultats obtenus indiquent que les deux méthodes peuvent être utilisées pour caractériser les nœuds recouvrants. Les deux approches apportent des points de vue distincts et complémentaires. Dans le cas des graphes dynamiques, nous donnons une définition sur la relation entre les communautés à deux pas de temps consécutif. Cette technique permet de représenter le changement de la structure en fonction du temps. Pour mettre en évidence cette relation, nous proposons des diagrammes de lignage  pour la visualisation de la dynamique des communautés. Ces diagrammes qui connectent des communautés à  des  pas de temps successifs montrent l’évolution de la structure et l’évolution des groupes recouvrantes., Nous avons également appliquer ces outils à des cas concrets.

Abstract:
***********************

In complex networks, the notion of community structure refers to the presence of groups of nodes in a network. These groups are more densely connected internally than with the rest of the network. The presence of communities inside a network gives an insight on network structural properties. For example, in social networks, communities are based on common interests, location, hobbies…. Generally, a community structure is described by a partition of the network nodes, where each node belongs to a unique community. A more reasonable description seems to be  overlapping community structure, where nodes are allowed to be shared by several communities. Moreover, when considering dynamic networks whose interactions between nodes evolve in time, it appears crucial to consider also the evolution of the intrinsic community structure.
This thesis focus on mining dynamic community evolution and overlapping community detection. We have proposed two distinct methods for overlapping community detection. The first one named clique optimization and the second one called fuzzy detection. Our clique optimization aims to identify granular overlaps and it is a fine grain scale approach. Our fuzzy detection is at a coarser grain scale with the strategy of identifying modular overlaps. Their applications in synthetic and real networks indicate that both methods can be used for characterizing overlapping nodes but in distinct and complementary views. We also propose the definition of predecessor and successor in mining community evolution. Such definition describes the relationship between communities at different time steps. We use it to detect community evolution in dynamic networks and show how modular overlaps evolve over time. A visualization tool called lineage diagrams is used to show community evolution by connecting communities in relationship of predecessor and successor. Several cases are studied.