Using SOMbrero for clustering and visualizing graphs - Université Paris 1 Panthéon-Sorbonne Accéder directement au contenu
Article Dans Une Revue Journal de la Société Française de Statistique Année : 2015

Using SOMbrero for clustering and visualizing graphs

Utiliser SOMbrero pour la classification et la visualisation de graphes

Résumé

Graphs have attracted a burst of attention in the last years, with applications to social science, biology, computer science... In the present paper, we illustrate how self-organizing maps (SOM) can be used to enlighten the structure of the graph, performing clustering of the graph together with visualization of a simplified graph. In particular, we present the R package SOMbrero which implements a stochastic version of the so-called relational algorithm: the method is able to process any dissimilarity data and several dissimilarities adapted to graphs are described and compared. The use of the package is illustrated on two real-world datasets: one, included in the package itself, is small enough to allow for a full investigation of the influence of the choice of a dissimilarity to measure the proximity between the vertices on the results. The other example comes from an application in biology and is based on a large bipartite graph of chemical reactions with several thousands vertices.
L'analyse de graphes a connu un intérêt croissant dans les dernières années, avec des applications en sciences sociales, biologie, informatique, ... Dans cet article, nous illustrons comment les cartes auto-organisatrices (SOM) peuvent être utilisées pour mettre en lumière la structure d'un graphe en combinant la classification de ses sommets avec une visualisation simplifiée de celui-ci. En particulier, nous présentons le package R SOMbrero dans lequel est implémentée une version stochastique de l'approche dite « relationnelle » de l'algorithme de cartes auto-organisatrices. Cette méthode permet d'utiliser les cartes auto-organisatrices avec des données décrites par des mesures de dissimilarité et nous discutons et comparons ici plusieurs types de dissimilarités adaptées aux graphes. L'utilisation du package est illustrée sur deux jeux de données réelles : le premier, inclus dans le package lui-même, est suffisamment petit pour permettre l'analyse complète de l'influence du choix de la mesure de dissimilarité sur les résultats. Le second exemple provient d'une application en biologie et est basé sur un graphe biparti de grande taille, issu de réactions chimiques et qui contient plusieurs milliers de noeuds.
Fichier principal
Vignette du fichier
olteanu_villavialaneix_JSFdS2014-final.pdf (1.63 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01232672 , version 1 (23-11-2015)

Identifiants

  • HAL Id : hal-01232672 , version 1
  • PUBMED : 342048
  • WOS : 000365744300005

Citer

Madalina Olteanu, Nathalie Vialaneix. Using SOMbrero for clustering and visualizing graphs. Journal de la Société Française de Statistique, 2015, 156 (3), pp.95-119. ⟨hal-01232672⟩
217 Consultations
486 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More