2 avril 2011

Réseaux de co-occurrence

Réseaux des co-auteurs (détail)

Réseaux des co mots-clés (détail)


Nous avons construit à partir de notre base de données les réseaux des co-auteurs, le réseau des co-mots-clés et un réseau de co-occurrence hétérogène comportant des auteurs, des mots-clés et des institutions. Chacun de ces réseaux est construit sur le même principe simple:
  • On pose ni le nombre d'articles dans lequel un item (auteur, mot-clé ou institution) i apparait, et nij le nombre d'articles dans lequel deux items i et j apparaissent. Par définition, il y a un lien de co-occurrence entre deux items i et j lorsque nij> 0. On choisit également de définir le poids relatif d'un lien de co-occurrence d'une manière simple: wij = nij/sqrt(ninj).
  • Pour construire un graphe, il convient de choisir un ensemble d'items de départ, par exemple "l'ensemble des auteurs ayant publié plus de n articles".
  • Une fois cet ensemble de départ déterminé et le poids des liens de co-occurrence correspondant calculés, on fait tourner un algorithme de layout (présenté dans le post précèdent) dans gephi.
Nous avons ainsi créé un réseau des co-auteurs (le graphe en pdf, fichier gephi correspondant) regroupant les 1244 auteurs ayant publié plus de 5 articles (le graphe à ouvrir avec gephi contient 4483 auteurs ayant publié plus de 2 articles) ainsi qu'un graphe des co-mots-clés (graphe en pdf, fichier gephi correspondant) regroupant les 667 mots-clés utilisés dans plus de 10 articles. Sur ces deux graphes, la couleur correspond à une communauté d'auteurs ou de mots-clés détectée via l'algorithme de Louvain (voir post précèdent).

Enfin, l'animation suivante vous permet une navigation interactive dans un réseau hétérogène regroupant mots-clés, auteurs et institutions apparaissant dans plus de 10 articles. La taille des noeuds est proportionnelle  au nombre d'articles dans lequel un item apparait. Pour alléger le graphe, seuls les liens d'un poids relatif supérieur à 0.1 (en gros pour des couples d'item se retrouvant ensemble dans un article au moins 1 fois sur 10) ont été conservé. [ENSL est un raccourci pour Ecole Normale Super Lyon]


1 commentaire:

  1. Bonjour Dr,
    c'est Abdou le stagiaire de l'INSA, j'ai essayé de te joindre sur le mail avec lequel on échangeait mais en vain. Je souhaiterais te rencontrer si tu es toujours à Lyon bien sûr pour quelques pistes sur la cartographie.
    Tu pourras me répondre sur ce mail abdoubeukeu@gmail.com

    RépondreSupprimer