Une première carte que l'on peut fabriquer à partir de nos données est une carte de l'organisation de nos 7584 articles en communautés "naturelles". Ainsi, chaque noeud de la carte ci-dessous correspond à un regroupement d'articles traitant de sujets similaires, la taille de chaque noeud est proportionnelle au nombre d'articles dans la communauté correspondante, les liens indiquent des relations de similarité entre communautés et les labels correspondent à un auteur et un mot-clé caractéristique de la communauté correspondante.
[EDIT: les couleurs sont ici mises à la main, elles correspondent aux différents départements]
[EDIT: les couleurs sont ici mises à la main, elles correspondent aux différents départements]
Voyons de manière plus concrète et plus détaillée comment cette carte est fabriquée et ce que représentent exactement les différents éléments qui la compose.
Etape 1: Réseau Bibliographic Coupling
On parle de bibliographic coupling entre deux articles lorsqu'ils partagent au moins une référence commune. Une manière commune de mesurer la "force de couplage bibliographique" entre deux articles i et j est d'utiliser le cosine similarity introduit par [Kessler, 1963]:
où Ri correspond à l'ensemble des références de l'article i. Cette mesure est d'autant plus grande que les deux articles possèdent de références communes et peut être utilisée comme proxy pour évaluer la similarité entre les sujets abordés dans les deux articles.