25 mars 2011

Bibliographic Coupling

Une première carte que l'on peut fabriquer à partir de nos données est une carte de l'organisation de nos 7584 articles en communautés "naturelles". Ainsi, chaque noeud de la carte ci-dessous correspond à un regroupement d'articles traitant de sujets similaires, la taille de chaque noeud est proportionnelle au nombre d'articles dans la communauté correspondante, les liens indiquent des relations  de similarité entre communautés et les labels correspondent à un auteur et un mot-clé caractéristique de la communauté correspondante.
[EDIT: les couleurs sont ici mises à la main, elles correspondent aux différents départements]

Voyons de manière plus concrète et plus détaillée comment cette carte est fabriquée et ce que représentent exactement les différents éléments qui la compose.


Etape 1: Réseau Bibliographic Coupling

On parle de bibliographic coupling entre deux articles lorsqu'ils partagent au moins une référence commune. Une manière commune de mesurer la "force de couplage bibliographique" entre deux articles i et j est d'utiliser le cosine similarity introduit par [Kessler, 1963]:

 où Ri correspond à l'ensemble des références de l'article i. Cette mesure est d'autant plus grande que les deux articles possèdent de références communes et peut être utilisée comme proxy pour évaluer la similarité entre les sujets abordés dans les deux articles.

18 mars 2011

Base de données

Nos données de départ sont constituées d'un ensemble d'informations sur les 7584 articles contenant une adresse ENS Lyon1 recencés par le Web of Sciences ©. Cet ensemble d'informations est constitué pour chacun de ces articles:
  • des différentes infos permettant d'identifier l'article (auteurs, journal, titre, année de publication, ...)
  • des adresses (institutions, ville, pays) des differents auteurs
  • des mots-clés fournis par les auteurs
  • des Index Keywords, les mots-clés créé par ISI à partir des champs titre, abstracts et keywords.
  • des références citées (premier auteur, année de publi, journal, volume, pages)
>>> Un exemple ici <<<


Une analyse rapide de ces données permet de dégager une première vue  d'ensemble de la production scientifique de l'ENS.



I Une production en constante croissance










10 mars 2011

Introduction

La bibliométrie est une science déjà relativement ancienne (le terme "bibliométrie" a été introduit comme synonyme de "bibliographie statistique" par Pritchard en 1969) qui se renouvelle aujourd'hui sous l'effet de plusieurs facteurs, dont:
  • la disponibilité de base de données de plus en plus complètes (Web Of Science, Scopus, Google Scholar, ...)
  • son utilisation accrue (et controversée) comme outil d’évaluation et comme aide à la décision dans l'administration de la recherche (la communication d'un chercheur ou d'un groupe de chercheur peut dorénavant être quantifiée en terme de volume, de visibilité, d'influence, de collaboration...) 
  • la mondialisation du « marché » de l'enseignement supérieur (les classements d'universités de type Shangaï sont sans dote l'utilisation la plus visible/connue de la bibliométrie - un autre exemple récent: le Nature Publishing Index)
  • le dévelopement d'outils de visualisation permettant d'appréhender et d'explorer des ensembles d'informations complexes, outils qui ont pu servir à la création de diverses "maps of sciences" (voir liens).

Le but du travail (en cours!) présenté sur ce blog est de produire une représentation qui se veut complète, objective et visuellement attractive de la production scientifique d'un établissement donné - l'institution nous servant d'exemple étant l'ENS de Lyon, côté Monod (ie "sciences dures"). Nous avons ainsi construit plusieurs types de cartes permettant d'appréhender les liens scientifiques entre différents auteurs, disciplines ou départements scientifiques d'une institution via les références partagées, articles co-écrits, etc... Ces cartes offrent un point de vue unique sur l'organisation de la recherche à l'ENS, un point de vue global qu'aucun individu ne peut avoir.

Ce type de carte permettant une lecture rapide, simple et accessible aux non-experts sera de plus en plus utilisé comme outil de gouvenance, avec tous les dangers que celà comporte. Raison de plus pour comprendre comment ces cartes sont produites, voire travailler à leur élaboration. N'hésiter donc pas à utiliser l'espace des commentaires pour poser des questions, critiquer ce qui est fait et proposer vos idées. Bonne lecture, et bonne exploration!