Cartographies des connaissances scientifiques
Comment cartographier les sciences? De la "Métaphysique" d'Aristote à la classification de Dewey, le classement des savoirs est un enjeu philosophique majeur. Raphaël Velt retrace les cartes historiques et s'intéresse à leurs utilisations.
Article publié sur OWNISciences sous le titre, Les connaissances scientifiques à la carte
Les techniques cartographiques peuvent s’appliquer à toutes les disciplines scientifiques, notamment en biologie où elles servent entre autres à décrire les réseaux trophiques (plus connus sous le nom réducteur de « chaînes alimentaires ») ainsi que les réseaux complexes d’interactions entre molécules. Je m’intéresserai aujourd’hui à leur application à l’épistémologie, c’est à dire l’étude de ce que sont les connaissances humaines.
Les techniques cartographiques peuvent en effet décrire l’état des connaissances scientifiques ainsi que la dynamique de la recherche. Après un historique rapide des cartes des sciences et quelques exemples récents, j’évoquerai les usages et applications de celles-ci.
Une brève histoire de l’organisation des connaissances
Le classement des savoirs est une question philosophique majeure aux origines anciennes, qui prennent racine dès l’Antiquité grecque et la Métaphysique d’Aristote. Mais sautons quelques siècles pour découvrir l’une des premières présentations synthétiques et graphiques, publiée dans l’œuvre phare du siècle des Lumières, l’Encyclopédie de Diderot et d’Alembert. Le Discours préliminaire, publié en 1751 dans le premier tome de l’Encyclopédie, s’achève en effet par une planche présentant le « Système figuré des connoissances humaines », représentant celles-ci sous forme d’un arbre. Celui-ci part d’une racine qu’est l’« Entendement » et de trois branches principales que sont l’Histoire, la Philosophie et la Poésie, qui se divisent elles-mêmes sur plusieurs niveaux, jusqu’à couvrir aussi bien les procédés artisanaux et industriels que les sciences, les arts et la religion.
Cette classification vieille de deux siècles et demi semble aujourd’hui quelque peu désuète. Depuis, l’organisation proposée par le bibliothécaire américain Melvil Dewey en 1876 a connu bien plus de succès. La Classification Décimale de Dewey, qui a certes subi quelques aménagements pour accueillir les nouvelles disciplines nées entretemps, est toujours utilisée par les bibliothèques du monde entier pour classer les ouvrages dans les rayons, selon un code numérique à trois chiffres. Ces codes sont organisés de manière hiérarchique, le premier chiffre correspondant à un grand domaine, par exemple 3xx pour les sciences sociales, le second à un sous-domaine plus précis, comme 32x pour les sciences politiques, et ainsi de suite, 327 pour les relations internationales.
L’un des défauts de cette classification est qu’elle est mal adaptée aux documents qui ne rentrent pas suffisamment précisément dans ses cases. C’est pourquoi les juristes belges Paul Otlet1 et Henri La Fontaine ont développé la Classification Décimale Universelle, dérivée de celle de Dewey, offrant des possibilités de combinaisons entre codes décimaux.
Mais ces classifications sous forme d’arbres, si elles facilitent l’accès aux connaissances et aux documents, ne rendent pas compte des relations que les disciplines ont entre elles. Par exemple, la hiérarchie de Dewey, qui classe la biochimie dans les Sciences de la Vie avec le code 572, ne traduit pas la parenté de celle-ci avec la chimie organique (code 547).
L’une des premières tentatives de présenter l’organisation des sciences en tenant compte de ces relations a été réalisée par le britannique John Desmond Bernal, physicien et chimiste spécialisé dans la cristallographie, mais également militant politique et auteur de l’un des premiers ouvrages consacrés aux relations entre sciences et société, La fonction sociale de la science.
Dans ce livre paru en 1939, il propose une cartographie hiérarchique partant des fondamentaux théoriques, en haut du schéma, et descendant vers les applications techniques quotidiennes. De gauche à droite de la carte, les colonnes correspondant à trois grands secteurs : le secteur physique (lui-même sous-divisé en physique et chimie) et les secteurs biologique et sociologique. Les blocs du dessin sont reliés par des flèches indiquant les apports théoriques entre disciplines : par exemple, la biochimie reçoit ainsi, entre autres, des flèches provenant de la physique nucléaire et de la chimie des polymères et en retour, alimente la biologie cellulaire et l’industrie des fibres et plastiques.
Cette carte, comme celle que publiera le chimiste Ellingham (connu également pour ses représentations visuelles des états d’énergie des réactions d’oxydo-réduction) neuf ans plus tard, est basée sur la connaissance que l’auteur a de son champ d’études.
Les débuts de la scientométrie
À côté de cette approche qualitative, une autre approche a commencé à se développer quelques années plus tard, se basant non plus sur une expertise mais sur des données quantitatives collectées, analysées puis représentées visuellement. La mesure des traces de l’activité scientifique, basée sur l’analyse des publications des chercheurs, se nomme la scientométrie. Celle-ci a fourni les bases conceptuelles à partir desquelles seront élaborées les cartographies des sciences que j’évoquerai dans la suite de cet article.
Le britannique Derek John de Solla Price et l’américain Eugene Garfield furent parmi les premiers, dès les années 60, à représenter la recherche scientifique sous des formes de réseaux, en se basant sur les relations de citations entre articles. Garfield s’est notamment inspiré de l’index des citations de Shepard, créé en 1873 pour répondre aux besoins de documentation des juristes américains2. Il transposa cet index dans le monde scientifique, fondant l’Institute for Science Information (depuis racheté par Thomson Reuters) et publiant le premier Science Citation Index en 1960.
Le premier exemple de représentation graphique d’un réseau de citations connu date de cette même année et représente les relations entre quinze articles qui, de 1941 à 1960, ont permis le développement de la technique de coloration des acides nucléiques. Pour Garfield, « bien qu’Allen [l'auteur de la représentation] n’en ait pas eu l’intention, le diagramme résultant [le] frappe comme étant un tracé concis, facile à comprendre du développement historique de [cette] méthodologie ».3
Un paysage plus large : des réseaux de chercheurs, publications, mots et institutions
Les éléments que la scientométrie peut extraire des publications vont bien au-delà de ces réseaux de citations. À un article scientifique sont en effet rattachés les noms de ses auteurs et leurs institutions, la revue dans laquelle il a été publié, mais également l’ensemble des mots qu’il – ou que son résumé – contient.
D’autres traces des sciences, de plus en plus accessibles avec l’ouverture des universités sur le web, sont les annuaires des établissements de recherche, qui fournissent notamment les listes de leurs chercheurs, classés par disciplines, unités de recherche et/ou projets.
Tous ces types de données peuvent servir comme briques de base des cartographies et constituer les points du paysage, les nœuds des réseaux. Pour les relier et déterminer les distances entre eux, plusieurs rapprochements sont possibles. Le lien de citation d’un article par un autre, que nous avons déjà évoqué, en est un, et fonctionne aussi bien pour relier des articles entre eux que pour relier des auteurs (qui cite qui ?), des institutions ou des revues.
Un autre rapprochement entre deux auteurs peut venir du fait d’être cités tous les deux dans un même article (et non d’être cité l’un par l’autre), formant un lien dit de co-citation. Pour poursuivre cette liste (qui n’est pas exhaustive), on parle de co-occurrences lorsque des mots sont rapprochés. Ces co-occurences fonctionnent à double sens : pour comparer des articles selon leur proximité lexicale ou, en sens inverse, pour rapprocher des mots ou des expressions entre elles, selon le nombre d’articles qui les utilisent.
Changer d’échelle, cartographier toutes les sciences
Après avoir vu un réseau de citation à l’échelle d’une quinzaine d’articles, changeons de dimensions et projetons-nous à l’échelle de l’ensemble des disciplines scientifiques. Quelles propriétés apparaissent si l’on cartographie la totalité des articles répertoriés dans le Science Citation Index ?
Jusqu’au début des années 2000, les technologies ne permettaient pas d’atteindre l’exhaustivité et la précision des cartes les plus récentes : les données n’étaient pas aussi faciles d’accès4 et les capacités de calcul des ordinateurs insuffisantes ou trop coûteuses pour des quantités de données aussi importantes.
Les premiers essais de cartographies calculées à l’échelle globale contournaient ce dernier obstacle en limitant fortement le nombre d’articles pris en compte à quelques milliers ou quelques dizaines de milliers.
Le nombre important d’articles (jusqu’à 2 millions dans une carte publiée en 2007) peut poser des problèmes de lisibilité lorsque chaque nœud de la carte est un article. Tout en gardant les mêmes données de citations entre articles, certaines cartes regroupent les articles par revues (chaque nœud de la carte représentant une revue), voire par groupe de revues, selon la classification de celles-ci en catégories proposées par Thomson Reuters.
Faire apparaître la structure des sciences
Quelle que soit la méthode employée, une structure générale des sciences semble se dégager, sous une forme circulaire : les sciences physiques sont très liées à la chimie et aux sciences de l’ingénieur qui, connectées respectivement par la biochimie et les sciences de la terre, amènent aux sciences de la vie, puis à la médecine. Les neurosciences connectent celle-ci à la psychologie. De là , le cercle se referme grâce aux sciences humaines et sociales, puis à l’informatique et enfin les mathématiques qui se reconnectent aux sciences physiques.
Ces cartes ne mettent pas seulement en évidence les positions relatives des disciplines, mais également leur poids (qui peut se mesurer au nombres d’articles, de journaux, de chercheurs ou même aux financements que celles-ci reçoivent) : ainsi, la médecine et la biologie apparaissent comme étant les domaines les plus actifs.
Cette mise en évidence de la structure des sciences laisse entrevoir deux types d’usages fondamentaux de ces cartes : un outil pratique pour les chercheurs ainsi qu’un outil de communication. Les cartes permettent ainsi de faire connaître la structure des sciences à un certain nombre de publics.
Des cartes pour comprendre la dynamique des sciences
L’étude de l’évolution de ces cartes dans le temps peut faire apparaître des changements dans l’organisation des disciplines et retracer l’évolution de celles-ci. Ainsi, on peut assister à l’apparition de l’informatique ou voir comment les neurosciences se sont structurées en empruntant à des domaines aussi divers que la biologie moléculaire, la psychologie et l’informatique.
À des niveaux plus précis, ces cartes permettent également de visualiser la dynamique d’une seule discipline, d’un sujet de recherche ou d’un groupe de chercheurs et de savoir, par exemple, quels sujets sont liés entre eux, ou quels scientifiques travaillent sur les mêmes problématiques. La densité ou au contraire la dispersion des points de la carte permettent également de savoir si un sujet de recherche est cloisonné ou si ses spécialistes dialoguent fortement avec ceux de domaines proches.
Les travaux de Chaomei Chen, chercheur en sciences de l’information à l’université Drexel à Philadelphie, visent à utiliser ces cartes pour déterminer des caractéristiques mesurables de ce qu’est la créativité. Celui-ci considère en effet que les articles les plus innovants se repèrent à leur capacité à rapprocher des idées qui jusque là n’interagissaient pas et à modifier fortement la structure de leur discipline, ouvrant de nouveaux axes de recherche. Des articles ayant ces particularités se repèrent facilement sur des cartographies des sciences dans lesquelles la couleur ou la position sur un axe des articles exprime la date à laquelle ils ont été publiés.
Des cartes pour prendre des décisions
Savoir où se trouve l’innovation répond à des enjeux évidents et peut aider à guider des choix économiques et politiques. Les cartographies des sciences répondent également à d’autres questions de politiques de la recherche. Pour mettre en avant l’intérêt de celles-ci, Ismael Rafols de l’université de Sussex, donne l’exemple de l’évaluation des universités, qui jusqu’ici, se fait principalement à partir d’indicateurs chiffrés de leur activité scientifique. Ceux-ci sont notamment à l’origine des polémiques sur le classement de Shanghaï : celui-ci, basé sur un indice calculé à partir de données telles que le nombre d’articles publiés dans Science etNature par une université et le nombre de Prix Nobel qui en sont issus, tend à favoriser les institutions les plus grosses.
Comme alternative, Rafols propose un nouvel outil, nommé Overlay Mapping, basé sur une carte des sciences utilisée comme référence. En superposant les données de l’activité d’une institution (de recherche ou de financement) à cette carte, la diversité et la répartition de cette activité apparaît immédiatement.
Les questions de financement de la recherche sont également liées aux problématiques de développement territorial. Certains travaux mettent donc en évidence la relation entre les « territoires virtuels » tracés par les cartographies des sciences et les espaces géographiques. C’est notamment le cas du projet VisIR, réalisé dans le cadre du pôle de compétitivité breton Images et Réseaux par Franck Ghitalla et l’École de Design de Nantes.
Un autre exemple d’utilisation comme outil d’aide à la décision est cette cartographie des cours proposés à l’université Brown, conçue pour que les étudiants trouvent les cours les plus pertinents par rapport à leurs centres d’intérêt (la proximité entre deux cours dépend du nombre d’étudiants qui les suivent tous les deux).
Des cartes pour interagir avec des données
Les cartographies en général sont considérées par les chercheurs comme des outils d’analyse exploratoire de données. Si la vérification des hypothèses continue généralement à se faire avec des méthodes statistiques reposant sur des données chiffrées, ce type de visualisation peut être nécessaire lors de la manipulation de grandes quantités de données pour voir apparaître des structures et y retrouver des éléments particuliers.
Cette exploration a beaucoup à gagner à l’utilisation de technologies interactives : si les sous-domaines des sciences physiques ne sont pas facilement lisibles sur une carte globale des sciences (à moins de l’imprimer en grand format), les possibilités de zoomer et de sélectionner un sous-ensemble d’éléments facilitent la lecture de l’organisation hiérarchique des sciences, du niveau global aux sujets les plus pointus.
En dehors de ce passage d’une échelle à l’autre, les dispositifs interactifs ouvrent une multitude de possibilités de navigation entre les différentes dimensions des cartes de sciences, par exemple passer des articles aux chercheurs et aux mots-clés (c’est notamment ce que permet le projet TINA de l’Institut des Systèmes Complexes de Paris-Île de France).
Des cartes pour tous les publics ?
Ces cartes fournissent ainsi des moyens d’accéder à de nombreux aspects des sciences et leurs applications pourraient servir tous les citoyens, aussi bien pour la communication d’enjeux de société liés aux problématiques scientifiques et techniques que comme supports pédagogiques à l’école.
Mais, de la même manière que tous les conducteurs n’ont pas la même facilité face à une carte routière, la lecture de ces outils n’a rien d’inné. Les cartographies des sciences se multiplieront sans aucun doute dans les années à venir, mais la vitesse et l’étendue de leur adoption dépendront de la capacité des concepteurs de ces objets à dialoguer avec leurs publics pour à la fois rendre les cartes plus simples à lire et éduquer les lecteurs à décrypter leurs significations.
Si les cartes des sciences veulent dépasser la communauté scientifique, leur avenir est tout autant dans les mains de ceux qui connaissent les sciences que chez les designers d’interactions.
Pour aller plus loin…
L’une des collections les plus complètes de cartographies des sciences, où se retrouvent la plupart des cartes évoquées ici, a été réalisée par Katy Börner, chercheuse en Sciences de l’Information à l’Université d’Indiana. Celle-ci se présente sous la triple forme d’un site web, d’une exposition itinérante et d’un beau livre, Atlas of Science. Cette collection se construit par cycles, et de nouvelles cartes seront rajoutées jusqu’en 2014.
A noter également la conférence « Mapping the Digital Traces of Science », organisée par l’Institut des Systèmes Complexes, regroupant des spécialistes de la cartographie des sciences (dont Chen et Rafols, cités dans cet article) et dont vous pouvez retrouver la captation vidéo en ligne.
En français, vous pouvez retrouver les réflexions du chercheur Franck Ghitalla sur son blog nommé l’Atelier de Cartographie.
Article publié sur Knowtex sous le nom “Cartographier les connaissances scientifiques“.
Photos Flickr CC par Kotomicreations et par frankfarm.
Illustrations :
- Wikipedia Commons
- Bibliothèque centrale de Seattle, photo Creative Commons par Frank Farm
- John Desmond Bernal, extrait de The Social Function of Science, 1939, reproduit dans Atlas of Science
- Harold Ellingham, Natural Science and Technology Chart, 1948, reproduit dans Atlas of Science
- Extraite d’Eugene Garfield, Citation Index to Genetics and Science Literature, 1960, reproduit dans Atlas of Science
- Extraite de Small & Garfield, The geography of science: disciplinary and national mappings, 1985, Journal of Information Science.
- Carte représentant les citations entre les catégories de revues de Thomson Reuters, présentée surEigenfactor.org.
- Créée en regroupant les données issues de 20 autres cartes, dont celles des illustrations 3, 4, 6 et 7, issue de Klavans & Boyack, Toward a Consensus Map of Science, Journal of the American Society for Information Science and Technology, 2009
- Diagramme présentant l’évolution des catégories de journaux, présentant la création de la catégorie « Neurosciences » et les catégories auxquelles les journaux qui la composent étaient auparavant reliées. Extrait de Rosvall et Bergstrom, Mapping Change in Large Networks, 2010.
- Cartes réalisées avec l’outil Overlay Maps, présenté sur le site Measuring and Mapping Interdisciplinary Research. Pour aller plus loin, lire Rafols, Porter & Leydesdorff, Science overlay maps : a new tool for research policy and library management, Journal of the American Society for Information Science and Technology, 2010.
- Projet VisIR, Franck Ghitalla, INIST-CNRS. Pour aller plus loin, lire la présentation du projet.
- Carte des cours de l’Université Brown, créée par Dylan Field, Devin Finzer et Ram Jayakumar
- Carte des Sciences pour Enfants, créée par Fileve Palmer, Julie Smith, Elisha Hardy et Katy Börner. Pour aller plus loin sur l’usage des cartes des sciences pour les enfants lire l’article Teaching Children the Structure of Science, des mêmes auteurs.
.
- Son projet de regrouper et d’indexer toute l’information de l’humanité dans un lieu, le Mundaneum, auquel tous pourraient accéder par téléphone, fait de lui l’un des grands visionnaires qui ont préfiguré le Web. [↩]
- En effet, le droit américain étant largement basé sur la jurisprudence, il est nécessaire pour pouvoir traiter un sujet, de remonter, de proche en proche, aux décisions de justice le concernant. [↩]
- Citation Indexing: Its Theory and Application in Science, Technology, and Humanities [↩]
- Aujourd’hui, les bases de données de Thomson Reuters (héritières du Science Citation Index), ainsi que celles, concurrentes directes, de Scopus, publiées par Elsevier, sont facilement accessibles pour les chercheurs via les sites Web of Knowledge et SciVerse. [↩]
Laisser un commentaire