Les centres de documentation dans les sciences sociales: des musées laboratoires aux digital humanities.


Communication présentée dans le cadre de la Journée d'étude en hommage à Jean Meyriat, le 11 octobre 2011, au CERI/SciencesPo, Paris
« Recherche et documentation en sciences humaines et sociales : nouvelles pratiques et nouveaux enjeux»

Mon propos ne sera pas précisément historique, ce que je vais tenter de mettre en évidence ici, c'est la spécificité de catégories documentaires rapportées à des configurations historiques particulières. Ce que j'appelle ici le « musée-laboratoire» – l'expression est  chez GH Rivière, qualifie également une démarche documentaire qui se met en place dans les années trente. Si je fais référence à distance aux Digital Humanities, j’envisage une notion qui n'est pas en fait précisément documentaire, du moins pas prioritairement. Je l’utilise ici pour pointer  de nouvelles façons d’envisager le rapport entre les SHS et l’univers numérique.
Ce que je voudrais éviter ici, c'est de tomber dans le piège des fausses continuités historiques, ou celui des reconstructions rétrospectives. Je ne chercherai pas dans les années trente une phase préalable, le moment d'une évolution qui conduirait aux développements récents, une sorte de moment-naissance ou de moment-origine. Pas plus que je chercherai dans les années trente, ce que certains spécialistes des sciences de l'information et de la communication espèrent y trouver, un moment fondateur, ou un temps des précurseurs.
S'il y a des similarités entre ces deux moments, celui des années trente, et le nôtre, c'est peut-être parce que ces deux moments sont des moments de transition, des moments de transformations des systèmes documentaires. Mon hypothèse et mon propos sont peut-être ambitieux mais je vais tenter le pari. Bien entendu je me concentre ici sur deux éléments: la documentation et les sciences sociales. Par ailleurs, en procédant de la sorte, j’ai bien conscience d’écarter délibérément toute analyse des développements et des évolutions et de laisser ainsi en suspens la question des lignes de continuité.

De la documentation
Je propose l'idée que l'émergence et le développement de la documentation dans les années trente a été une tentative de résoudre des problèmes de gestion et de traitement de l'information qui excédait en quelque sorte les systèmes institués alors qu’étaient d'une part les bibliothèques, de l'autre les archives et dans une certaine mesure les musées.
La notion de documentation se redéfinit et se restructure dans la première partie du XXe siècle pour tenter de faire face à la gestion et au classement de nouvelles formes de documentation et d'information dans deux domaines principalement: les sciences et l'industrie plus largement les activités économiques.

La deuxième partie du XIXe siècle est marquée par un développement important de ces deux domaines d'activités qui génèrent des formes inédites de documentation:
= imprimées: revues, brochures, prospectus, modes d'emploi, schémas;
= manuscrites: notes, dessins, graphiques, fiches.  

Cette énumération n'est nullement exhaustive. Il me semble que le classement et la gestion de cette documentation dépassaient les capacités des bibliothèques, soumises également à une augmentation de la production des livres et de l'imprimé, et des archives.

La notion de documentation, si je m'en réfère à la conception qui était celle du belge Paul Otlet, avait pour ambition de classer la forme et surtout le contenu du document. A cette fin, il avait imaginé un dispositif ambitieux de mise en fiches de l'information et son classement recourrait à une version revue et complétée de la Classification décimale universelle de Dewey.

La CDU était en quelque sorte le prolongement classificatoire de l'utopie universalisante de Paul Otlet qui avait esquissé le projet d'une cité mondiale et un Mundaneum, musée ou plus ambitieusement Palais de la connaissance universelle. Paul Otlet publie en 1934 son volumineux Traité de la documentation. Une grande partie de ses engagements documentaires se tournent alors vers les entreprises et les activités économiques Il publie notamment un Traité de documentation pour la chimie, pour les pharmaciens, les médecins, etc...

Mais la documentation ne se résume pas pour Paul Otlet à un ensemble plus ou mois cohérent ou disparates de documents, ce qui l'intéresse c'est moins la forme ou le support que les contenus qui dès lors concernent l'intégralité des supports, que ce soit le livre ou l'archive ou la documentation de manière générale. L'instrument de cette opération était la fiche, qui ne devait pas se limiter dans la conception d'Otlet à référencer l'objet, tel le livre mais également ses contenus (Encylcopédie documentaire). 


L'unité documentaire: le biblion

Je  cite Paul Otlet un peu longuement:
« partant d'une unité initiale, s'étendant à des grands d'unités de plus en plus étendus, embrassant finalement toutes les unités, existantes ou à réaliser, en une organisation envisageant à la base, l'entité documentaire collective des institutions, des administrations et des firmes: l'entité des organes spécialement consacrés au Livre et au Document, à l'ensemble ou quelqu'une de ces fonctions: Bureau, Institut, Rédactions des Publications, Bibliothèques, Offices de Documentation.»

Il définit  cette unité commune à toutes les formes et tous les supports comme le biblion, sorte d’atome ou de particule élémentaire de la documentation. Mais c’est un peu forcer le trait.

La diversité des supports: un système de télécommunication
Paul Otlet est aussi fasciné par la diversification des modes de communications et des supports de l'information. Dans un schéma esquissé sur du papier calque destiné  à illustrer son Encyclopédia Universalis, Otlet montre comment il pensait associer les différents «médias» de son temps, mentionnés également dans la citation dont je viens de vous faire part.
Ainsi à la fin du Traité de documentation, il suggère cette hypothèse optima, hypothèse qu'il juge «réaliste et concrète» : une Table de travail libérée de tous les livres : « A leur place se dresse un écran et à portée un téléphone. Là-bas au loin, dans un édifice immense, sont tous les livres et tous les renseignements, avec tout l'espace que requiert leur enregistrement et leur manutention, avec tout l'appareil de ses catalogues, bibliographies et index, avec toute la redistribution des données sur fiches, feuilles et en dossiers, avec le choix et la combinaison opérée par un personnel permanent bien qualifié. Le lieu d'enmmagasinement et de classement devient aussi unlieu de distribution, à distance avec ou sans fil, télévision ou télétaugraphie. De là on  fait apparaître sur l'écran la page à lire pour connaître les réponses aux questions posées par téléphone, avec ou sans fil.»
Nous avons bien là une structure d'échange et de circulation qui est le réseau organisé par une Convention internationale gérée par un Office mondial.
Le réseau universel de documentation prend place dans une organisation générale du travail intellectuel et celle-ci dans l'organisation mondiale elle-même. Ce réseau est un réseau de télécommunication

Une discipline : la sociologie
Dans la pensée de Paul Otlet, une discipline a une place particulière: la sociologie. Paul Otlet est membre de l'Institut international de sociologie Solvay. A cet égard il faut rappeler ici l'importance de l'Institut de sociologie Solvay créé à Bruxelles en 1902 qui était organisé autour de 4 axes: Cabinets de travail (technologie et géographie, statistique, histoire, anthropologie); groupes d'études; des publications, et un Service de documentation: lequel comprenait 1) le Répertoire bio-bibliographique et 2) l'Intermédiaire sociologique. C'est la Bibliothèque et le Service de documentation qui constituent alors le coeur des activités de l'Institut. Le Service de documentation se propose d'élaborer des répertoires en complément des bibliographies existantes, d'établir également un fichier des comptes rendus extrait des revues, et de constituer un répertoire biographique des sociologues contemporains. Le complément de ce dispositif de fichiers étant l'Intermédiaire sociologique, publié sous le patronage de l'Office International de Documentation et d'information pour les sciences sociales.
Ce dispositif pense et tente d'associer plusieurs idées: l'accumulation des connaissances, la diversité de supports, la multiplicité des sciences et leurs spécialisations. 

La documentation dans les nuages : les digital humanities
Le projet des Digital Humanities qui se met en place aujourd'hui dans un univers technologique très différent qui se caractérise à la fois par le tout numérique, le développement d'internet, et plus récemment le Web 3.0 dit web des données ou web des connaissances qui se déploie dans le cloud computing est confronté à des échelles très différentes à des problèmes similaires.

On assiste également depuis quelques années à un accroissement exponentiel spectaculaire des données, cet croissance est telle que l'idée même de la gestion de l'accumulation devient un problème en soi. En revanche, on pourrait en apparence penser que la gestion de la diversité des supports est réglée avec la grande conversion numérique. Mais d’autres problèmes liés notamment à l’incertitude sur la conservation ou la stabilité des documents ont surgi.
Le numérique a par ailleurs généré de nouveaux types de documents hypertexte, hypermedia, etc.. Tous les dispositifs bibliographiques et documentaires, et progressivement le contenu même des bibliothèques est soumis à cette conversion. 

De manière précise, l'émergence de la notion d'Humanités digitales pour franciser un peu Digital humanities n'est pas directement liée aux problèmes de la gestion de cette accumulation spectaculaire qui échappe à toute mesure. Mais il rejoint ces questions ou plutôt me semble-t-il les retravaille différemment. A l'origine si je m'en tient au Compagnion des Digital Humanities, cette notion renvoie à une formule différente et plus explicite qui était le lien entre les humanités et l'informatique.

L'expression anglo-saxonne est alors «the computer and the humanities», les humanités et l'informatique. L'expression désigne alors l'ensemble des expérimentations d'analyse textuelle et généralement lexicographique de corpus linguistiques ou textuels. Il s'agit donc exploitant les ressources informatiques encore limitées d'inventer de nouveaux dispositifs pour analyser des corpus  importants de ressources linguistiques. L'une des origines de ces expérimentations a été celle du père jésuite Roberto Busa qui a traité informatiquement tout le corpus des textes de Saint Thomas d'Acquin constitué à un moment où les textes eux-mêmes n'étaient pas encore numérisés. 

Les Humanités digitales se sont donc développées dans un créneau qui a été celui du traitement automatique des textes, celui aussi de l'édition électronique aujourd'hui numérique des textes. La constitution d'énormes ressources de textes numérisés confrontent les chercheurs à des problèmes nouveaux qui ne sont pas ou de moins en moins l'élaboration d'instruments de gestion de ces masses documentaires, mais leur lecture, leur analyse et leur interprétation. Ces nouveaux questionnements sont désormais possibles par la qualité et la précision de la numérisation. 

A ces ambitions d'édition et de critique textuelle, les Humanités digitales intègrent aujourd'hui d'autres éléments qui touchent plus largement aux données elles-mêmes, à leur circulation et leur conservation. Digital humanities est donc devenu un slogan, un «buzzword», qui s'efforce de mobiliser les sciences humaines et sociales autour de grands projets informatiques. 

Aujourd'hui en France, la formule est revendiquée dans un Manifeste des Digital humanities qui se propose de rassembler l'ensemble des chercheurs et des acteurs militant pour à une libre circulation des données  produites par la communauté scientifique. 
Ces orientations sont exprimées en particulier dans les points 9 et 10 de la charte.
« 9. Nous lançons un appel pour l’accès libre aux données et aux métadonnées. Celles-ci doivent être documentées et interopérables, autant techniquement que conceptuellement.
10. Nous sommes favorables à la diffusion, à la circulation et au libre enrichissement des méthodes, du code, des formats et des résultats de la recherche.»
Je n'ai pas le temps d'interroger plus avant ces projets mais il serait aisé et sans doute utile de les confronter à l'utopie universalisante de Paul Otlet.

D'ailleurs, les préoccupations et les propositions des acteurs des Digital Humanities  rejoignent d'autre problèmes auxquels s'est confronté Paul Otlet et qui me paraissent avoir été et être  nouveau aujourd'hui des problèmes de période de transition.

Ce sont quelques unes des dimensions de ces transitions que je voudrais esquisser pour terminer. 
L'univers numérique qui est désormais principalement le nôtre (ce qui ne signifie pas obligatoirement la disparition des autres formes de support) transforme non seulement nos modes de travail, nos savoir faire, etc.. mais aussi peut-être nos modes de penser. C'est l'hypothèse que font des chercheurs comme Bruno Bachimont qui propose de rendre compte des nouvelles façons de penser induite par les technologies numériques. Il oppose en particulier dans une étude très excitante l'idée d'une raison computationnelle fondée sur le calcul opposée ou distincte au moins de  la raison graphique fonde sur l’écriture analysée par Jack Goody. Celui-ci avait analysé dans un livre devenu un grand classique certaines transformations de la pensée produite par l’écriture. J’en retiens deux ici : la liste: qui permet d’énumérer; qui rassemble ce qui est dispersé, qui ouvre le classement et autorise les catégorisations. L’écriture fonde une raison classificatoire. L’autre élément, c’est le tableau: qui permet d’établir des rapports entre des unités à travers leur position. L’écriture fonde ici une raison systématique. Brunon Bachimont oppose à cette raison graphique  une autre logique induite par le numérique : à la liste s’oppose le programme qui permet de déterminer un parcours dans la masse des données ; le tableau désormais dynamique est remplacé par la structure complexe du réseau.
Je cite Bachimont : « La raison graphique a produit la raison classificatoire, la raison computationnelle  produit la pensée en réseau et le temps de la prévision.»
Tout cela est trop rapide, mais me permet de mettre en évidence une discontinuité entre des régimes documentaires qui se succèdent sans s’éliminer complètement.

Je reviens pour terminer à Paul Otlet. Il avait lui tenté de penser son projet documentaire dans une perspective similaire,  qui nous permettrait de proposer la formule de «raison documentaire».
Otlet pense non seulement la CDU comme un « langage nouveau» mais  la documentation comme une raison spécifique: on en trouve les éléments dans les lois «bibliologiques» qui régissent selon lui l'immense accroissement documentaire de son temps: je les reprend rapidement:  
a) il se constitue par les livres un véritable dédoublement  des esprits : le double de l'humanité» ;
b) ce double documentaire s'affranchit des auteurs eux-mêmes et produit des effets d'accumulation et d'abstraction,
c) partout dit-il enfin la condition humaine en est elle même «toute modifiée».

Mais une des limites me semble-t-il de la raison documentaire de Paul Otlet, c'est qu'elle ne s'émancipe pas véritablement du livre. La bibliographie dans son système demeure l'horizon documentaire et le répertoire bibliographique son instrument. Mais le livre chez Otlet n'est pas réduit à sa dimension matérielle habituelle car il pense également l'organisation du livre sur un support nouveau: le microfilm. Il évoque dans ses écrits les avantages du «livre microphotique» comme moyen de conservation durable de la pensée et de la connaissance.
Aujourd'hui dans le nuage informatique, le livre et le document sont profondément redéfinis, mais l'unité de référence ce n'est plus le biblion mais les données et les métadonnées.
Si le numérique transforme le livre, il ne le détruit pas. Avec la multiplication des tablettes de lecture, on peut même penser que le livra aura raison de l’ordinateur.