La revue du projet

La revue du projet
Accueil
 
 
 
 

La recherche publique à l’heure des humanités numériques, Olivier Ritz

Connaissez-vous les humanités numériques ? Les programmes de recherches, les colloques, les publications et même les postes spécifiques estampillés « humanités numériques » se multiplient. Au-delà d’un effet de mode, ce développement institutionnel est la partie la plus visible de transformations profondes de la recherche en sciences humaines, pour le meilleur et pour le pire. Alors que les résultats des premiers grands projets aboutis sont désormais accessibles, les humanités numériques font l’objet de nombreux écrits. Je souhaite donner un aperçu des pratiques et de leurs critiques, en prenant surtout des exemples du côté des études littéraires.

 

Les sciences humaines et l’informatique

« Les humanités numériques recouvrent un ensemble de pratiques de recherche à̀ l’intersection des technologies numériques et des différentes disciplines des sciences humaines » (Dacos et Mounier, 2014). L’expression humanités numériques, qui traduit l’anglais Digital Humanities, marque une étape importante dans l’histoire des relations entre les sciences humaines et l’informatique. Le développement des ordinateurs a permis, depuis les lendemains de la Seconde Guerre mondiale pour les projets pionniers puis surtout depuis les années 1980, des approches nouvelles des sciences humaines. L’utilisation de l’informatique a plusieurs conséquences. Elle permet d’automatiser le traitement des données et par conséquent d’en traiter des quantités toujours plus importantes. La préparation des données implique de mettre au point des protocoles de numérisation et d’encodage qui contraignent à faire des choix, à lever des ambiguïtés.

En France et dans le domaine de la littérature, la Banque de données d’histoire littéraire (BDHL), créée en 1985 à l’université Paris 3, donne un bel exemple des réalisations de cette première période : l’informatique a permis de réaliser l’ambition d’une « science du littéraire » affirmée par Gustave Lanson. La BDHL est construite à partir de plusieurs dizaines de manuels d’histoire littéraire. En mesurant la présence des différents écrivains, elle permet d’interroger la notion de canon littéraire. On peut ainsi « étudier objectivement des données subjectives », comme l’écrit Michel Bernard, qui dirige depuis 2000 le centre Hubert de Phalèse, dont la mission est de « développer les études littéraires assistées par ordinateur et de diffuser ces nouveaux savoirs ».

Les sciences humaines assistées par ordinateurs (Humanities Computing) sont devenues humanités numériques (Digital Humanities) avec le développement du Web à partir du milieu des années 1990 : « L’informatique (computing), outil au service de la recherche est devenu le numérique (digital), véritable environnement global au sein duquel la recherche est effectuée » (Dacos et Mounier, 2014). La mise en réseau des machines transforme radicalement le rapport aux données, auxquelles on peut désormais accéder à distance, de manière instantanée. La communication entre chercheurs change aussi profondément, rendant possible des modes de collaboration inédits.

L’exemple de la numérisation des textes montre à la fois les potentialités et les problèmes nouveaux qui sont posés. Pour étudier un texte, il est de moins en moins souvent nécessaire d’aller dans une bibliothèque et d’en lire une version imprimée. Des versions numérisées peuvent être consultées à distance. Mieux même : les techniques de reconnaissance de caractères progressent très rapidement. Alors qu’il y a peu de temps les textes disponibles en ligne étaient de simples images des pages imprimées, il s’agit maintenant, dans la plupart des cas, de chaînes de caractères qui peuvent être interrogées par des outils de recherche automatisés. On a donc accès plus rapidement à un plus grand nombre de textes et l’on peut, de plus en plus, utiliser l’ordinateur pour effectuer un travail de repérage qui nécessitait autrefois de longues lectures.

Les enjeux économiques et politiques

Mais ce progrès technique est lourd d’enjeux économiques et politiques. En matière de numérisation des textes, le principal acteur, et de très loin, s’appelle Google. La multinationale a entrepris de numériser tous les livres ! Plus étonnant encore : elle est en voie d’y parvenir. Pour les textes anciens, dans le domaine public, l’accès est libre pour le moment, puisqu’il s’agit encore de gagner le plus grand nombre d’utilisateurs possible. Mais qui peut garantir qu’il le restera toujours ? Si Google parvient à établir un véritable monopole, qui l’empêchera de faire payer l’accès ? Pour les textes plus récents, sous droits d’auteurs, Google et les éditeurs se livrent des batailles juridiques qui bénéficient rarement aux utilisateurs.

Deux types de contre-pouvoir existent. D’une part, de manière décentralisée, les militants du libre accès et des logiciels libres : spécialistes d’informatique ou nouveaux venus dans le champ des technologies de l’information et de la communication, ils dénoncent les stratégies monopolistiques des grands groupes privés et inventent des outils que chacun peut s’approprier librement. D’autre part, les pouvoirs publics peuvent et doivent jouer leur rôle. En France, la Bibliothèque nationale mène une politique de numérisation et de mise à disposition des textes très ambitieuse, avec sa plateforme Gallica. Moins connue du grand public, la très grande infrastructure de recherche (TGIR) Huma-Num développe des services de stockage, de traitement, de diffusion et de conservation des données. Huma-Num est une institution publique, qui dépend du CNRS et de l’université d’Aix-Marseille. Véritable service public de la recherche à l’heure du numérique, elle travaille à rendre les données utilisables par tous, de manière pérenne. Tout en développant des outils à vocation universelle, elle ne procède pas de manière centralisée, mais plutôt par la concertation collective et la collaboration.

Les humanités numériques changent en effet la manière de travailler. Les chercheurs ne découvrent pas le travail collectif : la collégialité fonde leur travail depuis toujours. Mais les outils qui se développent avec les réseaux rendent possibles des collaborations nouvelles, soit entre spécialistes de champs disciplinaires assez éloignés les uns des autres, soit entre spécialistes et non-spécialistes. À l’université Paris-Diderot, nous avons entrepris de numériser les six volumes de notes prises par Michelet alors qu’il préparait son Histoire de la Révolution française. Si Paule Petitier, à l’initiative de ce projet, est une spécialiste de littérature française, nous travaillons régulièrement avec des informaticiens, soit pour mettre au point et faire évoluer le protocole de transcription, soit pour élaborer l’outil de visualisation qui rendra disponible le résultat de la recherche. Un autre projet, déjà abouti, montre l’intérêt de la collaboration : les manuscrits de Madame Bovary de Flaubert ont été transcrits entre 2003 et 2005, grâce à de très nombreux transcripteurs bénévoles. La mise au point d’un protocole de saisie et d’encodage très simple a permis de faire contribuer près de six cents personnes, dont un grand nombre d’élèves de seconde. La production participative (en anglais crowdsourcing) permet un gain de temps considérable, mais aussi un partage beaucoup plus grand de la connaissance, jusque dans son processus de production.

Comme pour l’accès aux données, les possibilités nouvelles offertes par le numérique sont aussi de nouveaux dangers pour la recherche publique. D’une part, là aussi, les outils collaboratifs les plus répandus appartiennent aux plus grands groupes privés, Google et Microsoft. D’autre part, les projets collaboratifs sont souvent le levier d’une gestion néolibérale de la recherche et des universités. Les humanités numériques servent de prétexte pour multiplier les contrats courts ou le recours à des prestataires extérieurs, quand la recherche souffre par ailleurs d’un manque criant de moyens pérennes.

Le Manifeste des Digital Humanities adopté à Paris en mai 2010 appelait à la constitution d’une « communauté de pratique solidaire, ouverte, accueillante et libre d’accès ». L’enjeu de l’ouverture et du libre accès reste déterminant, mais le rôle des pouvoirs publics sera également décisif pour le développement de la recherche à l’heure des humanités numériques. Les pouvoirs publics sont les seuls qui aient la puissance économique nécessaire pour faire exister des institutions et des infrastructures indépendantes des multinationales du numérique. Pour cela, il n’est pas seulement nécessaire de dénoncer les partenariats passés avec ces grands groupes, il faut aussi en finir avec une gestion managériale et néolibérale de la recherche. Cela suppose un changement profond des rapports de forces politiques, mais c’est à cette condition que le formidable potentiel démocratique des humanités numériques pourra être réalisé : l’accès libre au savoir et son partage en actes.

 

*Olivier Ritz est maître de conférences en littérature française, édition et humanités numériques à l’université Paris-Diderot.

La Revue du projet, n°68 juin 2017

Il y a actuellement 0 réactions

Vous devez vous identifier ou créer un compte pour écrire des commentaires.