Site créé avec :
jefaismonsite création de sites web

exercices de philosophie

par Maryse Emel


Humanités numériques


La revue Socio ainsi fait paraître un numéro sur le thème Le tournant numérique et après ? dans lequel les contributeurs « cherchent à comprendre comment se déploie la recherche en sciences humaines et sociales sur et avec le numérique, mais aussi, en quelque sorte, en son sein, de l’intérieur, comme partie intégrante d’une nouvelle culture scientifique ».

Dana Diminescu, Michel Wieviorka (dir.), Le tournant numérique et après ?, numéro de la revue Socio, 4 avril 2015.


 

Vers une nouvelle ontologie.

Une des questions que soulèvent les humanités numériques est celle du critère de sélection des sources et ensuite l’usage qui peut être fait de cette production quantitative de données. Il s’agit de montrer dans cet article comment on peut produire un renouveau dans les méthodes et les concepts en littérature à partir des outils existants et surtout mettre en question des présupposés admis. La notion de chef-d’œuvre se voit ainsi par exemple critiquée car elle se révèle être une catégorie préconstruite. Un des paradoxes de la démarche des humanités numériques est de nous libérer d’une approche bien trop mécanique de la littérature, et de fait d’une conception erronée de l’outil numérique, bien trop souvent ramené lui aussi à un mécanisme aveugle.


 

Dans un dossier publié dans la revue Socio en 2015, Alexandre Gefen ((chargé de recherche au Centre d’étude de la langue et des littératures françaises, CNRS )) faisait le point sur les « humanités numériques » après le moment des « big data », c’est-à-dire cette période d’accumulation des données. Extraction et traitement de, l’information avaient alors nécessité de mettre en place des méthodes algorithmiques. L’émergence de nouvelles sources disciplinaires, les bibliothèques en ligne, les moteurs de recherche, tout cela contribua à un renouveau assez fascinant des informations. Apparaissaient de nouvelles ressources. Prenant l’exemple de la littérature, il montre comment alors le texte, face à l’empire hypertexte, se trouve décentré, délocalisé. La question qui se pose alors est celle du sens de tous ces savoirs accumulés, de leur usage et d’en souligner les enjeux épistémologiques.

Après ce moment des données, surgit un second moment, celui de la construction du corpus. Les besoins concrets et les contraintes des usages techniques, les modalités juridiques d’exploitation, sont assortis d’autres difficultés, à savoir les outils de la méthode à mettre en place utiles à leur classement, les politiques de numérisation de masse, les ressources des bibliothèques n’étant pas toujours numérisables – notamment dans le cas des périodiques. Le projet d’une bibliothèque de Babel numérique reste une chimère. Bien souvent on en reste à des méthodes empiriques proches du bricolage. En outre, le passage à la numérisation présente des zones d’ombre. Par exemple qu’est-ce qui explique le passage d’un récit narratif à une information ou encore quelle est la méthode suivie pour passer d’un contenu dit « significatif » à un contenu « négligeable » ? Pour un texte classique qu’est-ce qui justifiera de conserver ou non l’écriture d’origine – les marques de ponctuation par exemple ? S’appuyer sur des procédés déjà en place, ou « des cartes de mots clés signifiants » ((p.65)) générés par les algorithmes, pose la question de leur pertinence en termes d’universalisation, et comme l’écrit l’auteur, une « lourde ingénierie des connaissances », sans parler du temps à investir. L’informaticien se voit ainsi associer par nécessité au travail disciplinaire.

Il y a ainsi un paradoxe dans cette association de « la standardisation et la modélisation égalisatrice par les normes ouvertes, « démocratiques » et générales du web » ((p. 65)) et la délégation de certaines opérations de sémantisation à des algorithmes. Il y a donc une diversité de méthodes de numérisation. Ainsi les textes numérisés sont exposés aux aléas de leur constitution.

L’interprétation de tables lexicales de concordance, les fouilles textuelles approfondies qui permettent de dégager une thématique sont comme abandonnées à une certaine intuition interprétative et un retour à la disciplinarité. Cependant, face au présupposé majeur des œuvres classées comme chefs-d’œuvre, évolutionnisme historiciste qui daterait de Lukacs, l’accroissement numérique des corpus et « l’aplatissement » des textes littéraires dans l’espace numérique, « permettent d’interroger des corpus qui ne hiérarchisent pas a priori les entités informationnelles » ((p.68)). Cela signifie des rapprochements parfois originaux et des constats inattendus, éloignés des présupposés de départ. L’automatisation des rapprochements textuels fait surgir aussi un certain nombre de surprises. On peut au sein de textes éloignés de la littérature trouver parfois des rapprochements avec des textes littéraires. Le travail sur la réception d’une œuvre se voit également enrichi. Ce décentrement de la littérature qui aboutit à une remise en question de ses frontières aboutit à une ontologie plus fluide, moins essentialiste : une ontologie « plate ». Cette idée d'ontologie plate apparaît récemment dans l'ouvrage de Manuel De Landa (Intensive Science and Virtual Philosophy, 2002) pour désigner des pensées qui ne visent aucune hiérarchie et posent entre les choses du monde une stricte égalité ontologique

« Les humanités numériques font du texte littéraire, pour le meilleur ou pour le pire, un discours parmi d’autres, connecté à d’autres » conclut Alexandre Gefen ((p. 7, 1)).