Pratiques participatives et patrimoine numérisé
Participation
L’ouvrage de Raphaëlle Bats, Construire des pratiques participatives en bibliothèque (Bats 2015), est un excellent point d’entrée pour comprendre ce que l’on entend par « participation ».
Selon l’autrice, ce concept « implique un principe d’égalité qui est au cœur des sociétés démocratiques, depuis l’agora grecque. » (Bats 2015, p. 18). Il s’agit donc avant tout de questionner la hiérarchie habituelle entre les décideurs et ceux pour qui l’on décide, la légitimité et la perméabilité de celle-ci. Ce processus trouve sa place dans de nombreux domaines de la vie politique, sociale, et bien sûr culturelle.
On reconnaît généralement trois niveaux de participation : information, délibération et décision. Ces niveaux doivent cependant être nuancés en fonction de quatre autres modalités : temps (récurrence et régularité), acteurs, sens de la mise en œuvre (bottom-up ou top-down) et dispositifs (assemblées, conseils consultatifs etc.) (Bats 2015).
Il est cependant parfois complexe de saisir la nuance entre participatif et collaboratif. Un mémoire de recherche, écrit par Ariane Néroulidis, distingue en effet les projets participatifs, où les participants contribuent à un projet monté et tenu par des décideurs, et les projets collaboratifs, « pour lequel les contributeurs sont à la fois les concepteurs et les bénéficiaires, comme c’est le cas de Wikipédia » (Néroulidis 2015). Cette distinction est également retenue dans des ouvrages de Design Thinking (Aldana, Dromer, Leméni 2019, par exemple). La définition de de Raphaëlle Bats n’est cependant pas invalidée, car elle se base sur une notion politique de démocratie qui va au-delà de ce que d’autres entendent par « participation ».
Crowdsourcing
Le crowdsourcing a fait couler beaucoup d’encre, et l’on trouve d’excellents états de l’art récents qui traitent de l’un ou l’autre aspect de ce concept (Moirez, Moreux, Josse 2013 ;Néroulidis 2015 ; Dias da Silva, Heaton, Millerand 2017 ; Carron 2018 ; Boder, Dubosson 2020). Cette partie se contente de présenter les sources et éléments clés pour la compréhension du sujet et du présent travail.
Le terme crowdsourcing trouverait ses origines dans un article du magazine Wired, « The Rise of Crowdsourcing » (Howe 2006a). Dans un billet de blog publié le lendemain, l’auteur de ce mot-valise, composé de crowd, la foule, et d’outsourcing, externalisation, en donne cette définition :
« Simply defined, crowdsourcing represents the act of a company or institution taking a function once performed by employees and outsourcing it to an undefined (and generally large) network of people in the form of an open call. » (Howe 2006b)
Si l’idée de base semble simple, ce concept a pourtant été interprété de bien des manières. Un article de 2012, visant à proposer une définition exhaustive du crowdsourcing, recense en effet une quarantaine de définitions différentes de ce terme, réparties entre trente-deux articles publiés entre 2006 et 2011 (Estellés-Arolla, González-Ladrón-de-Guevara 2012).
Spécificités terminologiques et typologiques dans les GLAM
Dans le domaine patrimonial, le crowdsourcing prend des formes particulières. Un excellent état de l’art émanant de la Bibliothèque nationale de France, présente la participation dans ce contexte comme « la mise en œuvre de véritables compétences et connaissances des usagers, une interaction de haut niveau, de caractère scientifique », et le crowdsourcing comme des « projets collaboratifs de grande ampleur, mais l’accent sera davantage mis sur le nombre de participants, sur la notoriété du projet, sur la constitution de communautés de contributeurs, que sur la valeur scientifique de leurs contributions. » (Moirez, Moreux, Josse 2013, p. 6). Cette nuance repose à nouveau sur la place laissée aux usagers, mais aussi, et c’est essentiel, sur la légitimité accordée à leurs savoirs.
On note en outre l’importance de la notion de communauté. En effet, dans le contexte des GLAM, on parle volontiers de community sourcing, car les projets visent plus souvent des communautés d’usagers ou d’intérêt plutôt qu’une masse indistincte. Le terme nichesourcing est également utilisé pour des projets de niche, visant un public spécifique d’experts amateurs (Ridge 2013). La notion d’« amateur » prend ici une coloration particulière, et Trevor Owens souligne qu’il ne faut pas y voir de connotation négative, car Charles Darwin et Gregor Mendel étaient eux-mêmes des amateurs, au sens où ils n’étaient pas payés pour leur travail et leurs recherches (Owens 2014).
Publics et motivations
Les projets de crowdsourcing menés par des institutions culturelles attirent des usagers divers. L’article de Rose Holley, mentionné plus haut, propose quelques éléments concernant leurs profils (Holley 2010). Si certains profils semblent récurrents, chaque projet attire son public propre et développe sa communauté. Notons cependant qu’en règle général, 90% des tâches sont effectuées par 10% des usagers (Carron 2018), d’où l’intérêt d’attirer dès le début une foule aussi nombreuse que possible.
La question des motivations demeure cependant cruciale, car il s’agit toujours de volontariat, et l’usager doit pouvoir en tirer profit. Un article très récent (Alam, Sun, Campbell 2020) présente les motivations des usagers qui permettent d’initier la participation et de la maintenir.
Les auteurs distinguent les motivations intrinsèques, donc liées à la pratique de l’activité pour elle-même, extrinsèques, liées aux incidences de cette pratique, et extrinsèques internalisées.
Le paléographe et la machine
Les documents manuscrits sont un cas particulier. Leur intérêt premier découle en effet de leur contenu écrit, qui doit être déchiffré pour pouvoir être traité. Contrairement aux documents imprimés, pour lesquels les logiciels OCR donnent des résultats généralement bons, tous les manuscrits ne peuvent encore être décryptés par une machine avec des résultats suffisants (Terras 2016). La plateforme Transkribus, pionnière du domaine, repousse toujours plus loin les limites de la technologie, mais se révèle efficace essentiellement lors du traitement de manuscrits écrits de la même main. Une intervention humaine demeure donc nécessaire dans la majorité des cas pour produire des transcriptions fidèles à l’original.
Cet exercice, loin d’être aisé, est une discipline en soi que l’on nomme paléographie. Elle vise à produire des transcriptions qui pourront ensuite faire l’objet d’éditions, rendant l’accès au texte plus aisé et permettant d’en mieux comprendre la structure. Avec l’arrivée du numérique, le travail des paléographes et des éditeurs a évolué, en n’en devenant pas moins complexe. L’usage de langages de balisage tels que le XML, recommandé par le Text Encoding Initiative (TEI), permet en effet de mieux rendre la structure d’un document (Vikhrova 2018). Dans sa thèse, Anne Vikhrova parle de « decoding and encoding » : on décode le manuscrit pour ensuite l’encoder en un langage compris par les machines (Vikhrova 2018, p. 20). Ce travail requiert néanmoins des compétences informatiques qui ne font pas partie du cursus de formation traditionnel des paléographes, mais dont les spécialistes en Humanités numériques sont les ambassadeurs (Terras 2016).
Projets fondateurs
Le projet de transcription collaborative le plus connu est sans doute Transcribe Bentham.
Lancé en 2010 par un groupe de chercheurs du University College London, ce projet a pour objectif principal d’établir une édition complète de Jeremy Bentham (1748-1832), sur la base des transcriptions produites par le public (Moyle, Tonra, Wallace 2011). S’inspirant des bonnes pratiques de Rose Holley (Holley 2010), leur but est également de créer une communauté et d’attirer l’attention du public vers la pratique de la transcription de manuscrits ainsi que vers les œuvres méconnues de Bentham. Ce projet utilise un outil open source développé en interne, Transcription Desk, basé sur MediaWiki et permettant le balisage des transcriptions en XML par les contributeurs (Moyle, Tonra, Wallace 2011). Le projet n’est pas encore fini mais, rien qu’entre 2012 et 2014, plus d’un million de mots ont été transcrits, dont à peine 1% ont nécessité des modifications par l’équipe de chercheurs (Causer et al. 2018). Transcribe Bentham est un succès indiscuté qui a permis de faire connaître la transcription collaborative au grand public (Brumfield 2011).
Un autre projet que l’on peut considérer comme « fondateur » est Old Weather, lancé en 2010 par le service météorologique et le Musée Maritime National du Royaume-Uni, le site Naval History.net et la plateforme de science citoyenne Zooniverse. Il utilise l’outil de crowdsourcing de cette dernière, devenu depuis open source sous le nom de Scribe. Présenté à l’origine comme un projet de science météorologique, il a été considéré comme un projet de recherche historique par son public qui l’a traité ainsi, et c’est cet aspect qui aurait finalement attiré et fait rester les volontaires (Blaser 2014).
Projets récents et « état de l’art »
L’un des projets récents qui a fait beaucoup parler de lui est le Transcribathon d’Europeana, qui donne accès non seulement à des manuscrits mais aussi à des objets, photographies et autres, que les volontaires peuvent tagger. Ces documents sont issus de multiples institutions, l’un des objectifs d’Europeana étant de donner accès aux collections patrimoniales européennes en les agrégeant (Europeana 2020). Ce projet se construit comme un concours, et l’utilisateur reçoit des points, nommés miles, à chacune de ses contributions, ce qui lui permet d’accéder à plus de fonctionnalités (relecture et validation, par exemple).
La plateforme Zooniverse continue de proposer des projets de transcriptions. Parmi les plus récents, on trouve Anti-Slavery Manuscripts, lancé par la Boston Public Library, et Every Name Counts, un projet des Arolsen Archives visant à identifier les détenus de camps de concentration nazis.
Plusieurs grandes institutions ont récemment monté leurs propres projets de transcription collaborative. Non des moindres, la Library of Congress (LoC) a lancé, en 2018, By the People, un projet basé sur Concordia un outil open source développé en interne avec la méthode Agile, (Ferriter et al. 2019). La British Library a également développé son propre outil open source basé sur Pybossa, LibCrowds, pour sa plateforme du même nom.
|
Table des matières
1. Introduction
1.1 Cadre général : le virus, le web, et le patrimoine
1.2 Contexte du projet
1.3 Problématique et objectifs
2. Méthodologie
2.1 Design Thinking et UX
2.2 Ajustements méthodologiques
2.2.1 La théorie et la pratique
2.2.2 La crise sanitaire et ses incidences
2.3 Méthodes choisies
2.3.1 Lectures et observations participantes
2.3.2 Entretiens avec des experts
2.3.3 Questionnaires et tests – DCTN et Comité éditorial
2.3.4 Persona et recrutement d’usagers potentiels
2.3.5 Questionnaires et tests – usagers potentiels
2.3.6 Tri de cartes
2.3.7 Parcours utilisateurs
2.3.8 Prototype et outils
2.3.9 Marche à suivre
3. Revue de la littérature
3.1 Pratiques participatives et patrimoine numérisé
3.1.1 Définitions et typologies.
3.1.2 Recommandations et bonnes pratiques
3.1.3 Publics et motivations
3.1.4 Enjeux
3.1.5 La situation helvétique
3.2 Le cas des manuscrits
3.2.1 Le paléographe et la machine
3.2.2 Une solution collective : la transcription collaborative
3.2.3 Projets existants
4. Résultats et analyse
4.1 Observations participantes
4.1.1 Annotated Books Online
4.1.2 Anti-Slavery Manuscripts
4.1.3 DIY History
4.1.4 E-manuscripta
4.1.5 Europeana – Transcribathon
4.1.6 Harvard Library – Archives of the Gray Herbarium
4.1.7 Library of Congress : By the people
4.1.8 TACT
4.1.9 Transcribe Bentham
4.1.10 Transcrire
4.1.11 Éléments à retenir des observations participantes
4.2 Entretiens avec des experts
4.2.1 David Glaser – responsable de notrehistoire.ch – 16.04.2020
4.2.2 Barbara Roth – conservatrice responsable des collections spéciales de la BGE récemment retraitée – 04.05.2020
4.2.3 Liliane Regamey – responsable de e-newspaperarchives.ch – 25.05.2020
4.2.4 Alexa Renggli – coordinatrice de la plateforme e-manuscripta.ch et responsable de projet pour l’outil de transcription – 04.06.2020
4.2.5 Éléments à retenir des entretiens
4.3 Questionnaires et tests – DCTN et Comité éditorial
4.3.1 Objectifs, attentes et besoins
4.3.2 Publics, usagers potentiels
4.3.3 Un projet participatif
4.3.4 Sélection des documents
4.3.5 Plateformes testées
4.4 Persona et recrutement d’usagers potentiels
4.5 Questionnaires et tests – usagers potentiels
4.5.1 Enseignement et recherche en Histoire
4.5.2 Amateurs
4.5.3 Généalogie
4.5.4 Enseignement et recherche en Sciences naturelles
4.5.5 Récapitulation générale
4.6 Tri de cartes
4.7 Parcours utilisateurs
4.8 Prototype et outils
4.8.1 Maquette
4.8.2 Outils envisageables
4.8.3 Informations récentes et proposition de solutions
4.9 Marche à suivre
5. Recommandations
5.1 Recommandations techniques
5.1.1 Qualité et interopérabilité
5.1.2 Cadre juridique
5.1.3 Communication et collaboration
5.1.4 « Construire pour » et « construire avec »
5.2 Recommandations stratégiques
5.2.1 Le parapluie et les baleines
5.2.2 La vitrine et la porte d’entrée
5.2.3 Une communauté plutôt qu’une foule
5.2.4 Ouvrir la porte
5.2.5 …et sortir de la pièce
6. Conclusion
Télécharger le rapport complet