En route vers la numérisation
A vrai dire, ce projet n’a pas commencé le 18 décembre 2006, date du début de mon stage, mais trois semaines plus tard. Au cours de la réunion hebdomadaire du lundi, il fut décidé que le lendemain, soit le mardi 9 janvier 2007, se tiendrait une première réunion pour discuter du projet.
Les premières idées surgissent et sont prises en notes par Célia et moi-même. Beaucoup de sujets à la fois sont évoqués mais la tâche à effectuer dans un premier temps nous apparaît primordiale: il s’agit d’une étude du fonds documentaire visant à mieux le caractériser, visant à déterminer ce que possède réellement l’entreprise. Comment commencer une numérisation sans savoir ce qui est à numériser? Cela paraît totalement impossible. Selon Thierry Delcourt, directeur de la bibliothèque municipale à vocation régionale de Troyes, dans l’ouvrage Conduire un projet de numérisation, la démarche qu’il qualifie d’« habituelle » est l’identification du « corpus documentaire ». Cette étude va aider à répondre à la question: « Quels documents sont concernés par le projet? ».
A la découverte du fonds photographique
Il est important de préciser que la volonté de départ de La Voix du Nord est de numériser la totalité de son fonds documentaire, c’est-à-dire celui qui n’est pas numérique et qui regroupe des photographies sur support papier, des diapositives et des microfilms. Si l’étude que j’ai effectuée s’attache davantage au fonds photographique, c’est parce que la numérisation d’un fonds photographique est intéressante pour le nombre de questions problématiques qu’elle soulève. Ces problèmes sont dus essentiellement au fait que les documents ne contiennent pas de caractères graphiques. Mais nous développerons toutes ces interrogations un peu plus tard.
L’étude qui s’impose tout d’abord est un recensement quantitatif des photographies. Seulement, les difficultés pointent déjà le bout de leur nez puisque la salle des archives est constituée de plusieurs dizaines d’étagères avec plusieurs centaines de boîtes dont le contenu n’a pas servi depuis quelques années. En allant à la découverte de ces archives, les trois semaines précédentes, j’avais pu faire ce constat: le fonds photographique possédé par La Voix du Nord est dense, riche et diversifié. En effet, la salle des archives se compose de vingt-trois imposants rayons qui supportent des boîtes dont la poussière indique qu’elles ne sont pas souvent maniées. Ces boîtes sont classées par catégories qui sont variées mais qui peuvent apporter des confusions à certains moments. Les personnalités, qui ne font pas moins de onze rayonnages au total, représentent une catégorie assez éparse à cause du fait que sont mélangés des acteurs, des hommes politiques, des artistes et des anonymes qui ont eu un jour ou l’autre leur photo dans La Voix du Nord. Toutes les personnes sont réunies sous cette seule appellation puis vient un classement alphabétique. Voici quelques autres thèmes: les pays et villes du monde, les véhicules, les catastrophes, les accidents et faits divers, le cinéma, les téléfilms, le théâtre, la vie quotidienne, la marine nationale, les communes de France qui se trouvent à part de celles de la région et de la ville de Lille,… Ce classement thématique ne suit aucune norme et a été visiblement créé il y a bien longtemps et petit à petit de nouveaux thèmes sont venus rejoindre les précédents afin de se compléter. Une boîte contient plusieurs dossiers toujours classés par ordre alphabétique, sachant qu’un dossier est employé pour une personne, un thème précis, une ville,… Par exemple, le dossier intitulé « Carthage » se trouve dans la boîte étiquetée « Tunisie – Villes sauf Tunis ».
Les documents que l’on trouve dans les dossiers sont de nature diverse. D’abord j’ai découvert des documents textuels qui sont soit des articles tirés de La Voix du Nord ou d’autres journaux, soit des brèves de l’Agence France Presse. C’est étonnant puisque ces boîtes sont destinées en priorité aux photographies mais après réflexion, j’ai remarqué que certaines personnalités n’étaient pas célèbres contrairement à d’autres et par conséquent le documentaliste de l’époque a certainement voulu replacer les photos dans leur contexte. Par exemple, il a ajouté les résultats des élections législatives d’un candidat qui ne fait plus partie de la scène politique aujourd’hui. Les autres documents sont des photographies papier, des photos tirées d’articles de presse, des reproductions, des cartes postales, etc… Les photos sont pour certaines en noir et blanc, d’autres ont bénéficié de la couleur.
La salle des archives est impressionnante à première vue et nous nous demandions, Célia et moi, comment réaliser notre étude en étant très rigoureu^Nous avons opté pour une estimation, compter toutes les photos une par une serait une mission impossible. Le tout est de mettre en place une méthode, une procédure pour que l’estimation soit aussi proche que possible de la réalité. D’un-^ commun accord, nous avons pris la décision d’étudier avec attention un échantillon de vingt-trois boîtes à raison d’une boîte par rayon. Comme toutes les boîtes sont identiques et fermées, le choix est aléatoire. De plus, chaque boîte contient un nombre de photos différent, nous ferons attention de sélectionner des boîtes bien remplies et d’autres moins. A chaque fois que je choisis une boîte, je compte le nombre de photos découvertes et je les classe dans un tableau à trois colonnes, conçu préalablement. Ces trois colonnes portent les titres suivants: « photos jugées valables pour la numérisation », « articles accompagnants » qui sont souvent collées à des fiches cartonnées et qui donnent des précisions sur le sujet du dossier et enfin « photos non datées et/ou abîmées » dont la numérisation est fortement déconseillée. Les critères de jugement sont purement subjectifs quoique, lorsque la photo que l’on a entre les mains est vieille, jaunie et a des couleurs qui ont comme on dit « passées », ce ne soit plus la peine de se demander si elle est « numérisable ». J’ai consacré trois après-midi entiers à cette étude. Ce travail nécessaire était à la fois pénible et captivant. Cela m’a permis de faire de plus amples connaissances avec ce fonds et de découvrir des véritables trésors cachés. En moyenne, les photos datent des années 1970-80. Cependant, il m’est arrivé de trouver des clichés d’une époque antérieure. Par exemple, des représentations de paysages tunisiens datent tout de même de 1935, soit quelques années avant la deuxième guerre mondiale. C’est d’autant plus intéressant que le journal à l’époque n’existait pas encore, il s’agit sûrement de photos récupérées. D’autres ont été prises pendant la guerre. Toutefois, des photos beaucoup plus récentes, des années 1990 existent mais restent tout de même minoritaires, le fonds étant numérisé depuis juillet 1998. Cette exploration d’un fonds qui n’est pas à la portée de tous n’a pas été un travail laborieux. Pendant que je m’occupais de ce tri quantitatif, la documentaliste Célia Ricard s’attelait au même travail dans la salle des archives de La Voix des Sports, qui se situe au bout du couloir. Comme les boîtes sont nettement moins nombreuses, l’étude a porté sur un échantillon de deux boîtes seulement.
A la fin de ce dépouillement de dossiers et de ce classement, il a fallu se mettre à calculer et se rappeler de quelques formules mathématiques pour en venir à bout. Sur vingt-trois boîtes, ont été recensées au total 1928 photos dont 522 sont non datées ou trop abîmées pour faire partie du projet de numérisation. Sachant que chaque rangée peut comporter jusqu’à 58 boîtes, que chaque étagère possède sept tablettes et que dans la salle, il y a en tout 46 étagères, nous avons procédé aux estimations. Ainsi, après avoir calculé le nombre approximatif de photos pour une boîte, puis pour une rangée, et enfin estimer le nombre approximatif de photos par étagère, nous sommes arrivées au nombre approximatif de photos qui constituent ce fonds: 1 568 784 photos. Ce résultat est vertigineux, il faut ajouter que ce chiffre prend en compte les 429 548 photos qui ne sont pas exploitables, ce qui donne un taux d’environ 27%. Bien entendu, tous ces calculs et ces chiffres ont été transcrits par écrit quand le compte-rendu a été rédigé afin de faire part des résultats obtenus aux autres membres du service. Pour les besoins du service, j’ai également effectué le recensement des bobines de microfilms possédées. Il est vrai que j’ai du en rendre compte mais leur numérisation est moins problématique que celle des photos moins évidente.
L’exemple de la gestion du fonds depuis juillet 1998: Unisys DocCenter
Les systèmes d’information dans les entreprises ou n’importe quels centres s’occupant de la circulation des documents fonctionnent avec le concept de Gestion Electronique de Documents. La GED se définit comme un « système informatique composé de matériels et de logiciels permettant la production, le traitement, la consultation, la diffusion et l’archivage de documents électroniques « ». En d’autres termes, c’est un système qui accompagne le document électronique durant toute sa vie: de sa conception jusqu’à son entrée aux archives. Grâce à des programmes informatiques spécifiques, il est possible de retrouver des documents qui sont la plupart du temps sous format électronique, de les consulter ou de les afficher à l’écran et même de les imprimer ou de les envoyer par courrier électronique pour le transmettre à une tierce personne. Mais il faut alors se demander en quoi cette méthode de gestion est bénéfique pour un système d’information et de documentation. La GED est lié au concept de numérisation car les documents une fois numérisés sont pris en charge par le système informatique qui s’occupe de cette GED. Pour cette raison, la GED contribue à la préservation des documents et donc des données. Ces documents étant tous conservés sous le même format électronique, le système de Gestion Electronique de Documents facilite la consultation, l’accès mais aussi l’échange de données. La recherche est plus aisée puisque les requêtes les plus compliquées peuvent être posées dans un système de bases de données relationnelles au moyen de relations opérationnelles. Ainsi, c’est la totalité des moyens d’accès aux documents qui se trouve à la portée de tous les membres d’une entreprise. Ces raisons expliquent bien pourquoi la GED est désormais nécessaire à tout service ou système gérant de l’information.
Par conséquent, le projet de numérisation implique aussi qu’on se pose des questions concernant la gestion des documents qui vont être numérisés.
Depuis le mois de juillet de l’année 1998, la numérisation des articles, photos et pages complètes parus dans le journal La Voix du Nord, quelque soit l’édition, se fait automatiquement et ceux-ci sont stockés dans la base de données gérée par le programme développé par Unisys, qui se nomme DocCenter. Il s’agit pour le cas présent de la version 5.5.13.200 et c’est un programme conseillé pour les organismes de presse, d’après Unisys, et accompagné entre autres d’un logiciel de messagerie Hermès, qui permet la communication à l’intérieur de l’entreprise. Par exemple, les commandes pour la rubrique « Cinéma » expliquées dans la première partie se font par le biais de Hermès. Le service a donc bel et bien commencé à se moderniser depuis déjà près d’une dizaine d’années et d’après ce que j’ai pu constaté durant mon stage, l’accès à ces documents se fait d’une manière beaucoup plus simple pour tous les employés. Il est surtout utilisé par le service documentation et c’est d’ailleurs la première découverte de mon stage car il a fallu l’explorer pendant un certain temps pour que je sache le manipuler.
Ce projet peut-il en amener un autre?
En réfléchissant aux éventuelles usages du fonds photographique prévu pour être numérisé lors de la première réunion du 9 janvier dernier, a été abordée l’idée d’une possible exploitation commerciale. Les archives depuis 2004 sont déjà accessibles pour les particuliers et professionnels autres que l’entreprise, depuis le site de La Voix du Nord, rubrique « archives ». Cet accès est payant, les prix varient selon le nombre de documents consult%