Depuis maintenant presque une dizaine d’années, les politiques d’ouverture des données publiques (open data) ont conduit à la publication de jeux de données extrêmement variés par des États, des villes, des institutions internationales, et parfois des entreprises. Ces données, librement réutilisables par tous et généralement gratuites, sont souvent présentées comme la source d’un renouvellement de la transparence et les instruments d’une nouvelle accountability institutionnelle. Pour certains, elles pourraient aussi devenir des ressources majeures pour l’innovation ; par exemple, le cabinet McKinsey a estimé les retombées d’une ouverture des données généralisées à trois milliards de dollars par an dans le monde . Enfin, pour d’autres, ces données pourraient servir de vecteur à une transformation des pratiques administratives. En 2013, les dirigeants des huit pays les plus riches du monde, lors de la réunion du G8 en Irlande du Nord, ont adopté une charte sur l’open data dans laquelle ils s’engagent à ce que l’ouverture des données devienne la pratique par défaut des administrations des pays signataires. Aujourd’hui, selon la dernière version du classement Open Data Barometer de la Web Foundation , 51 gouvernements dans le monde ont adopté une politique d’open data. Les attentes suscitées par l’ouverture des données publiques sont donc très fortes et plusieurs gouvernements se sont engagés en faveur de sa généralisation.
D’un point de vue plus personnel, j’ai commencé à travailler sur le sujet en 2010 dans le cadre d’un mémoire de fin d’études au Celsa, l’école de communication de la Sorbonne. Le 29 novembre 2010, je me rendais à Rennes pour assister à une rencontre internationale qui se tenait dans l’hémicycle de la Métropole, intitulée «Open Data and Reuse: what is happening at local levels in Europe? » La conférence était organisée par ePSI Platform, un organisme créé par la Commission européenne pour promouvoir la réutilisation des données publiques et la Fondation Internet Nouvelle Génération (FING), un acteur associatif majeur sur les sujets numériques. Daniel Kaplan, le directeur de la FING, avait clôturé la rencontre en faisant un bilan de la journée et en invitant les participants, pour la plupart travaillant dans des collectivités locales, à ouvrir leurs données. J’avais été à l’époque très intrigué par ses propos dont j’ai pu retrouver un enregistrement .
L’invention de l’open data : retour sur six moments de définition
Le 27 novembre 2013, le service d’innovation numérique de la région Île-de-France et la Fonderie, son agence de développement de l’économie numérique, organisent une réunion à l’Institut d’Aménagement et d’Urbanisme (IAU) de Paris. Une quarantaine d’agents de la région assistent à cet évènement intitulé « Open Data Bootcamp ». Les organisateurs me présentent comme « observateur » tout comme Simon Chignard, auteur d’un ouvrage sur l’ouverture des données (Chignard, 2012) et un de mes « informateurs » à Rennes. Les organisateurs diffusent une vidéo de l’association nantaise Libertic intitulée « L’open data, on a tous à y gagner ». En voici un court extrait.
L’Open Data est une démarche qui vise à rendre des données numériques accessibles et utilisables par tous. Pour les collectivités et les organismes publics, l’Open Data consiste à publier sur une plateforme ouverte des informations : statistiques, cartographiques, des horaires, des données économiques et financières sur les territoires… La mise à disposition des données publiques est une obligation légale. Un cadre juridique strict définit les informations qui peuvent être rendues publiques et celles qui ne le peuvent pas. Les données sensibles et à caractère personnel sont exclues, de fait, de la démarche Open Data .
Après la diffusion de ce clip promotionnel de deux minutes, les organisateurs distribuent un document d’une dizaine de pages. Intitulé « vadémécum de l’ouverture des données de la région », il s’inspire d’une brochure produite par Etalab, la mission en charge de l’ouverture des données du gouvernement français, à l’attention des gestionnaires de données (j’y reviendrai dans le chapitre suivant) et se présente sous la forme de questionsréponses. Laurent, un des animateurs de la réunion, prend le micro et invite les participants assis face à lui à répondre à un quizz qui décline le vadémécum. Il explique que ce quizz vise à « mettre en discussion un certain nombre de sujets qui tournent autour de la problématique open data. » Il projette une présentation sur l’écran et s’arrête sur la première question : « en quoi consiste une démarche d’ouverture et de partage des données publiques ? Moi j’ai une réponse, je ne vous la donne pas. » Laurent demande si Simon veut répondre, il hésite, mais finalement répond : « une démarche d’ouverture et de partage des données publiques, c’est de mettre en ligne des données d’une manière qui facilite leur réutilisation par des tiers. » Laurent demande si quelqu’un aurait une autre définition. Pas de réponse dans la salle, il donne donc celle qui figure dans le vadémécum : « c’est mettre à disposition sur Internet toutes les données brutes qui ont vocation à être librement accessibles et réutilisables. »
Arrêtons-nous à cet instant dans le récit de cet évènement, j’y reviendrai en ouverture des prochains chapitres. Ici, les organisateurs définissent l’open data en s’appuyant sur des ressources : la vidéo de Libertic, le vadémécum de la région et la contribution d’un expert. La définition varie pour chaque version : Libertic insiste sur l’obligation légale d’ouverture, Simon Chignard sur les possibilités de réutilisation et Laurent sur le caractère brut des données publiées. Malgré ces différences, les personnes présentes ne débattent pas de ces définitions. Chacune des formulations contient donc un élément relativement admis par les participants. Ce chapitre retracera les lignes principales de ces définitions, encore mouvantes et débattues, de l’ouverture des données en suivant la trajectoire des acteurs qui l’ont définie, leurs revendications et leurs moyens d’action. Cette exploration des origines de l’open data révèlera des ressources essentielles qui fondent les politiques publiques d’ouverture de données. Pour reconstituer la genèse de ce qu’on appelle aujourd’hui l’open data sans prétendre retracer une histoire exhaustive des mouvements qui s’en réclament, je vais me limiter ici à des sources de seconde main, ainsi qu’aux nombreuses ressources disponibles publiquement sur le web : des pages, des articles, des listes de diffusion, des wikis ou encore des enregistrements réalisés par le site archive.org .
Je propose ici d’isoler six moments de définition de ce qui est devenu « l’open data». J’ai sélectionné ces épisodes, car on y voit progressivement se consolider de grands principes qui vont porter sur le processus de l’ouverture des données, les politiques publiques qui vont le définir et le cadre juridique de leur réutilisation. D’autre part, ils révèlent un réseau d’acteurs qui reprennent, reformulent ou contredisent les définitions et les critères exposés précédemment. Ces épisodes, délimités de manière chronologique, soulignent la diversité des acteurs qui ont formulé des définitions de l’open data. Une décennie après leur formulation, on peut délimiter trois demandes essentielles dans leurs revendications : la diffusion volontaire et proactive des données produites par les agents de l’État ; leur ouverture juridique et technique ; leur publication sous leur forme la plus « brute ». Formant un cadre juridique et technique très particulier, ces demandes orientent les politiques de diffusion de l’information publique vers les données de l’État dont la réutilisation permettrait de renouveler la transparence, de nourrir l’innovation et de transformer les pratiques de travail des administrations.
Le premier épisode de cette généalogie de l’open data débute en 2005 avec la rédaction de l’Open Definition par l’Open Knowledge Foundation. Fondé sur la définition de l’open source, ce texte propose des critères essentiellement juridiques qui décrivent les droits des usagers d’un savoir ouvert. Notons que cette définition s’attache au savoir en général et ne formule pas de revendication pour faire évoluer les politiques publiques de diffusion de l’information. A l’inverse, le deuxième moment que je retrace, la réunion de Sebastopol en Californie en 2007, a défini des principes de l’ouverture des données gouvernementales. Ses protagonistes ont espéré que leurs revendications soient adoptées par le futur président des États-Unis. Nous verrons dans quelle mesure leur ambition a été satisfaite avec la signature par Barack Obama d’un mémorandum sur l’Open Government à son entrée à la MaisonBlanche. L’inventeur du web, Tim Berners-Lee joue le premier rôle des deux épisodes suivants. En 2009, il donnait une conférence restée célèbre lors de laquelle il réclamait l’ouverture des données brutes. En 2010, son modèle en cinq étoiles proposait une approche progressive pour que les gouvernements adoptent des standards ouverts de données. Tim Berners-Lee a suivi l’application de ses préconisations en conseillant le gouvernement britannique dans sa politique d’open data. Ensuite, nous retournons auprès de l’Open Knowledge Foundation lorsqu’en 2012, elle créait un outil de benchmarking, l’Open Data Index qui classe les États selon la publication d’une sélection de données « essentielles. » Enfin, je reviens sur l’adoption en 2013 d’une charte par les chefs d’État du G8 qui ont déclaré vouloir faire de l’open data la pratique par défaut des administrations qu’ils dirigent et reprennent en partie le travail des groupes d’intérêt évoqués précédemment. On le voit à travers ce résumé, ces six épisodes retracent la trajectoire d’acteurs et de projets très différents. Ils montrent comment un vocabulaire, des revendications, des pratiques ont accompagné l’élaboration des politiques d’ouverture de données.
|
Table des matières
Introduction
L’invention de l’open data : retour sur six moments de définition
Episode 1, « Open Definition » : des droits de l’usager d’un savoir ouvert
Episode 2, « Sebastopol » : l’ouverture exhaustive des données primaires
Episode 3, « Raw Data Now » : l’entrée en politique des données « brutes »
Episode 4, « 5-star model » : des formats ouverts et lisibles par les machines
Episode 5, « Open Data Index » : un score d’ouverture et des données « essentielles»
Episode 6, « G8 » : la reconnaissance de données à forte valeur
Conclusion
Vers une administration des données : la trajectoire d’Etalab
Le renvoi de l’APIE : un virage de la politique gouvernementale en faveur de la gratuité
Etalab : un engagement affiché en faveur de « l’open data »
L’alternance : Etalab sur la sellette
La refonte de data.gouv.fr : « faire vivre » les données
L’administrateur général des données : de l’ouverture à la « gouvernance » des données
Conclusion
L’identification : la découverte progressive et collective des données
L’utopie de l’inventaire exhaustif
L’exploration de l’organisation
Le ciblage des usages
L’organisation d’un réseau
Conclusion
Les frictions de l’identification : quelques « bonnes raisons
organisationnelles » de ne pas ouvrir des données
L’extraction : des assemblages de données à défaire
La qualité : des données qui n’ont pas été conçues pour leur ouverture
La sécurité : anticiper les dangers de la réutilisation
La transparence : un mandat à obtenir
Conclusion
Transformations et transmutations : la fabrique des données brutes
Convertir
Structurer
Editer
Conclusion
L’instauration des publics de données
Les métadonnées : réduire les frictions de l’ouverture et de la réutilisation
La visualisation : transformer les données pour les rendre intelligibles à un plus large public
Les assemblages temporaires des concours de réutilisation de données
Conclusion
Conclusion
Bibliographie
Annexes
Télécharger le rapport complet