
« Le fonctionnement des administrations est incompatible avec l’ouverture des données publiques »
Enseignante-chercheuse à l’Université de Haute-Alsace et de Strasbourg, Karine Favro trouve « ridicule » le nombre de données publiques actuellement disponibles. Bien que les administrations soient contraintes par la loi de publier leurs informations, très peu s’y conforment, en raison des enjeux de pouvoirs que ces libérations de données supposent.
Les données produites par les collectivités locales, donc les données communes de tous les citoyens, doivent être rendues aux citoyens pour qu’ils puissent se les approprier. C’est la loi, en tout cas son esprit depuis octobre 2016 mais… on n’en est pas là. Selon une étude de Renaissance numérique, un think-tank spécialisé dans le déploiement de l’écosystème numérique dans les administrations, seules 12,5% des collectivités locales sont en conformité avec la loi quant à la libération de leurs informations.
Enseignante-chercheuse en droit public à l’Université de Haute-Alsace et de Strasbourg, spécialiste du numérique, Karine Favro revient sur les enjeux et les freins qui empêchent les administrations de publier leurs informations.
Rue89 Strasbourg : où en est-on de la libération des données publiques ?
Sur la plate-forme des données publiques de l’État (data.gouv.fr), il y a environ 32 000 jeux de données libérées. C’est ridicule quand on pense aux nombre de collectivités et administrations publiques qui doivent publier leurs informations depuis la loi pour une République numérique d’octobre 2016, c’est à dire toutes sauf celles de moins de 3 500 habitants, ou disposant de moins de 50 agents…
« 1 700 réutilisateurs en France, c’est ridicule »
De plus, ces données sont souvent de mauvaise qualité, peu ou mal mises à jour et encore plus rarement garanties de l’être… Résultat, il n’y a que 1 700 réutilisateurs de ces données, ce qui est encore plus ridicule.
Rue89 Strasbourg : comment expliquer cet échec ?
Le cadre légal est dérivé de la directive européenne « public sector information », révisée en 2013 et transcrite en droit français par la loi NOTRe. Mais le volet « open data » n’était pas contraignant, les collectivités locales n’ont donc guère fait d’efforts. En outre, le gouvernement a imposé une gratuité pour la réutilisation des données publiques, une démarche intéressante mais qui n’était pas demandée par l’Europe. C’est un peu différent depuis la loi pour une République numérique, qui impose aux collectivités la publication de leurs informations, par défaut et sauf exceptions liées notamment aux informations personnelles ou à la propriété intellectuelle.
Le processus qui consiste à transformer les administrations en centres d’informations ouverts et connectés prendra… des années, des dizaines d’années. Avec la loi, le gouvernement a fixé un cadre mais beaucoup trop ambitieux, hors de la portée de nombre d’administrations. Parce qu’il faut d’abord comprendre ce qu’est une donnée… Ce concept ne fait pas partie de la culture commune de la plupart des agents administratifs, même si ça change grâce aux formations actuelles. Et ensuite, il faut appréhender la valeur des données et là, on entre dans d’autres problèmes. Beaucoup de services considèrent qu’il y a une valeur à posséder des informations alors que la valeur des données s’apprécie dans l’échange, leur circulation et leur réutilisation.
Mais évidemment, cette école de pensée est à l’opposée des habitudes des administrations, qui fonctionnent en silos. Il n’est pas rare qu’à l’occasion d’une libération de données, ce soient d’autres services au sein d’une même collectivité qui soient les premiers réutilisateurs…
Les administrations rétorquent que produire, collecter et mettre ces données à disposition a un coût…
Certes – certaines collectivités avaient parfois l’habitude de vendre une partie de leurs informations. Mais si ce ne sont pas les administrations qui ouvrent la voie quant aux bénéfices de la publication gratuite des données et de leurs réutilisations par des tiers, qui le fera ? Pour la collectivité locale, c’est un coût mais le bénéfice d’une réutilisation intelligente ira à tous les citoyens et l’administration peut donc en partie en récolter les fruits également…
« Les premiers à aspirer les données sont les géants du web »
Il est vrai aussi que les premiers à aspirer les données publiques sont les géants du web (Google, Amazon, Facebook…). Mais est-ce une raison pour retenir les données ? Il suffit de voir comment Google gère Google Maps comme un service public, avec des données agrégées de la SNCF et de la CTS à Strasbourg ! Vaut-il mieux que ces données soient partagées, et utilisée par Google et ses utilisateurs, ou qu’elles ne soient disponibles que pour les applications de la SNCF et de la CTS ? Dans les débats sur l’open data, il faut se poser la question de l’intérêt général. Et face aux géants du web, il faut créer les conditions pour qu’ils ne soient pas les uniques bénéficiaires des libérations de données.
Quels sont les débats actuels des données publiques au sein des administrations ?
Le principal débat actuel, c’est la qualité de la donnée publiée. Il y a une pléthore de plate-formes, encore plus de formats et les récurrences ne sont pas garanties… Il y a l’association Open Data France, qui tente de sensibiliser les collectivités locales à ces enjeux. Leur dernier observatoire montre qu’en octobre 2018, seules 343 collectivités avaient une démarche d’open data, c’est peu mais c’est quand même 33% de plus qu’en mars 2018. (Dans le Bas-Rhin, seuls l’Eurométropole, la CTS et Atmo Grand Est sont référencés comme fournisseurs de données locales, ndlr)
Les administrations découvrent petit à petit l’ampleur des enjeux posés par l’open data. D’une démarche de publication de qualité, découlent tout une série de processus auxquels doivent se conformer les agents et qui sont parfois très délicats à mettre en place. Il en va de la numérisation complète des processus administratifs, et d’une horizontalisation des décisions. C’est le sens de l’Histoire mais les résistances et les freins sont nombreux.
Le cadre réglementaire initial vient de la loi de 78 (CADA) qui organise l'accès aux documents administratifs, mais bien sûr n'avait pas été pensé pour "la donnée".
La retranscription dans le droit français de la directive PSI c'est la Loi Valter , pas la Loi Notre. Cette retranscription a de plus généralisé la gratuité (non prévue par PSI) sauf rares exceptions.
Ensuite est venu la Loi Lemaire qui a permis de franchir plusieurs étapes:
- opendata "d'offre" (choix de l'administration de publier des données, situation avant cette loi)
- opendata "à la demande" (publication après demande communication)
- opendata "par défaut ou par principe", obligation de publier les bases de données et données sans demande
La propriété intellectuelle de tiers n'empêche pas forcément la publication, elle limite par contre éventuellement les réutilisations.
Pour les réutilisateurs, c'est malheureusement très difficile à mesurer et sortir un chiffre de 1700 est assez artificiel car ceux-ci n'ont aucune obligation de se manifester.
Un exemple concret: OpenStreetMap réutilise de nombreux jeux de données pour aider les contributeurs. Ces réutilisations sont rarement répertoriées sur data.gouv.fr alors que c'est possible de le faire très facilement et bien plus facilement que sur de nombreux portail locaux.
Ce qui est plus pertinent est de comptabiliser le nombre de téléchargement de tel ou tel jeu de données... et encore.
Téléchargé une fois sur un portail, il peut être rediffusé ailleurs et téléchargé de multiples fois.
Sur le manque de culture de la donnée dans l'administration, je suis totalement d'accord. La culture y est plutôt celle du document administratif... encore très liée au papier. Cela s'améliore, mais bien trop lentement même si les API d'accès aux données se généralisent.
Les silos sont aussi bien réels.
Les ventes de données locales étaient rares, c'est au niveau national que ceci se faisait le plus et se fait encore, parfois illégalement comme à la DGAC (malgré 3 avis CADA lui rappelant le caractère infondé des redevances demandées).
Le plan cadastral était facturé plusieurs centaines de milliers d'euros que seuls de rares acteurs pouvaient se payer, favorisant ainsi un élitisme dans les réutilisateurs d'informations publiques... il est désormais totalement gratuit depuis plus d'un an et utilisable par tous.
Le coût de publication pour les collectivités est souvent lié à un choix de communication. La création d'un portail opendata n'est pas gratuite, mais inutile pour publier de la donnée. Le portail national data.gouv.fr est totalement gratuit.
Google Maps géré comme un "service public" ? Certes, Google Maps rends un service au public, mais ce n'est que pour mieux capter les données personnelles de ce même public... tout comme ils le font sur votre site avec les différents traceurs que vous avez installé. ;)
La gratuité a mis au même plan l'ensemble des réutilisateurs (exemple du cadastre que Google pouvait sans problème se payer).
Qualité des données... oui, il y a beaucoup à dire, mais il ne faut pas oublier que l'essentiel de ces données ont été produites pour un usage "métier" interne et très rarement en vue de réutilisations plus génériques et externes.
En améliorer la qualité pour publication n'est pas une obligation mais c'est souvent un investissement pertinent car cela favorisera aussi les réutilisations internes.
Pour les données produites en vue d'une réutilisation, il y a un réel effort de fait, sur leur qualité, sur leur documentation (un problème souvent oublié).
Ces données sont bien plus rares mais essentielles et ont été mise un cran au dessus. C'est le "Service Public de la Donnée".
Bonne soirée autour des données !
J'ai cherché, j'ai pas trouvé…
Je suis en désaccord avec cet article qui soulève des questions importantes mais dont l'analyse comporte des erreurs surprenantes a fortiori s'agissant de travaux d'une chercheuse.
1- La France est classée au 4ème rang mondial des pays pour l'ouverture de ses données publiques (open data index de l'open knowledge fundation : https://index.okfn.org/place/). De nombreux jeux de données essentiels sont totalement ouverts et gratuits depuis quelques mois (Base des entreprises INSEE, cadastre, etc...).
2- Certes la loi française qui oblige les collectivités locales à l'opendata date de 2016, mais l'obligation légale n'est entrée en vigueur qu'en ... octobre 2018 ! L'article ne le dit pas.
3- En quelques semaines un nombre significatif de portails régionaux, départementaux ou intercommunaux ont été mis en ligne, comportant pour certains beaucoup de jeux de données.
4- Des stratégies très offensives de mutualisation des processus d'ouverture des données se déploient, par exemple dans l'Ouest (https://www.journaldunet.com/economie/services/1418259-nantes-metropole-pays-de-la-loire-loi-atlantique-open-data/). Ces stratégies vont aider à répondre aux problèmes réels des territoires qui n'ont pas les ressources suffisantes pour gérer seules l'ouverture des données.
5- NON, les collectivités locales n'avaient pas l'habitude de revendre leurs données... C'est n'importe quoi...
6- NON, Google ne gère absolument pas Google Maps comme un service public. Pas plus que Waze, Uber ou AirBnb qui collectent et produisent massivement de la donnée d'intérêt général mais au service exclusif de leurs intérêts (légitimes mais privés). Quel contresens...
La tonalité général de ce papier et le titre (!) donnent l'impression que nos administrations refusent la transparence (discours populiste dans l'air du temps...) alors qu'il n'y a jamais eu autant de démarches de la part des collectivités, de tous bords politiques, pour favoriser la transparence et la circulation des données publiques.
Jacques Priol
Et sur la tonalité générale, je l'assume en tant qu'auteur et réutilisateur des maigres données locales disponibles à Strasbourg et dans la région. Il ne suffit pas de publier un vague pdf sur une page et de l'appeler "open data" pour que ça soit effectivement interprété comme une démarche d'ouverture. Nier qu'une démarche open data qualitative est un effort de transparence auxquelles peu d'administrations sont habituées me parait osé. C'est pas être populiste de dire que les administrations ont plutôt une culture du secret... et j'ai des centaines d'exemples à vous opposer très récents...
En vertu de la loi CADA, c'est même depuis 1978 que les administrations doivent mettre à disposition leurs données.
La plateforme nationale des données publiques a reçu plus de 3 millions de visite et enregistrés près d'1 million de téléchargement de jeux de données. Ces statistiques d'usage sont librement accessibles et peuvent être vérifiées par tous. On est donc très loin du chiffre indiqué dans cet interview, qui confond le nombre de réutilisations postées sur la plateforme avec le nombre d'utilisateurs de l'open data ! Dans le premier cas il s'agit d'une démarche volontaire souvent réalisée par des individus ou des sociétés souhaitant faire connaître leur utilisation des données.
Pour ma part, j’ai juste tiqué un peu à propos de Google Maps comme un "service public" : depuis quelques mois Google Maps est payant pour les gros utilisateurs (tous les sites ou applications ayant un peu de traffic, y compris éventuellement des sites de collectivités ou services publics), on ne peut donc plus dire que c’est un service gratuit et donc a fortiori un service public.
Auparavant pour les gros utilisateurs, ou encore actuellement pour les petits utilisateurs, je ne dirais pas non plus que c’est un service public dans le sens que les services Google (dont Maps) s’enrichissent des recherches et des intérêts des utilisateurs pour valoriser des profils utilisateur revendus ensuite aux annonceurs ; Maps est donc un service gratuit, mais où l’utilisateur est en partie "utilisé", donc pas vraiment un service public non plus, même si c’est plus subtil.
Sur ce sujet j'avais écris un article il y a quelques années :
https://www.archi-wiki.org/Actualit%C3%A9:Un_contenu_pour_faire_des_d%C3%A9couvertes
Sur notre site www.archi-wiki.org nous utilisons de nombreuses données publiques (Archives de la ville, inventaire de la région grand est, office de tourisme...) si ces données ne pouvait pas être partagé il faudrait à chaque fois aller en bibliothèque, acheter des livres, se déplacer aux horaires de bureaux etc
Finalement en partageant les données bien plus d'utilisateur y ont accès. Le partage engendre de nouveaux contenus.
Le bénéfice du partage est extraordinaire, c'est à mes yeux la continuité de l'ère du service (tertiaire), avec une connaissance accessible à tous et donc une meilleur formation (quaternaire). Des auteurs comme Jérémy Rifkin ou Bernard Stiegler parle très bien de tout ça.
La nature partage à volonté, généreusement, sans brevet, sans coût, pourquoi l'homme ne serait pas capable de le faire à travers un nouveau modèle ?
Tout est dit: la dictature de Bruxelles !
Antoine BEYER