Contribuez à la Mission Politique publique de la donnée
Constats, freins et solutions
L’offre de données et de codes sources ouverts manque de lisibilité
Les portails de données et les dépôts se multiplient, comme vitrines de nombreuses entités. Ce foisonnement, signe d’une certaine vitalité, freine l’exploration et la lisibilité des données. D’autant que la plateforme nationale des données ouvertes data.gouv.fr ne recense pas l’intégralité des données disponibles.
Liste des soutiens
et 24 autres personnes
(voir plus)
(voir moins)
Signaler un contenu inapproprié
Ce contenu est-il inapproprié ?
15 commentaires
data.gouv.fr devrait passer à la vitesse supérieure et référencer systématiquement ce qui est publié en opendata.
Ceci rendrait les données publiées sur de nombreux portails plus visibles, plus "découvrables".
Ceci a été fait pour les différentes plateformes de données géographiques, rendu possible techniquement par des protocoles standardisés.
C'est moins simple pour les portails opendata exotiques, mais ceux reposant sur des solutions SaaS courantes peuvent facilement être ajoutés et moissonnés.
L'investissement ne serait pas énorme, mais le bénéfice général serait important !
Conversation avec Chamard-Bois
La Géoplateforme n'est toujours pas opérationnelle et le niveau régional doit palier au manque de toutes ces plateformes nationales annoncées mais fort décevant quand elles arrive à voir le jour ( géoportail urba, géoplateforme, géorisque, ...)
La "géoplateforme" initiée sur le rapport sur les données géographiques souveraines est un aspirateur à financements d'appels à projet (PIA, FTAP, etc).
La souveraineté commence par la compétence et la capacité à faire soit même, or les bruits actuels parlent d'hébergement totalement externalisés (Microsoft Azure ou ESRI).
Ne surtout rien attendre de cette géoplateforme qui risque fort d'être une usine à gaz non maitrisée par son opérateur.
La centralisation et/ou la complétude est un rêve trop fréquent et récurent, et qui me semble obsolète aujourd'hui. Ce serait bien plus facile, mais nous sommes trop nombreux, les sujets et les préférences aussi.
Concernant les données je trouve la plateforme data.gouv.fr très efficace. On peut soit même, même simple citoyen du web, y référencer des données situées sur d'autres plateformes, c'est génial.
Concernant les codes sources, il y a quelques tentatives comme https://adullact.net de l'association Adullact, aussi https://framasoft.org de Framasoft ou encore le Socle Interministériel de Logiciels Libres https://github.com/DISIC/SILL
Il existe de plus en plus de portail open data souvent liés à l'empilement de nos couches administratives (depuis la commune jusqu'à l'Union Européenne), et il n'est pas forcément facile de connaître les données disponibles notamment sur un territoire donné.
Les données produites par les administrations devraient être au moins recensés par le portail data.gouv.fr ou celui de l'Union Européenne (https://www.europeandataportal.eu).
Pour les données produites par d'autres entités (entreprises, associations, fondations, particuliers...), un grand acteur du web a déjà compris l'intérêt et mis en place des systèmes de recherche des données open data disponibles sur les nombreux portails.
Concernant les codes sources issus des administrations, ils sont encore peu nombreux.
Je rejoins l'avis précédent sur l'absence d'uniformisation des données par territoire.
Il est très difficile de "combiner" différentes sources d'informations qui choisissent des "mailles" d'analyses différentes ... parfois par obligation légale .. et parfois non.
Il serait logique de classer les données disponibles par type de regroupement : commune et périmètre : national (par exemple).
De plus les "formats" d'export mériteraient d'être uniformisés (avec séparateur TAB par exemple) pour éviter les ; qui se glissent dans certains fichiers
Toute donnée publique devrait être référencée ou publiée sur un portail unique (un petit point de loi ?)
Le principal défaut de data.gouv est de ne pas proposer des outils d'analyse ou de visualisation. Les collectivités et administrations doivent donc se porter vers des solutions tierces pour offrir des outils complets.
Au lieu de toujours aller chercher à l'extérieur, il faut aussi créer et fournir ses propres services. La souveraineté (et l'autonomie) passent aussi par là
L'Observatoire de la donnée territoriale d'Open Data France (http://www.opendatafrance.net/2020/10/15/observatoire-open-data-des-territoires-edition-oct-2020/) met clairement en lumière que la disparité des formats et des outils est un frein à la réutilisation. Il y a donc un enjeu de mutualisation et de standardisation, que le Socle commun des données locales, travaillé avec les collectivités, et donc basé sur l’expertise de terrain, propose (http://www.opendatafrance.net/scdl/).
Pour ce qui est des codes sources, l'Adullact a ouvert une forge souveraine en 2003 pour les collectivités, inspiré la forge de l'Ètat Admisource dans le projet Adèle, et la forge européenne Osor. L'État a confié depuis à l'association la forge Admisource.
Il serait souhaitable de prendre au sérieux dans la loi la disponibilité des données que sont les codes sources, et leur caractère patrimonial. On ne peut pas se contenter de recenser les souches.
Pour l'open data comme pour les codes source, il faudrait avoir une politique visant à faire des dépôts des "places de marché" permettant d'identifier, de promouvoir et animer des services commerciaux sur les objets numériques ouverts.
D'accord avec la plupart des remarques, je voudrais ajouter que les documents (je pense aussi notamment aux délibs des collectivités, aux dossiers de marchés publics, à légifrance, aux rapports et études), tout cela pourrait être indexé par des "robots" si publié correctement. Cela fait un gros morceau mais cela peut se faire progressivement, ça coûterait des millions (ça coûte déjà des millions de toutes façons) mais pas des milliards, c'est ce que fait le monde de la recherche avec les publis scientifiques.
Je rejoins @Cyrille37, la centralisation est contre-productive , mais avec une fédération des portails de données comme le fait data.gouv on pourrait agréger/enrichir/normaliser les données des différents portails existants sans impacter les producteurs.
Il serait donc souhaitable que les producteurs de codes sources et de données aient l'obligation de se référencer sur les portails pour permettre la découverte et la publication de leur données
L’offre de donnée est disparate ce qui ne facilite pas toujours les partenariats. Il faudrait créer un catalogue pour améliorer la visibilité sur l’existant afin d'augmenter la connaissance collective. La mission du HDH sur cette mission de centralisation devrait être renforcée et accélérée. Enfin des standards de partage nationaux pourraient être développés.
L’offre de donnée est disparate ce qui ne facilite pas toujours les partenariats. Il faudrait créer un catalogue pour améliorer la visibilité sur l’existant afin d'augmenter la connaissance collective. La mission du HDH sur cette mission de centralisation devrait être renforcée et accélérée. Enfin des standards de partage nationaux pourraient être développés.
Il faut noter que les plateformes de données sont parfois "spamées" par certains acteur qui diffusent massivement de variantes d'un même jeu de donnée rendant ainsi difficile la recherche et la lecture des résultats.
Cela peut être involontaire dans le cas d'un acteur qui ne réalise pas que ses 66 fichiers font partie d'une série cohérente et ne pense pas à les associer dans le catalogue. Cependant dans des cas plus rares, cela peut relever d'une stratégie inflationniste visant a justifier un grand nombre de séries de donnés en découpant volontairement un jeu de données selon des dimensions arbitraires pour donner une impression de quantité.
Dans tous les cas il semble donc important de consacrer du temps à accompagner les producteur dans l'utilisation des outils pour éviter ce genre de dérive.
La question de la visibilité de l'offre des artefacts logiciels publics est très difficile. Les questions de la gestion du patrimoine immatériel logiciel de l'état et de sa qualité juridique dépassent largement le cadre de la Mission et ne peuvent t être abordées que dans le cas d'infrastructures de preuve émergentes. Tout effort de référencement déclaratif ne sera pas exhaustif.
Un débat spécifique aussi riche que celui sur les données des années 2015 devrait avoir lieu pour les logiciels, qui certes sont des documents administratif disponibles sous forme électronique, mais ne peuvent être qualifiés de "données" au sens des directives européennes sur l'open data, qui à l'origine ont exclu les programmes informatique de leurs définitions. Les critères de communicabilité des données sont ils tous pertinents pour les logiciels ? Faut-il en créer de nouveaux mettant en cohérence des politiques publiques qui relèvent parfois de l'injonction paradoxale. (voir la proposition 116).
Chargement des commentaires ...