Vous êtes ici :

  • Google+
  • Imprimer

La réutilisation des informations publiques, souvent nommée par commodité open data, est devenue une des thématiques très porteuses :

  • Dans le secteur public, sujet de la règlementation à respecter ;
  • Dans le secteur privé où les initiatives se multiplient pour imaginer des produits et services innovants développés à partir de la réutilisation desdites informations publiques.

Ainsi apparaissent de plus en plus des « jeux de données » disponibles en ligne et récupérables par toute personne. 

Ce qui dit la loi

La mise à disposition des données produites ou détenues par les acteurs publics est un processus ouvert. Opens external link in new windowLa loi CADA et le décret du 30 décembre 2005 fixent les règles minimales à respecter pour accompagner l’ouverture des données publiques au sens strict (produites ou détenues par l’acteur public dans le cadre d’une mission de service public).

À noter

Les informations de cette partie "Définitions" proviennent du Guide de demande de données publiques auprès des collectivité dont les co-auteurs sont Cédric Favre (Aquitaine Europe communication – www.aecom.org) et Armelle Gilliard (Bordeaux métropole).

Ce guide est par ailleurs Opens external link in new windowdisponible en ligne.

Définitions

Open data

Qu’est-ce qu’une donnée « ouverte » ou « libre » ?

« Donnée ouverte » est la traduction littérale de l’expression « open data ». « Donnée libre » se rapporte au mouvement autour de la culture du libre (logiciel, matériel, etc.). Cela traduit trois acceptions possibles : 

  • usuellement : une donnée ouverte caractérise une donnée qui est mise à disposition de tous et qui peut être librement « récupérée » pour être réutilisée ;
  • techniquement : il s’agit d’une donnée qui n’est pas protégée par un logiciel particulier et qui peut, en conséquence, être lue par tout logiciel standard (ex : au format .XML, .WMS) et faire l’objet d’une publication organisée (globale ou sélective) ; 
  • juridiquement : la loi pour la confiance dans l’économie numérique (art. 4)5 énonce que « l’on entend par standard ouvert (…) tout format de données interopérables et dont les spécifications techniques sont publiques et sans restriction d’accès ni de mise en œuvre » ; il s’agit essentiellement de formats associés à des logiciels open sources (.CSV, .JSON, .XML, .RDF, etc.).

Le cas particulier de la « donnée publique »

Le langage courant confond parfois les « données publiques » avec « l’ensemble des données accessibles en ligne ». Ce n’est pas le sens de la politique d’ouverture et de partage des données publiques, qui est initialement fondée sur la loi sur l’accès aux documents administratifs (CADA) et sur la directive européenne sur les informations du secteur public.

Dès qu’une personne agit dans le cadre d’une mission de service public, tous les documents qu’elle produit et/ou reçoit sont publics au sens de la loi n° 78-7536 du 17 juillet 1978, dite « loi Cada ». Ce principe vaut pour tous les documents administratifs, « quels que soient leur date, leur lieu de conservation, leur forme et leur support » (art. 1, al. 2).

Ces documents doivent être finalisés, c’est-à-dire en mesure d’être rendus publics. Autrement dit, les « documents publics » sont les documents administratifs qui font l’objet d’une publication officielle : présentation publique ou validation par un élu.

L’article 10 de la loi précise qu’il s’agit des « informations figurant dans des documents produits ou reçus ». Puisqu’un document administratif contient des informations et que celles-ci sont des données, les documents administratifs contiennent tous des données publiques.

Ainsi, les modes de « conservation, leur forme et leur support » (loi Cada, 1, al. 2) importent peu. De même, les « dossiers, rapports, études, comptes rendus, procès-verbaux, statistiques, directives, instructions, circulaires, notes et réponses ministérielles, correspondances, avis, prévisions et décisions » sont considérés par la loi comme des documents administratifs qu’ils soient disponibles en format texte ou tableur et en version papier ou numérique. La loi Cada distingue les documents accessibles des documents réutilisables.

Les informations nominatives, les informations personnelles et les informations protégées par des secrets prévus par la loi (secret de la défense nationale par exemple) sont exclues du champ des données susceptibles d’être rendues publiques, sauf disposition légale ou règlementaire contraire.

Illustration extraite de Guide de demande de données publiques auprès des collectivités (p.8)
Illustration extraite de Guide de demande de données publiques auprès des collectivités (p.8)

L’accès et l’exploitation (réutilisation)

Mission Etalab

La politique d’ouverture et de partage des données publiques (« Open data ») est pilotée, sous l’autorité du Premier ministre, par la mission Etalab (cf Opens external link in new windowLa mission Etalab)

Au sein du Secrétariat général pour la modernisation de l’action publique, Etalab coordonne l’action des services de l’Etat et de ses établissements publics pour faciliter la réutilisation la plus large possible de leurs informations publiques.

La mission Etalab fait partie du Secrétariat général pour la modernisation de l’action publique. Etalab, depuis sa création, a mis en ligne le portail national data.gouv.fr qui permet l’accès aux informations publiques gratuites et réutilisables.

La plateforme “Opens external link in new windowdata.gouv.fr” permet aux services publics de publier des données publiques et à la société civile de les enrichir, modifier, interpréter en vue de coproduire des informations d’intérêt général.

Qui peut partager des données sur la plateforme “data.gouv.fr” ?

Tout le monde ! Citoyens, services publics ou toute organisation enregistrée sous son identité de personne physique ou de personne morale. L’inscription et l’utilisation de la plateforme sont gratuites, qu’il s’agisse par exemple de l’inventaire d’une bibliothèque communale, de l’état de la voirie, de la composition nutritionnelle de produits alimentaires ou du bilan environnemental d’une entreprise

Quelles données peuvent-être mises en ligne ?

Des données publiques produites ou reçues dans le cadre d’une mission de service public : impôts, budgets, subventions, dépenses, aménagement du territoire, chômage, rénovation de logements, mesures de qualité de l'air, adresses des services publics, délinquance et criminalité, statistiques du tourisme, résultats électoraux, dépenses de la Sécurité sociale, effectifs des fonctions publiques, aides de la politique agricole commune, rejets de polluants dans l'air par les installations industrielles ...

Les données à caractère personnel (données fiscales ou patrimoniales, données médicales, etc.) et celles dont la publication contrevient à la loi (secret médical, secret de la défense nationale, secret statistique, secret des affaires, etc.) ne sont pas acceptées sur la plateforme “data.gouv.fr”.

Open data, licences de réutilisation

La réutilisation (loi Cada, Titre I, chapitre II)

La réutilisation prend la forme d’une «utilisation non usuelle » des documents produits ou reçus par les administrations. Il s’agit d’une [ré]utilisation effectuée «par toute personne qui le souhaite» (loi Cada, art. 10), laquelle doit obligatoirement mener «à d’autres fins que (…) la mission de service?» pour laquelle les documents ont été produits ou reçus.

Qu’est-ce que la réutilisation des données publiques ?

La réutilisation des données publiques peut susciter le développement de nouveaux services comme les applications mobiles, des sites Internet, des visualisations données ou « datavisualisation » notamment par la presse, etc. Elle doit être autorisée sans restrictions autres que celles prévues par la loi CADA (qui demande que ces informations ne soient pas altérées, que leur sens ne soit pas dénaturé et que leurs sources et la date de leur dernière mise à jour soient mentionnées). (chapitre 4, www.modernisation.gouv.fr/sites/default/files/fichiers-attaches/vademecum-ouverture.pdf)

La réutilisation de données publiques est-elle gratuite ?

Seule la fourniture des documents administratifs peut être facturée (photocopies + envoi). La réutilisation des données est quasi libre et, sauf cas particulier, n’est soumise à aucune redevance due au profit des producteurs de données publiques. Dans la pratique, la gratuité apparaît comme la règle. Cependant, aucune loi n’oblige à mettre à disposition les données de manière gratuite.

Le Gouvernement a réaffirmé son attachement à la gratuité de la réutilisation des données publiques à l’occasion du Comité interministériel pour la modernisation de l’action publique (CIMAP) du 18 décembre 2012 ainsi que dans la « Stratégie gouvernementale en matière d’ouverture et de partage des données publiques » publiée le 28 février 2013.

Cependant, le droit n’interdit pas systématiquement la facturation du coût de mise à disposition des données publiques : il autorise en effet la facturation du coût de la mise à disposition de la donnée, ainsi que celle de services à valeur ajoutée. Cette autorisation est souvent importante pour les opérateurs dont la mission est de produire de l’information, et dont l’équilibre budgétaire peut dépendre de ces revenus complémentaires.

Les licences

En 2013, l'harmonisation des pratiques a conduit à l'usage de deux licences types utilisées dans des proportions équivalentes :

  • la Licence Ouverte https://wiki.data.gouv.fr/images/9/9d/Licence_Ouverte.pdf
  • l'Open Database Licence. Celle-ci permet à chacun d’exploiter publiquement, commercialement ou non, des bases de données; à condition néanmoins de maintenir la licence sur la base de données, et éventuellement, sur les modifications qui y sont apportées, et de mentionner expressément l’usage, s’il génère des créations à partir de celles-ci. (attention : complexité de cette licence due au droit relatif aux bases de données)

Les administrations de l’Etat et ses établissements publics administratifs publient systématiquement les données publiques en Open Data sous Licence Ouverte (permettant de reproduire, diffuser, adapter, et exploiter, y compris à titre commercial, sous réserve de mentionner la paternité).

Les établissements publics à caractère industriel et commercial (EPIC) et les collectivités territoriales, choisissent par eux-mêmes une licence Open Data : Licence Ouverte ou ODbL (l’Etat recommande l’usage de la Licence Ouverte).

Les individus, les associations et les entreprises publient des données en Licence Ouverte et des réutilisations (applications, visualisations, services Web…) dans la licence de leur choix, y compris pour permettre des usages commerciaux.

La « Licence Ouverte / Open Licence », sous laquelle les données sont publiées sur data.gouv.fr, rappelle aussi une règle simple : la réutilisation reste de la responsabilité du réutilisateur. Tout usage illégal reste illégal même lorsqu’il est fondé sur des données publiques.

Les data visualisations

Les data visualisations ne sont pas des données : elles sont des graphiques utilisant les données pour les « mettre en scène » et permettre leur interprétation. En cela, elles sont des créations dérivées basées sur les potentiels d’exploitation de données libérées.

Les utilisations afférentes peuvent aller de la plus triviale (application cartographique sur smartphone pour repérer les boulangeries plus proches ou une place de parking) aux plus élaborées (outil d’aide à la décision en matière d’immobilier, par exemple).

Exemples

Opens external link in new windowCarte interactive des collèges "tête de réseau" concernés par le réseau d'éducation prioritaire, 2014

Opens external link in new windowKelQuartier.com permet aux utilisateurs de chercher, en fonction de leurs préférences, le quartier qui leur est le plus adapté. Ont été nécessaires :

  • des données de l’Insee comme le découpage cartographique par quartiers,
  • la densité de commerces et services par quartier et le secteur d’activité de ces commerces et services, par exemple.
  • les données annuelles des chiffres de l’immobilier des notaires de France.
  • des données sur les tracés de voirie et les tracés des lignes et arrêts des transports en commun.

Opens external link in new windowDatajournalisme : comment une journaliste et un infographiste travaillent ensemble pour mettre en scène des données.  (Karen Bastien et François Prosper de Wedodat, 2011)

Jeux des données disponibles sur Opens external link in new windowdata.gouv.fr

Les enjeux

Pourquoi publier et partager des données ?

Pour un service public : l’ouverture et le partage de données publiques contribuent à rendre des comptes sur le fonctionnement des institutions et à encourager l’innovation. Data.gouv.fr renforce la visibilité des données par leur référencement national et fournit des outils qui facilitent les conversations avec chaque communauté gravitant autour du service public (associations, journalistes, chercheurs, étudiants, citoyens...).

Pour un individu, une entreprise, un chercheur, une association : produire des données d’intérêt public, les publier en Open Data et en partager les interprétations avec le public permet d’enrichir le débat public et de renforcer la liberté d’information.

Enjeux économiques

La réutilisation des données publiques présente un potentiel commercial.  En 2012, la Commission européenne a estimé que le marché de l'information publique pourrait bientôt atteindre les 140 milliards d'euros par an, contre 30 milliards actuellement. Plus récemment, l'institut McKinsey a livré des chiffres encore plus imposants. (Open data : la nouvelle révolution française ? Pierre Manière et Sylvain Rolland, 17/07/2014,

Opens external link in new windowhttp://www.latribune.fr/technos-medias/internet/20140702trib000838094/open-data-la-nouvelle-revolution-francaise-.html

Une stratégie d’innovation et de stimulation de l’économie

Avec la révolution numérique, les données prennent par ailleurs une place centrale dans l’économie. Ouvrir et partager les données publiques, c’est organiser la mise en ligne de données essentielles, qui vont enrichir les analyses de nombreux décideurs, permettre de nombreuses économies de temps de travail ou permettre, dans de nombreux secteurs, des prises de décisions mieux informées. C’est créer de grands référentiels partagés par tous les acteurs et encourager le développement de nombreux services à forte valeur ajoutée, par exemple dans le tourisme, le transport, la santé ou la maîtrise de la consommation d’énergie. C’est donc à la fois une stratégie de souveraineté (organiser soi-même la représentation numérique de notre pays) et, dans bien des cas, un fort levier de développement économique (Opens external link in new windowhttp://www.modernisation.gouv.fr/sites/default/files/fichiers-attaches/vademecum-ouverture.pdf)

Enjeux documentaires, patrimoniaux 

Pour les usagers, des applications culturelles…

Cette animation explique ce qu’est Linked Open Data et pourquoi il est une bonne chose, tant pour les utilisateurs que pour les fournisseurs de données.

Quel intérêt pour les bibliothèques ?

L’aspect ouvert des données permet au web sémantique (web des données) de se populariser et de faciliter la création de données liées. Voici quelques exemples à partir de deux grandes catégories de plus-values :

  • Une meilleure intéropérabilité des données
    Des données bibliographiques de structures très diverses (MARC, Dublin Core, EAD, etc.) peuvent être converties en un format unique basé sur RDF. Dans ce cas de figure, il est possible de proposer une recherche fédérée bien plus performante que lors de l'interrogation de plusieurs bases de données séparées. C’est ce qu’a réalisé avec succès la Bibliothèque nationale de France, à travers son service Opens external link in new windowdata.bnf.fr , qui permet de rechercher – au moyen d'une seule requête – dans le catalogue des imprimés, la bibliothèque digitale et d'autres données non issues des catalogues traditionnels.
  • De meilleures possibilités de recherche et de sérendipité.
    L’amélioration des possibilités de recherche peut élargir le rôle actuel du catalogue d’un dispositif de localisation vers un véritable outil de recherche.

Des liens permettent de rediriger l'utilisateur vers des ressources complémentaires, comme des notices d'autorités d'autres bibliothèques ou des articles Wikipédia. Opens external link in new windowVIAF, un agrégateur de ressources de bibliothèques sur les personnes et les organisations, permet de faciliter la création de ce genre de relations. On offre la possibilité à l'utilisateur de trouver des informations qu'il ne cherchait pas forcément.

Ainsi, le Centre Pompidou à Paris a converti des données de bibliothèque et de musée en un seul format, de cette manière, une seule recherche donne accès à des livres, des œuvres d'art numérisées, des dossiers pédagogiques ainsi que d'autres types de documents 

Bookzee : trouver la bibliothèque ou la librairie la plus proche qui possède le livre que vous recherchez (en recoupant les données de géolocalisation et les données des bibliothèques municipales, de librairies)

On obtient également une meilleur visibilité des données sur le web, en particulier à travers les moteurs de recherche.

Ouverture des données : quels liens possibles avec l’éducation ?

« On insistera sur la capacité à trier, hiérarchiser les informations pour les sélectionner et les valider. Il faut mettre en œuvre des compétences spécifiques si on veut comprendre, exploiter, critiquer les données. Elles demandent un traitement spécifique. Au-delà des compétences en termes de hiérarchisation, d’esprit critique et aussi capacité à en comprendre les sources, il va falloir mettre en œuvre des méthodes… L’éducation aux médias doit intégrer cette spécialité comme la capacité à critiquer les traitements mathématiques, statistiques et de mise en récit des dites données. » Opens external link in new windowElles sont partout/ Justine Margherin. Le Café pédagogique, juin 2012 

 

Les compétences DATA

Opens external link in new windowLa grille "Niveaux de pratique et champs de compétences de la FING" comme référence pour les enseignants :
- outil de diagnostic
- outil d'évaluation

 

Quelles applications ?

  • La  formation des élèves : des données sont disponibles, interactives (tableaux par exemple pendant les élections). Ces chiffres doivent être analysés car il y a une intention dans la "datavisualisation". Autre exemple : la visualisation des dépenses publiques sous des représentations avec une certaine orientation…
    Il faut développer cette culture de la donnée, apprendre à décrypter ces données. Effectivement ce sont les  mêmes chiffres à la base (open data)  mais des  représentations différentes qui interpellent de façon orientée.
  • Les cours : Apprendre aux élèves à faire de la visualisation à partir des données publiques, datavisualisation est le terme employé (données de territoire par exemple).
  • Ouverture de ses propres données : ouvrir ses propres cours (Sésamath) ; on peut citer également Mydata, dont l’objectif est de rendre au public les données qui lui appartiennent. Par exemple en exploitant les notes des étudiants, les appréciations, on peut analyser les parcours des étudiants quant à l’évolution de leurs compétences ; on peut développer des indicateurs et des outils décisionnels

(prise de notes  : Claire Gallon, conférence : ouverture des données : quels liens possibles avec l’éducation ? Les conférences sonores de Orme, juin 2013 Opens external link in new windowfichier mp3 17 min.)

Des séquences disponibles :

  • Les énergies en Aquitaine. Motion design
    Opens external link in new windowElèves de 3ème en technologie proposée par Bruno Vuillemin , professeur de technologie au collège La Force en Dordogne

 

 

 

 

 

 

Pour aller plus loin

Le virage Linked Open Data en bibliothèque : étude des pratiques, mise en œuvre, compétences des professionnels Opens external link in new windowwww.ressi.ch/num15/article_100

D’après Sylvère Mercier (Opens external link in new windowdiaporama de Silvère Mercier , 2012 ) « un objectif : éviter les clôtures, éviter les monopoles, éviter les silos d’informations ». Il dénonce l’oligopole d’éditeurs qui revendent des données enrichies à des acteurs publics !

Notes de bas de page

Vade-mecum sur l’ouverture et le partage des données publiques. Modernisation.gouv.fr, septembre 2013 [consulté le 2/02/2015]. 11 p.
Opens external link in new windowhttp://www.modernisation.gouv.fr/sites/default/files/fichiers-attaches/vademecum-ouverture.pdf

Guide de demande de données publiques auprès des collectivités. Version 1. Bordeaux Métropole, Octobre 2014 [consulté le 02/02/2015]. 20 p.
Opens external link in new windowhttp://www.lacub.fr/sites/default/files/guide-demande-open-data_0.pdf