Deux mots d’introduction sur l’opendata

ATTENTION, CE BLOG N’EST PLUS MIS A JOUR. MERCI DE VOUS RENDRE SUR LE NOUVEAU SITE POUR TOUTES LES DERNIÈRES ACTUALISATIONS

Quand j’évoque mon sujet de thèse, on me demande en général : « c’est quoi l’open-data ? » (parfois complété par : « C’est en rapport avec les logiciels libres, les ordinateurs, tout ça ? »).

La première difficulté, c’est qu’il y a autant de définitions de l’open-data que de personnes qui en parlent. Initialement, il s’agit surtout de l’ouverture des données publiques / leur libération. La loi de 1978 permettait d’accéder aux documents produits par les établissements publics (à condition d’en faire la demande, le droit à l’accès étant « contrôlé » par la CADA) ; l’open-data, c’est encourager la publication de toutes les données publiques, et d’autoriser leur réutilisation.

On peut noter deux raisons principales à cette libération des données : la transparence (donner aux citoyens les informations nécessaires pour comprendre et analyser l’action de l’administration), et la valorisation des données (favoriser les initiatives privées pour créer de la valeur ajoutée et stimuler l’économie). Paradoxalement, c’est l’idée de transparence qui est surtout mise en avant dans les pays anglo-saxons, alors qu’Etalab a plus orienté son discours vers la valorisation.

Quelles données sont concernées ? C’est là que les choses se compliquent… La qualité de l’air, le budget du gouvernement, le nombre de personnes mises en cause pour emploi d’étrangers sans titre de travail, les statistiques du permis à points, etc. A peu près tout et n’importe quoi, que l’administration collecte.

Exemple pratique : un organisme regroupe les cartes des pistes cyclables, un autre, des statistiques sur la qualité de l’air, et un troisième, le nombre d’accidents de la route impliquant des vélos. Ces jeux de données existent, mais en les mettant en libre disposition, une PME pourra les croiser pour concevoir une application mobile permettant de trouver la meilleure promenade à vélo à faire dans les environs. Avec un système économique viable, elle va générer des revenus, qui vont être imposés, et donc être profitables également à l’Etat.

L’idée sous-jacente, c’est que l’offre de données va stimuler l’innovation, et permettre la création de richesses nationales destinées à améliorer le quotidien de tout un chacun. Merveilleux, n’est-il pas ? Léger bémol : les données qui intéressent le plus immédiatement les usagers sont en général les données de transport, qui gérées par des sociétés privées refusant d’ouvrir l’accès à leurs données. Si cela est compréhensible pour des sociétés dont l’activité principale est de « créer de la donnée », que penser d’une société chargée de gérer les transports en commun d’une ville, qui refuserait de rendre librement accessible ses horaires de bus ?

L’open-data tel que défini par nos lois s’inscrit dans une approche top-down, de l’Etat et ses démembrements vers les citoyens, et pas bottom-up, avec un retour de chacun pour améliorer les statistiques. On note qu’il s’agit également d’une démarche orientée du secteur public vers le secteur privé uniquement. Ces deux points mériteront une analyse plus complète ultérieurement.

Dernier point de cette petite introduction à l’open-data : malgré la présence du terme « open », il n’y a aucun rapport avec les logiciels libres (en tout cas, pas de lien direct). Cette différence se manifeste notamment par le fait que les licences des logiciels libres ne présentent pas les mêmes particularités que les licences des données libres, en particulier concernant l’effet contaminant. En effet : si on veut utiliser une brique d’un logiciel libre dans son propre logiciel, on est contractuellement tenu de rendre libre son propre logiciel. Ce n’est pas le cas des données : réutiliser une donnée publique comporte des obligations, mais pas celle de redistribuer librement le résultat obtenu.

Voilà, si vous ne connaissiez pas l’open-data, j’espère que cet article vous aura aidé à y voir un peu  plus clair.

ATTENTION, CE BLOG N’EST PLUS MIS A JOUR. MERCI DE VOUS RENDRE SUR LE NOUVEAU SITE POUR TOUTES LES DERNIÈRES ACTUALISATIONS

Advertisements
Cet article, publié dans Open Data, est tagué , , , . Ajoutez ce permalien à vos favoris.

3 commentaires pour Deux mots d’introduction sur l’opendata

  1. jphl dit :

    Bonjour,
    Concerne l’effet « contaminant », il me semble que la licence OdbL oblige à redistribuer librement les données modifiées ou complétées sous la même licence ou sous une licence compatible (article 4.4). N’est-ce pas le même principe que les logiciels libres ?

    • Edile Max dit :

      En effet (même si la définition de « licence compatible » pourrait permettre une interprétation plus extensive). Mais la licence OdbL, bien que répandue, n’est pas la norme (notamment en France où la « licence ouverte » d’Etalab a été généralisée), alors que les licences Creative Commons avec une mention share alike ont servi de base à toute une déclinaisons d’autres licences qui ont façonné le monde du logiciel libre. C’est donc moins systématique dans le monde de l’open data.

  2. Ping : Actus Généralistes 2012 S18 | La Mare du Gof

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s