[OSM] La licence ODbL : décryptage

17 mars 2009

Le conseil de la fondation OpenStreetMap a décidé de changer la licence des données d'OpenStreetMap. Ce n'est pas une idée nouvelle, ça fait un moment qu'il en est question. Mais ce changement de licence a produit beaucoup de vagues sur les listes de diffusion anglaise et allemande.

Pourquoi une nouvelle licence ?

Actuellement, les données d'OpenStreetMap sont publiées sous la licence virale CC-BY-SA 2.0. Cette licence a été développée afin de protéger des créations originales, comme de la musique, de la vidéo, ou du texte. Elle s'applique mal à des données traitées informatiquement. L'Open Database Licence tente d'appliquer les préceptes de la licence CC-BY-SA pour des données informatiques.

La nouvelle licence est-elle mauvaise ?

Un brouillon de la fameuse licence ODbL est accessible depuis fin février. Elle est assez concise et plutôt claire. L'essentiel de sa substance tient en trois pages, dans la section 4.0.

Les points principaux :
- La licence est virale.
- L'usage commercial des données est autorisé.

Les points remarquables :
- Le relevé de données à partir d'un produit, qui a été généré à partir des données, est clairement décrit comme étant des données dérivées. Pas question de pomper les données à partir d'une carte Mapnik par exemple.
- Une integrated experience (ie. un mashup), n'entre pas dans ce cadre. La frontière peut être mince...
- La distribution d'une partie de données dérivées implique la mise à disposition d'un moyen de récupérer l'intégralité de ces données sans restriction techniques, sans surcoût (à part les coûts éventuels de production), et traitables informatiquement. Un fichier doit également être fournit indiquant la liste exhaustive des modifications entre les données originales et les nouvelles données. C'est le point le plus important pour la liberté des données, mais c'est également un point qui nécessite des moyens techniques non négligeables.
- L'utilisation de données dérivées à l'intérieur d'une organisation n'est pas soumise à la licence. Il est donc possible pour une entreprise de produire et d'utiliser des données dérivées sans les publier, tant qu'aucun produit de ces données n'est distribué hors de l'organisation. Par exemple, une entreprise de transport pourrait utiliser un système de navigation à partir de données dérivées personnelles, sans avoir à les publier. Par contre, une entreprise de navigation GPS, qui distribue déjà les données sous une certaine forme, se doit de distribuer ses données dérivées.

Personnellement, cette licence me paraît cohérente avec l'interprétation de la licence CC-BY-SA. Elle semble également éviter des pièges, comme la Tivoisation (Freeboxisation en France).

Pourquoi les listes de diffusion s'enflamment ?

Tout d'abord, par l'annonce surprise du calendrier serré d'adoption de la licence :
Fin février :
- le brouillon de licence est rendu public
Fin mars :
- la licence finale est adoptée
- toute nouvelle contibution sur OSM est sous licence ODbL
- chaque utilisateur doit donner l'autorisation à passer toutes ses anciennes contributions de CC-BY-SA à OBdL
- les données modifiées par des utilisateurs n'autorisant pas à passer leurs contributions en ODbL sont remises à leur état avant la première modification de ces utilisateurs

Le principal reproche concerne le temps assez court entre la découverte de la nouvelle licence et l'obligation de passer à la nouvelle licence. L'autre reproche concerne l'impression d'une décision unilatérale : deux spécialistes rédigent la licence ; un petit groupe (la fondation OSM) décide de la mort des données dont les utilisateurs refusent la nouvelle licence ; aucun effort de traduction de la licence n'a été considéré. Très peu de reproches portent directement sur la qualité de la licence.

La question qui revient n'est pas réellement une question mais une constatation sur l'impossibilité technique de supprimer automatiquement quelques données de manière juste. Par exemple, quid d'une route modifiée par 20 utilisateurs différents et dont l'un refuserait la nouvelle licence ? Quid d'une route corrigée point par point pour des raisons de simplicité, et qui n'a alors plus rien à voir avec la première version ?

Et pour mettre un peu d'huile sur le feu, les anarchistes en profitent : Pourquoi ne pas en profiter pour tout passer dans le domaine publique ? Comment peut-on entrer dans le conseil de la fondation OSM pour effectuer un putsch ?

Quelques questions/réponses intéressantes ici.

Problème franco-français : les imports du Cadastre

Avec la licence actuelle, Creative Commons, toute donnée doit être distribuée avec la liste des auteurs. Du point de vue du Cadastre, c'était assez commode, puisque la licence de réutilisation des données cadastrale impose une citation du Cadastre avec l'année de référence. La licence ODbL simplifie l'obligation de citer la paternité des données, ce qui est pratique lorsque la quantité de contributeurs dépasse les 100.000 entrées. Ce petit changement peut être gênant...

2 commentaires:

  1. Analyse intéressante mais plusieurs remarques:
    - la fondation n'a jamais dit vouloir forcément changer de licence. C'est une proposition et l'ODBl pourrait aussi bien mourrir de sa belle mort avant de naître.
    - pour les contributions de personnes refusant le changement de license, j'ai moi-même posté un message sur osm-talk à ce sujet (très chaud). D'abord, rien ne dit que les données seront effacées. Ensuite, il semblerait que seul les données créées de zéro par ces personnes seraient supprimées (même si modifié 20 fois par d'autres, par mesure de précaution, mais je trouve cela excessif). Leurs corrections sur d'autres objets seraient simplement annulées avec un retour sur une version précédente.
    - Je ne crois pas que la DGFiP (le cadastre) demande l'"affichage" de la source sur tous les documents utilisant ses données, ni sur une carte, ni dans une liste parmis 100000 noms. Mais bien que la source et le millésime figure quelque part, le mieux étant dans la base sur les objets eux-mêmes. D'autres pourvoyeurs de cartes utilisent le cadastre (navteq) ce qui n'est pas mentionné chez-eux.

    Pieren

    http://www.zdnet.fr/galerie-image/0,50018840,39380306,00.htm
    http://lists.openstreetmap.org/pipermail/talk/2009-March/034692.html
    http://lists.openstreetmap.org/pipermail/talk/2009-March/034708.html

  2. Concernant le problème du cadastre, voici le scénario qui me gêne :
    J'extrais une partie de la base, sans les tags "source". Je publie cet extrait à tout le monde.

    Ce n'est pas autorisé par DGFiP.
    C'était non-autorisé par CC (paternité).
    Or, c'est autorisé par ODbL.
    Et la ODbL requiert qu'elle peut être la seule valable, ie. qu'il ne faut pas lier des données avec une licence incompatible avec la ODbL.