OSM : les derniers débats sur les listes de diffusion

11 novembre 2008

La liste de diffusion anglaise d'OpenStreetMap s'échauffe ! Les avis divergent, ce n'est sûrement pas la première fois, et ce n'est sûrement pas la dernière. Il y a les avant-gardistes, qui prônent l'adoption des nouvelles idées dès que possible. Il y a les conservateurs, qui sont contre le changement puisque ça fonctionne bien ainsi. Il y a les administratifs qui pensent que pour régler tout conflit, il faut tout mettre à plat. Et il y a les vieux-loups qui savent bien qu'OpenStreetMap fonctionne sur le principe de l'anarchie participative.

Les conventions fantômes
Est-ce que roundabout implique toujours oneway ? Est-ce que motorway_link implique toujours oneway ? Est-ce qu'une route sans étiquette name est une route sans nom ou une route non encore nommée ? Est-ce qu'une route sans oneway est une route à double-sens ou une route potentiellement à sens unique ? Faut-il être exhaustif ?

Les conservateurs :
- insérer une simple route de manière exhaustive deviendrait extrêmement compliqué ;
- ça prend énormément de place.

Les avant-gardistes :
- être exhaustif éviterait des erreurs potentiellement dangereuses (ex. prendre une autoroute en sens inverse si le routage oublie d'ajouter les « conventions ») ;
- les conventions ne sont pas universelles ; il existe toujours des exceptions (ex. pas de limite de vitesse pour certaines autoroutes allemandes).

Motorway_link implies oneway=??


La complétude
Comment définir un outil universel pour savoir si une zone a été entièrement cartographiée ? Le premier problème est que le « entièrement » ne signifie pas la même chose pour tout le monde. Quelqu'un qui considère OSM comme un système de navigation souhaite que les vitesses maximum soient renseignées sur chaque rue. Quelqu'un qui considère OSM comme une base de circuits de randonnées souhaite que tous les chemins piétons soient renseignés. Quelqu'un qui considère OSM comme une base de circuits en roller souhaite que la qualité du revêtement soit renseigné.

Un autre problème rejoint les conventions fantômes. Comment savoir si une route sans étiquette oneway est à double-sens ou si le sens-unique n'a pas été renseigné ?

Enfin, le dernier problème, qui est le principal problème actuel pour les solutions commerciales de cartographie, tient du fait que rien n'est définitif. Des routes sont ajoutées, des sens uniques sont inversés, des ponts sont détruits par les ouragans... OpenStreetMap ne sera jamais terminée, il y aura toujours du travail pour les cartographes.

Les administratifs :
- Il faut concevoir une priorité dans les étiquettes : les plus importantes sont à cartographier d'abord, puis les moins importantes, et ainsi de suite.

Les vieux-loups :
- Il n'y aura un outil que lorsqu'un bénévole mettra les mains dans le cambouis et se donnera la peine d'en faire un qui lui convienne.


Les robots
Pourquoi faire à la main ce qu'on peut faire avec un script ? De nombreux scripts existent pour aider à cartographier. Par exemple, il fût un temps où les côtes n'existaient pas. C'est grâce à un script de détection de couleurs sur les images Landsat que les côtes ont été dessinées. Mais ce script nécessitait encore une validation humaine.

Récemment, un inscrit à la liste de diffusion cracha son venin contre un robot correcteur. Ce robot remplaçait par exemple des étiquettes anciennement admises par des étiquettes nouvellement admises censés être meilleures. Il remplaçait également des étiquettes semblant être erronées (erreur d'orthographe) ou non-conventionnelles.

Les avant-gardistes :
- Les étiquettes non-conventionnelles ou erronés sont des sources d'incompréhension pour les logiciels ;
- Pourquoi faire des choses à la main alors qu'elles peuvent être réalisées en une nuit sur le monde entier ?

Les conservateurs :
- Ça risque de casser des choses ;
- Ça risque de faire perdre de l'information ;
- Je veux bien des robots mais pas dans ma zone.

Les vieux-loups :
- Il n'y a pas de « ma zone » qui tienne. Sur OSM, chacun a le droit de modifier où il veut.

En gros, et c'est humain, chacun se considère maître d'un petit territoire. On a du mal à accepter que quelqu'un, et encore moins que quelque-chose, modifie son petit territoire à sa manière.

Xybot


barrier=gate et highway=path
De nouvelles étiquettes sont proposées régulièrement, souvent sans problème. Mais lorsqu'elles attaquent directement des étiquettes déjà en place, c'est une autre histoire... c'est le cas, par exemple, pour barrier=gate.

L'étiquette barrier est censée remplacer et rassembler, de manière exhaustive, tous les obstacles que l'on peut trouver au milieu d'une voie. Le travail de recensement et d'uniformisation est louable. Mais changer du jour au lendemain les anciennes étiquettes n'est pas du goût de tout le monde.

Les conservateurs :
- Ça risque de casser des choses, par exemple les logiciels qui traitaient les anciennes étiquettes ;
- Les anciennes étiquettes marchent très bien comme ça, pourquoi changer ?

Les avant-gardistes :
- Il est préférable de tout modifier d'un seul coup pour ne pas avoir de double-emploi et pour ne pas continuer à mettre les anciennes étiquettes ;
- Il faut mettre les moteurs de rendu à jour le plus vite possible.

Les administratifs :
- On a voté, ça a été accepté ;
- C'est sur le wiki.

Les vieux-loups :
- Il n'y a pas de structure officielle sur OpenStreetMap ;
- Le wiki ne représente pas l'autorité mais est une manière de rassembler les étiquettes acceptées ;
- Les rendus sont gérés par des bénévoles qui ont mis les mains dans le cambouis un jour, ont trouvé un hébergement, et n'ont d'ordre à recevoir de personne.
- Si quelqu'un souhaite qu'une étiquette précise soit rendue, il n'a qu'à faire son propre rendu lui-même.

barrier=gate, run a script?


Creative Commons vs. Domaine Public
Les données d'OpenStreetMap est sous licence CC-BY-SA. Cela impose qu'une entreprise souhaitant apposer ses données sur une carte OSM partage également ses données en CC. Ce peut être problématique lorsqu'une entreprise ne souhaite pas que ses données soient en CC. Imaginons par exemple une compagnie de transport en commun d'une ville. Mettre les trajets de ses bus en CC l'empêcherait ensuite de vendre ces données à une entreprise comme Google.

Il y a donc des conquérants qui veulent faire passer OSM dans le domaine public, au risque de se faire bouffer les données toutes crues par TéléAtlas, Navteq ou Google.

Je leur souhaite bon courage.

Les administratifs :
- Il suffit de demander à chaque contributeur s'il veut que ses données originales (dans le sens où elles n'ont pas été modifiées par un autre contributeur) tombent dans le domaine public, et dupliquer ces données dans une version spéciale « OSM Public Domain ».

Les vieux-loups :
- Qu'est-ce qui est une donnée originale ? Un tracé non modifié ? Est-ce que rajouter trois points sur un way afin de l'arrondir ferait perdre l'originalité de la donnée ?

A super quick poll


Faut-il accepter la cartographie à la main ?
Dans le flot de la discussion autour des droits d'auteurs, une petite ville a été citée, la ville de Cheadle. Cette petite ville a été cartographiée par un seul homme, sans GPS, avec sa bite et son couteau.

Le résultat est... disons... géométriquement imparfait. Mais de nombreuses informations précieuses y sont répertoriées (le nom des rues, les sens uniques, les bars...). Et puis le p'tit gars a sacrément travaillé, d'ici à ce qu'il ait un GPS, il pourrait faire des miracles. Faut-il un outil spécial pour la cartographie manuelle ?

data plucked from who-knows-where?

1 commentaires:

  1. Merci pour le résumé des débats, c'est très intéressant.

    d.