Affichage des articles dont le libellé est data. Afficher tous les articles
Affichage des articles dont le libellé est data. Afficher tous les articles

Quatre outils simples pour travailler sur les données

Qu'il s'agisse d'Open Data ou de Big Data, les données sont à la mode. Plutôt que d'en parler, pourquoi ne pas voir ce vous pouvez en faire vous même ? Voici quatre outils simples que je vous propose pour organiser, redresser et visualiser vos données.

Si Google SpreadSheet, ou Excel sont bien connus et assez pratiques, Google Refine mérite le détour. Pour une fois chez Google, il s'agit d'un "vrai logiciel" qui tourne sur votre PC, pas dans "les nuages". C'est une sorte de super tableur qui permet de corriger de grands fichiers contenant des données de mauvaises qualités comme par exemple une liste de 10 000 adresses clients dans laquelle le pays est parfois France, parfois Fr ou fr ou FRA, ou République française... Refine permet aussi d'interroger des "web services" ou d'aller récupérer les informations qui vous manquent sur un site Internet.

Google Fusion Table : est un autre outil proposé par Google qui complète bien Refine. Tout d'abord, celui-ci est hébergé, vos données quittent votre disque dur et elles peuvent bénéficier des infrastructures puissantes de Google. L'affichage des données sur une carte "google maps", ou sous forme d'animation pour les séries temporelles est aisé. Le partage des données et la collaboration sont aussi facilités. Un moyen pour partager les travaux de vérification qui sont souvent très pénibles.C'est,par exemple, Fusion que j'avais utilisé ici pour analyser mes traces et construire la carte ci dessous...

Processing : est à la fois un langage (simple mais puissant), un outil de programmation (open source) et une communauté (active) dédiés à la visualisation... L'objectif n'est pas de traiter de gros volume de données, mais de proposer des représentations interactives de vos résultats. Un bon exemple d'application dans le domaine du transport public est donné par Xiaoji Chen et ses "cartes isogreeniques" de Paris (voir aussi bien d'autres réalisations spectaculaires sur son blog ).


Gephi : c'est un outil dédié à la représentation de "graphes", c'est à dire de données mettant en jeux des "sommets" et des "relations" entre ces sommets. Il est idéal pour représenter des réseaux sociaux par exemple, comme sur cette vidéo qui présentent les messages échangés sur Twitter lors des manifestations en Egyspte. Chaque "point" représente un message, les liens sont des messages qui  sont re-twittés puis re-re-twittés par différents utilisateurs...

Daniel Delaveau sur l'Open Data à Rennes

Ils sont encore peu nombreux ceux, parmi nos hommes politiques, qui prennent position sur l'ouverture des données publiques. En ayant fait confiance à son équipe, en lançant il y a un an la première opération d'ouverture des données publiques et en organisant un concours d'applications, Daniel Delaveau a permis à la ville de Rennes et à Rennes Métropole de se distinguer.

Inutile d'attendre les résultats du concours pour constater qu'avec déjà plus de 40 applications proposées, dont certaines sont réellement originales et bien faites, la collectivité est la grand gagnante de l'opération.

Dans la vidéo si dessous, Daniel Deleveau s'exprime personellement sur ce sujet qui est souvent considéré, à tord, comme trop technique pour un élu. Même si il semble parfois un peu hésitant, il ouvre la voie ! Bravo...

#transitapps propose 4 liens sur l'open data dans les transports

Voila un exemple concret d'utilisation de twitter. Je tombe sur d'abord sur ce message de Valérie Peugeot qui indique qu'une conférence a eu lieu sur le sujet de l'open data dans les transports publics. En parcourant la page présentant la conférence, je note qu'un "hashtag" a été défini : #transitapps . Une recherche sur ce tag dans Twitter, me donne accès à une liste de commentaires émis par les participants pendant la conférence. La lecture rapide de ces messages courts me permet de trouver ces articles et pages intéressantes :
  1. Quickmap : qui propose des cartes simplifiées des principaux réseaux de transport public nord américain pour un usage sur téléphone mobile notamment,
  2. Un article sur le "gouvernement 2.0" et l'apport de l'open data à New York (voir ce site). L'article signale notamment que mycityway l'entreprise qui avait remporté la premiére édition du concours d'applications NYC Big Apps 2.0 vient de réaliser une levée de fonds de $5Millions. Ce qui tendrait à indiquer qu'il peut y avoir de véritables business sur ce créneau...
  3. Un article du New York Times sur les applications liées au stationnement, un domaine en plein développement...
  4. Enfin un excellent article du Huffington Post sur la stratégie open data/open source du gouvernement fédéral aux USA qui aborde, notamment, le problème du "shiny new app syndrom" dont souffre encore quelques uns de nos décideurs !


Savez-vous que vous pouvez suivre Transid par mail, sur FaceBook, sur Twitter ou sur un lecteur de flux rss de votre choix ?

Plan de métro et instrument à cordes... en html5

Coïncidence, coïncidence... J'évoquais hier la vidéo de REM et tombe aujourd'hui sur cette réalisation étonnante : un plan du métro de New York transformé en instrument à corde. Regardez et écoutez cette vidéo :

Conductor: www.mta.me from Alexander Chen on Vimeo.


Les explications de l'auteur sont ici et l'oeuvre l'originale en html5 là (attention tous les navigateurs ne sont pas compatible, utilisez donc un navigateur moderne).

Si vous lisez les explications vous apprendrez que cette réalisation se base sur les horaires réels des trains de la MTA et sur une carte du réseau datant de 1972 proposée par Massimo Vignelli. Au plan technique vous découvrirez peut être les vertues d'html5.

Dingue non ?

vous pouvez suivre Transid par mail, sur FaceBook, sur Twitter ou sur un lecteur de flux rss de votre choix !

OSM : bilan de la qualité des données cartographiques ouvertes

Open Street Map, le "Wikipedia" de la cartographie continue d'être alimenté par de nombreuses contributions individuelles. 
Des acteurs publics ou privés importants s'y mettent aussi., exemple :
  • les données du cadastre français sont, depuis 2009, accessibles directement depuis les outils d'édition d'OSM (JOSM). Elles permettent aux volontaires de s'appuyer sur les contours du cadastre pour enrichir OSM plus rapidement et plus précisement.
  • Mapquest, le "grand" concurrent de Google Maps aux US vient de s'engager à soutenir OSM et à l'utiliser (voir aussi plusieurs articles leur blog).
Dennis Zielstra et Alexander Zipf del'Université d'Heidelberg ont publié une étude comparant la couverture d'OSM et celle d'un de ses principaux concurrents commerciaux : TeleAtlas avec son produit Multinet.


 L'étude compare la quantité (pas la qualité) d'information dans les deux bases.

La comparaison est faite sur 3 zones différentes : toute l'Allemagne, 5 villes moyennes et 5 grandes villes. Elle porte aussi sur trois catégories de données : les données de voiries ou street network (en gros le nombre de km renseignés), les données de navigation automobiles ou Car Navigation Data (comme les sens uniques, les limitations de vitesses) et les données piétonnes ou Pedestrian Data comme les chemins non carossables, les monuements...).
Les conclusions sont :
  • dans les grandes villes OSM est plus riche que TeleAtlas dans toutes les catégories,
  • la croissance d'OSM est extrèmement rapide, y compris dans les zones (villes moyennes) et dans les catégories (données de navigation routière) où OSM est moins performant que TeleAtlas.  
  • les disparités sont néanmoins importantes dans OSM et les zones peu denses restent insuffisement couvertes.
Le tableau ci-dessous résume le match, pour ceux qui n'auraient pas envie de lire l'étude :

Comparaison OSM TeleAtlas d'après Dennis Zielstra, Alexander Zipf
Pays entier (Allemagne) 5 Villes Moyennes 5 Grandes Villes
Street Network
TA meilleur qu'OSM
OSM = TA
OSM meilleur que TA
Car Navigation
TA meilleur qu'OSM
TA meilleur qu'OSM
OSM=TA
Pedestrian
TA meilleur qu'OSM
OSM meilleur que TA
TA meilleur qu'OSM

OSM : bilan de la qualité des données cartographiques ouvertes

Open Street Map, le "Wikipedia" de la cartographie continue d'être alimenté par de nombreuses contributions individuelles. 
Des acteurs publics ou privés importants s'y mettent aussi., exemple :

  • les données du cadastre français sont, depuis 2009, accessibles directement depuis les outils d'édition d'OSM (JOSM). Elles permettent aux volontaires de s'appuyer sur les contours du cadastre pour enrichir OSM plus rapidement et plus précisement.
  • Mapquest, le "grand" concurrent de Google Maps aux US vient de s'engager à soutenir OSM et à l'utiliser (voir aussi plusieurs articles leur blog).






Dennis Zielstra et Alexander Zipf del'Université d'Heidelberg ont publié une étude comparant la couverture d'OSM et celle d'un de ses principaux concurrents commerciaux : TeleAtlas avec son produit Multinet.

 L'étude compare la quantité (pas la qualité) d'information dans les deux bases.

La comparaison est faite sur 3 zones différentes : toute l'Allemagne, 5 villes moyennes et 5 grandes villes. Elle porte aussi sur trois catégories de données : les données de voiries ou street network (en gros le nombre de km renseignés), les données de navigation automobiles ou Car Navigation Data (comme les sens uniques, les limitations de vitesses) et les données piétonnes ou Pedestrian Data comme les chemins non carossables, les monuements...).
Les conclusions sont :
  • dans les grandes villes OSM est plus riche que TeleAtlas dans toutes les catégories,
  • la croissance d'OSM est extrèmement rapide, y compris dans les zones (villes moyennes) et dans les catégories (données de navigation routière) où OSM est moins performant que TeleAtlas.  
  • les disparités sont néanmoins importantes dans OSM et les zones peu denses restent insuffisement couvertes.
Le tableau ci-dessous résume le match, pour ceux qui n'auraient pas envie de lire l'étude :

Comparaison OSM TeleAtlas d'après Dennis Zielstra, Alexander Zipf
Pays entier (Allemagne) 5 Villes Moyennes 5 Grandes Villes
Street Network
TA meilleur qu'OSM
OSM = TA
OSM meilleur que TA
Car Navigation
TA meilleur qu'OSM
TA meilleur qu'OSM
OSM=TA
Pedestrian
TA meilleur qu'OSM
OSM meilleur que TA
TA meilleur qu'OSM

IBM et l'Open Data dans les transports

J'aime bien les vidéos de GOODMagazine en général, mais celle ci traite d'un sujet fréquement abordé sur ce blog : celui de l'ouverture des données dans le secteur des transports publics (voir ces articles).
La première partie de la vidéo porte sur le SI de l'exploitant, elle est sponsorisée par IBM, mais, en fin de vidéo les bénéfices de l'ouverture des données sont clairement exprimés. C'est aussi l'occasion de signaler l'excellent blog asmarterplanet d'IBM qui a un thème transport (en anglais).

Les transports publics en Ile de France sur Mappy grâce au Stif

Depuis lundi vous pouvez calculez votre itinéraire en transport public en Ile de France sur Mappy et ce grâce à un partenariat avec le Stif.
Le fidèle de TranID se souviennent peut être de cet article en 2006 qui annonçait le partenariat RATP/Mappy. Alors qu'est ce qui a changé ? 
Jusqu'ici les internautes venant sur mappy.com et qui cherchaient un itinéraire en transport public finissait sur le site de la RATP... Dorénavant l'ensemble du service est proposé sur Mappy.com dans une ergonomie beaucoup plus homogène. Pour le tester allez sur mappy.com onglet itinéraire et cochez la case transports en commun.

Le service est proposé via des "web services de calcul d'itinéraires" fournis par le Stif et complétement intégrés sur le site de Mappy. 
La technologie a changé et le partenaire aussi. Ce n'est plus la RATP, mais le Stif. Le Stif est l'autorité en charge des transports publics en Ile de France. Il pilote aussi bien la RATP que Transilien ou les nombreux opérateurs de bus en banlieue et édite le site transports-idf.com
L'offre dont profite Mappy n'est évidement pas exclusive et on peut penser que d'autres fournisseurs de service vont demander au Stif d'accéder aussi à ces services.
Je trouve que Mappy a fait un excellent travail d'intégration des web services proposés par le Stif et offre une feuille de route très claire comme en témoigne l'extrait ci-dessous. 


Mais, la technologie de Canal TP étant impliquée dans cette réalisation, j'aimerai surtout savoir ce que vous, vous en pensez ?
Une remarque pour les fans de l'open data et des transports publics : ce qui est proposé ici n'est pas une ouverture de données brutes, mais la mise à disposition d'un "web service". Un "Open Service", en quelque sorte, qui présente des avantages : la qualité du service est "labelisée Stif", mais aussi des restrictions, par rapport à l'open data : les données "brutes" restent inacessibles.

8 bonnes raisons (au moins) d'ouvrir les données transport selon Street Films

Cette petite vidéo des talentueux auteurs de Street Films, qui est le prolongement vidéo de Street Blog, développe quelques bonnes raisons pour ouvrir les données transport public...
Regardez là, en anglais, ou parcourez mes notes en français ci dessous :


A Case for Open Data in Transit from Streetfilms on Vimeo.

1° Le transport public touche un grand nombre de concitoyens dans leur vie quotidienne,
2° Si le grand public peut consommer l'information météo via un grand nombre de canaux de diffusion différents,  c'est justement parce que l'information météo est "ouverte",
3° Une fois les données transport ouvertes, les développeurs ont rapidement proposé un grand nombre de canaux de diffusion pour l'information transport public : cartes, widgets, applications mobiles, afficheurs...
4° Un nombre croissant de leaders d'opinion dans le monde politique, économique ou associatif soutiennent l'ouverture des données publiques et la définissent comme une bonne pratique de gouvernement. Voyez le passage d'O'Reilly sur le gouvernement "comme une plateforme" et non comme "un distributeur automatique" !
5° Des exemples concrets de réalisations intéressantes et gratuites pour le contribuable existent : par exemple cet afficheur à LED installé dans une boutique de glace qui renseigne les consommateurs sur l'arrivée des prochains bus...
6° L'ouverture des données n'est pas tant un dispositif technique qu'une attitude d'écoute et de réponse aux besoins de la communauté des développeurs,
7° L'ouverture des données transport public prépare la publication d'autres données relatives à la mobilité en général (voir le passage de Robin Chase sur les données automobiles).
8° la sécurité sur la voie publique (statistiques sur les accidents) est un des domaines d'application de l'ouverture des données.

TransID sur BFM !

L'Atelier Numérique, l'émission de BFM présentée par François Sorel et animée notamment par Mathilde Cristiani et Jean de Chambure, m'a invité pour un "sujet" sur l'information des voyageurs ! Auditeur régulier de cette émission dédiée aux nouvelles technologies, j'étais absolument ravi.
J'ai été accueilli par Lila Meghraoua (@llmghr), interviewé par Mathilde Cristiani (@matdelat et j'ai même serré la main de François Sorel en vrai !
C'est une première pour moi et je m'aperçois que je n'ai pas dit la moitié de ce que j'espérais.
Heureusement il y a TransID pour compléter...
Mon objectif était de montrer que l'innovation en matière d'information voyageurs ne se limite pas à une "déclinaison" de vieux services sur des plateformes nouvelles.
Innovons sur les services d'information eux mêmes avant de les décliner sur iPhone, iPad et autres FaceBook.
Je n'ai pas eu le temps de donner des exemples concrets et d'évoquer le travail fait :
  • sur l'information en situation perturbée notamment sur InfoLignes et sur TCL,
  • sur l'accessibilité des itinéraires sur Vitalis à Poitiers,
  • sur l'information multimodale sur Destineo, jv-malin et les 7 autres sites régionaux réalisés par Canal TP...
  • sur l'émergence de projets multi-régionaux comme le porte@porte de voyages-sncf.com, voir nationaux avec l'Afimb...

Je voulais aussi parler de ce que font les autres comme par exemple GreenCove sur Transilien, ou Keolis avec Keo360.
J'aurai aimé aborder l'importance de l'ouverture des données en France, parler de Rennes Métropole et relayer l'initiative Datact lancée par Bruno Marzloff du groupe Chronos et Bruno Caillet de l'agence Le Hub.
J'aurai voulu débattre avec Xavier Aubry d'Appear Networks qui participait à l'échange, des avantages comparés des WebApps et des NativeApps pour le transport...
Evidemment, 12 minutes n'ont pas suffit !
Si vous l'écoutez, c'est ce week end sur  BFM (96.4 FM à Paris) le samedi entre 16 et 18 heures et le dimanche de 21 heures à 23 heures, n'hésitez pas à me faire quelques commentaires constructifs et critiques bienveillantes. C'est promis, je vais m'entrainer !
Merci en tout cas à toute l'équipe de l'Atelier, vous pouvez  les retrouver sur le Web, sur FaceBook et sur Twitter...

Opendata à Rennes une présentation d'Hugues Aubin

Je vous passe cette présentation faite par Hugues Aubin lors de la conférence Lift France. Hugues Aubin twitte ici et travaille à Rennes Métropole.
Je n'ai pas pu y assister à la présentation, mais les transparents sont simples et se passent bien de commentaires.

Il y a une semaine TfL ouvrait ses données

Il y a une semaine, Transport for London ouvrait ses données sur data.london.gov.uk.

Précisément, les données ouvertes sont  :

  • d'une part de plusieurs fichiers au format KML décrivant l'emplacement des stations de métro, des "webcams" surveillant le trafic, des emplacements permettant de recharger l'Oyster Card...
  • d'autre part de 4 "API" donnant de l'information en temps réel sur la position des trains et l'état des lignes et des arrêts (voir la doc technique en pdf).
Les quatre API ouvertes sont extrêmement intéressantes, et même si elles ne concernent que les métros, elles permettent d'envisager des applications utiles aussi bien en matière d'information des voyageurs que de constitution de statistiques. Trois applications remarquables sont déjà en ligne :

LiveTubeData : une application astucieuse qui fait le lien entre les événements auxquels vous participez sur FaceBook et les perturbations de trains desservant cet événement... Particulièrement utile pour les apéros géant auxquels vous vous rendrez, bien sûr, en transports publics....

Live Train Map for the London Underground : une carte des métros en temps réel, qui rappelle feu "wherearetrains" sur gMapify.

Et,last but not least, une carte des webcams, simple mais bien utile.

C'est plutôt encourageant en moins d'une semaine et pour une ouverture limitée ! Qu'en pensez vous ? 

Echanger des données : Fichiers, XML, API et WebServices

Cet article fait partie d'une série.

Ouvrir les données c'est les proposer en partage pour que d'autres les utilisent. La question des modalités d'échange des données est cruciale et le développement d'internet permet d'envisager plusieurs solution.

Il est, tout d'abord, possible de mettre simplement à disposition les tables de données et les éléments de documentation évoqués précédemment. On peut parler alors de "raw data" au sens où l'entend Tim Berners-Lee dans son fameux "we want raw data now !".

Pour faciliter les échanges de données, les fichiers XML constituent une alternative intéressante. Tous les fichiers xml sont conformes à une syntaxe normalisée par le W3C. Un fichier xml peut être utilisé pour présenter les données relative à un objet donné. Le fichier décrit à la fois des valeurs et les relations entre les valeurs.

On peut, donc, représenter l'ensemble du contenu d'une base de données sous forme de fichier xml. Le résultat est beaucoup plus volumineux mais aussi plus universel que la base en elle même.

Les fichiers XML sont faciles à interpréter pour les développeurs et pour les applications qu'ils réalisent. La facilité de l'interprétation de ces fichiers et le caractère universel de la syntaxe font d'xml un format courant pour les échanges entre machines via Internet. Une grande partie des "web services" et des API correspondent à des échanges de fichiers XML.

Les API sont une notion vaste qui englobe la notion de web service.

Une API est un dispositif appartenant à un programme et permettant dans un contexte technique donné, de solliciter automatiquement ce programme pour obtenir une action ou une réponse. C'est, comme son nom l'indique, une interface d'application utilisable par un programme.

Un web service est une API accessible via internet. Un web service permet à un ordinateur d'en interroger un autre via internet et d'utiliser la réponse dans le cadre de ses propres application.

Le développement du WEB suscite la création de nombreux web services. Un des plus visible est le web service de cartographie de google qui permet à n'importe quel site internet de présenter des éléments de cartographie. La cartographie est produite par un serveur Google, mais présentée par un serveur tiers. Autre exemple, Orange propose un catalogue API permettant, notamment, d'envoyer des SMS, et certains sites d'information sur les transports publics proposent des API de calcul d'itinéraire (comme le site Destineo de la région des Pays de la Loire qui alimente le site de la TAN à Nantes).

Données brutes en "fichier" (xml ou pas) et Web Service constituent deux façons de publier vos données. Beaucoup d'acteurs industriels (Google, Facebook...) proposent une ouverture par web service. Même si les coûts sont plus élevés, cette mise à disposition de web service permet :

  • un contrôle fin des accès, leur restriction éventuelle par exemple dans le cas d'un accès payant,
  • un suivi très complet de l'usage qui est fait du service puisque chaque utilisation se traduit par un requête visible par le serveur d'origine.
  • la garantie que l'ensemble des sites clients utilisent la "même version des données". Ce qui peut être important notamment lorsque les données évoluent souvent.
En revanche, beaucoup de développeurs préfèrent,au moins comme une alternative, avoir la capacité de disposer des fichiers comportant l'ensemble des données. Cela évite, notamment, toute dépendance vis-à-vis de l'éditeur des données.

Post suivant : Open data et Linked data : une donnée peut elle être libre et liée à la fois ?

Open data et Linked data : une donnée peut elle être libre et liée à la fois ?

Cet article est le dernier d'une série de 4 articles sur la notion de donnée.

Les d'outils collaboratifs comme Wikipedia et le web en général, mettent à disposition du public une quantité d'information considérable qu'il est tentant de vouloir exploiter pour ses propres applications. Malheureusement, il s'agit plus souvent d'information que de données directement exploitable par une machine. Comment extraire des données utiles de ce tas d'information ?

C'est l'un des objectifs des données liées ou "linked data".

Il s'agit simplement d'associer à chaque "objet réel", une adresse Internet (dite URI). Cette adresse doit permettre d'accéder à des informations complémentaires sur cet "objet" et notamment un certains nombre de relation avec d'autres URI.

Par exemple le mot Versailles peut faire référence à plusieurs objets. En revanche, Versailles associé à cet URI est beaucoup moins ambigu. L'URI permet d'accéder à de nombreuses informations complémentaires relatives à la géographie, à la population, ou à certains personnages célèbres liés à Versailles.

Vous pouvez notamment découvrir ce que Ferdinand et Nicolas ont en commun d'après Wikipedia.

A vous d'extrapoler le concept à des objets comme la "gare Montparnasse", le "train" de "18.17" et à la "ligne 2" direction "Jean Jaures" !

4 articles sur la notion de "donnée" et d'ouverture des données

Je vous propose une série d'articles pour préciser certaines notions clés pour la mise en oeuvre de projets d'ouverture des données. Ils sont illustrés par des exemples liés au domaine du transport public.

Information pour les hommes et données pour les machines ? porte sur la différence entre l'information et les données sous jacente.

Comment produire des données utiles pour une machine ? traite des méthodes permettant de présenter des données.

Echanger des données : Fichiers, XML, API et WebServices décrit quelques modalités d'échange de machine à machine et évoque l'importante différence entre mettre à disposition des fichiers et ouvrir un web service.

Open data et Linked data : une donnée peut elle être libre et liée à la fois ? Porte sur le concept de Linked Data.

Les 4 articles peuvent être lus séparément, mais ils s'enchainent aussi dans un ordre logique allant du plus général au plus détaillé. Si vous le lisez jusqu'au bout, en prime, vous apprendrez qu'il existe un point commun entre Anelka et Ferdinand de Lesseps !

Cet article vous a plu ? recevez les suivants par mail :

Data.gov : première évaluation de la directive Open Government

La Maison Blanche vient de publier un premier rapport d'évaluation de la directive Open Government prise par l'administration Obama fin 2009. La publication des données publiques est le premier article de cette directive (que je ne résiste pas au plaisir de vous présenter ci-dessous).
Open Government Directive
View more documents from White House.

Le rapport est assez bon comme l'indique ce tableau de bord.On notera que le ministère des transports remplie de façon satisfaisante l'ensemble des critères.
Certains ici ou notent qu'il s'agit d'une auto-évaluation, peut être complaisante et qu'il reste du chemin à parcourir... Bref le verre serait à demi vide.
D'autres notent que la dynamique est lancée et que l'objectif est maintenant de mobiliser les contributions et les projets d'utilisation de ces données.
Cela montre qu'une fois les réticences à l'ouverture des données dépassées, l'enjeu se déplace rapidement vers l'animation de la communauté des utilisateurs. Via O'Reilly.
Il ne suffit pas d'ouvrir les données pour susciter un intérêt des utilisateurs potentiels, il faut faciliter les projets d'utilisation, documenter les données et rester à l'écoute des utilisateurs. Cela rejoint les conclusions du MassDot.
Cet article vous a plu ? recevez les suivants par mail :

Les développeurs Mappy allient créativité et mobilité

Nous avions parlé du concours organisé par Mappy pour récompenser les développeurs les plus innovants dans l'utilisation des API Mappy. Ca y est, les prix sont attribués et ils méritent qu'on en reparle sur Transid puisque tous les lauréats ou presque proposent des applications liées à la mobilité et aux transports.

Mon palmarès personnel donne la première place à MappyHandicap qui est, officiellement, classé cinqième. C'est un service de recherche des places de stationnement réservées aux personnes à mobilité restreinte. Le site est soigné on peut "ajouter des places". Avec un peu de publicité et d'audience, cela peut devenir un outil très utile me semble-t-il.

Il faut aussi aller voir le second du classement : wimt.fr, une belle application qui présente les emplacements théoriques des RER à l'heure courante. L'application s'inspire et va au delà de wherearetrains du toujours très créatif gmapify. Elle permet de se faire une idée de la densité des RER en fonction de l'endroit et de l'heure.

Toujours autour de la mobilité, i-Bordeaux rassemble toutes les informations sur les taxis, les vélos et les tramways de Bordeaux. Un projet du même auteur existe à Rennes qui utilisera certainement les données transports de data.keolis-rennes.fr quand elles seront publiées.

Enfin, RosaLog Planning Easy est une application permettant d'optimiser les déplacements professionnels. L'idée est excellente et là aussi, l'intégration de données "transport public" serait vraiment utile !


Lauréats Mappy API Challenge from Mappy on Vimeo.

Bravo à tous ces développeurs et à Mappy  qui démontrent qu'on peut faire de belles choses à peu de frais à partir d'API bien conçues.
Si vous voulez découvrir le gagnant, il s'agit d'un jeux, c'est très à la mode mais c'est moins ma tasse de thé... (qui a dit "tu n'es plus dans la tranche d'age" ?) allez donc sur le geoinweb ou regardez la video jusqu'au bout !

Big Data ou Open Data ?

Un petit de clarification autour de deux concepts importants et bien distincts dont on entend beaucoup parler en ce moment : Big Data et Open Data.

Big Data recouvre les technologies nécessaires pour exploiter instantanément des quantités importantes de données. Il s'agit, typiquement, des données comportementales des internautes ou des données issues des capteurs, des données de géolocalisation des voyageurs... 
Il convient de collecter ces données, mais surtout de les exploiter si possible en temps réel pour adapter les réponses au contexte des clients. Ainsi, la recherche et les publicités comportementales sur Internet, et les itinéraires optimisés dans les transports sont des services qui reposent sur cette notion de "big data"...
De nouveaux outils sont mis en oeuvre, spécifiquement pour faire face à ces défis comme des bases de données "no SQL", des outils d'analyse et de visualisation...
Pour ceux qui doutent de l'intérêt pratique de ces outils je vous renvoie à deux articles récents de la presse économique : le FT titrait : "Smarter leader are betting big on data" (gratuit, mais inscription nécessaire) et The Economist : "Data everywhere".

Open Data recouvre la mise à disposition, notamment par les "services publics" des données d'intérêt général. J'ai régulièrement abordé le thème de l'Open Data dans ce blog, puisque les données d'offre (horaires, arrêts...) des transport public sont directement concernés. Je vous renvoie, si le coeur vous en dit aux articles plus anciens.

Décisions d'entreprises : êtes vous plutôt Data ou plutôt Hippo ?

J'emprunte cette question à Hal Varian dans la vidéo ci-dessous. Hal Varian est économiste. Il travaille notamment sur les apports économiques des transactions informatiques. Sur Internet tout, ou presque, peut être mesuré, analysé, comparé et optimisé. Logiquement, la diffusion d'internet dans les processus d'entreprise devrait donner lieu à un renouveau de l'analyse quantitative. Mais cette opportunité est souvent ignorée au profit de mode de décision plus... traditionnels !

D'où la question : la prise de décision dans votre entreprise s'appuie-t-elle plutôt sur des Data : des données, des tests... bref du quantitatif ou sur des Hippos ? Les Hippos sont les Highly Paid Person Opinions, c'est à dire les opinions des personnes bien payées ! Typiquement celle de votre patron ! Au delà de cette boutade, Hal Varian aborde plusieurs points fondamentaux dont chacun mériterai un exposé spécifique :
  • Le rôle de l'immatériel dans l'accélération de l'innovation,
  • Les 4 apports des échanges informatisés : 
    • De meilleurs contrats : plus d'information permet d'affiner l'offre et de proposer des contrats mieux adaptés. Après des exemples historiques, Hal évoque des contrats d'assurance automobiles qui prendraient en compte la vitesse à laquelle les clients conduisent, ou les évolutions constatées sur le marché de la location des vidéos.
    • La possibilité d'extraire et d'analyser des données bien au delà de la "comptabilité" traditionnellement associée au contrat. C'est là qu'il évoque les Data et les Hypos.
    • La possibilité d'expérimenter de façon continue et contrôlée, il explique que Google et Bing font continuellement évoluer leurs algorithmes en s'appuyant sur les résultats de plusieurs milliers d'expérimentations très limitées effectuées chaque année sur un petit pourcentage des internautes.
    • La personnalisation : c'est la possibilité de proposer une offre différente à chaque client, mais aussi d'analyser les comportements qui en résultent. Hal n'élude pas la question de la protection de la vie privée, mais il l'aborde sous un angle... économique !
Bref, food for thought comme disent les anglo-saxons ! la déclinaison de ces réflexions dans le domaine du transport public, à l'heure où les titres de transports (les "contrats") se dématérialisent, ouvre notamment les propositions suivantes :
  • des meilleurs contrats : des titres de transports flexibles en fonction des heures et des itinéraires, une sorte de yield management pour le transport public,
  • mieux exploiter les données : au delà des données d'offres dont on a déjà parlé, beaucoup d'autres données mériteraient d'être analysées. Peu de choses sont faites des masses de demandes d'itinéraires quotidiennement soumises par les internautes sur les sites des exploitants... Qu'en sera-t-il des données issues de la dématérialisation des titres de transports ?
  • l'expérimentation et l'amélioration continue des produits d'information est une pratique à adopter, au moins pour les réseaux les plus importants. De nouveau pourquoi ne pas la transposer dans le domaine de la distribution ?
  • la personnalisation des offres devient, elle aussi possible, avec le développement de la vente en ligne et l'avènement des titres sur téléphones portables.
D'autres idées ? 

Accès ouvert aux données publiques et élections régionales

Creative Common France lance une campagne pour un accès ouvert aux données publiques à l'occasion des élections régionales. Le communiqué est . L'idée est d'interpeller les candidats pour qu'ils se prononcent sur un questionnaire. Plus d'informations sur le wiki dédié à la campagne des régionales.
Pour les candidats qui auraient du mal à répondre au questionnaire, voici quelques pistes :
  • Pour l'intérêt politique d'un accès ouvert aux données publiques voir quelques articles sur TransID : l'exemple de San Francisco, l'exemple du Massachusetts (ici et ), l'exemple de Londres.
  • Les restitutions de l'Open Data Camp organisé par la Fing à la Cantine.
  • Greg Whisenant propose, sur O'Reilly Radar, un guide en 4 étapes (et en anglais que je traduis rapidement) :
    1. Convoquer la discussion : commencez par entrer en contact avec et écouter les communautés concernées,
    2. Examinez vos données et classez les en trois tas : celles que vous publierez sous forme de "données brutes", celles qui vous publierez sous forme d'API (notamment les données "vivantes"), celles que vous ne publierez pas.
    3. Publiez les données brutes.
    4. Publiez vos API.
    5. La distinction données brutes (pour des données qui ne "bougent pas") et API pour des données qui évoluent dans le temps est intéressante. On peut, par exemple, penser que les données "horaires" des transports fluctuent suffisement pour être mises à disposition sous forme d'API plus que sous forme de données brutes.
  • Enfin, un état des lieux fait par le CERTU en matière de données sur les Transports Publics en France.
Cet article vous a plu ? recevez les suivants par mail :