Quelles sont vos missions chez RATP Dev ? 

Je suis cheffe de projet au sein du pôle data depuis près de 4 ans. Notre objectif est de démocratiser l’accès à la donnée et de l’exploiter pour l’amélioration opérationnelle de nos différents réseaux. Dans ce cadre, j’anime au quotidien un réseau correspondants data managers dans nos réseaux qui sont clés pour les remontées d’information en lien avec les usages et tendances de la mobilité et en charge de déployer les projets data sur le terrain. Je participe également à l’élaboration de la stratégie data de nos réponses aux appels d’offre. Enfin, je pilote le projet Data Lake depuis un an et demi. Ce projet, co-mené avec la direction des systèmes d’information permet de disposer d’une banque centrale de données alimentée par les flux de différents réseaux et de leur proposer de nouveaux outils d’analyse. Ce projet est international : nous avons récemment travaillé avec Casablanca, London Bus et prochainement pour Le Caire.

Comment les données sont-elles exploitées au sein du Data Lake pour améliorer la gestion des réseaux de transport ?  

Nous nous appuyons sur nos datas managers qui sont des relais clés de l’information au niveau local. Nous partons ainsi des besoins terrain, des cas d’usage précis, pour comprendre les comportements des voyageurs, identifier des axes d’amélioration sur nos réseaux de transport ou concevoir de nouveaux services.

À ce titre, la constitution d’un Data Lake est un accélérateur sur trois aspects :  

  • L’extraction de données sur nos réseaux, puisqu’il vient automatiser les remontées de données qui était avant manuelles. 
  • La centralisation des données qui permet d’avoir une vue d’ensemble, de maîtriser tous les flux de données qui transitent chez RATP Dev dans le strict respect du RGPD. La moindre donnée déposée est déjà pré-anonymisée. Par exemple, les validations billettiques, considérées par la CNIL comme de la géolocalisation sont totalement anonymisées.  On ne peut pas remonter à l’individu, c’est une garantie absolue que doit offrir notre approche data.
  • La standardisation des outils. Par exemple, une validation billettique sera toujours exposée au même format. Les bases de données standardisées constituent le cœur du projet. 

En un an et demi, plus de 10 réseaux ont vu leurs flux de données transiter par le Data Lake. 
Pour aller plus loin, nous travaillons sans cesse, au sein même de cette plateforme data, pour calculer des indicateurs, croiser les données, apporter de l’intelligence, et donc faciliter la création de visualisation et d’outils, etc. En partant par ailleurs des besoins exprimés au niveau des réseaux, nous pouvons expérimenter, puis industrialiser de nouveaux outils.

Comment approchez-vous les nouvelles expérimentations ?  

Un projet d’expérimentation se conduit en 3 phases et intègre un ou deux réseaux pilotes. 

  • La première phase est celle de la définition conceptuelle de l’expérimentation que l’on appelle POC (proof of concept). Dans cette phase, nous manipulons des données à froid. On a une idée de ce que l’on veut faire et une interface très sommaire qui est construite. On travaille en général avec des startups spécialisées en data science.
  • La seconde phase est celle du prototype de pilote. Elle débute lorsque l’on voit qu’il y a un potentiel lors de la première phase. On va alimenter l’outil, le faire utiliser, estimer des premières pistes de retours sur investissement (ROI) concrets. 
  • La troisième phase correspond à la stratégie d’industrialisation des nouveaux outils d’analyse. Si on a obtenu des premiers ROI satisfaisants sur 4 mois, si le prototype a bien été pris en main (car ces expérimentations transforment les méthodes de travail sur les réseaux), on dresse une stratégie pour industrialiser l’outil avec différents scénarios (internaliser, externaliser, etc.).

Nous avons conçu une dizaine d’outils afin d’améliorer la relation voyageurs (outils CRM), servir le marketing et la performance via des outils de reporting tels que Citio ou la collecte de données des SAE, de données des systèmes billettiques, de données des systèmes de maintenance (GMAO). Les outils industrialisés Citio Analytics et Citio Fraude ont directement découlé de POC élaborés pour réussir à mieux comprendre la fraude et son évolution. Nous avons également mené toute une stratégie d’industrialisation du CRM, notamment pour améliorer les alertes info trafic à destination du voyageur. Dans nos expérimentations menées actuellement, la remontée d’informations en temps réel est un enjeu clé pour optimiser nos opérations. Par exemple, la demande d’information des voyageurs sur la charge à bord (fréquentation des modes de transport) en temps réel s’est renforcée avec la crise sanitaire. Il faut donc obtenir une vision en temps réel de ce qui se passe sur les réseaux afin de mieux piloter l’offre de transport et donner au voyageur la meilleure information possible. 

Quel est l’avenir de l’utilisation de la data sur les réseaux ? 

Pour nos nouveaux réseaux, qu’importe leur taille, on intègre systématiquement une vraie stratégie data avec un panel d’outils à mettre en place. 

Depuis 3-4 ans, la demande des autorités organisatrices de mobilité (AOM) en la matière a fortement évolué. Les AOM nous challengent fortement. Avant, le volet data était absent des cahiers des charges des appels d’offre, ou au mieux facultatif. Aujourd’hui, il constitue toujours une partie du cahier des charges bien identifié. Nous savons mettre en valeur la donnée et montrer comment on va l’exploiter, tout en restant une véritable force de proposition sur ces sujets, pour les Autorités Organisatrices.