Issue d’un projet propulsé par SNCF Mobilités et baptisée CAD (Contextualisation Augmentée des Déplacements), cette nouvelle fonctionnalité s’inscrit dans un large programme visant à proposer, à terme, un « assistant personnel de mobilité » à tous les clients du groupe.

Avec une audience importante (27 millions de sessions en juillet 2017), l’appli SNCF se révèle le canal idéal de la mise en place du dispositif. « Ce n’est pas seulement une application des déplacements en train, c’est surtout l’outil indispensable de la mobilité quotidienne. L’enjeu du projet est donc de comprendre la mobilité des voyageurs au-delà des gares », explique Iva Stankovic, data scientist au sein de la Fab Big Data – une équipe pluridisciplinaire où des profils variés (data engineer, spécialiste Cloud ou encore Cloud ops) collaborent dans un environnement agile interconnecté -.

screen_projet_cad

La géolocalisation et les algorithmes

C’est en se basant sur la géolocalisation actuelle instantanée de l’utilisateur et sur l’historique de ses déplacements, que l’appli parvient à proposer le trajet le plus probable à venir. Concrètement, l’équipe de la Fab Big Data a développé deux algorithmes afin de permettre à l’application de gagner en intelligence. Le premier est un algorithme de détection des lieux qui croise les données spatiales et temporelles du mobinaute (méthode dite de « clustering spatio-temporelle »), dont la logique a été inspirée du DBSCAN. D’après la data scientist, cela permet « d’extraire les lieux principaux des utilisateurs ». Le second est un algorithme de « prédiction », s’appuyant sur les déplacements entre ces lieux. « On constate en semaine un taux de prédictions positives à hauteur de 70% (du lundi au vendredi) », poursuit-elle.

projet_cad_2

L’intelligence au service de la mobilité

Le nombre d’utilisateurs de CAD est à la hausse depuis son lancement. Aujourd’hui, environ 500 000 personnes s’en servent quotidiennement, et participent ainsi au perfectionnement des algorithmes. Les données générées par les déplacements sont quant à elles traitées de manière anonymisée dans un DataLake sécurisé. Les habitudes d’un utilisateur évoluant, l’opération se fait sur un historique court.

Selon Iva Stankovic, une mise à jour de CAD est prévue pour la fin 2017. Elle permettra à SNCF d’identifier, parmi les déplacements, ceux qui se font en train. Une opportunité pour le groupe : celui-ci pourra restituer un véritable bilan de mobilité de ses utilisateurs, et ainsi mieux adapter le « comportement » de son application en fonction.