Le projet CAD, ou comment l’application SNCF devient plus intelligente
Depuis mai 2017, l’appli SNCF propose plusieurs fonctionnalités destinées aux « prochaines destinations probables » sur l’écran d’accueil. Leur utilité ? Suggérer le prochain endroit où l’utilisateur pourrait vouloir se rendre, et ainsi raccourcir le temps de recherche des trajets.
Publié le
Par La Redaction
Issue d’un projet propulsé par SNCF Mobilités et baptisée CAD (Contextualisation Augmentée des Déplacements), cette nouvelle fonctionnalité s’inscrit dans un large programme visant à proposer, à terme, un « assistant personnel de mobilité » à tous les clients du groupe.
Avec une audience importante (27 millions de sessions en juillet 2017), l’appli SNCF se révèle le canal idéal de la mise en place du dispositif. « Ce n’est pas seulement une application des déplacements en train, c’est surtout l’outil indispensable de la mobilité quotidienne. L’enjeu du projet est donc de comprendre la mobilité des voyageurs au-delà des gares », explique Iva Stankovic, data scientist au sein de la Fab Big Data – une équipe pluridisciplinaire où des profils variés (data engineer, spécialiste Cloud ou encore Cloud ops) collaborent dans un environnement agile interconnecté -.
La géolocalisation et les algorithmes
C’est en se basant sur la géolocalisation actuelle instantanée de l’utilisateur et sur l’historique de ses déplacements, que l’appli parvient à proposer le trajet le plus probable à venir. Concrètement, l’équipe de la Fab Big Data a développé deux algorithmes afin de permettre à l’application de gagner en intelligence. Le premier est un algorithme de détection des lieux qui croise les données spatiales et temporelles du mobinaute (méthode dite de « clustering spatio-temporelle »), dont la logique a été inspirée du DBSCAN. D’après la data scientist, cela permet « d’extraire les lieux principaux des utilisateurs ». Le second est un algorithme de « prédiction », s’appuyant sur les déplacements entre ces lieux. « On constate en semaine un taux de prédictions positives à hauteur de 70% (du lundi au vendredi) », poursuit-elle.
L’intelligence au service de la mobilité
Le nombre d’utilisateurs de CAD est à la hausse depuis son lancement. Aujourd’hui, environ 500 000 personnes s’en servent quotidiennement, et participent ainsi au perfectionnement des algorithmes. Les données générées par les déplacements sont quant à elles traitées de manière anonymisée dans un DataLake sécurisé. Les habitudes d’un utilisateur évoluant, l’opération se fait sur un historique court.
Selon Iva Stankovic, une mise à jour de CAD est prévue pour la fin 2017. Elle permettra à SNCF d’identifier, parmi les déplacements, ceux qui se font en train. Une opportunité pour le groupe : celui-ci pourra restituer un véritable bilan de mobilité de ses utilisateurs, et ainsi mieux adapter le « comportement » de son application en fonction.