48h pour faire parler la data ferroviaire
6 cas d’usage, 12 équipes, et 48h pour remporter le grand prix. La première édition du datathon groupe SNCF, ou hackathon de la data, s’est tenue dans les locaux franciliens de SNCF Réseau les 18 et 19 octobre. Les participants, issus du groupe SNCF mais aussi de l’École supérieure d’ingénieurs Léonard-de-Vinci (ESILV) à La Défense, ont bûché sur des problématiques réelles rencontrées sur le terrain, et développé des solutions basées sur l’usage de la donnée sous toutes ses formes.
Publié le
Par La Redaction
Plus haut, les 6 défis auxquels les participants du datathon ont dû répondre en seulement deux jours. En utilisant les jeux de données groupe SNCF, ainsi que les données publiquement accessibles (infrastructures cyclables, données INSEE sur les bassins de population…), les challengers ont créé, par groupe de cinq ou six, des prototypes pour répondre aux problématiques proposées.
Organiser un évènement de type hackathon sur des projets data n’est pas une mince affaire. Cela requiert un travail d’identification, de sélection et d’autorisation pour encadrer l’accès aux données, puis de nettoyage et d’harmonisation des données, afin que les participants puissent se concentrer sur la dernière étape : l’exploitation data en une forme utilisable sur le terrain. Un expert souffle même : « la préparation des sources de données, c’est 80% de l’enjeu du secteur ». En effet, impossible de concevoir un algorithme, et encore moins une IA sans un socle de données solide. Qu’entend-on par-là ? Il faut que la data soit récoltée au bon endroit, par des capteurs fiables, puis redressée et corrigée pour enlever d’éventuels biais, et enfin harmonisée avec les autres sources.
Deux journées entièrement consacrées à la data
Les challengers du datathon groupe SNCF édition 2023 ont donc pu travailler cette data au siège de SNCF Réseau à Saint-Denis. Du mercredi matin au jeudi après-midi – avec une nocturne jusqu’à 21h le mercredi ! – les 70 participants ont échangé, noirci des paperboards, codé en Python, créé des designs d’interface et leurs pitchs pour remporter l’un des six prix disponibles, sous l’œil attentif de leurs sponsors et du jury, composés de dirigeant.e.s des différentes activités du Groupe. Après une séance de pitchs blancs jeudi midi, les équipes se sont lancées dans la dernière ligne droite… Et la remise des prix s’est faite le soir : un trophée pour chacune des six thématiques, et un grand prix pour le coup de cœur du jury, attribué au modèle de prédiction des phénomènes d’enrayage et de patinage réalisé par l’équipe n°5.
Cette seconde journée a également été l’occasion d’organiser une table-ronde autour de trois thématiques structurantes pour le Groupe : l’équillibre à trouver entre protection du savoir-faire et partage des données pour maximiser leur valeur, les bénéfices d’une segmentation par domaine pour une meilleure maîtrise du patrimoine, et la data au service du business, un levier de performance. Une conversation à laquelle ont pris part intervenants internes et externes, avec notamment William Elong, Fondateur d’Algo Drone et Sophie Rogulski, Directrice Marketing Station-e, le tout animé par Jean-Jacques Thomas, Responsable gouvernance de la donnée et valorisation pour TER.
Au cours de ces deux jours de challenge, nous avons assisté à une véritable performance des experts métiers et des étudiants, qui se sont emparés des data mises à disposition pour les valoriser dans le but d’atteindre les objectifs stratégiques du Groupe. C’est cette mise en commun des expertises qui a fait la richesse de l’événement., Les étudiants de l’ESILV ont apporté un regard nouveau et leurs compétences en data science lors de la réalisation des cas d’usage.
Envie de rejoindre les équipes Numériques du groupe SNCF ?
Data, architecture SI, Réseaux/télécom, cybersécurité, développement applicatif, PMO…des centaines d’offres sont disponibles.