Chez SNCF, l’intelligence artificielle doit être vue comme un outillage pour l’humain
Alors que les applications de l’intelligence artificielle (IA) florissent à travers presque tous les secteurs d’activité, cette technologie peut être utilisée dans plusieurs secteurs d’activité au sein de la SNCF. L’IA épaule les utilisateurs et permet de remplacer certaines tâches répétitives, apportant aux agents des informations de plus en plus fines, mais laissant l’humain décisionnaire. Nous avons cherché sur ces questions les lumières d’Héloïse Nonne, directrice de la Factory Data et IA d’ITNOVEM, une filiale SNCF.
Publié le
Par La Redaction
L'intelligence artificielle est souvent perçue comme étant en concurrence avec l'humain, avez-vous des exemples où elle agit au contraire en le soutenant ?
C’est une réalité que l’automatisation peut venir remplacer l’humain : il faut moins de monde pour produire la même chose. Cependant je trouve cela restrictif de dire que l’IA remplace l’humain. Un exemple : pour l’approvisionnement en pièces du Matériel, il y a un problème de surstock accru par la crise sanitaire. L’équipe de la supply chain a souhaité mettre en place un algorithme capable d’évaluer le risque de surstock au moment de la commande. L’algorithme prévient, mais au final c’est l’expert métier qui décide de l’approvisionnement. L’intelligence du contexte reste le propre de l’humain. L’IA peut permettre d’alléger la charge de travail sur les cas simples en dégrossissant le travail. C’est un appui.
Dans ce cas, il n’y a pas de réduction d’effectif, juste un travail d’expertise recentré sur les cas plus complexes grâce à un nouvel outil. Je pense donc qu’il faut faire la part des choses entre le buzz médiatique autour de IA et la réalité. De plus, pour la mise en place d’un algorithme, on a besoin de l’intervention humaine à chaque étape, des phases préparatoires à l’entraînement de l’algorithme. Interviennent des experts métier, de l’IA et de l’IT.
Même lors des phases plus matures, l’humain reste indispensable, en tout cas au sein de SNCF, pour des raisons de sécurité, de complexité des tâches à effectuer, et de standards de performance. Si l’algorithme de Netflix se trompe dans ses recommandations, ce n’est pas très grave, tant qu’il fait des milliards de recommendations qui globalement sont correctes et génèrent un chiffre d’affaire. Chez nous, l’erreur d’un algorithme peut entraîner un risque pour la sécurité et une perte de millions d’euros si on automatise la prise de décision. L’humain reste donc décisionnaire. L’intelligence humaine est seule capable de mettre en place et d’opérer un outil contenant une IA, qui est loin d’être autonome et encore moins « autoapprenante ». D’ailleurs, je ne connais aucune IA autoapprenante. C’est un fantasme.
Quels sont les projets ou tendances data et IA qui ont retenu votre attention en 2021 ?
L’une des grandes tendances qui s’est confirmée en 2021, c’est la mutualisation des données par la plupart des entités du Groupe, avec pour but d’autonomiser les utilisateurs. Jusque-là on récupérait les donnée brutes, et on les traitait pour obtenir des indicateurs et faire un tableau de bord pour les utilisateurs. Cette démarche est intéressante, mais assez rigide et passive. Nous visons désormais à permettre à l’utilisateur à jouer avec la donnée, à se l’approprier. Mettre en place des outils pour permettre aux métiers de concevoir eux-mêmes leur permettra d’être plus agiles et créatifs, même si l’industrialisation demande l’intervention de développeurs et de spécialistes de la donnée pour automatiser les traitements et mettre en conformité avec les standards IT et sécurité.
Nous changeons la manière de développer les projets afin de créer un socle commun de données pour les alimenter, et non plus par cas d’usage. Ces données ne sont pas brutes, il y un effort de préparation pour les rendre lisibles et les organiser pour qu’elles parlent aux métiers. Ce n’est donc pas un data lake (un stockage de données brutes destiné aux développeurs spécialistes de la donnée, les data engineers), mais un réservoir de données pensées pour être utilisées par un data analyst ou un expert métier qui s’est formé sur quelques outils simples d’accès.
Parmi les projets marquants en 2021, il y a celui pour éviter les surstocks dont j’ai déjà parlé, mais aussi une étude menée pour TER pour mesurer la fréquentation dans ces trains sans réservation, en utilisant l’IA pour extrapoler les 1-2% de trajets comptés à la main au reste du trafic. Enfin, il y a le projet Qualesi, un outil de simulation de consommation énergétique des trains tenant compte du mode de traction (hydrogène, batterie, hybride, etc.) et du roulement.
Quels sont selon vous les grands défis qui attendent la data à l’avenir ?
Tout d’abord, il faut améliorer notre connaissance de nos clients et de la mobilité ; chez SNCF Voyages par exemple, afin de piloter finement les offres Ouigo et Inoui et s’adapter aux changements d’habitudes liés à la Covid. Il y a aussi le sujet de la maintenance industrielle pour SNCF Réseau et Matériel, notamment avec l’arrivée de la concurrence, mais aussi parce que les nouveaux matériels roulants nous fournissent de plus en plus de données qu’il faut valoriser et utiliser en quasi-temps réel pour la supervision des flottes et dans certains cas faire de la maintenance prédictive.
Ensuite la mutualisation des données représente autant d’opportunités que de défis. Au-delà de la qualité de ces données, il y a la question de leur gouvernance : en mutualisant les données, la question de l’accès devient primordiale. Dans quelles conditions les utilisateurs finaux accèdent-ils aux données ? Qui a accès à quoi ? Doit-on ouvrir les données ? Il y aussi l’aspect RGPD (Règlement Général sur la Protection des Données), ou encore les droits de diffusion des données.
Plus généralement, le secteur de la donnée est un marché qui évolue très vite. Pour SNCF, il faut savoir où situer le curseur entre tirer parti des innovations et compétences disponibles, et d’un autre côté garantir une certaine stabilité dans nos processus sans subir de retard technologique.
Tenant compte de l’impact carbone du numérique, il faut que nous cherchions à avoir un usage raisonné et frugal des données, en passant certes par de nouvelles technologies plus performantes, mais aussi en identifiant ce qui peut être supprimé ou optimisé dans nos applications.
Enfin, l’utilisation massive des données et plus largement du numérique, entraîne des défis énergétiques et financiers. Tout ce que l’on fait à la Factory Data et IA est sur le cloud, donc avec une consommation de ressources IT à l’usage. C’est une opportunité, mais aussi un paramètre à prendre en compte car la quantité de données traitées augmente avec les services qui se développent, ce qui peut créer un effet rebond.