Un historique de données conséquent est indispensable aux algorithmes prédictifs pour améliorer les performances. Mais, si la puissance de calcul s’avère insuffisante… Comment un datalake dans SAP HANA a-t-il résolu ce problème chez un fournisseur de l’aéronautique
Fin 2016, une grande entreprise de l’aéronautique souhaitait valoriser ses données afin de connaître l’utilisation des produits chez ses clients avec deux objectifs concernant son service de Support et Maintenance : améliorer la gestion de ses activités en prédisant les besoins en support et en tâches de maintenance des appareils installés chez ses clients, et optimiser la gestion du stock de pièces de rechange en fonction de l’utilisation des produits de ces équipements.
Du datawarehouse au datalake à la vitesse de SAP HANA
Au départ, l’entreprise disposait d’un datawarehouse important, rassemblant la plupart des données structurées de l’entreprise. Toutefois, il lui fallait aussi corréler ces informations avec les nouvelles données, internes ou externes, structurées ou semi-structurées. « L’entreprise souhaitait pouvoir croiser les données historiques sur les appareils installés chez les clients avec des données externes (macro-économiques sur le marché de la concurrence, historiques de conversion dollar/euro, prix du pétrole, historique des pannes…), » précise Stéphane Munoz, Directeur de l’Agence Sud chez KP Consulting. « D’autre part, il lui fallait aussi effectuer des calculs avec divers paramètres et hypothèses saisis à la volée. Des opérations pour lesquelles elle exigeait des temps de réponse très courts et des données rafraîchies en quasi temps réel. »
Les tests avec différents algorithmes sur l’installation existante ont permis de constater que les flux de rafraîchissement devaient tourner pendant trois ou quatre heures pour des calculs simples. Des délais prohibitifs. D’autant plus que la société nécessitait aussi le recours à des calculs plus complexes.
« L’utilisation de SAP HANA, déjà présent dans le système d’information, devenait incontournable afin de profiter pleinement de ses performances pour ces calculs, » rapporte Stéphane Munoz. « Il a donc été décidé d’installer un datalake dans SAP HANA. Les données internes sont récupérées depuis SAP BW, tandis que des flux SAP BO Data Services se chargent de récupérer les données externes. »
Des prédictions bien plus fiables et des projets ambitieux
Aujourd’hui, l’entreprise utilise deux types de requêtes : les calculs lourds et complexes manipulant de grosses quantités de volumes et nécessitant la puissance de la plate-forme SAP HANA, et des modules développés en langage R pour calculer des statistiques sur des volumes restreints et plus spécifiques.
Initié au début de l’année 2017, le projet a duré environ huit mois et nécessité l’installation de SAP HANA sur un cluster de trois nœuds avec 1,5 To de mémoire, auquel il a fallu ajouter un nœud pour le backup.
« La fiabilité de l’algorithme de prédiction qui se situait aux alentours de 60 à 70 % a été augmentée à plus de 90 %, tout en intégrant un volume de données beaucoup plus important, » assure Stéphane Munoz. « D’ailleurs, l’activité 2018 pour le département support de l’entreprise a été planifiée en fonction de ces chiffres. »
Afin d’améliorer sans cesse les résultats et la pertinence des prédictions, les applications utilisent également un algorithme de Machine Learning.
« L’entreprise disposait déjà d’un très gros historique, avec des informations remontant jusqu’en 2002, » ajoute Stéphane Munoz. « Les algorithmes ont donc tourné sur des volumes de données importants, tandis que le Machine Learning a permis d’affiner et d’améliorer la pertinence en continu. »
S’étant révélé pertinent et efficace, ce mécanisme de Machine Learning sera d’ailleurs déployé sur d’autres algorithmes.
Champions du Monde !
Les bons résultats des projets ouvrent des perspectives et donnent des ailes aux décideurs. A l’occasion de la coupe du monde de football 2018 en Russie, l’entreprise doit envisager une utilisation plus importante des appareils par ses clients. « Il lui faudra prévoir un surstockage des pièces de rechange sans excès, en fonction des zones géographiques concernées. Et anticiper des plans d’intervention. Dans le cadre de cette suractivité, les algorithmes devront utiliser de multiples informations externes : état des réservations, nombre de vols par les opérateurs, planning de maintenance des appareils, information sur les risques de pannes des différentes pièces… le tout nécessitant une application de prédictivité spécifique à cet événement, et qui viendra interagir de façon complémentaire avec les applications opérationnelles de pilotage et de gestion existantes. »
La maintenance et le support aéronautique, meilleurs alliés d’une coupe du Monde réussie ?