La Data Platform du programme Confiance.ai fait la pluie et le beau temps chez Air Liquide

Pour apprendre, les modèles de machine learning ont besoin de s’entraîner sur la base d’une immense quantité de données. Leur apprentissage doit, en principe, porter sur tous les scénarios possibles. Mais des scénarios imprévisibles apparaissent inexorablement dans un contexte industriel où interviennent des facteurs humains et environnementaux. De plus, certaines données sont difficiles à obtenir et à exploiter. Le défi réside donc dans la capacité à proposer des modèles de machine learning qui maintiennent leur fonctionnement sur des scénarios pour lesquels aucune ou peu de données réelles ne sont disponibles. Les données synthétiques, produites artificiellement par des approches d’IA générative, représentent ainsi une réponse efficace à cette problématique et un moyen, pour les acteurs industriels, de créer des modèles d’IA plus performants et plus robustes. 

Compréhension d’une scène à l’aide d’une caméra

Air Liquide utilise des caméras dotées d’un système à base d’IA pour le comptage automatique d’inventaire en plein air. Entraîné majoritairement de jour et par temps ensoleillé, cet outil de comptage s’avère sensiblement moins performant la nuit ou en cas d’intempérie (ex : pluie et nuit peuvent aboutir à une altération visible de l’image due aux réverbérations, baisse de résolution, flou de bougé, etc.). Les défis à relever sont donc multiples : comment détecter en temps réel ces nouveaux scénarios, dresser une analyse de sensibilité du système face à ces perturbations, proposer un outil garantissant le bon fonctionnement du système dans ce contexte, recueillir, annoter et augmenter la quantité de ces nouvelles données pour des entraînements ultérieurs ? 

La Data Platform, développée dans le cadre du programme Confiance.ai piloté par l’IRT SystemX, a contribué à améliorer la robustesse et la fiabilité de fonctionnement des modèles d’Air Liquide pour le comptage automatique d’objets dans des conditions météorologiques adverses. Elle a notamment permis de réduire de moitié l’erreur de comptage de nuit, pour arriver à des performances de précision au-dessus de 98 % :

  • •Grâce à un prétraitement des données consistant à éliminer des gouttes de pluie et éventuellement des flocons de neige/transformer des images de nuit en jour. Ce prétraitement a permis au système de traiter, sans entraînement supplémentaire, ces données comme en conditions normales d’apprentissage. 
  • Grâce à une meilleure maîtrise de ces nouvelles données (étude, visualisation, caractérisation) et à la complétion de la base de scénarios d’entraînement. Des méthodes synthétiques peuvent permettre d’annoter automatiquement ces données, voire de générer davantage d’images de nuit/neige susceptibles d’être exploitées par Air Liquide. 

Thématique FIT 2030

Digitalisation

Domaines d’application

Numérique
Confiance numérique
Économie des données
Technologies pour l’industrie du futur

Technologies clés

Technologies de conception de contenu et d’expérience
Modélisation, simulation et ingénierie numérique
Intelligence artificielle
Intelligence des données massives

Mots-clés

Prédiction / Supervision / Visualisation
Sûreté de fonctionnement
Robustesse électronique / Fiabilité
Aide à la décision / Big data