ROADEF 2026>
Apprentissage structuré et optimisation combinatoire : contributions méthodologiques et routage d'inventaire chez Renault
Louis Bouvier  1  
1 : Centre d'Enseignement et de Recherche en Mathématiques et Calcul Scientifique
Ecole Nationale des Ponts et Chaussées

Cette thèse découle des défis de recherche opérationnelle de la chaîne logistique Renault. Pour y répondre, nous apportons des contributions à l'architecture et à l'entraînement des réseaux neuronaux avec des couches d'optimisation combinatoire (CO). Nous les combinons avec de nouvelles matheuristiques pour aborder les problèmes de routage d'inventaire de Renault. La Partie I est dédiée aux applications des réseaux neuronaux avec des couches CO en recherche opérationnelle. Nous introduisons une méthode pour approximer les contraintes. Nous utilisons de telles couches pour encoder des politiques pour des processus de décision markoviens à grands espaces d'états et d'actions. Alors que la plupart des études sur les couches CO reposent sur l'apprentissage super- visé, nous introduisons un schéma primal-dual pour la minimisation du risque empirique. Notre algorithme est compatible avec l'apprentissage profond, adapté à de grands espaces combinatoires, et générique. La Partie II est dédiée à la logistique retour des emballages Renault en Europe. Notre politique pour les décisions opérationnelles est basée sur une nouvelle matheuristique pour la variante déterministe du problème. Nous montrons son efficacité sur des instances à grande échelle, que nous publions, avec notre code et nos solutions. Une version de notre politique est utilisée quotidiennement en production depuis mars 2023. Nous abordons aussi la contractualisation de routes au niveau tactique. L'ampleur du problème empêche l'utilisation d'approches classiques d'optimisation stochastique. Nous introduisons un nouvel algorithme basé sur les contributions de la Partie I pour la minimisation du risque empirique.


Chargement... Chargement...