ROADEF 2026 - Sciencesconf.org

sciencesconf.org:roadef2026:706627

Cette thèse découle des défis de recherche opérationnelle de la chaîne logistique Renault. Pour y répondre, nous apportons des contributions à l'architecture et à l'entraînement des réseaux neuronaux avec des couches d'optimisation combinatoire (CO). Nous les combinons avec de nouvelles matheuristiques pour aborder les problèmes de routage d'inventaire de Renault. La Partie I est dédiée aux applications des réseaux neuronaux avec des couches CO en recherche opérationnelle. Nous introduisons une méthode pour approximer les contraintes. Nous utilisons de telles couches pour encoder des politiques pour des processus de décision markoviens à grands espaces d'états et d'actions. Alors que la plupart des études sur les couches CO reposent sur l'apprentissage super- visé, nous introduisons un schéma primal-dual pour la minimisation du risque empirique. Notre algorithme est compatible avec l'apprentissage profond, adapté à de grands espaces combinatoires, et générique. La Partie II est dédiée à la logistique retour des emballages Renault en Europe. Notre politique pour les décisions opérationnelles est basée sur une nouvelle matheuristique pour la variante déterministe du problème. Nous montrons son efficacité sur des instances à grande échelle, que nous publions, avec notre code et nos solutions. Une version de notre politique est utilisée quotidiennement en production depuis mars 2023. Nous abordons aussi la contractualisation de routes au niveau tactique. L'ampleur du problème empêche l'utilisation d'approches classiques d'optimisation stochastique. Nous introduisons un nouvel algorithme basé sur les contributions de la Partie I pour la minimisation du risque empirique.

Type :	:	Résumé
Thématiques	:	[PRIX] Prix de thèse du GDR ROD
Mots-Clés	:	Matheuristiques ; Routage d'inventaire ; Algorithme d'apprentissage primal ; dual ; Minimisation du risque empirique ; Couches d'optimisation combinatoire ; Apprentissage structuré

Vie privée | Accessibilité