
Stage M 2 : Système hybride d’optimisation du covoiturage étudiant : intégration planification offline et décisions dynamiques temps réel par apprentissage par renforcement H/F
Stage
•Vandœuvre-lès-Nancy (54)
...à J-1 (68% de la population) * Une couche dynamique online : agent d'apprentissage par renforcement (PPO contraint) gérant...
New