← Projets sélectionnés/Transport public/2024–2025

Chemins de fer fédéraux suisses (CFF) · Opérateur ferroviaire · équipe de modélisation SIMBA MOBi

Un planificateur d'activités à l'échelle de la ville qui reproduit le microrecensement suisse sur une pile open-source

Un cadre MILP en temps continu construit avec les CFF à l'EPFL, calibré sur 10 110 emplois du temps réels du microrecensement et exécuté de bout en bout sur une population synthétique lausannoise de 46 970 emplois du temps — sans aucun rapiéçage à base de règles

La prévision de la demande de transport dépend de la simulation de ce que de vraies personnes font réellement pendant la journée, quand elles travaillent, font leurs courses, déjeunent, pas seulement du nombre de voitures sur la route. La plupart des modèles opérationnels trichent sur la couche temporelle avec des heuristiques, et perdent toute leur réalisme dès que quelque chose de disruptif se produit.

Nous avons travaillé avec les CFF et l'EPFL pour construire un véritable modèle d'optimisation pour la dimension temporelle. Un programme mixte décide conjointement de l'emploi du temps quotidien complet de chaque personne, calibré sur des données réelles du microrecensement suisse. Le résultat est une simulation à l'échelle de la ville dont les profils d'activité correspondent aux observations empiriques sans aucun rapiéçage heuristique.

46 970

emplois du temps de la population synthétique lausannoise simulés de bout en bout

10 110

emplois du temps réels du microrecensement suisse utilisés pour calibrer le cadre

Open-source

tourne sur SCIP / OR-Tools — zéro coût de licence pour solveur commercial

STRC 2021

peer-reviewed, co-rédaction CFF × EPFL, financé par Innosuisse

Le défi

Les modèles de transport activity-based traditionnels simulent les décisions séquentiellement, quoi faire, puis quand, puis où, puis comment, ce qui les rend aveugles aux arbitrages. Deux activités en concurrence pour la même heure ? Quarante mille personnes essayant de faire la navette et les courses en même temps ? Les modèles séquentiels devinent ; ils n'optimisent pas.

Les CFF avaient besoin d'un cadre suffisamment réaliste pour alimenter l'affectation de trafic dans MATSim, suffisamment rapide pour simuler des emplois du temps complets pour une ville entière, et suffisamment flexible pour absorber des changements de comportement majeurs comme la montée du télétravail.

Notre démarche

Nous avons transformé la couche temporelle en un véritable problème d'optimisation : les heures de début, durées et séquences d'activités de chaque personne sont décidées conjointement par un programme linéaire mixte avec des paramètres d'utilité estimés à partir des données. Les choix non temporels (où, quoi, comment) restent dans les modèles de choix discret existants des CFF et alimentent l'optimiseur comme entrées fixes.

Nous l'avons déployé sur le solveur open-source SCIP via OR-Tools afin que le pipeline opérationnel ne nécessite pas de licence commerciale, et validé contre le microrecensement suisse sur la sous-population des travailleurs à temps plein de Lausanne.

Le résultat

Livrable : un cadre de planification activity-based calibré et validé qui résout les conflits temporels dans les emplois du temps quotidiens via un MILP maximisant l'utilité, construit sur la pile open-source SCIP / OR-Tools (zéro coût de licence pour solveur commercial). Présenté à STRC 2021 en co-rédaction avec les CFF et l'EPFL, dans le cadre de la collaboration CFF × EPFL en modélisation de la demande financée par Innosuisse (projet 2155006680).

Sur une population synthétique lausannoise de 46 970 emplois du temps, les profils d'activité simulés reproduisent toutes les signatures empiriques du microrecensement suisse, pic matinal du travail, creux du déjeuner, fenêtre de loisirs en soirée, structure multi-tour, sans aucun rapiéçage basé sur des règles. Le cadre calibre 64 paramètres comportementaux sur 10 110 emplois du temps réels du microrecensement et atteint ρ̄² = 0,165.

Plongée technique

Le modèle derrière le résultat.

Le modèle

Chaque individu i a un ensemble fixe d'activités A_i à réaliser dans un budget de 24 heures ξ. Le MILP choisit l'heure de début x_a, la durée τ_a, le temps de trajet tt_a vers l'activité suivante, et un indicateur binaire de séquence z_{ab} (= 1 si a est immédiatement suivie de b). L'objectif est l'utilité totale de l'emploi du temps, une somme de pénalités pour s'écarter des heures de début et durées souhaitées, plus une désutilité de temps de trajet.

U_{i} = a \in A_{i} \sum U_{timing} (x_{a}) + a \in S_{i} \sum U_{duration} (τ_{a}) + O \in {P_{i}, H_{i}} \sum U_{duration} (a \in O \sum τ_{a}) + a \in A_{i} ∖ {dusk} \sum β^{travel} t t_{a} .

Utilité totale de l'emploi du temps. Les activités secondaires sont pénalisées individuellement ; les activités primaires et la maison partagent un budget de durée quotidien.

U_{timing} (x_{a}) = β_{a}^{early} max (0, x_{a}^{*} - x_{a}) + β_{a}^{late} max (0, x_{a} - x_{a}^{*}) .

Pénalité de temps linéaire par morceaux autour de l'heure de début souhaitée x_a*. Asymétrique, être en avance peut coûter plus ou moins que d'être en retard.

U_{duration} (τ_{a}) = β_{a}^{short} max (0, τ_{a}^{*} - τ_{a}) + β_{a}^{long} max (0, τ_{a} - τ_{a}^{*}) .

Pénalité miroir autour de la durée souhaitée τ_a*. Estimée à partir des données du microrecensement par maximum de vraisemblance.

(z_{ab} - 1) ξ \leq x_{a} + τ_{a} + z_{ab} t t_{a} - x_{b} \leq (1 - z_{ab}) ξ \forall a, b \in A_{i} .

Cohérence de séquence Big-M. Quand z_{ab} = 1, la paire se réduit à l'égalité x_b = x_a + τ_a + tt_a ; sinon les bornes sont inactives.

a, b \in A_{i} \sum (τ_{a} + z_{ab} t t_{a}) = ξ, b \neq = a \sum z_{ab} = 1, b \neq = a \sum z_{ba} = 1 \forall a \in A_{i} ∖ {dawn, dusk} .

Le budget temps remplit exactement la journée de 24 heures. Chaque activité (sauf les points limites aube/crépuscule) a exactement un prédécesseur et un successeur.

Les paramètres de flexibilité β^early, β^late, β^short, β^long sont inconnus par type d'activité. Nous les estimons par maximum de vraisemblance : pour chaque emploi du temps observé dans le microrecensement, nous construisons un choice set compétitif, scorons chaque alternative avec l'utilité ci-dessus, et ajustons les paramètres qui rendent l'emploi du temps observé le plus probable sous un modèle logit. Les paramètres alimentent ensuite le même MILP au moment de la simulation.

Benchmark

Paramètres de flexibilité estimés pour des clusters d'activités sélectionnés (significatifs au niveau 5 %).

Activité / cluster	β^early	β^late	β^short	β^long
travail : début matinal	−0,615	−0,436	-	-
travail : début d'après-midi	−0,406	0	-	-
travail : budget de durée quotidien	-	-	−0,022	0
loisirs : déjeuner (sous-tour)	−1,610	−0,821	−7,550	−1,360
loisirs : sous-tour du soir	−0,076	0	−3,060	−0,692
courses : dans un sous-tour	−0,239	−0,486	−5,910	−0,721
maison : après le travail	−0,073	−0,596	-	-
maison : budget de durée quotidien	-	-	0	−0,354

Les nombres négatifs sont des pénalités (perte d'utilité par heure d'écart). Le déjeuner est l'activité la plus rigide, tant pour le décalage horaire que pour le non-respect de la durée souhaitée. Le travail du matin a un horaire de début raide ; le travail de l'après-midi est beaucoup plus flexible. La pénalité maison-tard (β^late = −0,596) capture la préférence bien documentée de rentrer à la maison en début de soirée. Échantillon de 10 110 emplois du temps de travailleurs à temps plein nettoyés, ρ̄² = 0,165, log-vraisemblance améliorée de −57 295,58 à −47 847,37 sur 64 paramètres.

Tiré du dossier

Figure 1 du rapport : les deux flux du cadre. La ligne du haut calibre les paramètres de flexibilité à partir des emplois du temps du microrecensement ; celle du bas utilise ces paramètres pour simuler les emplois du temps de la population synthétique.

Figure 4 du rapport : profils d'activité simulés (à gauche) versus profils observés au microrecensement (à droite) pour la sous-population des travailleurs à temps plein. Le pic matinal de travail, le creux du déjeuner, la rampe de loisirs du soir et la dominance domestique se reproduisent sans rapiéçage par règle.

Figure 5 du rapport : heatmaps 2D heure de début × durée pour les activités travail et loisirs, modèle vs microrecensement. Le schéma bimodal du travail (matin seul vs split matin-après-midi) et le pic loisirs-déjeuner à 12:00 sont capturés par l'optimisation seule.

Techniques

Planification d'activités en temps continu
Programmation linéaire mixte via OR-Tools / SCIP
Estimation par maximum de vraisemblance des paramètres d'utilité
Génération d'ensembles de choix (alternatives probables + aléatoires)
Couplage d'optimisation MILP avec modèles de choix discret séquentiels

Stack

Python
OR-Tools
SCIP
Biogeme
Ray (exécution parallèle)
Intégration MATSim

Un problème de ce type ?

Nous serions ravis d'en entendre parler.

contact@optimally.ch