FLASH INFORMATIQUE FI



Quand le WiFi se met au service du réseau piétonnier


Des données WiFi collectées sur le campus de l’EPFL ont été associées aux informations sur son réseau piétonnier et sur les horaires de cours des étudiants, dans le but de mieux comprendre les destinations et les déplacements des piétons sur le site.



WiFi data have been collected on campus. Together with information about pedestrian network and class schedules, they enable to better understand destination choices of pedetrians at EPFL.



Antonin DANALET


Je ne suis qu’un piéton, rien de plus
Arthur Rimbaud

Dans le cadre d’un projet de recherche pour CarPostal [1], un sondage a été effectué auprès d’environ 2000 personnes. L’une des questions portait sur la perception des modes de transport. Il était demandé d’indiquer trois adjectifs décrivant le mieux chacun des modes proposés : la voiture, le train, le bus, le car postal, le vélo et la marche. À la lecture des résultats, on découvre que la perception de la marche dans la population correspond à l’exercice physique (22.9%), à la lenteur (10.3%), aux loisirs (5.0%) et à l’écologie (4.5%).
C’est oublier un peu vite que chacun d’entre nous est un piéton lorsqu’il essaie d’attraper sa correspondance de train ou de bus. La marche est la clé d’un système de transport multimodal. Chaque passage d’un mode de transport à l’autre se fait à pied et la stabilité du système nécessite des infrastructures robustes pour les piétons. Il est donc nécessaire de comprendre le lien entre d’une part l’infrastructure multimodale et d’autre part le comportement de la foule des utilisateurs du système. Dans une gare par exemple, l’infrastructure a un impact direct sur le comportement : un nouvel obstacle – une poubelle, un distributeur de billets – modifie les flux de piétons, un nouveau passage sous voie modifie l’itinéraire des passants, et un nouveau magasin modifie jusqu’aux activités effectuées. À l’inverse, le comportement des individus a un impact important sur les infrastructures : la congestion met en danger l’efficacité de la gare. Il est donc important de comprendre cet impact afin de planifier au mieux les infrastructures piétonnes.

La recherche sur les piétons : de l’évacuation à la modélisation dans les infrastructures intermodales et les villes

La recherche sur les piétons couvre plusieurs domaines. Les questions d’évacuation et de sécurité sont historiquement les plus étudiées. En 2010, vingt-et-une personnes meurent étouffées à la Love Parade de Duisburg, plus par un effet domino amplifiant la pression que par un réel mouvement de panique [2]. Le Hajj à la Mecque fait aussi face à de nombreux risques, avec plus de 3.5 millions de pèlerins par année. En prévision de l’augmentation du nombre de visiteurs, les autorités saoudiennes ont agrandi le pont Jaramaat en 2006 et mandaté des chercheurs pour les conseiller sur l’augmentation de la capacité de la mosquée. L’objectif ici n’est plus uniquement de comprendre les possibles mouvements de panique, mais aussi d’accueillir au mieux le nombre croissant de fidèles.
Les fidèles du rail entre Lausanne et Genève sont, quant à eux, aussi de plus en plus nombreux : d’ici à 2030, le nombre de passagers sur cet axe va probablement doubler [3]. Et deux fois plus de passagers dans les trains implique deux fois plus de piétons dans les gares. Il n’est plus question ici d’événements exceptionnels ni de sécurité, mais de la gestion quotidienne et opérationnelle d’une foule. La recherche, la politique et les opérateurs de transport s’intéressent de plus en plus à la compréhension des flux piétonniers. Le Centre de Transport (TraCE) de l’EPFL a été mandaté par les CFF pour analyser, modéliser et optimiser ces flux dans les gares. Dans le cadre de la transformation des gares d’un simple noeud de transit en un véritable lieu de vie contenant des restaurants et des magasins, les CFF ont en effet à coeur de maintenir le confort de l’usager et de garantir les correspondances [4].
De son côté, la ville de Lausanne a décrété la marche comme mode de déplacement prioritaire depuis son plan directeur communal de 1996. Une thèse récente a été consacrée au renouveau de la marche en milieu urbain [5]. Lorsqu’il s’agit de l’étude des comportements piétons, deux approches se dégagent. L’une cherche à promouvoir la marche comme mode actif, bon pour la santé et non polluant dans la ville multimodale. On cherche alors à comprendre le lien entre les différents modes ou les accès aux arrêts de transports publics depuis le domicile par exemple. C’est le cas de différentes études menées à Singapour ou à Mexico. L’autre approche porte sur les infrastructures piétonnières, qu’il s’agisse de gares, d’aéroports, de festivals musicaux comme Paléo, de supermarchés, d’hôpitaux ou encore d’un campus comme celui de l’EPFL. Dans ces situations, le mode de transport est défini par le lieu et chaque personne présente est nécessairement un piéton. Dans le cas des hubs de transport (gares, aéroports), le piéton entre dans une chaîne multimodale, mais il est localement contraint à la marche.
Nous nous intéressons ici à cette seconde catégorie.

Seul ce qui peut être compté compte

En 1963, le sociologue William Bruce Cameron écrivait : « Il serait agréable si toutes les données dont les sociologues ont besoin pouvaient être énumérées, car alors nous pourrions les utiliser sur des ordinateurs IBM et dessiner des graphiques comme font les économistes. Cependant, tout ce qui peut être compté ne compte pas, et tout ce qui compte ne peut pas être compté. » [6]. Ce n’est visiblement pas l’avis de l’Association suisse des piétons, qui organisait sa journée d’étude 2010 sur le thème « Nur was gezählt wird zählt », sous-titrée « Vers une culture des comptages piétons et cyclistes ». Par rapport aux autres modes de transport, les collectes de données sur les piétons sont plus complexes, que ce soit au niveau opérationnel (données sur l’évitement des obstacles et des autres piétons), au niveau tactique (données sur le choix du passage sous voie à utiliser par exemple) ou au niveau stratégique (données sur le choix de la destination ou de l’activité).
Comment alors collecter des données sur les piétons  ? Ces derniers ne sont pas couverts de métal et ne pèsent pas une tonne, comme les automobilistes. Ils ne suivent pas non plus de routes clairement définies et se faufilent dans chaque espace.
Au niveau opérationnel, de nombreuses expériences ont été filmées. Dans la gare de Lausanne, dans le cadre d’un projet de recherche commun entre l’EPFL et les CFF, un système différent a été installé, utilisant des capteurs de profondeur du même type que la Kinect de Microsoft. Ils permettent de suivre les trajectoires des passants même dans la pénombre et sans dévoiler leur identité.
Cette technologie est très précise, mais a un coût et peut difficilement être installée à l’échelle d’une infrastructure piétonne dans son ensemble.
À un niveau plus tactique, le choix de route a été étudié à l’aide des données de localisation provenant des smartphones [7]. Ces données ne sont pas liées à l’infrastructure, mais à l’individu, et par conséquent elles ne sont pas spécifiques à la marche, mais multimodales. Il faut donc déterminer le mode de transport avant de pouvoir étudier explicitement la marche. Par ailleurs, il faut aussi que l’utilisateur installe une application (voir l’application Future Mobility Survey du MIT [8]), demandant sa participation active et exposant dangereusement des informations privées puisque son téléphone ne contient pas uniquement des données de localisation, mais aussi son calendrier ou encore son carnet d’adresses.

Big WiFi is watching you

À un niveau stratégique, le WiFi offre d’intéressantes perspectives pour étudier les comportements piétons. Les données issues des bornes d’accès offrent une couverture globale de l’infrastructure piétonne et il n’est pas nécessaire de déterminer le mode de transport, forcément piéton. La technologie est bon marché, déjà existante dans la plupart des infrastructures piétonnes, et son éventuelle densification pour des raisons de localisation a un effet positif sur son rôle premier, à savoir fournir une connexion internet. Par ailleurs, elle ne nécessite aucune installation de la part de l’utilisateur et n’implique pas d’accès direct à son téléphone.
C’est la méthode que nous avons choisie pour notre étude menée à l’EPFL. Dans le cas du campus, 789 bornes d’accès couvrent l’ensemble des bâtiments. Avec l’aide du DIT-TI, et de Richard Timsit en particulier, deux jeux de données ont été collectés.






Les destinations réellement visitées par l’auteur pendant une journée (en haut) et un résultat utilisant les traces WiFi (en bas)

Données des serveurs Radius

Le premier jeu de données fournit la localisation de la borne à laquelle l’utilisateur est connecté. Les utilisateurs se connectant via WPA sont identifiés par les serveurs Radius [9]. Les enregistrements au niveau du serveur Radius permettent d’associer un utilisateur à une borne d’accès, elle-même géolocalisée [10]. Lorsqu’il se déplace, l’utilisateur génère de nouvelles données même s’il n’y a pas besoin de s’identifier à nouveau.
Les données sont collectées pour tous les utilisateurs du réseau EPFL. Un identifiant anonyme unique est généré quotidiennement pour chaque appareil. De cette manière, les appareils peuvent être suivis pendant une journée, mais pas plus.



Le réseau piétonnier de l’EPFL (données de plan.epfl.ch). En gris, l’étage 0 et en couleur, le 1e étage.

Données de triangulation par Cisco

La collecte de données peut aussi se faire par triangulation basée sur la puissance du signal. Nous avons utilisé ici le Cisco Context Aware Mobility API avec le Cisco Mobility Service Engine (MSE). L’outil (gracieusement prêté par Cisco pour l’étude) fournit les coordonnées horizontales et l’étage, ainsi qu’un intervalle de confiance horizontal à 95% (un carré  !), ne prenant pas en compte l’incertitude dans la détermination de l’étage. Le côté du carré de confiance est en moyenne de 374 mètres dans les données collectées. Huit participants ont accepté d’être suivis pendant deux mois à partir de l’adresse mac de leur smartphone. Par ailleurs, 200 étudiants provenant de six classes différentes et 300 employés, sélectionnés au hasard, ont été suivis sur une journée. Leur identité a été anonymisée.
Afin de mieux comprendre les comportements des piétons, il ne faut pas uniquement comprendre où ils sont, mais aussi qui ils sont. Pour cela, des données socio-économiques telles que l’âge ou le genre sont utiles. Dans le cas du campus, il est possible d’obtenir des informations anonymisées sur l’activité principale (employé ou étudiant), voire sur la classe (5e semestre bachelor ou 2e semestre master) sans mettre en péril la sphère privée de l’individu. Dans un cas plus général, le développement de réseaux hétérogènes [11], où l’utilisateur d’un téléphone portable se connecte soit à l’antenne GSM la plus proche, soit à la borne WiFi de l’opérateur, pourrait fournir ce type de données. En effet, le processus est transparent pour l’utilisateur, mais son identité est connue dans le réseau WiFi. Ce type de système existe par exemple déjà pour certains clients de Swisscom qui se connectent automatiquement et gratuitement au réseau MOBILE dans les gares et ailleur. L’inconvénient majeur de cette méthode est évidemment sa faible précision. Une solution consiste à augmenter le nombre de bornes d’accès . Il est aussi possible de calibrer le système de localisation en créant une cartographie des puissances reçues (et donc des interférences des différents obstacles).
Une autre solution consiste à utiliser d’autres sources de données comme une connaissance a priori du comportement des individus. Sur le campus par exemple, les horaires de cours fournissent une première information sur la distribution géographique des étudiants. Il est intéressant de noter ici que la notion d’horaires se retrouve dans de nombreuses infrastructures piétonnes : sur le campus, mais aussi dans les gares avec les horaires des trains, et dans les festivals, avec les horaires des concerts. De la même manière, une connaissance du réseau piétonnier permet de mieux saisir les mouvements piétons à partir des données de localisation (voir encadré).

Une méthode pour extraire les destinations à partir de la localisation WiFi, du réseau piéton et de connaissances a priori

Cette méthode probabiliste a pour objectif d’utiliser les données de géolocalisation, cartographiques et d’horaires pour générer un ensemble de séquences de destinations potentiellement effectuées par un individu pendant une journée, associées à la probabilité d’être la vraie séquence de destinations effectuée par le piéton. Elle se compose d’un modèle de mesure – afin d’associer à chaque séquence de destinations une probabilité, d’un générateur de séquence de destinations candidates, d’une gestion des signaux intermédiaires générés en marchant, et d’une procédure d’élimination des séquences de destinations improbables. Le modèle de mesure associe à chaque séquence de destinations une probabilité d’être la vraie séquence, connaissant les signaux générés par l’utilisateur. Une approche bayésienne permet d’associer les données de géolocalisation aux données d’horaires. L’équation de mesure en elle-même dépend de la distance entre le lieu de la destination et la géolocalisation. La probabilité a priori dépend quant à elle uniquement des horaires, et est indépendante des destinations précédentes.
Pour pouvoir appliquer le modèle de mesure, il faut une séquence de destinations candidates. Pour cela, toutes les destinations possibles (en fonction de la liste des salles de classe, restaurants et bureaux selon plan.epfl.ch) dans un rayon de 60 à 80 mètres du signal sont associées à toutes les destinations du signal suivant, et ainsi de suite. Ainsi, si la localisation du signal bouge peu, une des séquences candidates consistera à rester au même endroit. La durée passée à chaque destination est aussi générée en fonction des instants auxquels les signaux ont été mesurés ainsi qu’en fonction du temps nécessaire pour connecter deux destinations avec le plus court chemin dans le réseau piétonnier du campus.



Le réseau piétonnier du Rolex Learning Center (données de plan.epfl.ch)

De cette manière, une destination candidate est générée pour chaque signal reçu du WiFi. Cependant, en pratique, certains signaux seront générés en mouvement, alors qu’il ne s’agit pas d’une destination, mais du fait que l’utilisateur marche. Pour cela, chaque destination où le temps passé à destination est en dessous d’une certaine valeur limite – environ 5 minutes – est supprimée. Finalement, cette méthode génère une énorme quantité de séquences candidates. Chaque signal représente environ 150 nouvelles possibilités. On élimine alors les séquences les moins probables selon le modèle de mesure et on ne garde que les plus probables. Ainsi, à terme, on obtient un nombre défini de candidats les plus probables.





Le nombre d’étudiants bachelor-master suivant des cours à l’EPFL par quart d’heure, cumulés sur tous les jours de la semaine (semestre de printemps 2012). Invisibles sur la figure, onze étudiants avaient des cours de 19h15 à 21h. En associant ces données d’horaires à la localisation des salles de classe, on obtient une information sur les flux d’étudiants sur le campus

Le but n’est pas de suivre un individu en particulier, mais de reconnaître parmi l’ensemble de la population les tendances globales. Il s’agit de modéliser le choix de destinations dans la journée et comment ce choix va évoluer dans le futur, tout comme on étudie déjà ce type de flux à l’échelle d’une ville pour évaluer la demande en infrastructure. Ce choix dépend de la distance à parcourir, de la période de la journée, du réseau piétonnier ou encore des horaires des cours.
On suppose ici que si le choix peut changer, de même que les facteurs explicatifs de ce choix, le modèle comportemental sous-jacent est stable. Il doit pour cela être au plus proche de la réalité et prendre en compte certaines caractéristiques de ce choix : différencier le choix d’activité (manger à midi) et sa réalisation (aller à l’Ornithorynque), de même que les activités planifiées (aller en cours) et les activités secondaires (aller boire un café).
À l’aide de ces modèles, on saura peut-être demain comment les festivaliers réagiront à la nouvelle scène des Arches à Paléo avant de la construire, combien de personnes utiliseront le passage sous voie pour se rendre au futur Swiss Tech Conference Centersur le campus ou dans la gare de Lausanne en 2030, ou encore les temps d’attente et la qualité de service dans les aéroports.
Et créer un système prédictif des files d’attente dans les cafétérias du campus, afin de les éviter  !

Remerciements à

  • Richard Timsit (DIT-TI) et Jean-François Pujol (Cisco) pour les données WiFi,
  • Florent Deseneux (DII) et Yves Bolognini (Camptocamp) pour la carte du campus, et
  • Cédric Junillon (SAC) pour les données d’inscription aux cours et les horaires.

[1] Source : Optima, Projet de recherche sur la mobilité combinée : Rapport définitif de l’enquête de préférences révèlées, EPFL

[2] HELBING, D. and MUKERJI, P. Crowd disasters as systemic failures : Analysis of the Love Parade Disaster. EPJ Data Science 1:7 (2012)

[3] Léman 2030 – le projet des CFF, de l’OFT et des cantons de Vaud et Genève pour l’Arc lémanique

[4] SAHALEH, S., BIERLAIRE, M., FAROOQ, B., DANALET, A., and HÄNSELER, F. (2012). Scenario Analysis of Pedestrian Flow in Public Spaces. Proceedings of the 12th Swiss Transport Research Conference (STRC) May 2-4, 2012

[5] LAVADINHO, S. Le renouveau de la marche urbaine – Terrains, acteurs et politique. Thèse de doctorat, septembre 2011

[6] CAMERON, William Bruce. 1963, Informal Sociology, a casual introduction to sociological thinking. p.13, Random House, New York

[7] CHEN, J. Modeling route choice behavior using smartphone data.Thèse de doctorat EPFL, janvier 2013.

[8] COTTRILL, C. D. et al. The Future Mobility Survey : Experiences in developing a smartphone-based travel survey in Singapore. Future Mobility Survey in Singapore

[9] RIGNEY, C., WILLENS, S., RUBENS, A. and SIMPSON, W. (2000). Remote Authentification Dial in User Service (RADIUS), RFC 2865

[10] KOO, S. G. M., ROSENBERG, C., CHAN, H.-H. and LEE, Y. C. (2003). Location discovery in enterprised-based wirless networks : case studies and applications. Annals of Telecommunications 58(3-4) : 531–552

[11] HOADLEY, John, MAVEDDAT, Payam. Enabling small cell deployment with HetNet. in Ieee Wireless Communications (2012)



Cherchez ...

- dans tous les Flash informatique
(entre 1986 et 2001: seulement sur les titres et auteurs)
- par mot-clé

Avertissement

Cette page est un article d'une publication de l'EPFL.
Le contenu et certains liens ne sont peut-être plus d'actualité.

Responsabilité

Les articles n'engagent que leurs auteurs, sauf ceux qui concernent de façon évidente des prestations officielles (sous la responsabilité du DIT ou d'autres entités). Toute reproduction, même partielle, n'est autorisée qu'avec l'accord de la rédaction et des auteurs.


Archives sur clé USB

Le Flash informatique ne paraîtra plus. Le dernier numéro est daté de décembre 2013. Vous désirez recevoir la clé USB contenant tous les numéros, inscrivez-vous avec le formulaire inform.epfl.ch pour la recevoir.

Taguage des articles

Depuis 2010, pour aider le lecteur, les articles sont taggués:
  •   tout public
    que vous soyiez utilisateur occasionnel du PC familial, ou bien simplement propriétaire d'un iPhone, lisez l'article marqué tout public, vous y apprendrez plein de choses qui vous permettront de mieux appréhender ces technologies qui envahissent votre quotidien
  •   public averti
    l'article parle de concepts techniques, mais à la portée de toute personne intéressée par les dessous des nouvelles technologies
  •   expert
    le sujet abordé n'intéresse que peu de lecteurs, mais ceux-là seront ravis d'approfondir un thème, d'en savoir plus sur un nouveau langage.