PROPOSITION D’UNE APPROCHE DE PREDICTION

Télécharger le fichier pdf d’un mémoire de fin d’études

Les systèmes de transports intelligents

Les systèmes de transport intelligents (STI) (en anglais : Intelligent Transportation Systems – ITS) sont les applications des nouvelles technologies de l’information et de la communication au domaine des transports et de sa logistique. Un aspect important des STI est d’améliorer les transports publics pour les rendre plus attractifs que les transports privés.
Les STI sont présents dans plusieurs champs d’activité tels que l’optimisation de l’utilisation des infrastructures de transport, l’amélioration de la sécurité routière et le développement des services. Ils interviennent dans un contexte mondial de congestion du trafic routier (et parfois même ferroviaire, métro ou aérien) d’une part et de développement des nouvelles technologies de l’information d’autre part.
Les technologies ITS sont regroupées dans un ensemble de services utilisateur interdépendants visant à résoudre les problèmes liés au transport. Le tableau 2 fournit des exemples de tels services.

La revue des modèles de prédiction

Comme tout système où les aléas ont une place importante, la prévision des temps de trajet des bus n’est pas toujours évidente. Plusieurs techniques d’assimilation de données permettent à un modèle de prévoir l’évolution d’une ligne d’autobus à partir de données antérieures. Celles-ci ont chronologiquement été développées dans le domaine de la météorologie et de l’océanographie. Elles combinent la connaissance de données parcellaires arrivant en temps réel avec un modèle. Ce dernier permet d’une part de reconstruire éventuellement la connaissance entière du système à un instant donné, d’autre part de proposer une évolution possible de ce système.
Deux approches principales, que nous aborderons dans les lignes qui suivent, peuvent être distinguées lorsqu’il s’agit de prédire le temps de trajet d’un bus : l’approche basée sur les données historiques en opposition à l’approche statistique.

Les données historiques

Ce type de modèle de prédiction donne les temps de trajet actuel et futur du bus, à partir du temps de trajet historique des voyages précédents sur la même période. L’état de la circulation est supposé rester stationnaire.
Williams et Hoel ont souligné que le phénomène selon lequel les conditions du trafic suivent en théorie des schémas quotidiens et hebdomadaires, mène à une prévision dont les moyennes historiques des conditions, à un moment et à un jour particulier de la semaine, donneront une prédiction favorable des conditions futures à la même heure de la journée et le même jour de la semaine.
Par conséquent, ce modèle n’est fiable que lorsque la circulation dans la zone d’intérêt est relativement stable, comme en zones rurales. Il existe deux modèles concernant la prédiction des données historiques : l’un basé sur les temps d’arrivée et l’autre, sur la vitesse réelle du bus.

Modèle basé sur les temps d’arrivée

Généralement, il utilise directement la moyenne historique des temps de trajet pour obtenir l’heure d’arrivée du bus. Dans la plupart des recherches, ce modèle a été développé à des fins de comparaison [8] [15] [21]. Il a été démontré qu’il surpassait certains des modèles tels que les modèles de régression multilinéaire [8] [15].
Chung et Shalab ont élaboré un modèle statistique de prévision des heures d’arrivée (en anglais : Expected Time Arrival – ETA) à l’aide de variables explicatives [18]. Le modèle proposé avait prédit l’heure d’arrivée à partir de deux catégories de données d’entrées : les données historiques des derniers jours et les conditions opérationnelles actuelles. Une stratégie opérationnelle a en outre été intégrée au modèle afin de réduire le risque qu’une heure d’arrivée surestimée puisse entraîner l’absence de l’autobus. Lors de l’élaboration du modèle, la contrainte la plus notable a été la taille des données historiques pour calibrer le modèle. Contrairement aux véhicules de transport en commun, les autobus scolaires ont une course par trajet par jour et leurs horaires sont révisés chaque année scolaire. Cela nécessitait que le modèle de l’ETA soit basé sur une méthode applicable à la taille relativement petite des données historiques. Étant donné que les autobus exploitaient de façon conventionnelle les mêmes trajets et les mêmes arrêts, leur modèle ETA supposait que le temps de trajet entre deux arrêts pouvait s’expliquer par les tendances historiques des temps de déplacement des autobus et d’autres variables corrélées dépendantes. Pour ce qui est des conditions opérationnelles, l’étude a intégré le respect des horaires et l’état des conditions météorologiques, mais n’a pas tenu compte des temps d’arrêts en raison d’une demande stable. Les auteurs ont évalué la performance du modèle à l’aide des données recueillies à partir des opérations réelles des autobus scolaires sur lesquelles un système de localisation automatique des véhicules (en anglais : Automatic Vehicle Location – AVL) a été installé. Il a été mentionné que le modèle proposé montrait constamment des niveaux plus faibles d’erreur de prédiction que les approches de régression et de moyenne de déplacement. Avec la stratégie opérationnelle, le modèle a fourni un service suffisamment fiable dans lequel environ 99 temps de trajet peuvent être combinés avec des informations en temps réel sur le temps de déplacement pour développer un algorithme dynamique de prévision du temps de trajet.

Modèle basé sur la vitesse du bus

Ce type de modèle utilise la vitesse moyenne des véhicules sur certains segments pour prédire les temps de trajet. Ils sont particulièrement applicables pour prédire le temps de trajet à l’aide des données recueillies par la technologie GPS car la distance parcourue sur les segments peut être calculée à l’aide des informations de position. Généralement, ces modèles utilisent des techniques Cartospondance [36].
Weigang et al. ont mis au point un modèle pour estimer les heures d’arrivée des autobus sur un arrêt à l’aide d’informations GPS [4]. Le modèle consistait en un algorithme principal estimant l’heure d’arrivée et deux sous-algorithmes pour déterminer la position et la vitesse de l’autobus sur la route.
Tout d’abord, le trajet du bus est divisé en un certain nombre de segments. Lorsque l’équipement GPS dans l’autobus transmet sa position, sa vitesse et les autres informations connexes au centre de contrôle, il est peu probable que cette position soit bien positionnée sur la route. Ainsi, la position réelle a été cartographiée à un point sur le graphique pour obtenir la position de l’autobus.
Deuxièmement, lorsque nous utilisez les informations de vitesse issues des mesures GPS, l’heure d’arrivée sera infinie si le véhicule est stationnaire. Afin de résoudre ce problème, ils ont utilisé la vitesse de trajet historique des autobus le long du segment de l’itinéraire et la vitesse actuelle de l’autobus dérivé des données GPS.
Grâce à l’amélioration de la méthode et à l’étalonnage empirique, les résultats du modèle développé se sont avérés satisfaisants dans la mise en oeuvre et l’expérimentation. Ils ont constaté que l’erreur moyenne entre les résultats de sortie du système et la position réelle de l’autobus est réduite de moins de 8 en augmentant le nombre de segments représentant le trajet de l’autobus. Le même type de modèle a ensuite été développé par Sun et al. avec une légère modification [17]. L’algorithme de prédiction proposé a combiné les données de localisation en temps réel du GPS avec la vitesses moyenne sur chaque segment, en tenant compte de la vitesse de déplacement historique ainsi que des variations temporelles et spatiales des conditions de circulation.
Weigang et al. [4] avait proposé que la vitesse moyenne estimée sur un point géographique A, dépendait principalement de la vitesse moyenne historique des points séparant le bus au point A. Sun et al. ont soutenu que la vitesse actuelle d’un bus est habituellement un facteur important qui influe sur la vitesse à laquelle l’autobus se déplacera sur la distance jusqu’à un point géographique d’intérêt. Leur algorithme comprenait essentiellement deux composants.
Le premier consistait en un modèle de suivi d’autobus en temps réel dans le but de traiter les données GPS, de les projeter sur la carte et d’obtenir ensuite la distance jusqu’à chaque arrêt d’autobus. Le deuxième volet était un modèle de prévision des heures d’arrivée des autobus utilisé pour estimer le temps que va mettre le bus pour arriver au prochain arrêt sur la base de la production de la première composante et de divers autres facteurs. Le système a été mis en oeuvre comme un automate fini [37] pour assurer sa régularité, sa stabilité et sa robustesse dans un large éventail de conditions d’exploitation.
Une étude sur les trajets des autobus a été menée pour évaluer le rendement du système proposé en termes d’exactitude des prédictions. Les résultats ont indiqué que le système proposé était capable d’atteindre une précision satisfaisante en prévoyant les heures d’arrivée des autobus. Cependant, on a observé que leur modèle était moins performant aux heures de pointe. Cela est dû à la variation de l’état du trafic qui entrainait une augmentation de la vitesse de l’autobus à mesure que le niveau de congestion augmente. La performance de l’algorithme a également été comparée à celle proposé par Weigang et al. en terme de précision et a montré une amélioration.
En général, ces modèles nécessitent un vaste ensemble de données historiques, qui peuvent ne pas être disponibles dans la pratique, en particulier lorsque le modèle de trafic varie considérablement. Ces modèles ne conviennent pas aux grandes villes. Leur précision repose en grande partie sur la similitude entre le temps réel et les schémas de trafic historiques.

L’approche statistique

Dans l’approche statistique, l’heure d’arrivée des bus est évaluée par plusieurs facteurs y compris le comportement du conducteur, la largeur de la voie de transport, les intersections, les signaux…. Ces facteurs sont utilisés comme variables autonomes dans de nombreuses études. La plupart des articles sur le modèle de série temporelle et le modèle de régression ont été publiés avant les années 90.

Les séries temporelles

Une série temporelle est un ensemble de données indexés dans un ordre temporel. Le plus souvent, une série chronologique est une séquence prise à des points successifs à intervalles réguliers dans le temps. Il s’agit donc d’une séquence de données à temps discret. Les modèles de séries temporelles dépendent des données qui proviennent de périodes historiques et prévoient les périodes futures. Les modèles de séries temporelles supposent que les tendances historiques du trafic resteront les mêmes à l’avenir.
Dans ce type de modèle, la précision dépend fortement d’une fonction de la correspondance entre les schémas de trafic en temps réel et historiques [5] [22]. La variation des données historiques ou des changements dans la relation entre les données historiques et les données en temps réel pourrait entraîner une inexactitude significative des résultats de prévision [2], et le problème dans ces méthodes remonte habituellement à son court délai si le modèle de prédiction est en temps réel [1].
D’Angelo a utilisé un modèle de série temporelle non linéaire pour prédire un temps de déplacement dans le couloir sur une autoroute [3]. Il a comparé deux cas : le premier modèle n’utilisait que des données de vitesse comme variable, tandis que le deuxième modèle utilisait des données sur la vitesse, l’occupation et le volume pour prédire le temps de déplacement. Il a été découvert que le modèle variable unique utilisant la vitesse était meilleur que le modèle de prédiction multivariable.

Les modèles de régression

Contrairement aux modèles de prévision basés sur les données historiques, ceux-ci sont capables de fonctionner de manière satisfaisante dans des conditions de trafic instables [25]. Les modèles de régression mesurent habituellement les effets simultanés de divers facteurs, qui sont indépendants entre eux, affectant ainsi la variable dépendante.
Patnaik et al. ont proposé un ensemble de modèles de régression multilinéaire pour estimer les temps d’arrivée des autobus à l’aide des données recueillies par le compteur automatique des passagers (en anglais : Automatic Passenger Counter – APC) [11]. Ils utilisaient la distance, le nombre d’arrêts, les heures d’attente, l’entrée et la sortie des passagers et les descripteurs météorologiques comme variables indépendantes. Ils ont indiqué que les modèles pourraient être utilisés pour estimer l’heure d’arrivée des autobus aux arrêts en aval.
Jeong [8] et Ramakrishna et al. [15] ont également développé des modèles de régression multilinéaire à l’aide de différentes données d’entrées. Les deux études ont indiqué que les modèles de régression ont été surclassés par d’autres modèles.
Le grand avantage de ce modèle est qu’il révèle les entrées plus ou moins importantes pour la prédiction. Par exemple, Patnaik et al. ont découvert que les conditions météorologiques n’étaient pas un élément important pour leur modèle. Aussi Ramakrishna et al. ont découvert que les temps d’arrêt depuis le début du trajet jusqu’à la position actuelle du bus sont des entrées moins importantes. En général, le domaine d’application de ces modèles est limité parce que les variables des systèmes de transport sont fortement corrélées.

Les filtres de Kalman

Les filtres de Kalman ont été largement utilisés pour prédire l’heure d’arrivée des autobus et beaucoup plus. La fonction de base du modèle est de fournir des estimations de l’état actuel du système. Mais il sert aussi de base pour prédire les valeurs futures ou pour améliorer les estimations des variables à des moments antérieurs, c’est-à-dire qu’il a la capacité de filtrer le bruit.
L’algorithme de filtrage de Kalman a été introduit par Chien et Kuchipudi [6] pour la prédiction du temps de trajet en raison de son avantage à mettre à jour en continu la variable d’état en tant que nouvelles observations.
Chu et al. [12] ont développé une méthode d’estimation du temps de trajet en appliquant la technique du filtre de Kalman adaptatif. Cet algorithme basé sur un filtre de Kalman a été testé sur une portion d’autoroute. Comparé à la méthode basée sur sonde et à la méthode basée sur double détecteur, l’algorithme proposé s’est révélé efficace dans des conditions de trafic récurrentes et non récurrentes.
Dans l’étude de Yang [13], un filtre de Kalman à temps discret a été utilisé pour prédire les temps de trajet artériel. Bien que diverses approches basées sur le filtre de Kalman aient été explorées pour améliorer la précision des prédictions, cette étude manque de comparaison avec d’autres modèles de prédiction.
Kumar [25] s’est concentré sur un algorithme de filtrage de Kalman. Comparé au modèle de prédiction à temps discret, l’algorithme qu’il a proposé avait de meilleures performances en termes de précision. Récemment, il y a eu d’autres études [20] [23] qui ont été développé pour la prédiction des temps d’arrivée en utilisant le filtre de Kalman.
Il existe de nombreuses études antérieures utilisant l’algorithme dynamique basé sur le filtrage de Kalman dans la prédiction du temps de trajet. Toutes ces études ont montré que les modèles basés sur le filtre de Kalman sont réalisables et ont une base théorique solide dans la prévision du temps de trajet. Cependant, la plupart de ces modèles n’ont pas de comparaison de performances avec d’autres modèles et algorithmes.

Machine Learning

Le Machine Learning (ou apprentissage automatique en français) est un champ d’étude de l’intelligence artificielle qui se fonde sur des approches statistiques pour donner aux ordinateurs la capacité d’apprendre à partir de données, c’est-à-dire d’améliorer leurs performances à résoudre des tâches sans être explicitement programmés pour chacune. Plus largement, cela concerne la conception, l’analyse, le développement et l’implémentation de telles méthodes.
Les méthodes de Machine Learning contiennent deux étapes que sont : le choix d’un modèle candidat, et la prédiction des paramètres du modèle par le processus d’apprentissage sur les données existantes [19]. Ces méthodes présentent certains avantages par rapport aux méthodes statistiques :
• le traitement des relations complexes entre les prédicteurs qui peuvent donner un énorme volume d’informations ;
• le traitement des relations non linéaires entre les prédicteurs ;
• le traitement de données complexes et contenant du bruit.
Les résultats obtenus pour une position géographique donnée ne sont normalement pas les mêmes ailleurs, en raison de circonstances spécifiques à l’emplacement (par exemple, la géométrie ou le contrôle de la circulation). Les réseaux de neurones et les machines à vecteurs de support prennent en considération ces problèmes.
Voici quelques algorithmes utilisés en Machine Learning pour faire la prédiction :
• Les réseaux de neurones (en anglais : artificial neural network – ANN)
Les ANN ont récemment gagné en popularité dans la prédiction des heures d’arrivée des autobus en raison de leur capacité à résoudre des relations complexes non linéaires [16] [8]. Motivés par l’imitation de la capacité de traitement des données du cerveau humain, les ANN sont construits avec de multiples couches d’unités de traitement nommées neurones artificiels. Les neurones contiennent des fonctions d’activation (linéaires ou non linéaires) et sont fortement interconnectés les unes aux autres par des poids synaptiques.
Les études précédentes ont montré que ce modèle permet de résoudre des relations complexes non-linéaires et sont très efficace pour prédire le temps d’arrivée du bus.
• Les machines à vecteurs de soutien (en anglais : support vector machine – SVM)
Les SVM sont un ensemble de méthodes d’apprentissage supervisées. Elles sont utilisées pour la classification et la régression. Alors que d’autres techniques d’apprentissage automatique, comme ANN, ont fait l’objet d’études approfondies, les recherches signalées pour la SVM dans le domaine des systèmes de transports sont très peu nombreuses. La SVM et la régression vectorielle de soutien (en anglais : support vector regression – SVR) ont démontré leur succès dans l’analyse des séries temporelles et l’apprentissage statistique [7] [26]. Étant donné que la SVM a une plus grande capacité de généralisation, beaucoup supposent que la SVR fonctionnera bien pour l’analyse des séries temporelles.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

LISTE DES TABLEAUX
INTRODUCTION GENERALE
CHAPITRE 1 : PRESENTATION ET CONTEXTE
Introduction
1.1 Contexte
1.2 Problématique
1.3 Objectifs et méthodologies
Conclusion
CHAPITRE 2 : ETAT DE L’ART
Introduction
2.1 Les systèmes de transports intelligents
2.2 La revue des modèles de prédiction
2.2.1 Les données historiques
2.2.1.1 Modèle basé sur les temps d’arrivée
2.2.1.2 Modèle basé sur la vitesse du bus
2.2.2 L’approche statistique
2.2.2.1 Les séries temporelles
2.2.2.2 Les modèles de régression
2.2.2.3 Les filtres de Kalman
2.2.2.4 Machine Learning
2.3 Les solutions existantes développées sur ce domaine
Conclusion
CHAPITRE 3 : PROPOSITION D’UNE APPROCHE DE PREDICTION
Introduction
3.1 Approche proposée pour la prédiction
3.2 Estimation de la distance géographique
3.3 Estimation des positions GPS reçues
3.4 Etude expérimentale
3.4.1. Paramètres expérimentaux
3.4.1.1 Collecte des données de géolocalisation
3.4.1.2 Pré-traitement des données de géolocalisation
3.4.1.3 Evaluation de l’échelle du MAPE
3.4.1.4 Définition d’intervalles d’observation
3.4.2. Application des méthodes avec le langage Python
3.4.3. Résultats
Conclusion
CONCLUSION GENERALE
REFERENCES
BIBLIOGRAPHIE

Télécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *