L’oculométrie, une méthode pour étudier la prise d’information visuelle en conduite

Télécharger le fichier pdf d’un mémoire de fin d’études

Conception et certification de la signalisation verticale

Bien conçue et réalisée, la signalisation routière réduitesl causes d’accident et facilite la circulation. Insuffisante, trop abondante ou impropre, elle est facteur de gêne et d’insécurité.
Les catégories de signalisation sont d’après [2] :
– la signalisation verticale :
– par panneaux,
– par feux,
– par balisage,
– par bornage.
– la signalisation horizontale, c’est à dire la signalisati on par marquage des chaussées.
Les principaux critères d’efficacité sont, toujours d’après [2] :
– L’uniformité, qui impose l’usage exclusif de signaux réglementaires, sur toutes les voiries.
– L’homogénéité,qui exige que, dans des conditions identiques, l’usager ren-contre des signaux de même valeur et de même portée, implantés suivant les mêmes règles.
– La simplicité, qui s’obtient en évitant une surabondance de signaux qui sur-charge l’attention de l’usager, lequel tend alors à négliger les indications données ou même ne peut les lire, les comprendre ou les mémoriser.
– La continuité des directions signalées, qui est assurée sur les routes importantes par la coordination effectuée à l’échelon de l’Administration Centrale. Cette continuité doit être recherchée sur toutesles autres routes en réalisant, localement, entre services, les liaisons nécessaires.
La signalisation routière a pour objet de rendre plus sûre la circulation rou-tière, de faciliter cette circulation, d’indiquer ou de rappeler diverses prescriptions particulières de police et de donner des informations relatives à l’usage de la route.
Toutefois, la signalisation n’a et ne saurait avoir le caractère d’une garantie assurée par les pouvoirs publiques aux usagers de la route contre les aléas et les dangers de la circulation. Ces usagers circulent toujours à leurs ri sques et périls.
Dans la conception et l’implantation de la signalisation verticale, les condi-tions de perception de l’usager ne doivent jamais être perdues de vue : il se dé-place à une vitesse non négligeable et son attention est sollicitée par les exigences de la conduite [14]. De par l’article 4 de l’instruction interministérielle sur la si-gnalisation routière [2], outre les règles d’implantationet de normalisation des panneaux, le gestionnaire doit s’appuyer sur trois grands principes de base de la signalisation, afin qu’elle soit efficace et ainsi utile. Ces trois principes sont :
– Le principe de valorisation. L’inflation des signaux nuit à leur efficacité (rmq : et réduit leur saillance). Il ne faut donc en placer quelorsqu’ils sont jugés vraiment utiles. Ceci rejoint le critère de simplicité.
– Le principe de concentration. Lorsqu’il est indispensable que plusieurs si-gnaux soient vus en même temps ou à peu près en même temps, on doit les implanter de façon à ce que l’usager puisse les percevoir d’un seul coup d’œil, de nuit comme de jour. Il y a un intérêt à grouper deux signaux sur un même support lorsque les deux indications se rapportant ua même point se complètent l’une à l’autre. Le principe de concentration trouve toutefois une limite dans le principe suivant.
– Le principe de lisibilité. Il ne faut pas demander à l’usager un effort de lecture ou de mémoire excessif. On doit donc réduire et simplifier les indications au maximum et le cas échéant répartir les signaux sur des supports échelonnés.
Les panneaux de signalisation français, cf. Fig. 2.1, se répartissent en 18 types, pour un total de 576 panneaux [3] :
– Type A – Panneaux de danger (29 panneaux).
– Type AB – Panneaux d’intersection et de priorité (9 panneaux).
– Type B – Panneaux de prescription (88 panneaux) se subdivis ant en cinq catégories : Panneaux d’interdiction (40 panneaux) – Panneaux d’obligation (18 panneaux) – Panneaux de fin d’interdiction (6 panneaux) – Panneaux de fin d’obligation (8 panneaux) – Panneaux de prescription zon ale (16 pan-neaux).
– Type C – Panneaux d’indication utiles pour la conduite des v éhicules (52 panneaux).
– Type CE – Panneaux d’indication d’installations pouvant être utiles aux usa-gers de la route (39 panneaux).
– Type D – Panneaux de direction (56 panneaux).
– Type Dp – Panneaux de jalonnement piétonnier (4 panneaux).
– Type Dv – Panneaux de jalonnement des aménagements cyclables (13 pan-neaux).
– Type Dc – Panneaux de signalisation d’information locale ( 2 panneaux).
– Type E – Panneaux de localisation (26 panneaux).
– Type EB – Panneaux de début et de fin d’agglomération (2 panneaux).
– Type G – Panneaux de position des passages à niveau (10 signa ux).
– Type H – Panneaux d’information (10 panneaux).
– Type ID – Idéogrammes, emblèmes et logotypes (101 panneaux).
– Type AK, K, KC et KD – Panneaux de signalisation temporaire ( 35 pan-neaux).
– Type M – Panneaux additionnels ou panonceaux (59 panneaux) .
– Type SE – Symboles (37 signaux).

Importance de la conception d’outils de diagnostic pour le gestionnaire routier

De par les lois et règlements concernant la signalisation routière, le gestion-naire doit respecter les divers principes, critères et règles énoncés afin d’assurer la conformité de son réseau routier.
Ainsi, l’article 2 de l’instruction interministérielle sur la signalisation routière [2], énonce qu’elle « complète l’arrêté du 24 novembre 1967t précise les règles à suivre, tant pour l’implantation que pour la nature des sig naux à adopter. Elle s’impose dans les conditions qu’elle édicte à tous ceux qui sont à un titre quel-conque habilités à mettre en place la signalisation routière, sur les voies ouvertes à la circulation publique ». Or, il est aussi indiqué dans son préambule que cette ins-truction « représente l’idéal vers lequel on doit tendre. Toutefois, la signalisation effectivement mise en place peut être moins dense pour des raisons d’ordre pra-tique (faible circulation, nécessité d’éviter la multiplication de panneaux, choix de la meilleure affectation des crédits). La responsabilité de l’Administration ne saurait être mise en cause en pareil cas ». Le gestionnaire est donc finalement le seul décisionnaire de l’implantation sur son réseau et reste légalement res-ponsable de l’exploitation et de la maintenance de celui-ci, l’article 18 appelant son attention sur la nécessité d’assurer l’entretien des signaux et de leurs supports.
L’article 4 de l’instruction interministérielle sur la signalisation routière, pré-cise à propos du principe de visibilité que « l’expérience prouve qu’il y a inté-rêt à inspecter périodiquement la signalisation de jour et ed nuit, avec un « œil neuf » pour faire disparaître les panneaux superflus ou remédier aux insuffisances éventuelles ». A propos du principe de lisibilité, elle précise également que « des expériences ont montré que l’observateur moyen ne peut d’unseul coup d’œil percevoir et comprendre plus de deux symboles ».
Le gestionnaire, voulant s’assurer de la conformité du réseau routier à sa charge, se trouve alors confronté à l’analyse de son patrimoine alors que cela requiert une connaissance fine des instructions et une appro che d’ergonomie cognitive auxquelles les services techniques ne sont pas ou peu formés.
La perception visuelle de la route et de son environnement constitue un ob-jet d’applications et d’études important en vue de l’amélioration de la sécurité [4]. Cette thématique est étudiée depuis de nombreuses années au sein du Réseau Scientifique et Technique (RST) du MEEDDM. Ceci, depuis le début des années 80 au Laboratoire Centrale des Ponts et Chaussées (LCPC) dans la division « Ex-ploitation, Signalisation, Eclairage » et plus récemment dans plusieurs Équipes de Recherche Associées (ERA), Laboratoires Régionaux (LRPC)et Centre d’Etude Technique de L’Équipement (CETE) situés à Strasbourg, Sain t-Brieuc, Rouen, Angers et Clermont-Ferrand. Divers outils d’aides à la mesure et au diagnostic ont déjà été mis au point et proposé aux gestionnaires, pour caractériser la visibilité photométrique de diffé-rents types d’objets routiers, mais pas leur saillance :
– CYCLOPE : Véhicule instrumenté par une caméra en position ed conduite, permettant de savoir si les niveaux de visibilité des objetsroutiers (pan-neaux, marquages) situés dans la scène routière respectentbien le modèle d’Adrian, ou bien encore de contrôler la luminance ( cd/m2) moyenne pro-duite par l’éclairage public ainsi que son homogénéité transversale et longitudinale.
– COLUROUTE : COefficient de LUminance des ROUTEs, appareil ml pcr permettant la mesure in situ des caractéristiques photométriques des chaus-sées (regard porté à 60m).
– VECLAP : Véhicule de contrôle de l’ÉCLAirage Public, perme ttant une mesure en continu de la qualité de service de l’éclairage public. Ceci afin d’effectuer une analyse de la visibilité, du confort et de lasécurité nocturne.
– ECODYN : Appareil ml pcr à grand rendement pour le contrôle, en continu, de jour, de la visibilité diurne et nocturne de la signalisation horizontale (marquages).
Il est aussi proposé aux gestionnaires de caractériser la visibilité géométrique de l’infrastructure en développant des outils d’analyse dela visibilité offerte, que ce soit par :
– Comparaison directe de la visibilité requise (distance d’arrêt, visibilité en carrefour, …) avec la visibilité offerte. Ceci par l’utilisation de VISULINE (LRPC St Brieuc), qui est un dispositif de saisie embarquée des conditions de visibilité (agent dans le véhicule) entre deux véhiculeslocalisés par GPS.
– Mesure indirecte de la visibilité géométrique de la chaussée (sansa priori d’un opérateur) que l’on retrouve dans le projet SARI/VIZIR. La distance de visibilité peut être estimée par analyse d’images (détection de la zone chaussée, estimation de la hauteur de la route dans l’image et conversion en distance métrique). Cette distance de visibilité peut également être calculée par l’utilisation d’un modèle 3D de la route, obtenu par un véhicule instrumenté d’un laser rotatif vertical (CAOR, Mines Paris). Le logiciel « Qt-Ballad » (ERA 27, LRPC Strasbourg) utilisant ce modèle 3D, permet de calculer alors la visibilité offerte et de la comparer à celle requise.
Certains systèmes, issus de travaux de thèse et brevetés [16], utilisant le traitement d’images sont également en cours de transfert vers des matériels ml pcr , afin de caractériser la visibilité météorologique, en perception dégradée (vision dans le brouillard). D’autres systèmes permettant le relevé du patrimoine routier sont eux aussi en cours de réalisation. Ils reposent également sur des techniques de traitement d’images afin d’effectuer, par exe mple, la détection des panneaux (LRPC Strasbourg).
En terme d’applications visées, cette thèse s’inscrit dansla même lignée. Tou-tefois, comme présenté précédemment, nous nous limitons àa lsaillance de la signalisation de police permanente de jour.

Éléments de physiologie du système visuel humain

L’attention visuelle entretient des relations étroites avec la perception et le mouvement des yeux [20]. Ces mouvements oculaires peuvent être intentionnels ou réflexes. Ils ont pour but d’amener le centre de la rétine vers le stimulus pré-détecté afin de procéder à son analyse et son identification avec plus de netteté et de résolution. D’où la nécessité, pour le conducteur, de pré-sélectionner des zones pertinentes de la scène routière (en fonction de la tâche) afi n d’y fixer le regard et ainsi de placer la zone sélectionnée dans le champ visuel ed la fovéa et par la même de permettre le traitement perceptif (identification et catégorisation) des objets dans cette zone [21].
Dans le système visuel humain, l’œil est le capteur qui perme t le codage de l’information qui sera traitée par les différents constituants du cortex. Or, contrai-rement à un capteur d’image (ex : appareil photo), l’œil n’a p as une réponse spa-tiale uniforme. La conduite exige l’utilisation simultanée de deux zones de vision :
la vision centrale et la vision périphérique. Selon, [22, 23], on peut distinguer, comme il est présenté dans la Fig.3.1, quatres régions du champ visuel en fonc-tion de l’angle d’ouverture par rapport au centre de la rétine :
– La vision fovéale, inférieur à 1◦ de demi angle visuel ;
– ◦ ◦ d’excentricité ;
La vision para-fovéale qui complète la fovéale jusque 4 à 5
– Vient ensuite la vision péri-fovéale qui d’étend jusque 9 ou 10 ;
– Au delà, et jusqu’à la limite du champs visuel humain (90 ◦ temporal pour chaque œil soit 180 ◦ au total), c’est la vision périphérique.
Dans le langage courant, la vision centrale correspond à la v ison fovéale et para-fovéale tandis que la vision dite périphérique correspond elle à l’association de la vision péri-fovéale et du reste du champ visuel périphérique. Il est aussi commun de rencontrer la notion de proche-périphérie, qui regroupe les visions para-fovéale et péri-fovéale.
Comme le montre la Fig. 3.2, l’œil est un instrument optique d e haute préci-sion dont la fonction est de focaliser les flux lumineux sur la rétine, partie pho-tosensible située sur son fond. La fovéa, au centre de la rétine, correspond à la zone d’acuité maximale, cf Fig. 3.3. On remarque également neu zone appelée tâche sombre qui correspond à la zone de ramification du nerf o ptique sur la ré-tine. dans cette zones, vierge de tout photorécepteurs, la rétine est « aveugles ». Les photorécepteurs constituant la rétine sont de deux types et sont inégalement répartis :
– Les cônes, qui permettent la vision, en couleur, dans le dom aine photopique (vision de jour). Chaque type de cône a une bande passante lim itée, dans des longueurs d’ondes correspondant à ce qui est perçu comme des couleurs. Dans l’œil humain, il y a généralement 3 types de cônes, cf. Fi g. 3.4 et 3.5, réagissant principalement aux couleurs :
– jaune (560 nm), cônes L, communément appelés cônes rouges du fait que les longueurs d’ondes rouges activent ces cônes sans active r les cônes verts.
– vert (530 nm), cônes M, communément appelés cônes verts .
– bleu (424 nm), cônes S, communément appelés cônes bleus .
Cette catégorisation a servi à la décomposition de la lumière en vidéo, et de manière complémentaire en impression numérique et en peinture. Les cônes sont principalement présents dans la zone centrale, sauf pour les cônes bleus qui sont absents de la fovéa, cf. Fig.3.5. Cette densité se réduit rapidement à mesure que l’on s’éloigne du centre de l’œil.
– Les bâtonnets, qui permettent la vision, en niveaux de gris , dans le domaine mésopique et scotopique (vision de nuit). Au contraire des cônes, la densité des bâtonnets est la plus forte en périphérie de la rétine et iminued à mesure que l’on s’approche du centre de l’œil, cf. 3.5. Cette densit é est quasi nulle au centre de la fovéa.

Activité de conduite et prise d’information visuelle

Durant l’acte de conduite, 65 tâches principales et 1700 sou s-tâches ont été identifiées par [28, 29]. Cette multitude de sous-tâches cor respond aux actions à réaliser pour une situation définie [30], et se retrouve dansla description du « mo-dèle hiérarchique de la tâche de conduite », modèle cognitifbasé sur le recueil d’observations de l’activité de conduite, par [14].
L’activité de conduite est complexe et peu structurée [31, 2]3. En effet, le conducteur doit traiter de nombreuses tâches diverses (act ion sur le véhicule et tâches annexes) alors qu’il ne dispose pas d’ordre précis et clair qui lui indique son champ des actions possibles et que l’environnement dans lequel il se déplace est, par nature, instable et variable (la dynamique des autres usagers comporte toujours une part d’incertitude). Ainsi, [33] décrit la conduite automobile comme « un contrôle de processus individualisé réalisé dans un environnement dynamique partagé » pendant lequel « le conducteur est amené à préleveren permanence de l’information dans son environnement afin d’acquérir une conscience de la situation pertinente pour satisfaire ses objectifs de performance et de sécurité ».
A ce jour, il n’existe pas de consensus sur un modèle complet du conducteur. Comme l’explique [34], les modèles proposés se focalisent urs une, ou un en-semble, restreint de composantes impliquées dans la conduite. Par ailleurs, lors de l’activité de conduite, le conducteur se repose surtout surson système visuel [35]. Selon [7], et nombreux autres auteurs s’y référant, cette modalité sensorielle rend compte de 90% de l’information perçue, mais ce chiffre n’est pas vérifié, et l’on peut juste affirmer que la majeure partie des informations se nsorielles utilisées en conduite sont visuelles. Toutefois, la modélisation des informations visuelles uti-lisées en conduite reste peu prises en compte par les modèlesde conducteur qui incorporent souvent des composants visuels fondés sur des comportements idéa-lisés et dans certain cas des suppositions discutables [36]. Bien sûr, si la modélisation des composants du système visuel du conducteur est incorrecte, le modèle complet est, dans une certaine mesure, compromis.
Selon [19], la perception et l’exploration visuelle, le traitement et la mémori-sation des indices sont, par de nombreux aspects, liés à la vigilance et à l’attention. Cette dernière est, pendant la conduite, dirigée vers une source d’information ou la résolution d’un problème en fonction des représentationmentales activées par le conducteur. Elle est, par ailleurs, sujette aux interférences internes (préoccupa-tions, distractions) et externes (lecture des instruments de bord, téléphone, GPS, ou autres tâches multiples tels que la conversation). Les re cherches dans le do-maine de l’exploration visuelle font donc intervenir des domaines divers.
Pour avancer dans notre problème, il est impératif de mettreen perspective différentes disciplines qui sont complémentaires, afin de comprendre et maîtriser les effets des caractéristiques photométriques des objets, des distances de visibi-lité, de la signification et la mémorisation des indices en fonction des contextes de conduite, de la symbolique et de la syntaxe de la signalisation ou de l’informa-tion embarquée. Dans un champ plus restreint, étudier la saillance de la signalisa-tion verticale fait intervenir également plusieurs disciplines, telles que les sciences cognitives et informatiques.
Comme expliqué précédemment, selon [18], l’activité de conduite est une ac-tivité d’adaptation à un environnement en évolution continue. Elle exige alors le prélèvement et le traitement d’informations afin de prendre connaissance de l’état courant de l’environnement et du véhicule en vue de maintenir ce dernier dans une trajectoire et une vitesse compatible avec le contexte routier. Cet auteur sé-pare les activités d’exploration visuelle, d’identification, de prévision et de déci-sion d’action. Ce formalisme a été repris récemment par [13]qui considère que le conducteur doit :
– sélectionner les informations issues de l’environnement routier afin de ne retenir que celles pertinentes pour la tâche de conduite (so us-tâche de dé-tection et d’identification) ;
– comprendre la situation présente pour anticiper la situation futur ;
– prendre des décisions pour interagir de la manière la plus sûre et convenable, à travers les commandes de son véhicule, avec l’environnement routier et les autres usagers ;
– gérer ses propres ressources (physiques, perceptives et cognitives) afin de rester opérationnel dans la dynamique de la tâche de conduite.
Cet auteur insiste sur l’importance de la prise de l’information (sous-tâche de dé-tection) et de la sélection de celle idoine à la conduite (sous-tâche d’identification).
Par ailleurs, la conduite est une tâche qui se déroule dans un environnement dynamique, c’est à dire en évolution continue, même en absence d’action de la part du conducteur. La conduite se définie comme une activité d’adaptation à l’environ-nement pour laquelle le conducteur doit mettre en oeuvre des traitements cognitifs variés. L’un des principaux est le mécanisme d’anticipatio (activité de diagnos-tic) [37] que celle-ci soit consciente ou inconsciente. L’anticipation en conduite porte principalement sur les effets des actions effectuéespar le conducteur, sur l’état futur du système Véhicule-Infrastructure-Conducteur, et sur les priorités à accorder (en fonction du temps) aux différentes tâches et sous-tâches de conduite.
Le mécanisme anticipatif permet donc de prédire le comportement des autres usa-gers, les directions à prendre, les actions à effectuer, en r espect avec l’analyse de la signalisation, indiquant l’ensemble des actions possibles et réalisables par les autres usagers et le conducteur lui même [38]. Sans prised’information, ce mécanisme est naturellement inopérant.
Pour [18], en conduite automobile, les activités prévisionelles peuvent ainsi être reliées aux activités perceptives, en l’occurrence suellesvi. On distingue alors trois types d’activités :
– le recueil anticipé d’indices visuels (détection et sélection de l’information pertinente) ;
– l’anticipation des indices visuels (prédiction des futurs indices possibles et conditionnement de la recherche à effectuer) ;
– l’utilisation des indices pour la prévision d’événementsfuturs (manoeuvres possibles, dangers potentiels, …).
Lors de l’activité de conduite, le prélèvement de l’information est donc un mo-ment privilégié. C’est à la fois le point de départ d’une décision, par l’évaluation de l’état actuel du système dynamique Véhicule-Infrastructure-Conducteur, et le résultat (en terme de stratégie d’exploration visuelle) del’état futur de ce système.
Ainsi, [39] rejoint ce formalisme, en dégageant deux fonctions principales de la vision égocentrée, qui fournit :
– des informations immédiates sur le véhicule lui même (position, direction, vitesse) ;
– des informations utiles à la prédiction, en particulier su r le déplacement du véhicule par rapport à l’environnement routier et aux autres usagers, ainsi que leurs déplacements propres.
La psychologie cognitive ne s’éloigne pas des formalismes présentées pré-cédemment. Pour [40] la perception est conçue comme un traitement de l’infor-mation fournie par les sens. C’est un processus selon lequel le conducteur sé-lectionne, organise et interprète les données de l’environement routier. Les in-formations portées pars les objets peuvent être plus ou moins saillantes dans la scène routière. Ceci peut rejoindre la théorie de la détection du signal qui prend en compte le rapport signal/bruit, [41, 42].
En accord avec les autres auteurs cognitivistes [43] découpe la perception en trois niveaux de tâches :
– La tâche de détection, qui correspond à la discrimination d e l’information pertinente (dans notre cas la signalisation de police) par rapport au bruit de fond (dans notre cas l’environnement routier complexe et ses distracteurs).
La détection dépend alors directement de la visibilité ou uspl exactement de la saillance de l’objet vis à vis de son environnement proche .
– La tâche d’identification, qui correspond à la reconnaissa nce de l’objet dé-tecté. Ceci par la comparaison des caractéristiques de l’objet détecté avec les représentations apprises, en mémoire et associées à un nomDans. notre cas, ceci correspond à la phase de discrimination entre la certit ude de reconnaître un panneau et de rejeter un distracteur au préalable détectécomme étant un panneau possible. L’identification dépend, quand à elle, de la saillance intrinsèque de l’objet, l’observateur étant fixé sur cet objet. La saillance in-trinsèque se définit ici comme la propension d’un objet à êtreidentifié, c’est à dire reconnu, lorsqu’il est le seul stimuli analysé, en dehors du monde environnant.
– La tâche de catégorisation sémantique, qui correspond à la reconnaissance de la classe, dans le réseau sémantique, à laquelle appartient l’objet identi-fié.
Cette approche, en trois niveaux de tâches perceptives, à ét é largement étudiée et utilisée dans le cadre duparadigme de l’attention visuelle [44].

Deux types de saillance en conduite

Les mécanismes attentionnels dépendent de la tâche effectuée, ce qui a été mis en évidence par différents paradigmes tels que leparadigme de l’amorçage spatial [45] ou le paradigme de la recherche et de la détection visuelle[46, 47].
Le paradigme de la recherche et de la détection visuelle montre que l’at-tention est « une ressource aux capacités limitées qui permet le traitement de l’information » [47]. Les travaux de [46], ont permis de démontrer quelques propriétés des processus contrôlés et automatiques de l’attention. Le traitement des processus contrôlés est sériel, puisque le conducteur raite un à un chacun des éléments constituant la zone de stimulus. Le traitement desprocessus automa-tiques est, quant à lui, parallèle, puisque toute l’information présente est traitée simultanément. Par ailleurs, l’attention peut être déclenchée automatiquement et capturée par une cible qui « saute aux yeux », on parle d’effet « pop-out ». Le guidage de l’attention visuelle peut être considérée comme une vision pré-attentive [48]. [49], décrit les caractéristiques attirantes qui régissent ces mouvements pré-attentifs, tels que les mouvements, les couleurs, la luminance, l’orientation, etc.
Le paradigme de l’amorçage spatial [45], met en avant que l’a ttention est « un contrôleur du système de traitement de l’information ». De ce paradigme découlent deux constats, concernant le « coût attentionnel» selon la région consi-dérée et concernant « deux distinctions cognitives de l’attention ».
Le « coût attentionnel » concerne l’aspect spatial en lui même :
– Le fait de diriger l’attention (en vision fovéale) sur une zone a pour effet de renforcer perceptivement l’information contenue dans celle-ci. Les dé-cisions (identification, catégorisation) sur l’information (objet détecté) sont alors plus efficaces et les actions correspondantes exécutées plus rapide-ment.
– Les régions voisines (para-fovéale et péri-fovéale) et périphériques sont, dans le même temps, inhibées. Le « coût attentionnel » équivaut à une com-plication des processus cognitifs mis en jeu. En effet, pour ne pas passer à coté d’autres informations dans la scène, l’attention doitêtre désengagée de la zone focalisée, pour pouvoir se déplacer vers une autre zone détectée et ensuite se réengager sur cette zone.
En conduite, le coût attentionnel, réside dans le fait que leconducteur doit analy-ser rapidement toutes les informations pertinentes. Ainsi, il doit démobiliser son attention d’un objet qu’il a détecté comme pertinent pour satache en cours si le traitement de l’information de celui-ci commence à prendre trop de temps. Dans ce cas, la stratégie adoptée est de ne pas identifier l’objet, au profit de la mo-bilisation de l’attention vers d’autres objets informatifs pertinents. La saillance intrinsèque est de ce fait liée au coût attentionnel.
Les « deux distinctions cognitives de l’attention » concernent une catégorisa-tion des processus attentionnels selon qu’ils soient :
– objets de modulations involontaires, dépendantes du milieu extérieur. On parle alors d’attention exogène, de processus ascendant ou « bottom-up ». Cette catégorie d’attention est rapide, brève et capturée arp l’arrivée inat-tendue d’un stimulus dans le champ visuel (distracteur).
– objets de modulations volontaires, dépendantes de l’individu et de sa tâche (ou plus précisément sous-tâche) en cours. On parle alors d’attention endo-gène, de processus descendant ou « top-down ». Cette catégorie d’attention
est plus lente, dure plus longtemps mais permet, une fois engagée de ne plus prendre en compte les distracteurs.
Hughes et al. dans [8, 50, 51] ont démontré que la conduite se aractérise par l’utilisation en alternance de ces deux types de processus qui régissent deux modes d’acquisition de l’information visuelle dans l’environnement :
– L’« attention conspicuity », traduit ici par saillance attentionnelle, qui cor-respond à la modulation involontaire de l’attention. C’est l’information qui, du fait d’une saillance élevée, s’impose au conducteur et guide son atten-tion en changeant ses priorités (par exemple, un signal lumineux de type warning ou l’allumage de feux stop) ;
– La « search conspicuity », traduit ici par saillance de recherche, qui correspond à la modulation volontaire (qu’elle soit consci ente ou fortement automatisée). C’est le conducteur qui recherche l’information pertinente (correspondante aux caractéristiques recherchées) en fonction de la tâche en cours (par exemple, recherche des indices pour prendre le chemin voulu).
On ne peut évaluer la proportion de chacun de ces deux types desaillance (de recherche ou attentionnelle) dans la perception de la signalisation verticale. Des expérimentations [52, 53], ont permis de récolter des indicateurs sur le fonction-nement de ces deux processus et de les mettre en confrontation avec le compor-tement visuel et la prise d’information dans des tâches de co nduite simulée. Ces expérimentations n’ont montré aucune corrélation entre slemodèles de saillance attentionnel (« bottom-up ») et l’activité de conduite. Pour autant, nous pensons que la prise en compte par le conducteur de la signalisation de police, en particu-lier des panneaux de police, mobilise dans une plus grande proportion la saillance de recherche (processus « top-down ») par rapport à la sailla nce attentionnelle (processus « bottom-up »).

Les modèles informatiques de la saillance attentionnelle

Un exemple de modèle informatique de saillance attentionnelle (« bottom-up ») est le modèle d’Itti [54]. Ce modèle, trouve ses origines dans les travaux de Koch et Ullman [55], qui ont proposé une architecture, biologiquement plausible, pour la modélisation de l’attention visuelle. Ils ont également introduit le concept de carte de saillance, qui exprime l’encodage spatial du degré d’intérêt de chaque pixel d’une image.
Comme le montre l’architecture générale du modèle d’Itti sur la Fig. 3.8, le principe de déroulement de ce modèle consiste à :
– Calculer quatre types de cartes de caractéristiques sur l’image :
– contrastes rouge-vert,
– contrastes bleu-jaune,
– contrastes en luminance,
– variation de l’angle du gradient.
– Calculer ces cartes à différentes échelles.
– Normaliser toutes les cartes sur la même échelle des ordonnées, cf . 3.9.
– Combiner les cartes de façon linéaire, avec une pondération différente pour chaque carte. La pondération est fonction de la présenc d’un ou de quelques pics prépondérants dans la carte. La combinaison btenueo est nom-mée carte de saillance, même s’il n’y a pas de preuve de la présence d’une telle carte dans le système cognitif humain.
– Définir les zones de forte saillance comme des disques de tai lle fixe autour des maximums locaux de la carte de saillance.
– Utiliser la stratégie « Winner take all » pour ordonner les zones saillantes dans l’image.
En 2001, ce système a été modifié [56], afin de prendre en compteune com-binaison pondérée des cartes de saillance, les poids étantssusi d’un apprentissage pour spécialisé la carte selon quelques caractéristiques répondérantes, cf. Fig. 3.8. Une normalisation itérative est également apparue, cf.Fig. 3.9.

Les modèles informatiques de saillance de recherche

Tout le problème est donc de modéliser l’influence de la tâche sur l’atten-tion, notamment la tâche de recherche d’un objet. Pour ce fai re, nombre d’auteurs prennent le formalisme de moduler les modèles « bottom-up » par les effets du contexte et des effets « top-down ». Ces effets ont été, à ce jour limité à la tâche de détection ou de reconnaissance d’objet. Ainsi, Navalpakkam et Itti [74], ont proposé un modèle de ce type. En partant de mots clés spécifiant la tâche à accom-plir, la carte de saillance d’Itti est biaisée par les caractéristiques connus de l’objet correspondant recherché. Torralba et al. [75] considèrentégalement une tâche de détection d’objet et proposent une modulation spatiale de la carte de saillance par une carte additionnelle qui représente les positions probables de l’objet recherché dans la scène. Cette carte est obtenue par un apprentissage supervisé sur une base d’image dans lesquels les positions les plus probables de certains objets ont été pointées manuellement. D’autres modèles font de même en modelant la carte de saillance par des a priori sur le contexte ou les objets d’études [76] [77]. Toutefois, ces approches proposées restent essentiellement théoriques plutôt que pratiques et informatiques. Elles sont donc peu applicables à notre prob lème.
Des modèles informatiques de la propension de détection d’un objet donné ont été proposés dans les travaux de Gao et al [78, 79] et Witus [80] ou Wolfe [81]. Toutefois, ces travaux sont pour l’instant limités à des situations de laboratoire. Par exemple, un de ces modèles intéressant est celui de Gao. Ce modèle est basé sur la sélection des caractéristiques qui sont les plus discriminantes pour une reconnais-sance de l’objet. Les parties de l’image qui contiennent la plus grande partie des caractéristiques sélectionnées sont considérées commeillsantes. Ce modèle a été testé lors d’une expérimentation oculométrique où le sujetavait pour tâche de de reconnaître si un objet donné était présent dans l’image affichée. Mais cette expé-rimentation était en simple tâche, sur des images synthétiques et très simples. Ce modèle ne peut pas être appliqué à des situations compliquées où l’objet recherché peut avoir des apparences variables. De plus, la dépendanceentre les caractéris-tiques n’est pas assez informative.
Une approche intéressante se retrouve dans les travaux de Chapuis, Chausse et al. [82, 83, 84] sur la reconnaissance d’objet focalisé capable de s’auto-adapter à l’instance de l’objet et qui défini une approche « top-down » comme processus de focalisation de l’attention dans l’espace des caractéristiques.

Vers une modélisation de la saillance de recherche en conduite pour la caractérisation de la saillance de la si- gnalisation de police

La question reste ouverte sur la proportion de la mobilisation de l’un ou l’autre des deux processus présentés précédemment, selon la sousâche-t en cours lors de la conduite. Au sens ergonomique, les processus perceptifs sont déterminés à la fois par l’objectif de la tâche, la structure de la représentation externe et le contexte global dans lequel s’effectue l’activité cognitive [85]. Ce qui rejoint certains au-teurs, [86], [87], [72] et [71, 70], selon lesquels, les processus de type « top-down » (saillance de recherche) priment sur ceux de type « bottom-up » (saillance atten-tionnelle), spécifiquement en conduite pour certains de ces auteurs. Ceci pourrait expliquer le fait qu’un conducteur s’engage à contre-sens d ans une voie à sens unique, le panneau de sens interdit ayant été « vu mais pas regardé ». Cela peut s’expliquer par le fait que le panneau de sens interdit, n’ayant pas une saillance suffisante, n’a peut être pas été détecté et sûrement non identifié par le conduc-teur, d’où sa non-reconnaissance (cf. partie 3.2). Heureusement, dans certains cas, la non-reconnaissance des objets routiers n’induit pas systématiquement un acci-dent, le conducteur et les autres usagers adaptant instantanément leurs compor-tements pour tenter de résoudre rapidement la situation pré-accidentogène. Ces situations peuvent avoir une conséquence dramatique, il est donc nécessaire de les minimiser en comprenant et agissant sur la saillance de la signalisation verticale et plus précisément sur la signalisation de police.
Il a été montré par [88], dans une expérimentation où les sujets devaient lire toute la signalisation routière (panneau de police, de direction, feux, marquages confondus) que seulement 11.2% d’entre elle était fixée. Mais, comme présenté dans la partie 3.1, une fixation correspond à la vision fovéal e (centre du regard). Elle ne prend pas en compte les objets vus, détectés et identifiés par la vision périphérique. Le taux de signalisation pris en compte doit tre,ê en fait, bien plus important. [89] a, quant à lui, montré que les objets routiers étaient globalement bien vus et mémorisés, grâce à une expérimentation d’oculométrie cognitive en conduite sur un parcours de 50 km. Les sujets étaient questionnés sur les diffé-rents objets qu’ils ont rencontrés. En étudiant la relationentre les fixations vi-suelles et la perception « consciente » des sujets, cet auteur a noté que certains des objets fixés (vision fovéale, ie. centre du regard) n’ont pasété mémorisés, donc certainement non identifiés ou reconnus. De plus, certains objets vus et mémorisés l’ont été grâce à la vision périphérique (que l’oculomètreenpeut pas enregistrer cf.3.4.1). Cet auteur a également montré des différences lonse le type d’objets mémorisés (signalisation, marquage, piétons, chevaux,. ).. Les signaux de vitesse sont rapportés correctement à 78% par les conducteurs, 63% pour les signaux de police et 17% pour les passages piétons.
Les panneaux de direction, par exemple, n’ont pas besoin d’avoir une forte saillance attentionnelle, car ils ne sont pas nécessaires à tous moments lors de la tâche de prise d’information visuelle en conduite. Les cond ucteurs ont recours aux panneaux indicateurs de direction seulement lorsqu’ils s’orientent et ceci de ma-nière active. Pour de tels panneaux, le conducteur considère alors volontairement cet objet routier, il mobilise donc des processus « top-down » réalisés consciem-ment et dans un temps correspondant au temps nécessaire à la prise de décision et au traitement des informations. Cette stratégie, répondant à une tâche de re-cherche, est une stratégie endogène de l’attention dans laquelle les mouvements oculaires sont volontaires, avec une mobilisation de l’attention vers la cible re-cherchée.
Par contre, pour un panneau de police (prescription, obligation ou interdiction), la relation entre saillance attentionnelle et saillance de recherche est com-plexe. Les deux mécanismes entrent en jeux, mais nous penson que le processus
« top-down » est prépondérant sur le processus « bottom-up ».Les caractéris-tiques visuelles des panneaux de police sont choisies pour permettre une forte saillance attentionnelle (« bottom-up ») afin de faciliter l a vision pré-attentive du conducteur (localisation de l’information). Toutefois, l’une des sous-tâches de conduite est la prise d’information à partir de la signalisa tion, afin d’en déduire le champ des actions possibles. Cette sous-tâche s’apparen te à une tâche de re-cherche (« top-down »). En revanche, cette tâche est automat isée par les conduc-teurs dès lors qu’ils ne sont plus novices. On se place alors dans un caractère involontaire de cette « tâche de recherche », qui par son cara ctère automatique, est réalisée rapidement et inconsciemment. Nous formulonsalors l’hypothèse que la saillance de la signalisation de police, objet de notre étude, correspond à un processus « top-down » de l’attention dans lequel les informations visuelles sont sélectionnées selon des caractéristiques connues (modèlemémoriel).
La revue de littérature présentée ci-dessus nous amène à proposer un algo-rithme de la saillance de recherche qui représentera le comportement du conduc-teur en réaction à la signalisation de police [90, 91]. A notre connaissance, il n’existe aucun modèle informatique de la saillance de recherche à ce jour. Notre démarche nous amène à vérifier la validité écologique de l’algorithme que nous proposons. Ainsi, nous vérifions la corrélation de notre modèle avec le compor-tement humain en situation écologique à la conduite, par des tâches (induites ou explicites) de focalisation sur les panneaux, au sein d’un contexte routier. Ce que nous avons réalisé, par le biais d’expérimentations psycocognitive- qui utilisent un système oculométrique, cf. partie 5.6.2, et chapitre 7.

L’oculométrie, une méthode pour étudier la prise d’information visuelle en conduite

Les mouvements oculaires et l’attention étant reliés par les mêmes processus de sélection attentionnelle [92], les méthodes d’oculométrie sont majoritairement utilisées pour étudier les mécanismes de perception visuelle.

Fonctionnement et limite de l’oculométrie

L’oculométrie s’appuie sur le paradigme que les processus cognitifs et la vi-sion, notamment les mouvements oculaires sont associés. Ainsi, selon [93], les fixations témoignent des traitements cognitifs tandis que les saccades relèvent des mécanismes perceptifs et oculomoteurs.
Le principe de l’oculométrie remonte à la fin du 19 eme` siècle. Le premier sys-tème utilisant l’analyse du reflet cornéen a été développérpaDodge et Cline en 1901. Cette technique, utilisée par notre matériel [94], reste la plus répandue à présent, mais une autre technique, basée sur le traitement ‘imagesd [95], plus pré-cise, car non soumise à la dérive du au larmoiement, fait son apparition et semble très prometteuse. Historiquement, on retrouve les premiers travaux utilisant l’ocu-lométrie avec ceux de Fitts [96], en 1947, dans le domaine de l’aéronautique. La technologie se répand à partir du développement de la psychologie cognitive au début des années 1970, notamment par l’expérimentation marquante de Yarbus [97, 73], qui a mis en évidence les différences de trajectoir oculaire lors de l’ex-ploration d’un tableau, selon que l’exploration est libre ou guidé par une problé-matique, cf. Fig. 3.10.
Depuis le début de l’oculométrie, différentes techniques nto été mises en oeuvre, celles-ci décrites dans [98, 99, 100, 101, 93, 102].On retient principa-lement :
– La technique de Huey en 1897, considéré comme le premier système ocu-lométrique. Le principe est de coller un amer sur le blanc de ‘œil du sujet afin de le suivre. Naturellement très invasive, cette méthode ne fonctionne que pour les mouvement horizontaux. Le sujet est contraint à l’immobilité.
– La technique du Limbe, développée par Torok en 1951, dont le principe est d’éclairer le limbe (séparation entre la sclère, c’est à dire le blanc de l’œil, et l’iris, la partie sombre), la quantité de lumière réfléchie dépend de la sur-face relative de la sclère et de l’iris dans le champ de mesure, et donc permet d’identifier la position de l’œil. Cette technique a suscité plusieurs applica-tions dans le domaine du handicap. Cette technique peu coûteuse (simple source de lumière et détecteur d’intensité lumineuse) peutêtre fixé sur une monture. Or, elle nécessite l’alignement du capteur par rapport au globe FIGURE 3.10 – Expérimentation de Yarbus, 1967. Sept enregistrements de che-mins visuels de trois minutes, pour le même sujet, en fonctio de la tâche de-mandée. 1- Exploration libre. Avant les autres enregistrements, le sujet devait : 2- Évaluer la situation matériel de la famille ; 3- Donner l’â ge des personnes ; 4- Prévoir ce que la famille avait fait avant l’arrivée du « Visiteur inattendu » ; 5- Mémoriser les vêtements portés par les personnes ; 6- Mémoriser la position des personnes et des objets dans la chambre ; 7- Estimer combien de temps « Le visiteur inattendu » a été loin de la familleSource. [97, 73] oculaire, ce qui n’est pas toujours évident ; les mouvementsde la tête per-turbent la mesure ; les paupières supérieures perturbent lafiabilité de la me-sure des mouvement verticaux, seuls les mouvements horizontaux restent fiables ; enfin, cette technique est particulièrement sensib le aux variations brutales de luminosité et fonctionne mal avec des yeux très lairsc.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

1 Introduction
1.1 Contexte
1.2 Objectifs : La détection de panneaux pour l’estimation de la saillance corrélée avec le comportement humain
1.3 Plan de la thèse
2 La signalisation verticale, une nécessité et des besoins
2.1 Conception et certification de la signalisation verticale
2.2 Importance de la conception d’outils de diagnostic pour le gestionnaire routier
3 Vision, saillance de la signalisation verticale dans l’activité de conduite
3.1 Éléments de physiologie du système visuel humain
3.2 Activité de conduite et prise d’information visuelle
3.3 Deux types de saillance en conduite
3.3.1 Les modèles informatiques de la saillance attentionnelle
3.3.2 Les modèles informatiques de saillance de recherche
3.3.3 Vers une modélisation de la saillance de recherche en conduite pour la caractérisation de la saillance de la signalisation de police
3.4 L’oculométrie, une méthode pour étudier la prise d’information visuelle en conduite
3.4.1 Fonctionnement et limite de l’oculométrie
3.4.2 Les indicateurs du comportement visuel humain utilisés en oculométrie cognitive
4 Analyse d’images pour la détection de la signalisation verticale
4.1 État de l’art sur la détection de panneaux, contraintes spécifiques liées à notre problème
4.2 Apprentissage par SVM
5 Un SVM pour détecter les zones saillantes cohérentes à la signalisation verticale
5.1 Choix des SVMs
5.2 Construction des bases d’exemples pour l’apprentissage et les tests
5.3 Procédure d’apprentissage et de recherche de panneaux
5.3.1 Apprentissage standard
5.3.2 Influence du paramètre de régularisation dissymétrique
5.3.3 Détection par fenêtres en multi-échelles
5.4 Etude sur les signatures
5.4.1 Histogramme des angles et des couleurs des contours
5.4.2 Histogramme des couleurs
5.4.3 Histogramme des couleurs normalisées
5.4.4 Histogramme des couleurs normalisées sur les contours
5.4.5 Histogramme de la distribution des couleurs normalisées autour des contours
5.4.6 Histogramme des angles des contours OEH
5.4.7 Histogramme de la concaténation OEH et couleurs
5.5 Etude sur les Noyaux
5.5.1 Noyau Gaussien
5.5.2 Noyau Polynomial
5.5.3 Noyau Laplacien
5.5.4 Noyau Triangulaire
5.6 Choix des couples noyau/signature de meilleures performances
5.6.1 Vérité Terrain, la signalisation verticale
5.6.2 Données de comportement humain, expérimentation exploratoire sur les fixations du regard dans un contexte routier
5.6.3 Choix du couple en fonction des deux vérités
6 Un modèle d’estimation de la saillance de recherche basé sur les SVMs
6.1 Utilisation des valeurs de confiance du SVM comme estimateur de la saillance intrinsèque
6.2 Prise en compte du fond environnant
6.3 Prise en compte de la taille de la signalisation verticale
6.4 Calcul de saillance des objets routiers à partir du modèle proposé
7 Expérimentation de validation par oculométrie cognitive
7.1 Méthodologie
7.1.1 Matériel et dispositif expérimental
7.1.2 Participants
7.1.3 Procédure
7.1.4 Variables étudiées
7.2 Analyse des données et modèle statistique
7.2.1 Evaluation objective
7.2.2 Evaluation subjective
7.3 Résultats et Interprétation : Une corrélation positive entre le modèle et le comportement humain
8 Conclusion et perspectives