Intégration de la navigation et de la sélection de l’action dans une architecture de contrôle inspirée des ganglions de la base

Les animaux sont capables d’assurer leur survie de façon totalement autonome dans des environnements complexes, dynamiques et bien souvent hostiles. Cette survie dépend entre autres de leur capacité à exhiber des comportements adaptés à la fois aux besoins de leur métabolisme et au contexte environnemental. Ils sont capables de sélectionner à chaque instant, parmi un ensemble d’objectifs contradictoires, celui qu’il convient de mener à bien et la manière d’y parvenir. Cette capacité est désignée sous le nom de sélection de l’action. La mise en œuvre de ces comportements, en particulier chez les vertébrés, nécessite l’utilisation de stratégies de navigation élaborées, permettant par exemple de trouver dans l’environnement les ressources nécessaires et de les rapporter au nid tout en évitant les prédateurs. La navigation désigne toute aptitude d’un animat à se repérer, s’orienter et se déplacer dans son environnement.

Approche animat

L’Approche Animat vise à concevoir des animaux artificiels(animats)simulés ou robotiques, au fonctionnement inspiré des animaux. Son objectif est de comprendre les mécanismes d’autonomie et d’adaptation des animaux, puis de les importer dans des artefacts capables, eux aussi, de s’adapter et d’assurer leur mission dans un environnement dynamique imprévisible (Meyer et Guillot, 1991; Wilson, 1991; Meyer, 1996).

Cette voie de recherche est née d’un certain nombre de limitations de l’intelligence artificielle classique (IAC), résumées par Dreyfus (1972) et Guillot et Meyer (2003) en ces quelques points :
– le système de décision y est considéré comme isolé du monde, la notion d’enveloppe corporelle et la résolution des problèmes d’interaction avec le monde réel sont considérés comme négligeables,
– le concepteur doit conséquemment prétraiter l’information issue du monde réel pour pouvoir fournir ses entrées au système, puis en interpréter les sorties,
– il doit également envisager de manière exhaustive l’ensemble des situations susceptibles d’être rencontrées lors de la conception du système, ce qui n’est guère compatible avec l’interaction avec l’environnement réel.

L’IAC se montre donc performante pour la réalisation de systèmes qui « raisonnent», mais moins efficace dans le cadre de systèmes qui « se comportent » tels que les robots, à moins qu’ils n’évoluent en environnements contrôlés (robots industriels).

L’approche animat tire son inspiration des sciences du vivant. Multidisciplinaire par définition, elle se place au carrefour de différentes disciplines : informatique, robotique, sciences cognitives, éthologie, biologie en général et neurosciences en particulier. Cet intérêt pour le vivant est issu de la simple constatation des capacités d’adaptation et d’autonomie développées par les êtres vivants dans leur milieu naturel, bien supérieures à celles des robots actuels. La notion d’autonomie telle qu’elle est entendue dans le cadre de cette approche diffère de celle des ingénieurs et des industriels (Alami et al., 1998). Elle correspond en effet au fait que le système peut de lui-même agir de telle façon qu’il conserve toujours ses variables « essentielles » dans une zone de viabilité (Ashby, 1952), dans des environnements dynamiques et imprévisibles, soumis parfois à des contraintes déclaratives (mission à accomplir) mais toujours libre du choix de ses procédures (moyens) mises en œuvre pour s’y soumettre (fig. 1). On comprend que cette dernière possibilité puisse susciter quelques réticences chez les industriels. Ainsi que le résume fort bien (Keijzer, 1998) : «A key issue of adaptive behavior is not merely to achieve distal goals, but to achieve these goals under always varying proximal circumstances. »

Les fondations de cette approche étant établies, une méthodologie spécifique en découle :
– lessystèmes élaborés ont pour destinée d’être situés, embarqués sur des plateformesrobotiques évoluant dans le monde réel, ils doivent donc être complètement spécifiés, depuis la perception jusqu’à l’action en passant par l’architecture de contrôle,
– ils sont conçus par une ingénierie inverse appliquée aux systèmes naturels («when the ’devices’ were already ’designed’ and ’built’ by nature – by evolution – and we have to figure out how they work, how they can do what they can do » –(Dawkins, 1995)), dans une approche bottom-up, où l’on commence par reproduire les comportements les plus simples pour les utiliser ensuite comme constituants de base de comportements plus complexes,
– enfin, le degré de réductionnisme adopté dans la modélisation est varié : il peut être très proche de la réalité observée, comme dans la modélisation du système de vision de la mouche de (Franceschini et al., 1992), plus éloigné, dans les très nombreux modèles utilisant comme composant de base les neurones artificiels –si simples comparés à leur homologues naturels–, voire lointain, lorsque l’on s’intéresse notamment aux méthodes d’évolution artificielle dans lesquelles un darwinisme primaire est mis en œuvre.

Enfin, la perspective de l’approche animat est double : il s’agit à la fois, d’un point de vue fondamental, de chercher à comprendre les mécanismes adaptatifs du vivant et, d’un point de vue appliqué, d’attribuer des capacités d’autonomie aux systèmes artificiels (Webb, 2001; Meyer et Guillot, 1994; Guillot et Meyer, 2000; Guillot et Meyer, 2001). C’est de ce flux bidirectionnel que peuvent naître de réelles interactions avec les sciences du vivant.

De l’animat à l’animal

L’approche animat aspire donc non seulement à doter les robots autonomes des capacités des animaux (voir Bar-Cohen et Breazeal, 2003 pour une revue), mais également à nourrir en retour les sciences du vivant (Webb, 2001). En intégrant plusieurs mécanismes étudiés isolément dans des systèmes simulés ou robotiques, elle permet, par exemple, de tester des hypothèses spécifiques –comme celles concernant les règles de navigation guidant le comportement des fourmis (Lambrinos et al., 2000), des abeilles (Srinivasan et al., 1999) ou des rats (Burgess et al., 1997)– ou des hypothèses plus générales, comme de mettre en œuvre la « loi de la parcimonie » (Morgan, 1894), en se demandant dans quelle mesure l’interaction de mécanismes réactifs peut conduire à des comportements dits cognitifs (Brooks, 1991) et pour quels problèmes environnementaux ces derniers sont réellement nécessaires. Enfin elle présente des commodités méthodologiques qui la rendent complémentaire des expérimentations animales, avec un contrôle plus rigoureux du système étudié (pas d’influence du mode d’élevage ou d’éducation du robot sur son comportement présent, pas de comportements « parasites » produits par des mécanismes non-étudiés) et un accès à des variables cachées, comme les variables internes d’un animal. De même, par des modèles incrémentaux, elle peut déterminer les rôles respectifs des divers mécanismes supposés être impliqués dans la production d’un comportement. L’équipe de Webb (Webb, 1995; Webb et Scutt, 2000), par exemple, s’est tout d’abord intéressée à l’étude d’un mécanisme neuronal suffisant pour expliquer à la fois le comportement d’approche de la femelle et la sélectivité du chant chez le grillon, puis a intégré un système auditif périphérique expliquant des caractéristiques spatio-temporelles de son comportement et enfin a raffiné le modèle de neurones artificiels afin d’en perfectionner les aspects temporels.

Validation des modèles

Il reste cependant que l’application de cette même méthodologie est susceptible de limiter la portée de sa contribution aux sciences du vivant (Chatila, 2002; Webb et Consi, 2001; Florian, 2003). En effet, les simplifications qu’implique la conception de modèles computationnels ne sont pas toujours compatibles avec le détail des mécanismes biologiques étudiés. Or, il s’avère difficile d’évaluer où se situe la frontière pertinente entre modélisation fidèle et trop haut niveau d’abstraction.

L’évaluation et la validation des modèles est difficile. Elles sont trop souvent qualitatives (« l’animat se comporte comme un animal ») donc subjectives et arbitraires. Le développement d’évaluations quantitatives et comparatives est indispensable. Il peut s’agir, dans un premier temps, de comparer entre eux plusieurs modèles computationnels, bioinspirés ou non, ou de comparer incrémentalement les versions successives d’un modèle. Encore faut-il que l’environnement de test soit pertinent. En effet, les mécanismes biologiques sont supposés avoir évolué pour résoudre des problèmes donnés, dans des environnements donnés. Souvent le biologiste ignore à quel problème environnemental précis telle ou telle organisation anatomique ou nerveuse apporte une solution. Si l’environnement du robot, équipé d’un modèle computationnel copié sur ces mécanismes, ne lui fournit pas les mêmes contraintes, le rôle de ces mécanismes sera mal interprété ou restera ignoré. Une solution –en général inaccessible à cause des limitationstechniques– est la comparaison de systèmes artificiels et de systèmes vivants, testés rigoureusement dans les mêmes conditions expérimentales.

Démarche biomimétique et biorobotique

Au sein de l’approche animat, la démarche biomimétique se place en position d’interaction avec les neurosciences. Elle se situe à un degré de réductionnisme intermédiaire, adoptant couramment le modèle des réseaux de neurones artificiels. Elle donne lieu, d’une part, à des travaux de simulation (Baldassare, 2003), nécessaires pour tester rapidement des hypothèses et préparer la réalisation de robots en s’affranchissant des problèmes techniques, et, d’autre part, à des implémentations robotiques (Webb et Consi, 2001) qui sont capitales pour prendre en compte l’imprédictibilité intrinsèque d’un environnement réel. C’est dans le cadre général de l’approche animat, et dans celui plus restreint de la démarche biomimétique, que se place notre travail.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Introduction
1 Approche animat
1.1 De l’animat à l’animal
1.2 Validation des modèles
1.3 Démarche biomimétique et biorobotique
2 Projet Psikharpax
2.1 Une démarche intégrative
2.2 Pourquoi le rat ?
2.3 Organisation du projet
3 Objectif de notre travail
4 Plan
1 La sélection de l’action
1.1 Définitions
1.1.1 Sélection de l’action
1.1.2 Action
1.1.3 Optimalité de la sélection
1.1.4 Evaluation
1.2 Modèles computationnels de sélection de l’action
1.2.1 Modèles éthologiques
1.2.2 Modèles ingénieurs
1.2.3 Mécanismes de sélection de l’action et navigation
1.2.4 Bilan
2 Les ganglions de la base : biologie et modèles computationnels
2.1 Données neurobiologiques
2.1.1 Circuit dorsal
2.1.2 Circuit Ventral
2.1.3 Rôle des ganglions de la base
2.1.4 Boucles parallèles
2.1.5 Communication inter-boucles
2.1.6 Rôle de la Dopamine
2.2 Modèles computationnels des GB
2.2.1 Apprentissage par renforcement
2.2.2 Mémoire à court terme et mémoire de travail
2.2.3 Génération de séquences
2.2.4 Contrôle de trajectoire bas niveau
2.3 Bilan
3 Modèle biomimétique de sélection de l’action
3.1 Le modèle de Gurney, Prescott et Redgrave
3.1.1 Une nouvelle interprétation des GB
3.1.2 Fonctionnement du modèle
3.1.3 Expérimentations réalisées à l’ABRG
3.2 Evaluation dans une tâche de survie
3.2.1 Matériel et Méthodes
3.2.2 Implémentation et adaptations du modèle
3.2.3 Expérimentation et résultats
3.3 Discussion
4 Modèle biomimétique d’intégration de la navigation et de la sélection de l’action
4.1 Ganglions de la base et informations spatiales
4.1.1 Codage de l’information spatiale dans le NAcc
4.1.2 Boucle limbique « core » et ordres moteurs
4.2 Stratégies de navigation et ganglions de la base
4.3 Intégration de la navigation et de la sélection de l’action : modèles computationnels existants
4.3.1 Arleo
4.3.2 Guazzelli et al
4.3.3 Gaussier et al
4.3.4 Bilan
4.4 Modélisation de l’interface navigation/sélection de l’action
4.4.1 Intégration de deux stratégies de navigation
4.4.2 Sémantique des canaux
4.4.3 Interconnexion des deux boucles
4.4.4 Effets du changement de sémantique des canaux
4.5 Système de navigation
4.5.1 Choix
4.5.2 Description
4.5.3 Adaptation du système de navigation pour l’interface
4.6 Expérimentations dans une tâche de survie en environnements simples
4.6.1 Matériel et méthode
4.6.2 Expérimentations et résultats
Conclusion