Encodage binaire de la couche FAB
Classificateur neuronique fuzzy ARTMAP
En reconnaissance de forme, le rôle du classificateur est de choisir à laquelle des catégories connues appartient le motif, sous forme de vecteur de caractéristiques, qui lui est présenté à son entrée (Duda, Hart et Stork, 2001). Les classificateurs statistiques de type « génératif » tentent de créer des modèles statistiques pour représenter les différentes catégories. Les classificateurs de type Bayesiens et les modèles de mixtures gaussiennes sont de bons exemples de classificateurs génératifs (Duda, Hart et Stork, 2001). Ce type de classificateurs est intéressant car les modèles statistiques utilisés pour représenter la fonction de distribution de probabilités sont très compacts. Par contre, les données du monde réel ne répondent pas toujours aux lois gérant ces différents modèles statistiques. En opposition, les classificateurs statistiques de type « discriminatif » tentent de diviser l’espace des possibilités de façon à identifier les différents sous-espaces que représente chacune des catégories. Parmi les classificateurs discriminatifs, nous trouvons les fonctions discriminantes linéaires ou quadratiques ainsi que les machines à vecteurs de support (Duda, Hart et Stork, 2001). En divisant l’espace des possibilités, les classificateurs discriminatifs offrent une bonne capacité de généraliser avec peu de données d’entrainement, mais l’établissement d’une frontière dans l’espace des possibilités peut être complexe lorsque la distribution de multiples catégories se chevauchant.
Optimisation multiobjective par essaim de particules (OMOEP)
L’optimisation multiobjective est la recherche d’un optimum lorsque la performance d’une solution dépend de plus d’un critère indépendant. Puisque ces aspects sont indépendants, il est impossible de les comparer sur un pied égal. La notion d’un ensemble de solutions non dominées est utilisée pour remplacer celle de la solution optimale. On dit que la solution A domine la solution B si les paramètres de la performance de la solution A sont supérieurs (ou inférieurs dans le cas d’une minimisation) à ceux de la solution B. Ainsi, une solution non dominée est une solution qui pour un des paramètres de performance est supérieure (ou inférieur) à toutes les autres solutions. L’ensemble des solutions non dominées, aussi appelé front de Pareto,représente l’enveloppe de performance du système. L’algorithme d’optimisation multiobjective par essaim de particules (OMOEP) (Coello, Pulido et Lechuga, 2004) est une extension de l’algorithme OEP afin d’être capable de traiter les problèmes multiobjectifs. Tout comme dans le cas de l’OEP, OMOEP utilise une population de solutions qui évoluent dans le temps pour explorer l’espace paramètres en quête de la performance optimale. Par contre, la notion de la meilleure performance de toute la population (meilleure performance globale) a été remplacée par une archive de solutions non dominées produites au cours de l’évolution de la population. La meilleure performance d’une des particules (meilleure performance locale), a été remplacée par une archive locale pour contenir la position de l’histoire d’une particule dont la performance domine les autres.
Intel Core™ i3-530
Le processeur Core™ i3-530 de la compagnie Intel (Intel, 2009b) représente le type de processeur ordinairement trouvé dans les postes informatiques de bureau ainsi que les ordinateurs personnels. Il exécute le jeu d’instructions standard IA-32 de la compagnie Intel et il est supporté par la majorité des systèmes d’opérations modernes et des outils de développement commerciaux ainsi qu’en code source libre. Ce processeur est disponible sur le marché depuis le premier trimestre de l’année 2010 et fait partie de la gamme de base de la famille de processeurs Core™. Basée sur la microarchitecture 32 nm Nehalem (Intel, 2008), ce processeur possède un contrôleur de mémoire DDR3 à deux canaux, une interface PCI Express, une interface Direct Media ainsi que les technologies Hyper-Threading et QuickPath. Il possède deux nœuds de calcul évoluant à une cadence d’horloge de 2.93GHz pour puissance théorique de 73W. Le processeur possède 32kB de mémoire cache de niveau 1 par nœud de calcul , 256kB de mémoire cache de niveau 2 par nœud de calcul ainsi que 4 MB de mémoire cache de niveau 3 partagée par les deux nœuds de calcul (Intel,2009b).
Octasic Vocallo MGW
Le processeur Vocallo MGW de la compagnie Octasic est l’alternative haute technologie. Ce processeur parallèle de très faible puissance vise principalement les applications de traitement de signaux numériques pour le transcodage audio & vidéo sur des réseaux IP (Octasic, 2004). Pour obtenir un bon degré de performance tout en maintenant une très faible consommation d’énergie, l’architecture Opus utilisée dans le processeur fonctionne de façon asynchrone permettant ainsi de réduire la consommation d’énergie en éliminant l’horloge globale (Tremblay, 2009).
Le Vocallo MGW Evaluation est une carte PCI de développement fabriquée par la compagnie Octasic, qui est composée d’un processeur Vocallo MGW, d’un contrôleur de mémoire DDR ainsi qu’une interface de télécommunication de type t041 (Octasic, 2004).
Prédiction par accumulation d’informations
Jusqu’à présent, les mentions du taux de classification faisaient référence au taux de classification pour une seule trame. Avec l’utilisation d’un module de trace, plusieurs trames d’une séquence vidéo peuvent être combinées afin d’améliorer la qualité de la prédiction de l’identité de l’individu cible.
Une des façons les plus simples et les plus efficaces pour exploiter le traitement des données temporelles est de placer les prédictions faites pour chacune des trames dans un tampon de décision. Ceci permet de créer une estimation discrète de la distribution de la probabilité à partir de laquelle la prédiction finale est faite (Carpenter et Ross, 1995).
Ceci permet d’augmenter le taux de classification jusqu’au point désiré, mais, en contrepartie, crée un délai avant que la prédiction finale durant la période où le tampon de décision se rempli. Ceci peut causer un problème lorsque l’application nécessite un traitement en temps réel.
|
Table des matières
INTRODUCTION
CHAPITRE 1 IDENTIFICATION BIOMÉTRIQUE
1.1 Validation, identification et dépistage
1.2 Caractéristiques biométriques ainsi que leurs performances
1.3 Système typique de reconnaissance de visages dans des séquences vidéo
1.4 État de l’art en reconnaissance de visages dans des séquences vidéo
1.5 Défis à la réalisation
1.6 Conclusion
CHAPITRE 2 PRÉDICTION DE L’IDENTITÉ
2.1 Extraction et sélection de caractéristiques avec l’analyse par composantes principales
2.2 Classificateur neuronique fuzzy ARTMAP
2.2.1 Architecture
2.2.2 Hyperparamètres
2.2.3 Algorithme
2.2.4 Analyse de complexité
2.3 Stratégies d’apprentissage pour les réseaux de neurones fuzzy ARTMAP
2.3.1 Optimisation par essaim de particules (OEP)
2.3.2 Optimisation multiobjective par essaim de particules (OMOEP)
2.4 Conclusion
CHAPITRE 3 IMPLÉMENTATION MATÉRIELLE
3.1 Sélection des processeurs
3.1.1 Intel Core™ i3-530
3.1.2 Intel Atom™ N270
3.1.3 Octasic Vocallo MGW
3.2 Modifications algorithmiques
3.2.1 Fonction de choix
3.2.2 L’inversion de la modification du signal de suivis
3.2.3 Encodage binaire de la couche FAB
3.2.4 Traitement parallèle
3.2.5 Prédiction par accumulation d’informations
3.3 Conclusion
CHAPITRE 4 MÉTHODOLOGIE D’ÉVALUATION
4.1 Base de données expérimentale
4.2 Méthodologie expérimentale
4.3 Indicateurs de performance
4.4 Conclusion
CHAPITRE 5 RÉSULTATS EXPÉRIMENTAUX
5.1 Communications internœuds
5.2 Extraction et sélection de caractéristiques
5.3 La performance en reconnaissance d’images individuelles
5.4 La performance en reconnaissance dans des séquences vidéo
5.5 Conclusion
CONCLUSION
Télécharger le rapport complet