DÉFINITION D’UN PROCESSUS ET D’UN MODÈLE
Processus
Un processus est caractérisé par :
• une ou plusieurs grandeurs de sortie, mesurables, qui constituent le résultat du processus,
• une ou plusieurs grandeurs d’entrée (ou facteurs), qui peuvent être de deux types :
– des entrées sur lesquelles il est possible d’agir (entrées de commande),
– des entrées sur lesquelles il n’est pas possible d’agir (perturbations) ; ces dernières peuvent être aléatoires ou déterministes, mesurables ou non mesurables. Les processus peuvent être de toutes natures : physique, chimique, biologique, écologique, financier, sociologique, etc.
Modèles
Qu’est ce qu’un modèle ?
Nous nous intéressons ici aux modèles mathématiques, qui représentent les relations entre les entrées et les sorties du processus par des équations. Si ces équations sont algébriques, le modèle est dit statique. Si ces équations sont des équations différentielles ou des équations aux différences récurrentes, le modèle est dit dynamique, respectivement à temps continu ou à temps discret. Un modèle est caractérisé par son domaine de validité, c’est-à-dire par le domaine de l’espace des entrées dans lequel l’accord entre les valeurs des sorties du processus calculées par le modèle, et leurs valeurs mesurées, est considéré comme satisfaisant compte tenu de l’utilisation que l’on fait du modèle.
Buts d’une modélisation
Un modèle peut être utilisé soit
• pour simuler un processus : à des fins pédagogiques, de détection d’anomalies de fonctionnement, de diagnostic de pannes, de conception assistée par ordinateur, etc.,
• pour effectuer la synthèse d’une loi de commande, ou pour être incorporé dans un dispositif de commande.
Classification des modèles
Classification selon le mode de conception
On distingue trois sortes de modèles en fonction des informations mises en jeu pour leur conception :
• Les modèles de connaissance : les modèles de connaissance sont construits à partir d’une analyse physique, chimique, biologique (ou autre suivant le type du processus), en appliquant soit les lois générales, fondées sur des principes (lois de la mécanique, de l’électromagnétisme, de la thermodynamique, de la physique quantique, etc.), soit les lois empiriques (finance, économie), qui régissent les phénomènes intervenant au sein des processus étudiés. Ces modèles ne comportent généralement pas de paramètres ajustables, ou des paramètres ajustables en très petit nombre. Dans la pratique, il est toujours souhaitable d’établir un modèle de connaissance des processus que l’on étudie. Néanmoins, il arrive fréquemment que le processus soit trop complexe, ou que les phénomènes qui le régissent soient trop mal connus, pour qu’il soit possible d’établir un modèle de connaissance suffisamment précis pour l’application considérée. On est alors amené à concevoir des modèles purement empiriques, fondés exclusivement sur les résultats de mesures effectuées sur le processus.
• Les modèles “boîte noire” : les modèles “boîte noire” sont construits essentiellement sur la base de mesures effectuées sur les entrées et les sorties du processus à modéliser. La modélisation consiste alors à utiliser, pour représenter les relations entre les entrées et les sorties, des équations (algébriques, différentielles, ou récurrentes) paramétrées, et à estimer les paramètres, à partir des mesures disponibles, de manière à obtenir la meilleure précision possible avec le plus petit nombre possible de paramètres ajustables. Dans ce mémoire, nous désignerons fréquemment l’estimation des paramètres sous le terme d’apprentissage.
Le domaine de validité d’un tel modèle ne peut pas s’étendre au-delà du domaine des entrées qui est représenté dans les mesures utilisées pour l’apprentissage .
• Les modèles “boîte grise” : lorsque des connaissances, exprimables sous forme d’équations, sont disponibles, mais insuffisantes pour concevoir u n modèle de connaissance satisfaisant, on peut avoir recours à une modélisation « boîte grise » (ou modélisation semi-physique) qui prend en considération à la fois les connaissances et les mesures. Une telle démarche peut concilier les avantages de l’intelligibilité d’un modèle de connaissance avec la souplesse d’un modèle comportant des paramètres ajustables.
Classification selon l’utilisation
Indépendamment de la classification précédente, on peut distinguer deux types de modèles en fonction de l’utilisation qui en est faite.
• Les modèles de simulation (ou simulateurs) : un modèle de simulation est utilisé de manière indépendante du processus qu’il représente. Il doit donc posséder un comportement aussi semblable que possible à celui du processus. De tels modèles sont utilisés pour valider la conception d’un système avant sa fabrication (conception assistée par ordinateur en mécanique, en microélectronique, …), pour la formation de personnels (simulateurs de vols), pour la prévision à long terme, etc. Du point de vue de la structure du modèle, les sorties passées, mesurées sur l e processus à modéliser, ne peuvent constituer des entrées du modèle. L’estimation des paramètres et l’utilisation du modèle constituent deux phases successives et distinctes (apprentissage non adaptatif).
• Les modèles de prédiction (ou prédicteurs) : un modèle de prédiction est utilisé en parallèle avec le processus dont il est le modèle. Il prédit la sortie du processus à une échelle de temps courte devant les constantes de temps du processus. Les prédicteurs sont utilisés pour la synthèse de lois de commande, ou dans le système de commande lui-même (commande avec modèle interne). Du point de vue de la structure du modèle, les sorties passées, mesurées sur le processus, peuvent constituer des entrées du modèle. L’estimation des paramètres et l’utilisation du modèle peuvent être effectuées simultanément si nécessaire (apprentissage adaptatif, utile notamment si les caractéristiques du processus dérivent dans le temps).
Ce mémoire présente la mise en oeuvre de plusieurs types de réseaux de fonctions paramétrées pour la modélisation dynamique de processus, et la comparaison de leurs performances respectives. Il s’agira donc exclusivement de modèles de type “boîte noire” qui peuvent être utilisés indifféremment comme simulateurs ou comme prédicteurs.
LES ÉTAPES DE LA CONCEPTION D’UN MODÈLE
Lors de la conception d’un modèle de connaissance, la relation entre les entrées et la (ou les) sortie(s) du modèle découlent directement de la mise en équation des phénomènes physiques (chimiques, ou autres) qui régissent le fonctionnement du processus. Une fois le modèle obtenu sous forme analytique, des approximations peuvent être faites pour simplifier son expression (par exemple « linéariser » le modèle pour passer d’un modèle non linéaire à u n modèle linéaire) si une telle approximation est justifiée. Dans le cas d’une modélisation de type “boîte noire”, la construction du modèle nécessite les trois élements suivants :
• Une hypothèse sur l’existence d’une relation déterministe liant les entrées à la (ou aux) sortie(s). Cette relation est caractérisée par une fonction appelée fonction de régression (ou plus simplement régression). L’expression formelle supposée adéquate pour représenter cette relation est appelée modèlehypothèse.
• Une séquence de mesures des entrées et de la sortie du processus.
• Un algorithme d’apprentissage.
Dans la suite de ce paragraphe, nous présentons les différents aspects qui doivent être pris en considération lors du choix d’un modèle-hypothèse .
|
Table des matières
Introduction
CHAPITRE I. Modélisation de processus et estimation des paramètres d’un modèle
I. INTRODUCTION.
II. DÉFINITION D’UN PROCESSUS ET D’UN MODÈLE.
II.1 Processus.
II.2 Modèles.
II.2.1 Qu’est ce qu’un modèle ?
II.2.2 Buts d’une modélisation.
II.2.3 Classification des modèles.
II.2.3.1 Classification selon le mode de conception.
II.2.3.2 Classification selon l’utilisation.
III. LES ÉTAPES DE LA CONCEPTION D’UN MODÈLE.
III.1 Choix d’un modèle-hypothèse.
III.2 Du modèle-hypothèse au prédicteur ou au simulateur.
III.3 Présentation de quelques modèles-hypothèses et de leurs prédicteurs associés.
III.3.1 Modèle-hypothèse déterministe.
III.3.2 Modèles-hypothèses non déterministes.
III.3.2.1 L’hypothèse “Bruit de sortie”.
III.3.2.2 L’hypothèse “Bruit d’état”.
IV. FONCTIONS PARAMÉTRÉES POUR LA MODÉLISATION « BOÎTE NOIRE ».
IV.1 Les fonctions paramétrées linéaires par rapport aux paramètres.
IV.2 Les fonctions paramétrées non linéaires par rapport aux paramètres.
IV.2.1 Les réseaux de neurones.
IV.2.2 Les réseaux de fonctions radiales (RBF pour Radial Basis Functions).
IV.2.3 Les réseaux d’ondelettes.
V. ESTIMATION DES PARAMÈTRES D’UN MODÈLE.
V.1 Position du problème et notations.
V.2 Les algorithmes de minimisation de la fonction de coût.
V.2.1 Méthode des moindres carrés ordinaires.
V.2.2 Principe des algorithmes de gradient.
V.2.3 La méthode du gradient simple.
V.2.3.1 Présentation de la méthode.
V.2.3.2 Techniques de réglage du pas.
V.2.4 Les méthodes de gradient du second ordre.
V.2.4.1 L’algorithme de BFGS.
V.2.4.2 L’algorithme de Levenberg–Marquardt.
V.3 Commentaire.
VI. CONCLUSION
CHAPITRE II. Réseaux de fonctions dorsales
I. INTRODUCTION.
II. NEURONES FORMELS À FONCTIONS DORSALES ET RÉSEAUX.
II.1 Qu’est ce qu’un neurone formel ?
II.2 Qu’est-ce qu’un neurone formel à fonction dorsale ?
II.3 Qu’est ce qu’un réseau de neurones ?
II.4 Réseaux non bouclés et réseaux bouclés.
II.4.1 Les réseaux non bouclés.
II.4.2 Les réseaux bouclés.
II.5 Réseaux non bouclés complètement connectés et réseaux à couches.
II.5.1 Les réseaux non bouclés complètement connectés.
II.5.2 Les réseaux non bouclés à couches.
II.5.3 Les réseaux mis en œuvre dans ce travail.
III. CHOIX DE LA FONCTION D’ACTIVATION ET PROPRIÉTÉ D’APPROXIMATION UNIVERSELLE.
III.1 La fonction sigmoïde.
III.2 La fonction gaussienne.
IV. APPRENTISSAGE DES RÉSEAUX DE FONCTIONS DORSALES.
IV.1 Apprentissage de réseaux non bouclés.
IV.2 Apprentissage de réseaux bouclés.
IV.3 Initialisation du réseau et minima locaux.
IV.4 Autres schémas d’apprentissage pour les réseaux de fonctions dorsales.
V. ANALYSE D’UN RÉSEAU DE FONCTIONS DORSALES.
V.1 Principe.
V.2 Élagage de poids synaptiques.
V.3 Une procédure pour la détection de neurones à fonctions gaussiennes “mal utilisés”.
V.4 Étude d’un exemple.
VI. MODÉLISATION DYNAMIQUE DE PROCESSUS À L’AIDE DE RÉSEAUX
DE FONCTIONS DORSALES.
VI.1 Modélisation entrée–sortie.
VI.1.1 Prédicteurs non bouclé.
VI.1.2 Prédicteur bouclé.
VI.2 Modélisation d’état.
VII. CONCLUSION.
CHAPITRE III. Réseaux d’ondelettes (approche fondée sur la transformée continue)
I. INTRODUCTION.
II. RÉSEAUX ISSUS DE LA TRANSFORMÉE EN ONDELETTES CONTINUE.
II.1 La transformée en ondelettes continue.
II.2 De la transformée inverse aux réseaux d’ondelettes.
III. DÉFINITION DES ONDELETTES MULTIDIMENSIONNELLES ET DES
RÉSEAUX D’ONDELETTES.
III.1 Ondelettes multidimensionnelles.
III.2 Réseaux d’ondelettes.
III.3 Réseaux d’ondelettes et réseaux de neurones.
IV. APPRENTISSAGE DES RÉSEAUX D’ONDELETTES NON BOUCLÉS.
IV.1 Calcul du gradient de la fonction de coût.
IV.2 Initialisation des paramètres du réseau.
IV.3 Exemple de modélisation statique.
IV.3.1 Présentation du processus simulé.
IV.3.2 Modélisation avec 100 exemples.
IV.3.3 Modélisation avec 300 exemples.
IV.3.4 Influence des termes directs
IV.3.5 Quelques figures.
V. MODÉLISATION DYNAMIQUE ENTRÉE–SORTIE ET RÉSEAUX
D’ONDELETTES.
V.1 Apprentissage de réseaux de type entrée-sortie.
V.1.1 Apprentissage de prédicteurs non bouclés.
V.1.2 Apprentissage de prédicteurs bouclés.
V.1.3 Calcul du gradient par rétropropagation.
V.1.4 Calcul du gradient dans le sens direct.
V.2 Exemple.
V.2.1 Présentation du processus.
V.2.2 Étude du gain statique.
V.2.3 Modélisation du processus.
VI. MODÉLISATION D’ÉTAT ET RÉSEAUX D’ONDELETTES.
VI.1 Modèles d’état sans bruit, avec états non mesurables.
VI.2 Apprentissage de réseaux d’état bouclés.
VI.2.1 Structure du réseau d’état.
VI.2.2 Calcul du gradient par rétropropagation.
VI.2.2.1 Calcul du gradient de J par rapport à la sortie et aux variables d’état.
VI.2.2.2 Calcul du gradient de J par rapport aux paramètres du réseau.
VI.2.2.3 Commentaire sur le choix des variables d’état.
VI.2.3 Calcul du gradient dans le sens direct.
VI.2.4 Initialisation des paramètres du réseau.
VII. LE PROBLÈME MAÎTRE–ÉLÈVE ET LES RÉSEAUX D’ONDELETTES.
VII.1 Minima locaux de la fonction de coût.
VII.2 Choix de la séquence d’apprentissage.
VII.3 Choix du domaine des entrées et des paramètres du réseau maître.
VII.4 Choix de l’algorithme et de l’initialisation du réseau.
VII.5 Approche adoptée pour l’étude du problème.
VII.6 Résultats et commentaires.
VIII. CONCLUSION.
CHAPITRE IV. Réseaux d’ondelettes (approche fondée sur la transformée discrète)
I. INTRODUCTION.
II. RÉSEAUX ISSUS SUR LA TRANSFORMÉE EN ONDELETTES DISCRÈTE.
II.1 Structures obliques et bases d’ondelettes orthonormales.
II.1.1 Ondelettes à variables continues.
II.1.2 Ondelettes à variables discrètes.
II.1.3 Choix de l’ondelette mère.
II.2 Réseaux fondés sur la transformée discrète.
III. TECHNIQUES DE CONSTRUCTION DE RÉSEAUX D’ONDELETTES.
III.1 Impossibilité d’utiliser les techniques de gradient.
III.2 Différentes approches pour construire un réseau d’ondelettes fondé sur la
transformée discrète.
III.2.1 Approches n’utilisant pas de procédure de sélection.
III.2.1.1 Technique fondée sur l’analyse fréquentielle.
III.2.1.2 Technique fondée sur la théorie des ondelettes orthogonales.
III.2.1.3 Réseaux d’ondelettes pour un système adaptatif.
III.2.2 Approches utilisant une procédure de sélection.
III.2.2.1 Technique fondée sur la construction de structures obliques étroites.
IV. PROPOSITION D’UNE PROCÉDURE DE CONSTRUCTION DE
RÉSEAUX ET D’INITIALISATION DE L’APPRENTISSAGE.
IV.1 Description de la procédure de construction de la bibliothèque.
IV.1.1 Famille engendrant la bibliothèque pour un modèle à une entrée.
IV.1.2 Cas des bibliothèques pour modèles à plusieurs entrées.
IV.2 La méthode de sélection.
IV.2.1 Principe de la méthode de sélection par orthogonalisation.
IV.2.2 Cas des termes directs.
IV.3 La procédure de construction du réseau.
IV.3.1 Présentation de la procédure de construction.
IV.3.2 Avantages et inconvénients de cette approche.
IV.4 Autre application de la procédure : initialisation des translations et dilatations
pour l’apprentissage de réseaux d’ondelettes à paramètres continus.
IV.4.1 Principe de la procédure d’initialisation.
IV.4.2 Avantages et inconvénients de cette méthode d’initialisation.
V. ÉTUDE D’EXEMPLES.
V.1 Exemple de construction de réseaux à l’aide de la procédure de sélection.
V.1.1 Présentation du processus.
V.1.2 Construction d’un modèle dynamique à l’aide de la procédure.
V.1.2.1 Modélisation dynamique sans bruit du processus simulé.
V.1.2.2 Modélisation dynamique avec bruit du processus simulé.
V.1.2.3 Conclusion.
V.2 Exemple d’initialisation des translations et des dilatations de réseaux à l’aide de
la procédure de sélection.
V.2.1 Processus 1.
V.2.1.1 Présentation du processus.
V.2.1.2 Initialisation de réseaux à l’aide de la procédure de sélection.
V.2.2 Processus 2.
VI. CONCLUSION.
Conclusion
Télécharger le rapport complet