Nouvel algorithme d’optimisation bayésien

Probabilité d’amélioration

   Historiquement, le premier critère utilisé dans un cadre de l’optimisation bayésienne fut introduit par Kushner (1964), et correspond à la probabilité d’amélioration. L’amélioration dont il est question est celle relative au maximum courant entre la n-ième et la n+1-ième évaluation. Le point du domaine X en lequel la probabilité d’améliorer est maximale, constitue ainsi la position de la nouvelle évaluation. Initialement proposé pour l’optimisation de trajectoires browniennes dans des espaces à une dimension, ce critère a ensuite été étendu à des cas plus généraux (voir, par exemple, Perttunen, 1991 ; Mockus, 1994). Deux types de zones du domaine sont le plus souvent associées aux plus fortes probabilités d’amélioration, à savoir celles proches du maximum courant (aspect exploitation) et celles où la fonction est mal connue (aspect exploration). Le problème de ce critère est qu’il favorise une amélioration extrêmement faible mais probable à une amélioration qui serait bien plus importante mais légèrement moins probable. Le voisinage du maximum courant a ainsi tendance à être échantillonné de façon dense avant que l’algorithme ne reprenne un comportement exploratoire. Une variante de ce critère, décrite par Jones (2001) et conçue dans le but de résoudre ce problème, est de considérer la probabilité d’amélioration par rapport à un seuil T =Mn + ǫn avec ǫn ≥ 0 et tendant vers zéro lorsque n augmente.

Un exemple de fonction trompeuse

   Nous considérons ici le cas des fonctions trompeuses, dont une illustration est donnée par la figure 1.7. Lorsque les résultats d’évaluation disponibles n’apportent pas suffisamment d’information sur la fonction objectif f pour estimer les paramètres avec une précision acceptable, la variance de l’erreur de prédiction est le plus souvent largement sous-estimée comme montré sur la figure 3.1. Cette situation est généralement à l’origine de comportements particulièrement décevants, non seulement d’EGO, mais aussi de la plupart des algorithmes utilisant une approche par substitution, de part leur tendance à privilégier une recherche locale autour des maxima courants (exploitation), et ce dès le début de la procédure d’optimisation, au détriment d’une recherche globale (exploration). Une illustration de ce problème est donnée à la figure 3.2. Lorsque l’information disponible (ou un choix judicieux d’a priori, dans le cas d’une estimation par MAP) permet de calculer une bonne approximation de θ, ce problème peut être évité. Plus généralement, l’utilisation d’un modèle stationnaire pour ξ pourrait être considérée comme un élément favorisant l’émergence de certaines fonctions trompeuses, en particulier si une zone relativement étendue du domaine est désertée à l’initialisation. Néanmoins, choisir les points d’évaluation initiaux de façon à couvrir le domaine (répartition selon, par exemple, un LHS space filling) permet de diminuer le risque lié à ce type particulier de fonctions trompeuses. Nous faisons donc le choix, comme l’essentiel de la littérature traitant de l’optimisation bayésienne, de ne considérer que des modèles stationnaires.

Construction d’une densité sur le domaine X

   L’étape de maximisation du critère EI complétement bayésien sur le domaine X est particulièrement importante, comme évoqué dans l’introduction et dans la section 4.2. La réponse que nous apportons est de maximiser ρn sur un ensemble de points candidats Xn = {xn,j} ⊂ X, que nous construisons afin de satisfaire un compromis faisant intervenir deux propriétés. La première est de contenir un point suffisamment proche du maximum réel de ρn pour que la maximisation soit effective. La seconde est de garder un nombre de points candidats suffisamment faible pour que les estimations du critère, calculées à partir de l’approche SMC en θ vue à la section 4.1, ne soient pas trop nombreuses, et offrir ainsi une complexité algorithmique acceptable . Afin de limiter le nombre de points candidats, tout en préservant une bonne estimation du maximum, nous faisons en sorte qu’ils soient répartis selon une densité « pertinente » pn. Nous entendons ici par « pertinente », une densité qui favorise les zones du domaine où les valeurs du critère ont tendance à être élevées. Au chapitre 2, nous avons passé en revue un ensemble de critères apportant une caractérisation des zones intéressantes du domaine. Ils étaient définis pour un processus ξ dont le paramètre θ était implicitement supposé connu. C’est à partir de ces critères, que nous noterons de façon générique gn : X × Θ → R+, que nous allons chercher à construire pn.

Description du convertisseur de puissance étudié

   Les composants de puissance de type IGBT (InsulatedGateBipolar Transistor) sont communément utilisés (Lefranc, 2005) dans la conception de convertisseurs de forte puissance (supérieure à quelques centaines de kilowatt), pour des domaines d’application tels que la traction ferroviaire, les énergies renouvelables (éoliennes), le transport d’énergie électrique via l’utilisation de liaisons HVDC (High Voltage Direct Current) où les composants sont utilisés. Cependant, l’interrupteur de puissance IGBT (puces silicium et packaging associé) doit être piloté par un système de commande rapprochée appelé driver. Ce dernier permet d’apporter la puissance nécessaire à la commutation du composant (en général de quelques centaines de milliwatt à quelques watt) et les ordres de commande tout en garantissant un certain niveau de fiabilité et de protection (sur-intensité, court-circuit). Sur la figure 5.8 sont montrés des exemples d’interrupteurs de puissance de type IGBT avec leur système de commande rapprochée (communément appelés drivers d’IGBT) et le synoptique d’un driver d’IGBT pour une configuration classique d’un bras d’onduleur à deux niveaux.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

1 Introduction 
1.1 Contexte et formalisme
1.2 Construction bayésienne d’un critère d’échantillonnage 
1.3 Approche complètement bayésienne 
1.4 Plan du manuscrit 
1.5 Publications
2 Optimisation d’une fonction modélisée par un processus gaussien 
2.1 Critères d’échantillonnage
2.1.1 Probabilité d’amélioration
2.1.2 Espérance de l’amélioration (critère EI)
2.1.3 Entropie conditionnelle des maximiseurs globaux (critère ECM)
2.1.4 Borne supérieure de confiance (UCB)
2.2 Prise en compte du budget d’évaluations
2.2.1 EI et programmation dynamique
2.2.2 Stratégie optimale à deux pas
2.3 Résumé du chapitre 
3 Approche complètement bayésienne 
3.1 Algorithme EGO et fonctions trompeuses
3.1.1 Algorithme EGO
3.1.2 Un exemple de fonction trompeuse
3.2 Approche bayésienne pour l’optimisation par EI
3.2.1 État de l’art
3.2.2 Principe
3.3 Problème de l’intégration 
3.4 Comparaison approche par substitution, approche complètement bayésienne
3.4.1 Optimisation d’une fonction trompeuse
3.4.2 Résultats sur des fonction tests
3.4.3 Paramètres de simulation
3.4.4 Résultats
3.5 Résumé du chapitre
4 Construction d’un algorithme complètement bayésien utilisant une approche Monte-Carlo séquentielle 
4.1 Intégration en θ par méthode de Monte Carlo sequentielle
4.1.1 Principe
4.1.2 Étapes de la mise en œuvre proposée
4.1.3 Algorithme de Metropolis Hastings indépendant
4.2 Stratégies de maximisation du critère EI 
4.3 SMC en (θ, x) : description de l’algorithme 
4.3.1 Construction d’une densité sur le domaine X
4.3.2 Principe de l’algorithme SMC(θ, x)
4.3.3 Étape 1 : Démarginalisation
4.3.4 Étape 2 : Calcul et maximisation du critère EI
4.3.5 Étape 3 : Pondération, réchantillonnage et déplacement
4.3.6 Étape 4 : Choix de la densité instrumentale qn
4.4 Complexité algorithmique
4.5 Illustration et comparaisons
4.6 Résumé du chapitre 
5 Applications 
5.1 Configuration et choix des paramètres
5.2 Exemple 1 : problème d’identification de système dynamique
5.3 Exemple 2 : Optimisation du rendement d’un convertisseur de puissance
5.3.1 Description du convertisseur de puissance étudié
5.3.2 Optimisation en dimension 2
5.3.3 Optimisation en dimension 7
5.4 Étude de performances sur des fonctions de test classiques
5.4.1 Configuration des algorithmes considérés
5.4.2 Fonctions tests et nature des tests
5.4.3 Résultats
6 Conclusions et perspectives 
6.1 Résumé et contributions
6.2 Performances
6.3 Perspectives 
A Processus gaussien
A.1 Calcul de la prédiction par krigeage
A.2 Fonctions de covariance classiques
A.2.1 Covariance exponentielle généralisée
A.2.2 Covariance de Matérn
B Lois de probabilité utiles
B.1 Loi inverse-gamma
B.2 Loi de Student multivariée
B.3 Loi log-normale
C Expressions des fonctions tests
C.1 Branin
C.2 Goldstein & Price
C.3 Camel back
C.4 Shubert
C.5 Hartman 3
C.6 Hartman 6
C.7 Shekel
C.8 Hyper-sphère
D Preuves
D.1 Maximisation de la vraisemblance
D.2 Proposition 1
D.3 Proposition 2
D.3.1 Lemmes préalables et remarque
D.3.2 Démonstration de la proposition
D.4 Lemme 1
D.5 Calcul de la loi a posteriori πn

Rapport PFE, mémoire et thèse PDFTélécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *