Choix des données d’apprentissage et de validation
Le choix des données pour la phase d’apprentissage et pour la phase de validation constitue une étape indispensable pour le développement d’un RNA. Dans la phase d’apprentissage, le RNA s’entraine bien aux données préconisées pour celle-ci, durant laquelle il change ses paramètres (poids et biais) de façon à les ajuster pour que l’erreur de sortie soit minimale c.-à-d. bien approximer la fonction mise en question. Dans la phase de validation, il traite des nouvelles données qui n’ont pas été utilisées dans la phase d’apprentissage et qu’il doit les biens représentés vu la phase d’apprentissage. Il existe alors plusieurs méthodes qui permettent de bien choisir les données pour le traitement. Parmi lesquelles, on note :
Validation simple:
Diviser les données disponibles en deux ensembles (les ensembles d’apprentissage et de validation), sans qu’une donnée ne soit commune (souvent on garde 2/3 des données dans l’ensemble d’apprentissage et 1/3 pour la validation).
Cette méthode n’est justifiable que lorsque le nombre N de données est très important (vis-à-vis de la dimension de l’espace d’entrée et de la complexité de la relation à approximer).
Split-samples:
Réserve un troisième ensemble de données appelé ensemble de test, pour tester le réseau sur des données qui n’ont jamais été utilisées ni pour l’apprentissage ni pour la validation.
Validation croisée:
L’ensemble des données de départ est découpé en k parties de taille égale. Le réseau est entraîné k fois, chaque fois en utilisant k-1 parties pour l’apprentissage et la dernière pour la validation.
Si k est de la taille de l’ensemble de départ, on parle de « leave-one-out » (car chaque apprentissage n’est validé que sur un seul exemple), sinon on parle de « leave-v-out ».
La performance de généralisation du modèle appelée « score de validation croisée », est estimée en réalisant la moyenne quadratique des k erreurs obtenues.
Conclusion:
Plusieurs étapes doivent être franchies afin d’arriver à une estimation utile :
– Trouver un réseau (c.à.d. une famille paramétrique particulière de fonctions) capable d’approximer de manière satisfaisante la fonction à estimer ;
– Trouver un algorithme d’apprentissage (estimation par modification des paramètres) capable d’arriver à une bonne solution, et ayant une complexité non prohibitive ;
– Mener à bien l’apprentissage et évaluer la qualité de la solution obtenue (validation).
Guide du mémoire de fin d’études avec la catégorie chimiométrie et analyse chimique |
Étudiant en université, dans une école supérieur ou d’ingénieur, et que vous cherchez des ressources pédagogiques entièrement gratuites, il est jamais trop tard pour commencer à apprendre et consulter une liste des projets proposées cette année, vous trouverez ici des centaines de rapports pfe spécialement conçu pour vous aider à rédiger votre rapport de stage, vous prouvez les télécharger librement en divers formats (DOC, RAR, PDF).. Tout ce que vous devez faire est de télécharger le pfe et ouvrir le fichier PDF ou DOC. Ce rapport complet, pour aider les autres étudiants dans leurs propres travaux, est classé dans la catégorie sciences et techniques où vous pouvez trouver aussi quelques autres mémoires de fin d’études similaires.
|
Table des matières
INTRODUCTION GENERALE
PARTIE I : SYNTHESE BIBLIOGRAPHIQUE
CHAPITRE 1 : Présentation de l’entreprise
I. INRA (Institut National de Recherche Agronomique)
I.1 Histoire
II. Centre Régional de la Recherche Agronomique (CRRA) de Rabat
II.1 Présentation
II.2 Organisation et axes scientifiques
II.3 Unité de Recherche sur l’Environnement et la Conservation des Ressources Naturelles (URECRN)
CHAPITRE 2 : Généralités sur l’irrigation
II. Différents systèmes d’irrigation adoptés au Maroc
II.1 Irrigation gravitaire ou de surface
II.2 Irrigation goutte à goutte
II.3) Irrigation par aspersion
III. Impact de la qualité chimique des eaux d’irrigation sur le sol et les cultures
III.1) Salinité
III.2) Sodium: Proportion relative des cations sodium (Na+) par rapport aux autres
III.3) Alcalinité et dureté
III.4) Concentration en éléments toxiques
III.5) pH de l’eau d’irrigation
CHAPITRE 3 : Régression linéaire multiple (RLM)
I. Régression Linéaire Simple (RLS)
II. Estimation du modèle par la méthode des moindres carrés ordinaires (MCO)
III. Test de la pente de la droite de régression
IV. Régression linéaire multiple (RLM)
IV.1 Modèle de la RLM
IV.2 Notation matricielle
IV.3 Estimation du modèle par la méthode des moindres carrés ordinaires (MCO)
IV.4 Estimation de la variance des résidus
IV.5 Intervalle de confiance
IV.6 Décomposition de la variabilité
IV.7 Eléments d’évaluation de la qualité du modèle
IV.8 Prévision
CHAPITRE 4 : Théorie des réseaux de neurones artificiels
I. Introduction
II. Historique
III. Domaines d ‘application
IV. Réseau de neurones: fondement biologique
IV.1 Neurone
V. Réseaux de neurones artificiels
V.1 Modélisation
V.2 Différents modèles de RNA
V.3 Méthodes d’apprentissage ou d’entrainement
V.4) Réseau de neurones monocouche : perceptron de Rosenblatt (1958)
V.5 Réseau de neurones multicouche : perceptron multicouches (MultiLayers Perceptron(MLP))
VII .Conclusion
PARTIE II : ETUDE EXPERIMENTALE
CHAPITRE 1: Matériels et méthodes
I. Description de la zone d’étude
I.1) Contextes géographique, climatique et géologique
II. Méthode d’échantillonnage de l’eau
II.1) Choix des sites de prélèvement
II.2) Méthode de prélèvement
III. Analyse des paramètres physico-chimiques de l’eau in situ
III.1 pH de l’eau
III.2 Conductivité électrique (CE)
III.3 Niveau piézométrique
IV. Analyse des paramètres physico-chimiques de l’eau au laboratoire défini
IV.1Dosage du sodium (Na+) et du potassium (K+)
V. Normes et critères utilisées à l’évaluation de la qualité chimique de l’eau d’irrigation
V.1 Risque de Salinité
V.2 Risque d’alcalinité
V.3 Diagramme de classification américain
VI. Logiciel de traitement des données (IBM SPSS Statistics version 20)
CHAPITRE 2 : Résultats et discussion
I. Analyse exploratoire des données
I.1 Statistique descriptive des données
I.2 Analyse de corrélations
II. Application de la RLM
III. Application des RNA
IV. Comparaison entre les résultats de le RLM et des RNA
V.Calcul de sensibilité et de spécificité pour les modèles de SAR et de CE
Conclusion
Télécharger le rapport complet