Palmiers dans des blocs en essai nutrition
Outils statistiques utilisés
Analyse des spectres par les indices calculés
Il apparaît clairement que certaines zones du spectre peuvent être décrites en un nombre très réduit de points. Par exemple un seul point suffit pour décrire le plateau de réflectance dans le proche infra rouge. Au final un spectre apparaît comme une suite de variables très fortement corrélées entre elles. La première voie d’analyse consiste à diminuer le nombre de variables en sélectionnant des paramètres d’intérêt tirés des spectres, déterminés suivant les zones d’intérêt des spectres ou décrits dans la littérature.
paramètres ont été extraits où calculés sur les spectres. indices spectraux ayant fait leurs preuves dans la mise en évidence de déficience minérales chez les végétaux ont également été calculés.
Deux outils statistiques ont alors été utilisés :
-La régression linéaire multiple (MLR) pour la prédiction des teneurs minérales à partir des indices calculés à partir des spectres de réflectance.
-L’analyse factorielle discriminante (AFD) pour la classification des spectres, au moyen des indices calculés, selon différents groupes prédéterminés.
Analyse des spectres par les valeurs de réflectance
La seconde voie d’analyse consiste à utiliser le spectre dans sa totalité, considérer chaque bande spectrale comme une variable latente. Bien que le spectromètre UNISPEC soit conçu pour mesurer la réflectance entre 303.1 et 1131.4 nm, on remarque sur tous les spectres que le domaine entre 300nm et 480nm ainsi que le domaine entre 900nm et 1131nm sont assez bruités et présentent même un signal peu cohérent avec la théorie de la mesure spectrale. Le spectromètre UNISPEC a une gamme de sensibilité très faible dans le bleu donc un rapport spectre/bruit très faible. Le signal résumé n’est pas significatif dans ce domaine. La fibre optique n’est pas non plu optimale dans ce domaine.
On sélectionne ainsi 130 bandes spectrales entre 480 et 900 nm. Au final un spectre apparaît comme un ensemble de 130 variables corrélées. Deux outils statistiques ont alors été utilisés :
-La régression au sens des carrés partiels (Partial Least Square ou PLS) pour la prédiction des teneurs minérales à partir des spectres de réflectance.
-La PLS discriminante, une déclinaison de la régression PLS dédiée à la classification des spectres selon différents groupes prédéterminés.
Ces deux méthodes sont assez distinctes mais convergent en objectif : déterminer le plus précisément possible si un palmier est ou non déficient est une première étape dans l’estimation de l’état physiologique des palmiers à huile. L’étude des spectres par régression PLS est une technique récente présentant l’avantage d’être rapide et efficace. Elle se base sur l’ensemble du spectre de réflectance et détermine les combinaisons linéaires de longueur d’onde les plus efficaces pour estimer les teneurs foliaires ou discriminer les spectres selon leur appartenance a des classes préétablies (palmiers sain, palmiers déficients en azote, etc.)
La Stepwise : procédure pas à pas
Dans cette étude nous sommes confrontés à un très grand nombre de variables prédictives (47 variables pour l’étude basée sur les indices et 130 pour l’étude basée sur les spectres). Dans les deux cas ces variables sont toutes plus ou moins corrélées si bien que l’établissement de modèles prédictifs à partir de toutes ces variables présente le risque de sur apprentissage des modèles établis. Il est donc nécessaire de sélectionner les variables les plus significatives pour établir les modèles.
La procédure STEPWISE programmée sous Matlab permet, avant même de définir la fonction discriminante, de sélectionner les paramètres les plus efficaces pour former la variable discriminante.
La première étape consiste en une sélection ascendante : toutes les variables sont incluses dans le modèle et les paramètres de régression partielle sont calculés. Les variables sont ajoutées une à une, en commençant par la plus significative.
A chaque variable ajoutée une procédure de sélection descendante est réalisée pour voir si l’une des variables incluses jusque là n’est plus significative (seconde étape). Si une ou plusieurs variables ne sont pas significatives, la moins significative est retirée du modèle et les paramètres de régression sont recalculés.
Ces deux étapes sont répétées ainsi de suite jusqu’à ce que toutes les variables restantes soient significatives
La validation croisée
La base de données comporte un nombre important de variables comparativement au nombre d’individus. La validation croisée est une procédure d’estimation de l’erreur réelle d’un modèle qui permet de se passer d’un ensemble test. La validation croisée est souvent utilisée lorsqu’on ne dispose pas de suffisamment d’exemples pour valider un modèle.
Procédure :
L’échantillon est divisé en m parties égales disjointes de n/m observations. L’apprentissage du modèle, le calcul de la règle d’affectation (AFD) est réalisé sur un échantillon formé de m-1 parties. Le test donnant le taux d’erreur est réalisé sur la partie restante. L’opération est alors répétée m fois et on calcule le taux d’erreur moyen et variabilité.
Par exemple : sur un échantillon de 50 palmes, la procédure retire la première et établit un modèle avec les 49 autres. La première palme retirée est testée sur le modèle. On applique cette procédure pour chaque feuille. Le taux d’erreur moyen (erreur de validation croisée) est calculé à partir des erreurs calculées pour chacune des feuilles.
La régression linéaire multiple (MLR)
La MLR est une méthode très classique visant à prédire une variable Y appelée variable réponse au moyen de X variables explicatives. La MLR va nous servir à établir des modèles permettant de prédire les concentrations foliaires en azote, phosphore, potassium, magnésium et fer, au moyen des 50 indices extraits des spectres.
|
Table des matières
Résumé
Abstract
Remerciements
Sommaire
Introduction
Partie I : Contexte
1.1. Présentation du cadre d’étude
1.1.1. La structure d’accueil
1.1.2. Problématique scientifique
1.1.3. Les sites d’étude en Indonésie
1.2. Présentation du palmier à huile cultivé
1.2.1 Une culture tropicale devenue industrielle
1.2.2. Morphologie, biologie et culture du palmier
1.2.3. Une surfertilisation engendrant des problèmes de pollution
1.2.4. Problématique agricole
1.3. La télédétection au service de l’agriculture
1.3.1. Agriculture de précision et géomatique agricole
1.3.2. La télédétection en agriculture
1.3.3. Problématique géomatique
Partie II : Cadre expérimental
2.1. La mesure spectroradiométrique
2.1.1. Théorie physique
2.1.2. Le spectroradiomètre
2.2. Données agronomiques : les stress nutritifs du palmier
2.2.1. Les déficiences en macro éléments
2.2.1.1. Déficience en azote
2.2.1.2. Déficience en phosphore
2.2.1.3. Déficience en potassium
2.2.1.4. Déficience en magnésium
2.2.1.5. Balance potassium, magnésium
2.2.1.6. Autres macro éléments
2.2.2. Les déficiences en oligo-éléments
2.2.2.1. Déficience en fer
2.2.2.2. Déficience en bore
2.2.2.3. Autres oligo-éléments
2.3. Choix du matériel végétal
2.3.1. Palmiers dans des blocs en essai nutrition
2.3.2. Palmiers ayant des déficiences visibles
2.4. Etablissement d’un protocole de mesure
2.4.1. Contraintes de terrain
2.4.2. Choix des feuilles
LANORE Mathieu – 6 – 2005/2006
2.4.3. Choix des folioles
2.4.4. Mise en évidence d’une hétérogénéité
2.4.5. Protocole de mesure
Partie III : Interprétation des résultats
3.1. Interprétation des teneurs foliaires
3.1.1. Teneurs en azote
3.1.2. Le phosphore
3.1.3. Autres éléments
3.1.4. Mise en évidence de déséquilibres nutritifs
3.2. Traitement des données spectrales
3.2.1. Analyse visuelle des spectres
3.2.1.1. Dans le visible (400 nm à 700 nm)
3.2.1.2. Dans le proche infra rouge (700 à 1150 nm)
3.2.2. Paramètres extraits des spectres
3.2.2. Indices sélectionnés dans la littérature
3.2.3. Justification du choix de ces indices
3.3. Outils statistiques utilisés
3.3.1. Analyse des spectres par les indices calculé
3.3.2. Analyse des spectres par les valeurs de réflectance
3.3.3. La Stepwise : procédure pas à pas
3.3.4. La validation croisée
3.3.5. La régression linéaire multiple (MLR)
3.3.6. L’analyse factorielle discriminante
3.3.7. La régression PLS
3.3.8. La PLS discriminante
Partie IV : Résultats et discussion
4.1. Prédiction des teneurs foliaires en éléments nutritifs
4.1.1. Prédiction au moyen de la moyenne par palme
4.1.2. Prédiction au moyen de la foliole 55
4.2. Discrimination suivant les analyses foliaires
4.2.1. Groupes de déficiences basés sur les analyses foliaires
4.2.2. Groupes de déficiences basés sur le CND
4.3. Discrimination suivant les symptômes visibles de déficiences
4.3.1. La feuille de rang 5
4.3.2. La feuille de rang feuille 9 62
4.3.3. Les feuilles de milieu de couronne de rang 13 et 17
4.3.4. Bilan sur les déficiences visibles
Conclusion et perspectives
Références bibliographiques
Liste des figures
Liste des tableaux
Annexes
Télécharger le rapport complet