Palmiers dans des blocs en essai nutrition
Outils statistiques utilisรฉs
Analyse des spectres par les indices calculรฉs
Il apparaรฎt clairement que certaines zones du spectre peuvent รชtre dรฉcrites en un nombre trรจs rรฉduit de points. Par exemple un seul point suffit pour dรฉcrire le plateau de rรฉflectance dans le proche infra rouge. Au final un spectre apparaรฎt comme une suite de variables trรจs fortement corrรฉlรฉes entre elles. La premiรจre voie dโanalyse consiste ร diminuer le nombre de variables en sรฉlectionnant des paramรจtres dโintรฉrรชt tirรฉs des spectres, dรฉterminรฉs suivant les zones dโintรฉrรชt des spectres ou dรฉcrits dans la littรฉrature.
paramรจtres ont รฉtรฉ extraits oรน calculรฉs sur les spectres.ย indices spectraux ayant fait leurs preuves dans la mise en รฉvidence de dรฉficience minรฉrales chez les vรฉgรฉtaux ont รฉgalement รฉtรฉ calculรฉs.
Deux outils statistiques ont alors รฉtรฉ utilisรฉs :
-La rรฉgression linรฉaire multiple (MLR) pour la prรฉdiction des teneurs minรฉrales ร partir des indices calculรฉs ร partir des spectres de rรฉflectance.
-Lโanalyse factorielle discriminante (AFD) pour la classification des spectres, au moyen des indices calculรฉs, selon diffรฉrents groupes prรฉdรฉterminรฉs.
Analyse des spectres par les valeurs de rรฉflectance
La seconde voie dโanalyse consiste ร utiliser le spectre dans sa totalitรฉ, considรฉrer chaque bande spectrale comme une variable latente. Bien que le spectromรจtre UNISPEC soit conรงu pour mesurer la rรฉflectance entre 303.1 et 1131.4 nm, on remarque sur tous les spectres que le domaine entre 300nm et 480nm ainsi que le domaine entre 900nm et 1131nm sont assez bruitรฉs et prรฉsentent mรชme un signal peu cohรฉrent avec la thรฉorie de la mesure spectrale. Le spectromรจtre UNISPEC a une gamme de sensibilitรฉ trรจs faible dans le bleu donc un rapport spectre/bruit trรจs faible. Le signal rรฉsumรฉ nโest pas significatif dans ce domaine. La fibre optique nโest pas non plu optimale dans ce domaine.
On sรฉlectionne ainsi 130 bandes spectrales entre 480 et 900 nm. Au final un spectre apparaรฎt comme un ensemble de 130 variables corrรฉlรฉes. Deux outils statistiques ont alors รฉtรฉ utilisรฉs :
-La rรฉgression au sens des carrรฉs partiels (Partial Least Square ou PLS) pour la prรฉdiction des teneurs minรฉrales ร partir des spectres de rรฉflectance.
-La PLS discriminante, une dรฉclinaison de la rรฉgression PLS dรฉdiรฉe ร la classification des spectres selon diffรฉrents groupes prรฉdรฉterminรฉs.
Ces deux mรฉthodes sont assez distinctes mais convergent en objectif : dรฉterminer le plus prรฉcisรฉment possible si un palmier est ou non dรฉficient est une premiรจre รฉtape dans lโestimation de lโรฉtat physiologique des palmiers ร huile. Lโรฉtude des spectres par rรฉgression PLS est une technique rรฉcente prรฉsentant lโavantage dโรชtre rapide et efficace. Elle se base sur lโensemble du spectre de rรฉflectance et dรฉtermine les combinaisons linรฉaires de longueur dโonde les plus efficaces pour estimer les teneurs foliaires ou discriminer les spectres selon leur appartenance a des classes prรฉรฉtablies (palmiers sain, palmiers dรฉficients en azote, etc.)
La Stepwise : procรฉdure pas ร pas
Dans cette รฉtude nous sommes confrontรฉs ร un trรจs grand nombre de variables prรฉdictives (47 variables pour lโรฉtude basรฉe sur les indices et 130 pour lโรฉtude basรฉe sur les spectres). Dans les deux cas ces variables sont toutes plus ou moins corrรฉlรฉes si bien que lโรฉtablissement de modรจles prรฉdictifs ร partir de toutes ces variables prรฉsente le risque de sur apprentissage des modรจles รฉtablis. Il est donc nรฉcessaire de sรฉlectionner les variables les plus significatives pour รฉtablir les modรจles.
La procรฉdure STEPWISE programmรฉe sous Matlab permet, avant mรชme de dรฉfinir la fonction discriminante, de sรฉlectionner les paramรจtres les plus efficaces pour former la variable discriminante.
La premiรจre รฉtape consiste en une sรฉlection ascendante : toutes les variables sont incluses dans le modรจle et les paramรจtres de rรฉgression partielle sont calculรฉs. Les variables sont ajoutรฉes une ร une, en commenรงant par la plus significative.
A chaque variable ajoutรฉe une procรฉdure de sรฉlection descendante est rรฉalisรฉe pour voir si lโune des variables incluses jusque lร nโest plus significative (seconde รฉtape). Si une ou plusieurs variables ne sont pas significatives, la moins significative est retirรฉe du modรจle et les paramรจtres de rรฉgression sont recalculรฉs.
Ces deux รฉtapes sont rรฉpรฉtรฉes ainsi de suite jusqu’ร ce que toutes les variables restantes soient significatives
La validation croisรฉe
La base de donnรฉes comporte un nombre important de variables comparativement au nombre dโindividus. La validation croisรฉe est une procรฉdure d’estimation de l’erreur rรฉelle d’un modรจle qui permet de se passer d’un ensemble test. La validation croisรฉe est souvent utilisรฉe lorsqu’on ne dispose pas de suffisamment d’exemples pour valider un modรจle.
Procรฉdure :
Lโรฉchantillon est divisรฉ en m parties รฉgales disjointes de n/m observations. Lโapprentissage du modรจle, le calcul de la rรจgle dโaffectation (AFD) est rรฉalisรฉ sur un รฉchantillon formรฉ de m-1 parties. Le test donnant le taux dโerreur est rรฉalisรฉ sur la partie restante. Lโopรฉration est alors rรฉpรฉtรฉe m fois et on calcule le taux dโerreur moyen et variabilitรฉ.
Par exemple : sur un รฉchantillon de 50 palmes, la procรฉdure retire la premiรจre et รฉtablit un modรจle avec les 49 autres. La premiรจre palme retirรฉe est testรฉe sur le modรจle. On applique cette procรฉdure pour chaque feuille. Le taux dโerreur moyen (erreur de validation croisรฉe) est calculรฉ ร partir des erreurs calculรฉes pour chacune des feuilles.
La rรฉgression linรฉaire multiple (MLR)
La MLR est une mรฉthode trรจs classique visant ร prรฉdire une variable Y appelรฉe variable rรฉponse au moyen de X variables explicatives. La MLR va nous servir ร รฉtablir des modรจles permettant de prรฉdire les concentrations foliaires en azote, phosphore, potassium, magnรฉsium et fer, au moyen des 50 indices extraits des spectres.
|
Table des matiรจres
Rรฉsumรฉย
Abstractย
Remerciements
Sommaireย
Introductionย
Partie I : Contexte
1.1. Prรฉsentation du cadre dโรฉtudeย
1.1.1. La structure dโaccueil
1.1.2. Problรฉmatique scientifique
1.1.3. Les sites dโรฉtude en Indonรฉsie
1.2. Prรฉsentation du palmier ร huile cultivรฉ
1.2.1 Une culture tropicale devenue industrielle
1.2.2. Morphologie, biologie et culture du palmier
1.2.3. Une surfertilisation engendrant des problรจmes de pollution
1.2.4. Problรฉmatique agricole
1.3. La tรฉlรฉdรฉtection au service de lโagricultureย
1.3.1. Agriculture de prรฉcision et gรฉomatique agricole
1.3.2. La tรฉlรฉdรฉtection en agriculture
1.3.3. Problรฉmatique gรฉomatique
Partie II : Cadre expรฉrimental
2.1. La mesure spectroradiomรฉtrique
2.1.1. Thรฉorie physique
2.1.2. Le spectroradiomรจtre
2.2. Donnรฉes agronomiques : les stress nutritifs du palmier
2.2.1. Les dรฉficiences en macro รฉlรฉments
2.2.1.1. Dรฉficience en azote
2.2.1.2. Dรฉficience en phosphore
2.2.1.3. Dรฉficience en potassium
2.2.1.4. Dรฉficience en magnรฉsium
2.2.1.5. Balance potassium, magnรฉsium
2.2.1.6. Autres macro รฉlรฉments
2.2.2. Les dรฉficiences en oligo-รฉlรฉments
2.2.2.1. Dรฉficience en fer
2.2.2.2. Dรฉficience en bore
2.2.2.3. Autres oligo-รฉlรฉments
2.3. Choix du matรฉriel vรฉgรฉtal
2.3.1. Palmiers dans des blocs en essai nutrition
2.3.2. Palmiers ayant des dรฉficiences visibles
2.4. Etablissement dโun protocole de mesure
2.4.1. Contraintes de terrain
2.4.2. Choix des feuilles
LANORE Mathieu – 6 – 2005/2006
2.4.3. Choix des folioles
2.4.4. Mise en รฉvidence dโune hรฉtรฉrogรฉnรฉitรฉ
2.4.5. Protocole de mesure
Partie III : Interprรฉtation des rรฉsultats
3.1. Interprรฉtation des teneurs foliaires
3.1.1. Teneurs en azote
3.1.2. Le phosphore
3.1.3. Autres รฉlรฉments
3.1.4. Mise en รฉvidence de dรฉsรฉquilibres nutritifs
3.2. Traitement des donnรฉes spectrales
3.2.1. Analyse visuelle des spectres
3.2.1.1. Dans le visible (400 nm ร 700 nm)
3.2.1.2. Dans le proche infra rouge (700 ร 1150 nm)
3.2.2. Paramรจtres extraits des spectres
3.2.2. Indices sรฉlectionnรฉs dans la littรฉrature
3.2.3. Justification du choix de ces indices
3.3. Outils statistiques utilisรฉs
3.3.1. Analyse des spectres par les indices calculรฉ
3.3.2. Analyse des spectres par les valeurs de rรฉflectance
3.3.3. La Stepwise : procรฉdure pas ร pas
3.3.4. La validation croisรฉe
3.3.5. La rรฉgression linรฉaire multiple (MLR)
3.3.6. Lโanalyse factorielle discriminante
3.3.7. La rรฉgression PLS
3.3.8. La PLS discriminante
Partie IV : Rรฉsultats et discussion
4.1. Prรฉdiction des teneurs foliaires en รฉlรฉments nutritifsย
4.1.1. Prรฉdiction au moyen de la moyenne par palme
4.1.2. Prรฉdiction au moyen de la foliole 55
4.2. Discrimination suivant les analyses foliairesย
4.2.1. Groupes de dรฉficiences basรฉs sur les analyses foliaires
4.2.2. Groupes de dรฉficiences basรฉs sur le CND
4.3. Discrimination suivant les symptรดmes visibles de dรฉficiencesย
4.3.1. La feuille de rang 5
4.3.2. La feuille de rang feuille 9 62
4.3.3. Les feuilles de milieu de couronne de rang 13 et 17
4.3.4. Bilan sur les dรฉficiences visibles
Conclusion et perspectives
Rรฉfรฉrences bibliographiquesย
Liste des figures
Liste des tableauxย
Annexes
Tรฉlรฉcharger le rapport complet