Contribution à une agronomie numérique des territoires

Cas d’un corpus construit par des relevés annuels d’OCS : le site d’étude de Chizé

   Dans le cadre de ses recherches sur la biodiversité en relation avec les pratiques agricoles, le Centre d’Études Biologiques de Chizé (CEBC) effectue, chaque année, depuis 1994, deux relevés d’OCS (avril et juin) sur la totalité de son site d’étude. Ces deux relevés annuels permettent de prendre en compte à la fois les cultures précocement récoltées et celles tardivement plantées. Le site d’étude de Chizé s’est progressivement élargi : de 20km2 en 1994 à 200km2 en 1995, puis 320 km2 en 1996 avec une relative stabilisation jusqu’en 2005 suivie par d’autres élargissements à 420 km2 en 2006 et à 430km2 en 2007. Dans ce travail de thèse, nous avons considéré la période de 12 années successives à partir de 1996 (figure 2.3). Lors des relevés d’OCS, les enquêteurs attribuent un code dans une nomenclature de 45 modalités d’OCS dont 40 sont agricoles (figure 2.4). Les frontières des parcelles étant susceptibles de changer chaque année en fonction des choix des agriculteurs, les enquêteurs définissent l’ensemble des parcelles élémentaires (ou micro parcelles) comme étant l’ensemble des polygones constitués par l’union des frontières des parcelles (figure 2.5). La zone d’étude compte environ 20 000 parcelles élémentaires, couvrant une superficie de 430 km2. Les données collectées sont stockées dans un SIG au format vectoriel et constituent une couche d’informations spatio-temporelles où chaque parcelle élémentaire est liée à une succession d’OCS le long de la période d’étude.

Comparaison entre les corpus des deux territoires d’étude

   Le tableau 2.1 dresse une comparaison entre les deux territoires d’étude en mettant l’accent sur leurs caractéristiques contrastées. Dans ces deux cas d’étude, les bases de données spatio-temporelles des OCS sont construites et stockées sous SIG au format vectoriel. Dans le cas des données collectées par des relevés de terrain, les polygones correspondent à des parcelles élémentaires (cf. figure 2.5), alors que pour la base de données construite par traitement d’images satellites, les polygones correspondent à un ensemble de pixels voisins affectés à un même type d’OCS. Le nombre de modalités d’OCS peut aller d’une petite dizaine dans une base de données constituée par traitement d’images satellites à plusieurs dizaines dans une base de données constituée par des relevés de terrain.

Définition d’un HMM

   Les modèles de Markov cachés (HMM) sont issus du domaine de la reconnaissance de la parole (JELINEK, 1976) et de la reconnaissance des formes (BENMILOUD et PIECZYNSKI, 1995). Ils sont devenus des outils pertinents pour l’analyse de données séquentielles comme le génome en bioinformatique (KROGH, 1998) et les successions de cultures en agronomie (LE BER et al., 2006). Un HMM est défini par la donnée d’un ensemble E, et de deux matrices A et B définis comme suit :
– E = {e1, e2,…, eN}, un ensemble fini à N états.
– A est la matrice définissant les probabilités des transitions entre les états du modèle.
– B est la matrice regroupant les distributions des observations bi(·) associées aux états ei. Ces distributions peuvent être paramétriques, non paramétriques ou bien être données par un HMM lorsqu’il s’agit d’un HMM hiérarchique (HHMM) (FINE et al., 1998 ; MARI et LE BER, 2006). La matrice A définit la topologie du graphe des transitions entre états. Elle permet de spécifier quelles sont les transitions autorisées. Les transitions entre les états dépendent, suivant l’ordre n du modèle, de l’état courant et des n états précédents. Dans un HMM d’ordre 1 (HMM1), l’état suivant (ej) dépend uniquement de l’état courant (ei). La matrice de transitions d’un HMM1 est définie sur E 2 par A = (ai j). Dans un HMM d’ordre 2 (HMM2), l’état suivant (ek) dépend de l’état courant (ej) et de l’état précédent (ei). La matrice de transitions (A = (ai jk) ) d’un HMM2 est tridimensionnelle (définie sur E3). Comparés aux HMM1, les HMM2 permettent une meilleure modélisation des phénomènes transitoires (MARI et al., 1997). Contrairement à la chaîne de Markov (CASTELLAZZI et al., 2008) où chaque état est associé à une observation unique (on parle d’états observés), dans un HMM, les observations sont le résultat d’une variable aléatoire caractérisée par la densité bi(·) qui dépend de l’état ei.

Approximation d’un champ de Markov caché par un HMM

Motivation À des échelles régionales, nous considérons que l’espace agricole peut être vu comme une mosaïque de polygones sur lesquelles les OCS se succèdent à un rythme annuel ou pluriannuel. Par analogie avec une image numérique où le niveau de gris constitue l’attribut de chaque pixel, dans notre représentation de l’espace agricole, les parcelles sont des pixels de formes et de tailles irrégulières et les successions d’OCS sont les attributs de ces pixels. Nous faisons l’hypothèse que la succession d’OCS sur une parcelle dépend des successions du voisinage (temporel et spatial) proche définissant un champ de Markov de successions que nous analysons en empruntant et en adaptant des techniques d’analyse propres au traitement d’image. Les champs de Markov cachés sont des outils de fouille de données permettant la classification de données spatialisées assimilables à un champ de Markov. Dans ces modèles, les relations d’interdépendance spatiale sont décrites par un graphe non orienté où la dépendance spatiale ne concerne que les voisins immédiats (propriété markovienne). Les champs de Markov cachés sont depuis longtemps utilisés pour résoudre des problèmes de classification spatiale comme en classification d’images et plus généralement en reconnaissance de formes (BERTHOD et al., 1996). Les champs de Markov cachés sont également utilisés en cartographie vue comme une classification automatique de données spatialisées. À titre d’exemple, AZIZI et al. (2011) utilisent des champs de Markov cachés pour cartographier le risque de maladies rares (AZIZI et al., 2011). Mais en raison de la complexité de leurs algorithmes d’estimation, les champs de Markov cachés sont longtemps restés peu utilisés pour la classification de données spatio-temporelles (ABRIAL et al., 2010).

Recherche des régularités d’évolution de l’assolement

   Ce type d’analyse temporelle a pour objectif de fournir une première vue d’ensemble sur l’OTAA à travers l’assolement global du territoire d’étude et son évolution durant la période d’étude. Cette analyse est fondée sur des observations élémentaires (OCS ou catégories d’OCS) pour lesquelles l’apprentissage du HMM2 permet d’estimer l’évolution des fréquences le long de la période d’étude. Les observations élémentaires sont choisies en fonction des critères présentés au début de ce chapitre (cf. section 3.1.1 page 50). La segmentation temporelle est réalisée avec un HMM2 linéaire (cf. section 2.3.2 page 39) dont le nombre d’états dépend du nombre de segments temporels recherchés. Les états sont initialisés avec des distributions uniformes des observations élémentaires (états équiprobables). Si le HMM2 est défini avec un seul état,le résultat de la fouille est l’assolement moyenné sur la période d’étude (cf. p.ex. tableau 3.1 page 50). Si le nombre d’états du HMM2 est égal au nombre d’années de la période d’étude, le résultat obtenu est l’évolution de l’assolement du territoire d’étude qui permet de repérer d’éventuelles dates de « ruptures » correspondant à des modifications de l’assolement. Pour analyser ces modifications d’assolement, un moyen de procéder consiste à segmenter la période d’étude en plusieurs sous-périodes, et analyser les régularités correspondant à des sous-périodes encadrant une date de rupture. Nous avons mis au point une méthode pour définir le nombre minimum d’états du HMM2 linéaire permettant de segmenter la période d’étude en sous-périodes disjointes (figure 3.4). Cette méthode consiste à tester des HMM2 linéaires ayant un nombre croissant d’états et de choisir le modèle qui permet la segmentation la plus satisfaisante de la période d’étude. Pour les deux territoires d’étude, nous avons identifié des dates de rupture après lesquelles l’assolement connaît des modifications sur plusieurs années (figure 3.3). Pour analyser ces modifications d’assolement nous avons testé plusieurs longueurs de modèles linéaires. La figure 3.4(a) illustre le choix d’un HMM2 qui segmente la période d’étude en 6 sous-périodes dont deux encadrent des épisodes de sécheresses estivales qui ont influencé le raisonnement des agriculteurs dans le site d’étude de Chizé. Les régularités capturées par les états correspondant à ces deux sous-périodes ont été examinées afin de vérifier, à l’échelle du territoire agricole, la généricité de stratégies identifiées dans un échantillon réduit d’exploitations agricoles enquêtées (cf. chapitre 6 page 130). Un autre exemple illustrant le choix du modèle est donné dans la figure 3.4(b). Le HMM2 sélectionné segmente la période d’étude de manière biunivoque en 6 sous-périodes disjointes. Nous avons utilisé ce modèle pour spatialiser l’évolution de l’assolement dans le bassin versant du Yar (cf. section 3.2.2 page 59 et annexe A page 179).

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Liste des abréviations
Chapitre 1 Introduction et problématique 
1.1 Concepts clés de l’OTAA 
1.2 L’OTAA détermine les enjeux environnementaux en milieu agricole 
1.3 Spécificités de l’OTAA 
1.4 Deux communautés de chercheurs pour un objet commun : le territoire agricole 
1.5 Notre représentation conceptuelle de l’OTAA 
1.6 Contexte de la thèse et question de recherche
1.7 Références
Chapitre 2 Corpus de données spatio-temporelles d’OCS et outils de fouille utilisés 
2.1 Territoires d’étude et corpus de données 
2.2 Fouille de données spatio-temporelles d’OCS par segmentation à l’aide de HMM2 
2.3 Présentation et mise en œuvre d’ARPENTAGE
2.4 Conclusion
2.5 Références
Chapitre 3 Notre méthode de modélisation de l’OTAA avec ARPENTAGE 
3.1 Statistiques sur le corpus de données 
3.2 Segmentation temporo-spatiale
3.3 Fouille des voisinages des OCS et des successions d’OCS 
3.4 Interactions avec les experts
3.5 Conclusion 
3.6 Références
Chapitre 4 Segmentation temporo-spatiale 
4.1 Landscape regularity modelling for environmental challenges in agriculture 
4.2 Segmentation temporo-spatiale des successions de cultures d’un territoire agricole à l’aide de HMM2
4.3 Segmentation temporo-spatiale du bassin versant du Yar fondée sur des occupations du sol télédétectées 

Rapport PFE, mémoire et thèse PDFTélécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *