La segmentation des textes en évènements 

Télécharger le fichier pdf d’un mémoire de fin d’études

Transferts de sédiments en Asie du Sud-Est

Une fois détachées de la matrice du sol, les particules érodées sont redistribuées au sein des bassins versants et transportées vers l’aval par le réseau hydrographique, par le biais d’une succession de phases de transport, dépôt et remobilisation. La géomorphologie, en particulier la pente (Assouline et Ben-Hur, 2006) et la connectivité des versants avec les cours d’eau (Chaplot et Poesen, 2012; Koiter et al., 2013; Smith et al., 2014), conditionnent les déplacements latéraux des sédiments lors des évènements pluvieux. L’intensité et la durée des précipitations contrôlent, quant à elles, l’amplitude de ces déplacements et leur sélectivité granulométrique sur les versants (Assouline et Ben-Hur, 2006; Rienzi et al., 2013; Wei et al., 2014), des volumes d’eau plus importants étant susceptibles d’acquérir des vitesses d’écoulement plus élevées et donc de transporter des particules de plus grande taille. Le transfert des sédiments s’accompagne de celui de la matière organique des agrégats (Tanik et al., 1999; Six et al., 2002), des nutriments associés (Quinton et al., 2010), des polluants éventuels et des micro-organismes (Ribolzi et al., 2008) susceptibles de générer toute une série de problèmes pour les écosystèmes aquatiques et les populations situées à l’aval, notamment via la dégradation de la qualité de l’eau (Ribolzi et al., 2010) susceptible de limiter son utilisation quotidienne et d’engendrer des épidémies, la réduction de la pénétration de la lumière dans la colonne d’eau et son oxygénation, ou l’envasement des barrages (Downing et al., 2008; Thothong et al., 2011).
Compte tenu de ces nombreux impacts, les transferts de sédiments ont été étudiés depuis longtemps, afin de les quantifier et de prendre des mesures pour limiter leur ampleur. Les rivières d’Asie du Sud-Est, caractérisées par des taux d’exportations spécifiques de sédiments parmi les plus élevés de la planète (Figure 1-4; Ludwig et al., 1996; Huang et al., 2012), ont été identifiées depuis plusieurs décennies comme les principales exportatrices de sédiments vers les océans (Degens et al., 1991). En dépit de leur faible surface, les petits bassins versants montagneux (cours d’eau d’ordre 1 à 2 selon Strahler) fournissent une part importante de ces sédiments en raison de leurs forts taux d’exportation (Milliman et Syvitski, 1992). Parmi les taux annuels les plus élevés d’Asie, on trouve ceux qui sont observés à Taïwan, supérieurs à 10 000 Mg km-2 an-1 (Hsu et al., 2014) pour des bassins versants de plusieurs centaines de km2. En comparaison, les plus forts taux d’érosion annuels calculés au Laos par Valentin et al. (2008) et Chaplot et Poesen (2012) sont de l’ordre de 1100 Mg km-2 an-1 sur des surfaces de quelques hectares au maximum et ils diminuent jusqu’à quelques dizaines de Mg km-2 an-1 pour les bassins versants intégrant des surfaces moins sensibles à l’érosion ou moins connectées au réseau hydrographique.
Les problématiques de changements d’échelle sont particulièrement importantes dans l’étude de l’érosion des sols et des transferts de sédiments. En effet, des relations négatives ont été trouvées entre la surface de bassins montagneux d’Asie et d’Océanie (de 200 à 1 000 000 km2) et leurs taux d’exportations spécifiques de sédiments (Figure 1-5; Milliman et Syvitski, 1992).
Figure 1-5 : Corrélations entre la surface des bassins versants montagneux d’Asie et d’Océanie et leurs exportations annuelles de sédiments (à gauche), et leur taux d’exportation spécifique annuel (à droite). Modifié d’après Milliman et Syvitski, (1992).
A plus petite échelle, des évolutions similaires sont observées en passant de l’étude de l’érosion sur des micro-parcelles de 1-m² à des bassins emboités de tailles croissantes jusqu’à une dizaine de km² (Figure 1-6; Chaplot et Poesen, 2012). Cette diminution des coefficients de ruissellement et des taux d’érosion spécifiques avec l’augmentation de la surface drainée est communément appelée « effet d’échelle ». Cette relation peut parfois être absente voire inversée pour diverses raisons liées au contexte local (état de surface, type de couvert, saison, géomorphologie, etc… ; Le Bissonnais et al., 1998). Les changements d’échelle s’accompagnent de changements de processus dominant(s) (hydrologie de versant vs hydrologie fluviale) et soulèvent également des questions concernant l’hétérogénéité des sources de sédiments selon l’échelle considérée (Evrard et al., 2011). Enfin, la sélectivité granulométrique de certains processus (mobilisation préférentielle des particules fines, dépôt des particules les plus grossières lorsque l’énergie de l’écoulement diminue, …) est susceptible d’affecter le caractère conservatif de certaines caractéristiques des sédiments et de compliquer l’identification des sources (e.g., He et Walling, 1996).
Figure 1-6 : Coefficient de ruissellement, taux d’exportation de sédiments et de carbone organique à différentes échelles emboitées dans le bassin de Houay Pano au Laos pour l’année 2002-2003 (Chaplot et Poesen, 2012).

Techniques de traçage des sédiments en rivière : principe, exemples d’utilisations et limites

Afin de déterminer l’origine spatiale des sédiments exportés par les rivières et de contraindre la dynamique temporelle de leur transport à travers les bassins versants, l’utilisation de différentes techniques a été proposée dans la littérature (Walling, 2005, 2013; Davis et Fox, 2009; Koiter et al., 2013; Haddadchi et al., 2014). L’une de ces approches, le traçage ou « fingerprinting », de plus en plus utilisée à travers le monde (cf. la récente revue de Walling, 2013), consiste à mesurer un ensemble de propriétés physico-chimiques dans les sources potentielles de sédiments au sein d’un bassin versant ainsi que dans les particules transportées dans le cours d’eau ou celles qui sont exportées à l’exutoire (Figure 1-7).
Figure 1-7 : Schéma général des différentes étapes de la méthode conventionnelle de traçage des sources de sédiments en rivière (Haddadchi et al., 2013).
Les propriétés analysées peuvent être de différente nature (concentrations élémentaires, rapports isotopiques, concentrations en éléments radioactifs, paramètres magnétiques, paramètres biochimiques… ; voir Figure 1-8) et le choix de ces paramètres est conditionné par un certain nombre de prérequis à leur utilisation en tant que traceurs. La principale caractéristique requise est la conservativité du traceur, de la source jusqu’au sédiment collecté en passant par les multiples phases de dépôt et de remobilisation susceptibles de survenir au cours de son transfert au sein du bassin versant (Koiter et al., 2013). Or, cette hypothèse est souvent difficile à vérifier et constitue toujours un point faible de cette approche (Davis et Fox, 2009).
Figure 1-8 : Propriétés fondamentales des matériaux terrigènes, pouvant être utilisées afin de dater les sédiments ou de tracer leur source (Foster et Lees (2000), reproduit dans Koiter et al., 2013). L’un des processus affectant la conservativité des traceurs est la différence potentielle entre leur répartition granulométrique dans les sols (affinité pour certains minéraux argileux ou pour la fraction fine en raison de sa plus grande surface spécifique, par exemple) et la sélectivité granulométrique des différents processus érosifs (détachement préférentiel des particules fines et de la matière organique, transport plus lointain des particules plus fines vs dépôt rapide des particules plus grossières dès que la vitesse de l’écoulement diminue, etc…). Un autre prérequis, lié à l’échantillonnage cette fois, concerne la représentativité des sources, dont la collecte est toujours partielle et potentiellement biaisée par l’hétérogénéité intrinsèque de certains types de sources. De plus, les techniques de prélèvement des échantillons de sources (e.g. Onda et al., 2014), comme celle des sédiments déposés ou des matières en suspension, doivent être étudiées afin d’identifier et de limiter au maximum les biais méthodologiques. Afin de s’affranchir des problèmes liés à la sélectivité granulométrique, certains chercheurs ont proposé de tamiser systématiquement tous les échantillons de sol et de sédiments à 63 µm (ou même 20 ou 10 µm), afin de s’affranchir de la sélectivité induite par la succession de phases de dépôt et de remise en suspension (Wilkinson et al., 2013). En outre, afin de pallier les problèmes de conservativité de certains traceurs (e.g., Motha et al., 2002), la mise en place systématique de facteurs de correction universels, basés sur la surface spécifique (specific surface area – SSA) ou la teneur en carbone organique (TOC), a été proposée (e.g., Collins et al., 1997, 2001, 2010, 2012). Cependant, de récents travaux ont montré que ces « facteurs de corrections » linéaires peuvent introduire plus de biais qu’ils n’en résolvent, car les relations entre les traceurs et leur SSA (ou TOC) sont souvent logarithmiques (ce qui pose problème pour l’étude de larges gammes de concentrations) et varient d’un site à l’autre (Smith et Blake, 2014).
La technique de « fingerprinting » généralement utilisée nécessite l’emploi d’un modèle statistique de mélange (« unmixing model ») alimenté par les valeurs d’une combinaison de traceurs mesurés à la fois dans les différentes sources et dans les sédiments « mélangés ». Le modèle utilise ensuite des tests de Monte-Carlo (e.g., Gutiérrez-Villanueva et al., 2008; Evrard et al., 2011; Stone et al., 2014) et/ou des algorithmes génétiques (e.g., Haddadchi et al., 2013) pour déterminer la configuration avec le meilleur ajustement (goodness of fit) et le pourcentage de chaque source dans chacun des échantillons de sédiments. Le choix de la combinaison de traceurs (Collins et Walling, 2002) est souvent réalisé à partir de critères statistiques afin de ne conserver que les paramètres les plus discriminants (ceux qui sont statistiquement les plus différents entre les sources). Certaines approches géochimiques présentent ainsi des combinaisons de traceurs dont l’origine et le comportement dans l’environnement ne sont pas forcément bien caractérisés (Koiter et al., 2013). Ces choix « statistiques » qui ne s’appuient parfois sur aucune base physico-chimique (paramètre choisi malgré un manque de connaissance des processus qui contrôlent ses valeurs dans l’environnement) ont été récemment critiqués (Smith et Blake, 2014).
Il apparait donc primordial de privilégier des approches de traçage simples basées sur des traceurs dont les comportements sont relativement bien contraints. Les paragraphes suivants présentent les paramètres de traçage retenus dans le cadre de cette étude et des exemples d’applications issus de la littérature.

Utilisation des retombées de radionucléides émetteurs gamma

Les trois radionucléides émetteurs de rayonnement qui ont été étudiés au cours de ces travaux de thèse sont le béryllium-7, le césium-137 et le plomb-210. Comme ils se fixent aux aérosols de l’atmosphère, ils sont tous les trois apportés à la surface du sol par les retombées sèches et par les précipitations, et ces dernières dominent largement (Caillet et al., 2001; McNeary et Baskaran, 2003; Ritchie et Mchenry, 1990; Wallbrink et Murray, 1994). Une fois au sol, ils s’adsorbent rapidement et presque irréversiblement aux particules (Olsen et al., 1985; Gil-Garcia et al., 2009; Taylor et al., 2012). Leurs origines sont cependant très différentes. Le béryllium-7 (7Be), cosmogénique, est issu de la spallation d’atomes d’azote et d’oxygène dans la haute atmosphère sous l’action du rayonnement cosmique (Lal et al., 1958; Papastefanou et Ioannidou, 1995). Il présente une demi-vie de 53,2 jours. Le plomb-210 (210Pb) est issu de la chaîne de désintégration radioactive de l’uranium-238 du sol. Cette chaîne donne naissance au radon-222, gazeux, qui s’échappe du sol vers l’atmosphère et s’y désintègre (demi-vie : 3,82 jours) en une succession de radionucléides à très courte demi-vie produisant le 210Pb, d’une demi-vie de 22,3 ans (Olsen et al., 1985; Matisoff, 2014). Lorsqu’il se dépose sur les particules de sol, le 210Pb atmosphérique s’ajoute au 210Pb produit localement par la chaîne de désintégration radioactive de l’uranium-238 du sol. Il se retrouve donc « en excès » par rapport à la production en équilibre séculaire avec le matériau-parental, et est noté 210Pbxs. Tout au long de ce manuscrit, c’est le 210Pbxs qui sera étudié dans les échantillons de sol et de sédiments, et non le 210Pb total. Le césium-137 (137Cs), artificiel, a été introduit dans l’environnement par les essais des bombes thermonucléaires (commencés en 1945, avec un pic de production de 137Cs vers 1963; Ritchie et Mchenry, 1990) et les accidents nucléaires comme ceux de Tchernobyl en Ukraine en 1986 et Fukushima-Daiichi au Japon en 2011. Il présente une demi-vie de 30 ans. Contrairement aux retombées de 7Be et de 210Pb qui sont relativement « continues » dans le temps, les apports ponctuels de 137Cs à la surface des sols sont répartis de manière hétérogène à la surface du globe. Dans certaines régions du globe, en l’absence de retombées depuis les années 1970 et suite à l’érosion des particules de sol marquées, les activités en 137Cs des sols de surface sont devenues particulièrement faibles, ce qui limite son utilisation potentielle en tant que traceur (Mabit et al., 2008; Furuichi et Wasson, 2013).
Dans le sol, la distribution de ces radionucléides avec la profondeur diffère d’un radionucléide à l’autre mais aussi selon que le sol est remanié ou non (Figure 1-9).
Figure 1-9 : Exemple de distribution verticale du 7Be, du 210Pbxs et du 137Cs dans des sols non remaniés (A) et cultivés (B) au Maroc (Benmansour et al., 2011). Les barres d’erreur correspondent à 2 d’incertitude.
La majeure partie du 7Be reste concentrée dans le premier cm de sol, même lorsque celui-ci est remanié, en raison de sa courte demi-vie qui limite son accumulation. Cette caractéristique fait de lui un bon marqueur de la surface du sol (e.g., Huh et Su, 2004; Benmansour et al., 2011; Taylor et al., 2012, 2013; Zhang et al., 2013). En outre, dans un contexte climatique caractérisé par une saison sèche de plusieurs mois (comme c’est le cas dans le régime tropical de mousson et de savane; Figure 1-1), on observe une désintégration quasi-complète du stock de 7Be apporté par les pluies de l’année précédente.
Ce processus, permettant une « remise à zéro du compteur », favorise la distinction entre les particules récemment marquées par les retombées en 7Be au début de la saison des pluies et celles qui étaient protégées de ces retombées (parce qu’elles se trouvaient en profondeur ou dans le lit des cours d’eau). Grâce à sa demi-vie plus longue et au fait que les apports atmosphériques soient continus, le s’accumule dans les sols au fur et à mesure des retombées et pénètre plus profondément que le 7Be, jusqu’à 20-30 cm sous la surface (Matisoff, 2014). C’est également le cas du 137Cs, dont les activités les plus fortes sont souvent trouvées à quelques cm de profondeur (e.g., Jagercikova et al., 2014), traduisant, outre la migration verticale du stock (lente), l’érosion préférentielle des particules chargées en 137Cs (notamment la matière organique et la fraction fine pour lesquelles il possède une affinité particulière ; e.g., Li et al., 2006; Xiaojun et al., 2010) à la surface du sol, depuis la fin des retombées. Dans les terres remaniées, comme celles qui sont labourées, le stock de radionucléides se retrouve dispersé et plus ou moins homogénéisé dans la partie affectée du profil de sol (e.g., Porto et al., 2014). L’appauvrissement en radionucléides de la surface des sols cultivés (Figure 1-9) peut également refléter leur vulnérabilité face à l’érosion (Ritchie et McHenry, 1990; Mabit et al., 2008; Alewell et al., 2013; Iurian et al., 2013).
Compte tenu de leurs caractéristiques, ces traceurs ont été utilisés dans de nombreuses études portant sur l’érosion des sols (e.g., Fukuyama et al., 2005; Xiaojun et al., 2010), la redistribution des particules érodées au sein des parcelles (Ritchie et al., 1974; Owens et Walling, 1998; Li et al., 2006; Junge et al., 2010; Gaspar et al., 2013; Lacoste et al., 2014;), leur exportation des bassins versants (Olley et al., 1993, 2012, 2013; Le Cloarec et al., 2007; Evrard et al., 2010, 2013; Ben Slimane et al., 2013; Porto et al., 2014) et leur propagation des têtes de bassin vers les fleuves à travers le réseau hydrographique (Bonniwell et al., 1999; Matisoff et al., 2002; Whiting et al., 2005), ou leur accumulation dans des réservoirs ou des zones de dépôt (Loizeau et al., 1997; Kim et al., 2000; Simms et al., 2008; Zhu et Olsen, 2009; Huon et al., 2013).

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela rapport-gratuit.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

1 Introduction 
1.1 Motivations et objectifs
1.2 Organisation du document
2 Extraction d’information : vue d’ensemble du domaine 
2.1 Extraction d’information
2.2 Le contexte de l’extraction d’information
2.2.1 Contextes d’utilisation
2.2.2 Les types de documents utilis´es
2.3 Les tˆaches en extraction d’information
2.3.1 Pr´esentation des tˆaches
2.3.2 Architecture type
2.4 Approches pour l’extraction d’information
2.4.1 Approches symboliques
2.4.2 Approches statistiques
2.4.2.1 M´ethodes supervis´ees
2.4.2.2 M´ethodes semi-supervis´ees
2.4.2.3 M´ethodes non supervis´ees
2.5 Reconnaissance des entit´es nomm´ees
2.5.1 Pr´esentation du probl`eme
2.5.2 Les approches pour la d´etection des entit´es nomm´ees
2.5.2.1 Utilisation de r`egles
2.5.2.2 Utilisation d’apprentissage statistique
2.6 Cor´ef´erence entre entit´es nomm´ees
2.6.1 Pr´esentation du probl`eme
2.6.2 Les approches pour la r´esolution de cor´ef´erence
2.6.2.1 Utilisation d’approches linguistiques
2.6.2.2 Utilisation d’approches statistiques
2.7 Extraction de relations entre entit´es nomm´ees
2.7.1 Pr´esentation du probl`eme
2.7.2 Les approches pour l’extraction de relations entre entit´es nomm´ees
2.7.2.1 Approches `a base de patrons
2.7.2.2 Approches `a base de classifieurs statistiques
2.8 Construction des templates sur les ´ev´enements
2.8.1 Pr´esentation du probl`eme
2.8.2 Les approches pour la construction de templates
2.9 Notre probl´ematique d’extraction d’information
3 La segmentation des textes en évènements 
3.1 Introduction
3.1.1 Qu’est-ce qu’un ´ev´enement ?
3.1.2 Les informations discursives et les ´ev´enements
3.2 Segmentation des textes et extraction d’information
3.3 La segmentation en ´ev´enements `a partir d’indices temporels
3.4 Mod`ele discursif sous-jacent `a la segmentation ´ev´enementielle
3.5 Mod`eles de segmentation ´ev´enementielle
3.5.1 Une segmentation fond´ee sur les temps verbaux: le mod`ele HMM
3.5.2 ´Elargissement des indices temporels: le mod`ele CRF
3.5.3 Mod`ele MaxEnt
3.5.4 Approches heuristiques
3.6 Pr´e-traitement des documents
3.7 ´Evaluation des m´ethodes de segmentation
3.7.1 Les corpus d’´evaluation
3.7.2 ´Evaluation intrins`eque de la segmentation en ´ev´enements
3.7.3 ´Evaluation de la segmentation pour l’extraction d’information
3.8 Conclusions
4 Le rattachement des entit´es aux ´ev´enements 
4.1 Introduction
4.1.1 Bases de donn´ees et templates
4.1.2 Les relations complexes
4.2 Graphes d’entit´es nomm´ees
4.3 Application du rattachement `a l’extraction des ´ev´enements
4.3.1 Construction du graphe d’entit´es
4.3.2 S´election des entit´es et remplissage des templates
4.4 Application et ´evaluation de l’approche de rattachement
4.4.1 Construction du graphe d’entit´es
4.4.2 S´election des entit´es et remplissage des templates
4.4.3 Impact de la segmentation sur le rattachement
4.4.4 Analyse d’erreurs
4.5 Conclusions
5 Peuplement de bases de connaissances 
5.1 Introduction
5.2 Le peuplement de bases de connaissances
5.3 Lien entre peuplement de KB et question-r´eponse
5.4 Vue d’ensemble de l’approche pour l’extraction de relations
5.4.1 Apprentissage des patrons de relations
5.4.2 Filtrage pour l’apprentissage des patrons de relations
5.4.3 Extraction des relations
5.4.4 Am´elioration par l’utilisation d’un filtrage g´en´erique de relations
5.5 La campagne d’´evaluation TAC-KBP
5.5.1 TAC-KBP 2009 – 2010
5.5.2 TAC-KBP 2011
5.6 ´Evaluation de l’approche dans le cadre de TAC-KBP
5.6.1 Les donn´ees
5.6.2 M´etriques d’´evaluation TAC-KBP 2010
5.6.3 ´Evaluation de l’apprentissage des patrons
5.6.4 ´Evaluation de l’extraction des relations
5.6.4.1 Recherche des phrases candidates
5.6.4.2 Extraction de relations
5.6.5 Vue d’ensemble des r´esultats pour TAC-KBP 2011
5.7 Aper¸cu des syst`emes utilis´es pour TAC-KBP
5.8 Discussion sur les r´esultats de TAC-KBP
5.9 Conclusions
6 Conclusion 
6.1 Bilan des r´esultats
6.2 Analyse de notre contribution
6.3 Perspectives
Liste des publications
References 

Télécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *