ANALYSE ET PRETRAITEMENT DU SPECTRE PROCHE INFRAROUGE DU SOL
Problématique
Notre sujet de stage s’inscrit dans le domaine de l’intelligence artificielle plus précisément dans le domaine d’apprentissage automatique. Cette thématique, qui a connu une grande attraction pendant les dernières années représente un domaine d’intérêt pour les différentes équipes au sein de MAScIR. Dans la même thématique, notre projet s’intéressera aux traitements du sol. L’équipe micro électroniques et packaging cherche à fabriquer un dispositif mobile connecté à un serveur distant. Ce dispositif-là sera capable à transmettre des informations sur le sol à analyser tels que :
• Une ou plusieurs images du sol.
• Le spectre proche infrarouge du sol.
• Les coordonnées GPS de l’échantillon à analyser.
Le sol est considéré comme une structure très complexe, même dans le laboratoire les techniciens utilisent plusieurs phases de séparation pour arriver à décortiquer cette structure et donner la valeur de chaque matière chimique. De plus, chaque matière chimique nécessite un traitement spécial pour arriver à donner une valeur exacte. Cette complexité sera notre défi dans ce projet. En fait, prédire ces quantités chimiques à partir de l’image et du spectre proche infrarouge du sol sera une tâche délicate. Vu ces deux sources contiennent plusieurs informations ce qui influencera sur la qualité du modèle estimateur. Le spectre proche infrarouge ou l’image donne des informations sur le sol avec tous ces composants confondus. Autrement dit, pour prédire par exemple la quantité du fer dans le sol en utilisant tout le spectre infrarouge ne donnera pas de résultat exact vu les autres matières chimiques ou le taux du H2O influencerons sur ce résultat. Ce projet du stage s’intéressera à étudier le spectre proche infrarouge et les images du sol pour définir un algorithme capable à extraire les entrées adéquates du modèle d’apprentissage. Cet algorithme sera aussi capable de définir les entrées du modèle pour chaque matière chimique, cette séparation va permettre à notre modèle de maximiser son rendement.
Actuellement, l’analyse du sol se fait dans des laboratoires. Cette analyse donne un bilan sur la quantité de la matière organique et d’autres matières inclus le fer (Fe), Nitrate (NO3), Azote (N) etc. Le bilan de cette analyse donne une idée au fermier sur la fertilité du sol, la quantité et la nature des engrais qu’il doit prévoir. Cependant, cette analyse prend beaucoup du temps (72 heures) et nécessite des ressources financières importantes en plus de déplacement des échantillons du sol et le risque des erreurs humaines. Notre travail consiste à développer un modèle statistique de prédiction de la quantité de la matière organique et les autres minéraux qui existent dans le sol, et cela en étudiant son spectre proche infrarouge et son image capturée. Vu la complexité du sujet et la courte durée de stage, on va essayer dans un premier temps de traiter le spectre proche IR du sol et voir le résultat et après inclure les images. Au cours de ce projet, nous avons utilisés des échantillons des sols collectés des différentes régions du Maroc, cette diversification va nous permettre de bien tester et valider notre modèle. Ces données seront détaillées de plus dans le chapitre 2.
Collecte des données
Le Maroc se place dans la 4e place des terres agricoles les plus attractives en Afrique selon Land Matrix Report [2]. Ce classement n’est pas au hasard vu la richesse et la diversification du sol marocain. Cet avantage pour les fermiers s’agit d’un inconvénient pour les chercheurs. En outre, et pour une recherche plus juste et crédible, il fallait collecter les échantillons du sol de plusieurs régions du Maroc. Commençant par la région de l’oriental vers les régions de Tadla-Azilal en passant la région du Marrakech ce qui donne un total de 203 échantillons collectés (Figure 2). Par suite, ces échantillons sont distribués sur des laboratoires d’analyses à Rabat, Casablanca et Meknès inclut le laboratoire de MAScIR. Ces derniers effectuent les analyses nécessaires sur le sol et rendent un bilan des quantités des éléments chimiques et matières organiques. Le but de ces analyses c’est d’avoir une information a priori sur les quantités exactes et générer une base de données qui sera exploitée au cours de notre travail. L’étape qui suit c’est la prise des images et le spectre proche infrarouge.
Analyse et prétraitement des images
Après la collection des images vient la phase de génération de la BD. Pour cela, nous avons dû à rogner l’imager à partir du centre. Nous avons fixé une résolution de capture des images sur notre appareil photographique à 2848 × 4272, cette dimension qu’y est assez grande ralentira les traitements ultérieurs et surchargera la mémoire vive de notre station de travail. La solution était de choisir le point du centre de l’image et on calcule une distance de 25px dans chaque côté, ce qui donne un carré de taille 50px*50px. Le point du centre est pris sachant que la boîte de pétri est toujours centré dans la phase des captures. (Figure 4). Ce carré de taille 50px*50px est d’une image couleur, donc il s’agit d’une matrice à 3 dimensions. L’opération qui vient juste après l’extraction du carré, c’est la séparation du Rouge, vert, bleu. Donc à partir de la première matrice à 3 dimensions nous aurons 3 matrices à 2 dimensions. En calculant la moyenne par colonne de chaque matrice nous aurons un vecteur de 50 éléments. Une concaténation avec le résultat de la même opération sur les deux matrices nous donne un vecteur de 150 éléments. En appliquant la même démarche sur toutes les images nous aurons une matrice finale de taille 201*150 ce qui constitue notre première base de données qui sera exploitée ultérieurement. La figure 5 représente une partie de notre base de données avec 2 échantillons du sol à titre d’exemple.
Analyse et prétraitement du spectre
L’acquisition du spectre se fait à l’aide d’un spectromètre. Cet appareil émet un faisceau lumineux et calcule le taux d’absorption par longueur d’onde. Chaque spectromètre à ses propres propriétés. Au cours de la collection des données nous avons utilisé un spectromètre propre à MAScIR. Ce dernier balaye sur les différentes longueurs d’onde de 1300nm vers 2600nm dans le domaine infrarouge. Pour chaque échantillon, et pour éviter les erreurs de l’appareil, on effectue 5 mesures (Figure 7), et on calcule leur moyenne qui donne le spectre à prendre en considération. Après l’opération d’acquisition vient la phase de construction de la base de données à base des spectres. Pour chaque échantillon, nous avons 5 mesures. On calcule la moyenne de ces 5 mesures par bande, ce qui nous donne un seul spectre par échantillon. De la même manière sur tous les échantillons pour obtenir à la fin la base de données initiale.
|
Table des matières
INTRODUCTION GENERALE
CHAPITRE I: CONTEXTE GENERAL DU PROJET
INTRODUCTION
I.1 ORGANISME D’ACCUEIL
I.1.1 Présentation de MASCIR
I.1.2 Département Microélectronique et packaging
I.2 PROBLEMATIQUE
I.3 SOLUTION
I.3.1 La charte du projet
I.3.2 Planification du projet
CONCLUSION
CHAPITRE II: ÉTUDE DES DONNEES
INTRODUCTION
II.1 COLLECTE DES DONNEES
II.2 ETUDE DES IMAGES DU SOL
II.2.1 Capture des images
II.2.2 Analyse et prétraitement des images
II.3 ANALYSE ET PRETRAITEMENT DU SPECTRE PROCHE INFRAROUGE DU SOL
II.3.1 Spectroscopie
II.3.2 Analyse et prétraitement du spectre
CONCLUSION
CHAPITRE III: ÉTAT DE L’ART
INTRODUCTION
III.1 LES MACHINES A VECTEUR SUPPORT
III.1.1 Définition
III.1.2 Principe général
III.1.3 Principe du SVM pour la régression
III.1.4 Exemple d’application
III.2 LE PERCEPTRON MULTI COUCHE
III.2.1 Définition
III.2.2 Principe général
III.2.3 Exemple d’application
III.3 LES ALGORITHMES GENETIQUES
III.3.1 Définition
III.3.2 Principe général
III.3.3 Exemple d’application
CONCLUSION
CHAPITRE IV: IMPLEMENTATION ET RESULTATS
INTRODUCTION
IV.1 ENVIRONNEMENT DE TRAVAIL
IV.2 COMPARAISON DES MODELES.
IV.3 APPLICATION DU SVM
IV.4 APPLICATION DU MLP
IV.4.1 Normalisation des données
IV.4.2 Réglage des hyper paramètres
IV.4.3 Résultats
IV.5 APPLICATION DU MLP AVEC FENETRE GLISSANTE
IV.5.1 Définition de la méthode.
IV.5.2 Résultats
IV.6 APPLICATION DU MLP AVEC LES ALGORITHMES GENETIQUES
IV.6.1 Codage
IV.6.2 Génération de la population initiale
IV.6.3 Sélection
IV.6.4 Mutation
IV.6.5 Croisement
IV.6.6 Fonction de fitness
IV.6.7 Reproduction
IV.6.8 Résultats
CONCLUSION
CONCLUSION GENERALE
BIBLIOGRAPHIE
Télécharger le rapport complet