Mesure du débit par les vibrations d’un tuyau
PRÉPARATION DES DONNÉES
Comme spécifié au point 5.4.1.4, l’atténuation du RSSI d’un Access Point est moins significative lorsque l’appareil de mesure se trouve à une distance plus grande de l’origine du signal. De ce fait de nombreux doublons sont présents dans le jeu de mesures, en effet en raison de la précision de la mesure et de la puissance du signal il est courant de constater dans le jeu de mesure des doublons sur le triplet « Mac, SSID, Power » pour une salle de classe donnée. Se pose alors la question de que faire avec ces doublons. Les supprimer ou les garder ? Cependant les doublons donnent un poids à un élément. Par exemple, si on supprime les doublons, un trèfle à quatre feuilles devient autant signifiant qu’un trèfle à trois feuilles, alors que dans la vraie vie, il y a un trèfle à quatre feuilles pour 10’000 trèfles normaux. En se basant sur cette expérience de pensée, les doublons ont été conservés dans le jeu de données. 5.5.2 Suppression des SSID « Outliers » Comme expliqué précédemment, il est important de supprimer les données en provenance d’Access Point non significatif tel que les points d’accès mobile. Pour déterminer si un réseaux Wi-Fi provient d’un téléphone portable, le SSID va être analysé manuellement. Nombre de SSID aberrant : 4 Nombre de SSID utile : 8 Nombre de données aberrantes supprimées : 68 Une fois que les SSID aberrants ont été supprimés, la colonne SSID est supprimée pour ne garder que les valeurs utiles au modèle. 5.5.3 Gestion des données qualitatives Dans le but de permettre aux algorithmes de classification de travailler correctement, il est préférable de les faire travailler avec des nombres et non avec des chaînes de caractères. Etant donné que l’attribut « SSID » a été supprimé, il reste deux attributs de type texte à traiter dans le modèle : ➢ L’adresse MAC. ➢ La salle de classe. Afin de mener à bien cette opération, deux algorithmes sons possibles : ➢ L’encodage de type « Label » qui consiste à donner un identifiant unique pour chaque valeur possible de l’attribut. Le problème de cet algorithme est que les algorithmes de machine learning vont considérer que deux valeurs voisines sont plus semblables que deux valeurs éloignées. ➢ L’encodage de type « One Hot » qui consiste à transformer toutes les valeurs uniques d’un attribut en attribut et lui donner la valeur 1 ou 0 en fonction de s’il caractérise l’élément ou non. Le problème de cet algorithme c’est qu’en fonction du nombre de valeurs uniques d’un attribut, le jeu de données est considérablement alourdi. Maceiras Jérémy 20.09.2018 Page 15 sur 54 Tableau 4 : Exemple de l’encodage « Label » et de l’encodage « One Hot » : Brute Encodage Label Room RSSI Room RSSI A304 -60 0 -60 A203 -55 1 -55 A115b -67 2 -67 Encodage One Hot A304 A203 A115b RSSI 1 0 0 -60 0 1 0 -55 0 0 1 -67 Concernant les attributs qualitatifs du jeu de donnée un encodage « Label » a été préféré : ➢ Pour les salles de classes, car il est utile dans ce cas d’avoir un indice de proximité, car en effet, la salle A115 est semblable à la salle A115b et plus différente de la salle A304. ➢ Pour les adresses MAC, étant donné que160 adresses MAC différentes sont présentes dans le jeu de données, un encodage « One Hot » alourdirait trop le modèle de classification. 5.5.4 Filtre sur le RSSI minimum Comme expliqué au point 5.4.1.4, la faible variation du RSSI sur des grandes distances va ajouter du bruit sur le jeu de données, il est donc nécessaire de filtrer les valeurs qui sont qualifiée d’aberrantes. Le filtre a été effectué sur la valeur médiane du RSSI soit -77 [dBm].
TÂCHE 2 – MESURE DU DÉBIT PAR LES VIBRATIONS D’UN TUYAU
La commune de Bagnes par sa superficie (3ème plus grande de Suisse) dispose d’un réseau d’irrigation important (environ 3’000 cannes d’arrosage), leur récent désir d’avoir une instrumentation de ce réseau pose les bases de ce travail de Bachelor. Installer un débitmètre classique sur chacune des cannes serait trop couteux en appareil (un débitmètre standard coutant dans les 3’000CHF) et en manœuvre. Le but est donc de développer un débitmètre à bas coût en se basant sur les vibrations induites par un fluide sur un tuyau. Le débitmètre doit pouvoir détecter un débit allant jusqu’à 400 [l/min], débit maximum autorisé par la commune aux utilisateurs du réseau. Petit banc de test Dans le but de tester les différents prototypes de manière facilitée, un petit banc de test a été mis en place dans le laboratoire d’hydraulique. Ce banc de test se présente sous la forme d’un long tube en inox (1 pouce de diamètre) où au milieu se trouve un débitmètre électromagnétique qui présente l’avantage de ne perturber ni l’installation, ni l’écoulement de l’eau. Aux deux extrémités du tube, un tuyau d’arrosage est ajouté pour atténuer les perturbations qui pourraient être engendrées par la source ou par la sortie du robinet. La mesure s’effectue à un endroit suffisamment éloigné de l’entrée et de la sortie d’eau pour pouvoir négliger toutes perturbations engendrées par celles-ci (zone en rouge ci-dessus). Ce banc de test, bien que facile de mise en place et d’utilisation a le désavantage de fournir uniquement un petit débit de 0 à 42 [l/min], ce qui est bien éloigné du débit réel attendu sur le terrain. 6.3.2 Grand banc de test Figure 17 : Schéma du grand banc de test. Le laboratoire d’hydraulique de la HES-SO Valais-Wallis dispose d’un banc de test hydraulique 7de plus grande ampleur qui est principalement utilisé pour l’évaluation des performances de turbines ou de pompes. Il est composé d’un circuit en boucle fermée alimenté par trois pompes qui peuvent fournir un débit maximal de 100 m3 /h. Pour ce projet, il est possible de venir brancher une canne d’arrosage sur le circuit pour pouvoir y effectuer les différentes mesures. Bien que ce banc de test puisse fournir un débit suffisant, le pompage de l’eau fournit une perturbation vibratoire importante sur l’installation qui peut compromettre l’emploi du prototype de mesure.
|
Table des matières
1 Motivation
1.1 Un marché en pleine expansion
2 But du projet
2.1 Objectifs du projet
2.1.1 Prise en main de la littérature et des techniques de machine learning
2.1.2 Réalisation d’un prototype pour l’acquisition du débit d’un tuyau
2.1.3 Analyse et préparation des données mesurées
2.1.4 Etude du résultat, précision du système, améliorations possibles.
2.1.5 Comparer une méthode de résolution classique à une résolution par intelligence
artificielle.
3 Planification initiale
4 Outils employés
4.1 Logicielles
4.2 Librairies / API pour Python
5 Tâche 1 – Prise en main des outils de Machine Learning
5.1 Motivation
5.1.1 La classification automatique
5.2 Enoncé du problème
5.3 Obtention des données
5.3.1 Application de mesure
5.3.2 Format des données
5.4 Exploration des données
5.4.1 Caractéristique des variables
5.4.2 Visualisation des données
5.5 Préparation des données
5.5.1 Est-il nécessaire de supprimer les doublons
5.5.2 Suppression des SSID « Outliers »
5.5.3 Gestion des données qualitatives
5.5.4 Filtre sur le RSSI minimum
5.6 Entraînement du modèle
5.6.1 Sélection du jeu d’entraînement et du jeu de test
5.6.2 Sélection des modèles prometteurs
5.7 Validation du modèle
5.7.1 Matrice de confusion
5.8 Conclusion de la tâche
6 Tâche 2 – Mesure du débit par les vibrations d’un tuyau
Maceiras Jérémy 20.09.2018
Page 2 sur
6.1 Motivation
6.2 La physique derrière ce projet
6.3 Bancs de test hydraulique
6.3.1 Petit banc de test
6.3.2 Grand banc de test
6.4 Prototypes de mesure
6.4.1 Premier prototype : « Piézoélectrique
6.4.2 Deuxième prototype « Version 1 »
6.4.3 Deuxième version du logiciel d’acquisition
6.5 Mesures
6.5.1 Script de visualisation
6.5.2 Mesures en laboratoire
6.5.3 Mesures sur le terrain
6.6 Quantification du débit à l’aide d’algorithmes de machine learning
6.6.1 Pourquoi le machine learning ?
6.6.2 Calcul de la performance d’un modèle
6.6.3 Méthodes sans réseau de neurones
6.6.4 Méthode avec réseau de neurones artificiels
6.6.5 Discussion des résultats
6.7 Améliorations possibles
6.8 Conclusion de la tâche
7 Bibliographie
7.1 Machine Learning avec Scikit-Learn
7.2 Deep Learning avec TensorFlow
7.3 Hands-On Data Science and Python Machine Learning
8 Remerciements
9 Conclusion personnelle
10 Table des figure
Télécharger le rapport complet