Bases de données en langage de requête structurée (SQL)

Bases de données en langage de requête structurée (SQL)

Le Monde.fr

Le Monde est un journal français qui a publié une enquête réalisée en 2017 permettant de recenser des articles mensongers diffusés sur les réseaux sociaux (Sénécat, Les premiers diffuseurs de fausses informations sont souvent des pages Facebook douteuses, 2017). LeMonde a une équipe qu’il nomme « Les Décodeurs ». Cette équipe a, pendant toute l’année (2017), recenser presque 5000 liens redirigeant vers une fausse nouvelle. À la fin de l’année, il y avait 2865 liens redirigeant sur le réseau social Facebook, et environ 2000 liens vers divers réseaux sociaux comme Twitter ou Youtube (LeMonde, 2017). Les Décodeurs ont procédé à la récupération de ces données fausses en les compilant, en expliquant en quoi l’information était fausse et finalement en publiant une rectification, un démenti dans le but de rétablir les faits. L’équipe des Décodeurs a mis à disposition gratuitement sa base de données, et il est donc possible de la télécharger à condition d’en mentionner la source.

Méthodologie

Avant de nous lancer dans le développement, nous devons faire quelques choix technologiques. Il est important de pouvoir comparer toutes nos possibilités avant de développer. . Réseau social Le but de notre travail est de visualiser la propagation des fausses nouvelles diffusées sur les réseaux sociaux. Nous devons donc choisir un réseau social qui nous permettra de télécharger ses données que nous pourrons afficher sur notre plateforme de visualisation. Nous avons sélectionné deux réseaux sociaux les plus connus afin d’examiner leurs interfaces de programmation d’application (API). Une API permet de rendre accessible publiquement des données que nous souhaitons partager.  Twitter Twitter a une multitude d’API permettant de récupérer toutes sortes d’informations. L’avantage est que Twitter ne limite pas ses API à une application que nous aurions créée, comme c’est le cas pour Facebook. Sur son site internet, Twitter met en avant le fait de pouvoir analyser l’audience, la conjoncture du marché, les tendances, les sujets à la mode et les dernières nouvelles/informations. Twitter propose des API qui permettent par exemple de filtrer les tweets à l’aide de mots-clés proposés par Twitter, de chercher des tweets qui correspondent à ce que nous désirons ou encore de trouver les tendances qui sont propres à une région (Evaluate Twitter data to inform business decisions., s.d.). Facebook Les données auxquelles nous pouvons accéder sont plus nombreuses que sur Twitter. Le réseau social a même mis en place un simulateur qui renvoie les requêtes que nous lui envoyons. Voici un exemple de tous les champs que nous avons pu récupérer de notre utilisateur : Beaucoup de champs sont grisés car nous n’avons pas donné l’autorisation à l’application de pouvoir récupérer ces informations. Grâce à ces API qui permettent de faire des statistiques, les créateurs de contenu peuvent mieux orienter leur offre pour attirer davantage d’utilisateurs. Malheureusement, les API de Facebook permettent uniquement de récupérer les données des utilisateurs qui ont recours à un service de Facebook (comme un jeu ou un système de login). Nous ne pouvons donc pas utiliser leurs API pour récupérer du contenu publié sur Facebook. Après avoir étudié les possibilités de récupérer du contenu de ces réseaux sociaux, nous nous sommes vus contraints d’utiliser le réseau social Twitter. En effet, en le choisissant, nous pourrons récupérer une partie de ses données afin de les afficher sur notre plateforme.

Reputatio Lab

Ce blog publie régulièrement des articles en français sur l’actualité. Nicolas Vanderbiest, se basant sur un article qu’il avait écrit et publié avec avec Camille Alloing dans une revue, s’est penché sur l’analyse de la circulation des fausses informations. Pour son analyse, Nicolas Vanderbiest a téléchargé 23’323 messages provenant du réseau social Twitter (tweets, retweets, réponses) concernant les attentats qui s’étaient produits à Nice. Dans son article, il met en évidence les types de profils les plus enclins à partager les informations. Selon lui, la « fausse information est partagée par les jeunes et des écosystèmes éloignés des médias traditionnels et des institutions » (Vanderbiest, 2019). L’auteur a dressé un tableau comparant différents profils type d’utilisateurs : En regardant le tableau comparatif ci-dessus, nous constatons que la génération Y/X (âgée de 15 à 25 ans d’après l’auteur) a effectivement partagé davantage la fausse information. Dans son article, Nicolas Vanderbiest a également créé une carte qui montre la localisation des utilisateurs qui partagent les nouvelles : Il est intéressant d’observer sur la carte ci-dessus que la majorité des utilisateurs qui ont propagé de fausses nouvelles ne se trouvaient pas à Nice, lieu de l’attentat. 1.2.2. Fernando Flores García Fernando Flores García a rédigé un travail en anglais pour son Master en intelligence artificielle à l’Université d’Amsterdam. Son travail a consisté à analyser et visualiser la propagation de nouvelles à travers les réseaux sociaux. Pour obtenir les données, l’auteur a utilisé le réseau social Twitter. Il a sauvé la localisation de chaque message original ainsi que celle des retweets, et ce, afin d’avoir un graphique spatial. Ci-dessous le résultat cartographié qu’il a inséré dans son travail : Dans son travail de recherche, Fernando Flores García précise que, comme les utilisateurs n’activent pas toujours leur géolocalisation quand ils postent un message, il utilise un outil permettant de retourner les coordonnées géographiques d’une ville (García, 2015). En se basant sur un modèle de diffusion d’informations, Fernando Flores García énumère trois variables qu’il a retenues pour son analyse : • La vitesse • L’échelle • La portée La vitesse définit la rapidité à laquelle l’information atteint une personne. Ensuite, nous avons l’échelle qui est le nombre de cibles atteintes par le message original. La dernière dimension, la portée, est la profondeur que va atteindre l’information. Un point intéressant mentionné dans le travail de Flores García est la rapidité. En effet, il dit que la rapidité à laquelle la nouvelle se répand détermine le succès de celle-ci. Si la nouvelle attire l’attention par son message, ou que c’est une grande entreprise qui publie cette nouvelle, celle-ci sera considérée comme une information sûre et sera diffusée plus rapidement que les autres. Selon Flores García, une information peut avoir différentes qualités dont des liens vers une source qui lui donne une certaine crédibilité, une police de texte différente qui la distingue des autres ou encore le fait de mentionner une personne qui lui donnera du poids. À noter aussi que la rapidité de propagation dépendra aussi de ce que l’utilisateur a l’habitude de publier, ses thèmes de prédilection comme la politique ou l’écologie.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Liste des tableaux
Liste des figures
Liste des abréviations
Introduction
1. Contexte et état de l’art
1.1. Présentation du problème
1.2. Travaux similaires
1.2.1. Reputatio Lab
1.2.2. Fernando Flores García
1.2.3. SocialFlow
1.2.4. Synthèse des travaux
1.3. Jeux de données
1.3.1. Le Gorafi
1.3.2. NordPresse
1.3.3. LeMonde.fr
1.3.4. Synthèse des jeux de données
1.4. Plateformes similaires
1.4.1. Hoaxbuster
1.4.2. HOAXY
1.4.3. Synthèse des plateformes existantes
2. Méthodologie
2.1. Réseau social
2.1.1. Twitter
2.1.2. Facebook
2.2. Jeu de données en français
2.3. Twitter API
2.3.1. Jargon Twitter
2.3.1.1. Tweet
2.3.1.2. Friend
2.3.1.3. Timeline
2.3.1.4. Follower
2.3.1.5. Retweet
2.3.1.6. Retweeter
2.3.1.7. Bio
2.3.2. Compte développeur
2.3.3. API
2.3.3.1. GET statuses/show/:id
2.3.3.2. GET statuses/retweets/:id
2.3.3.3. Get followers/ids
2.3.3.4. Get statuses/user_timeline
2.4. Bases de données
2.4.1. Bases de données en langage de requête structurée (SQL)
2.4.1.1. MySQL
2.4.1.2. PostgreSQL
2.4.1.3. MariaDB
2.4.2. Bases de données orientées document
2.4.2.1. MongoDB
2.4.2.2. CouchDB
2.4.3. Tableau comparatif
2.5. Outils de développement
2.5.1. Laravel
2.5.2. Node.js
2.5.3. Django
2.5.4. Tableau comparatif
2.6. Outils de visualisation des données disponibles
2.6.1. D3.js
2.6.2. Cytoscape.js
2.6.3. Chart.js
2.6.4. Plotly.js
2.6.5. Vis.js
2.6.6. Synthèse des outils
2.7. Choix finaux
3. Développement
3.1. Diagrammes de classe
3.2. Collection des données
3.3. Création d’une base de données
3.4. Implémentation
3.4.1. Package.json
3.4.1.1. Embedded JavaScript templates (ejs
3.4.1.2. Express
3.4.1.3. Mysql
3.4.1.4. Nodemon
3.4.2. Classe principale
3.4.3. Contrôleurs
3.5. Proposition d’interface
3.6. Champ de recherche
3.6.1. Requêtes SQL
3.6.2. Librairie
3.7. Tweet sélectionné
3.8. Statistiques
3.9. Graphique chronologique
3.10. Graphique géographique
4. Analyses des résultats
4.1. Analyse quantitative
4.2. Analyse qualitative
4.3. Limitations des résultats
5. Gestion du projet
5.1. Planification
5.2. Respect des délais
5.3. Logiciels utilisés
6. Bilan
Conclusion
Références
Annexe I
Annexe II
Déclaration de l’auteur

Rapport PFE, mémoire et thèse PDFTélécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *