DÉCOUVERTE DES INTÉRÊTS DES UTILISATEURS DANS LES RÉSEAUX SOCIAUX 

Télécharger le fichier pdf d’un mémoire de fin d’études

Typologie de réseaux sociaux

L’expression réseau social renvoie à un usage social d’internet notamment aux services de réseautage social. Un service de réseautage social est l’ensemble des moyens en ligne mis en œuvre pour relier via des liens hypertextes des profils utilisateurs. Le premier site Web de réseautage social fut Classmates.com créé en 1995. L’objectif de Classmates était d’aider ses inscrits à retrouver leurs amis d’école primaire, collège, lycée, université, anciens collègues et anciens combattants. En 2011, Classmates a changé de nom pour devenir MemoryLane.com. Leur objectif a été recentré sur la proposition de contenus multimédias à forte valeur nos-talgique tels que les archives de magazines, films, chansons, etc.
Généralement, les sites de réseautage social sont orientés vers le web 2.0, c’est-à-dire qu’ils permettent à leurs utilisateurs d’être des participants actifs au sein du réseau, et non plus de simples visiteurs de pages statiques. Le profil d’un utilisateur au sein d’un réseau social peut être public, dans ce cas tous les individus reliés ou pas à l’utilisateur cible par un lien quelconque peuvent y accéder en lecture. Par contre, dans le cas d’un profil privé, le contenu n’est lisible que par les individus reliés à l’utilisateur cible par un lien bien précis. La plupart des réseaux sociaux intègrent communément deux types de liens : lien d’amitié et lien de communauté. Plus précisément, le lien d’amitié existe entre deux utilisateurs et indique que les utilisateurs cibles sont des amis, tandis que le lien de communauté existe entre un utilisateur (personne) et un organisme (communauté), et indique que l’utilisateur cible fait partie de la communauté rattachée.
Un réseau social fonctionne de manière récursive. On part d’une personne physique ou morale qui au préalable a déjà créé son profil utilisateur et qui envoie des messages invitant d’autres utilisateurs à se connecter à elle, c’est-à-dire à se lier à elle via un lien dont le type est défini dans l’invitation. Les nouveaux utilisateurs qui se sont alliés peuvent répéter le processus, accroissant le nombre de liens dans le réseau. De proche en proche le contenu et les liens au sein du réseau social se construisent. On distingue plusieurs types de réseaux sociaux, en fonction de leur orientation, ainsi que du type de données partagées par les utilisateurs dans leurs profils. Nous avons par exemple ceux organisés autour des relations d’affaires, c’est le cas de LinkedIn ou de Viadeo, dans lesquels les utilisateurs décrivent leurs parcours professionnels. De manière générale, nous catégorisons les réseaux sociaux en sept grands groupes, à savoir :
1. Les réseaux sociaux dits « généralistes » : ce sont des réseaux de personnes connectées par des relations d’amis, ou de fans pour discuter.
Facebook : Chaque internaute a la possibilité de créer son profil dans lequel il existe une limite sur la taille du réseau d’amis (individus proches ou inconnus) qu’il peut construire. Ce réseau permet de partager : statut, photos, liens et vidéos. Il est également utilisé par certains établissements ou créateurs pour leur promotion grâce aux pages fans accessibles à tous.
Twitter : outil de microblogging (service en ligne de textes courts) qui permet d’envoyer des « tweets » ou messages courts aux internautes (followers) qui suivent chaque compte. Autrement dit, les « followers » d’un compte sont ceux qui y sont abon-nés. Par contre, les « followees » d’un utilisateur sont ses abonnements c’est-à-dire les comptes que ce dernier suit.
MySpace : espace Web personnalisé dans lequel les utilisateurs ont la liberté de présen-ter des informations personnelles et de faire un blog. Ce réseau est notamment connu grâce aux nombreux chanteurs qui ont pris possession de cet espace, sa popularité a baissé ces dernières années.
D’autres moins connus : Beboomer, pour les plus de 45 ans et Cafemom, pour les mamans.
2. Les réseaux dits « de partage » : ce sont des réseaux de personnes qui publient des contenus générés tels que audios, vidéos, photos, etc.
YouTube & Dailymotion : ce sont des sites qui permettent de mettre en ligne et partager des vidéos, ainsi que des audios. On peut y trouver tous types de vidéos politiques, d’humour, de sport, de musique, de cinéma, d’art, etc. Ils proposent aux utilisateurs la possibilité de laisser un commentaire sous chaque vidéo.
Flickr : c’est un site web de partage de photos et de vidéos gratuit, avec certaines fonc-tionnalités payantes. Il est aussi souvent utilisé par des photographes professionnels pour présenter leurs œuvres.
3. Les réseaux sociaux dits « professionnels » : ce sont des réseaux de personnes partageant leur vie professionnelle.
LinkedIn : c’est un réseau social professionnel qui permet à ses utilisateurs de mettre en ligne leur Curriculum Vitae, afin qu’ils soient accessibles aux recruteurs.
Viadeo : il permet d’établir des contacts professionnels, c’est-à-dire faire connaître leurs utilisateurs en publiant leurs Curriculum Vitae et en proposant également des offres d’emploi.
Ziki : il a pour but d’aider les entreprises à trouver les meilleurs prestataires de services pour la réalisation de leurs projets.
InterFrench : c’est un réseau social francophone mondial pour les projets à l’international.
4. Les réseaux dits de « rencontre » : ce sont des réseaux qui permettent de faire des rencontres amoureuses.
Nous avons les réseaux sociaux tels que Meetic, Match.com, Be2, Adoptunmec ou encore Lovinside.
Il existe également des réseaux sociaux dédiés à la communauté gay tels que CiteGay, Cleargay et Ohlalaguys qui lui est européen.
5. Les réseaux dits de « services » : ce sont des réseaux utilisés pour se rendre services entre utilisateurs.
Ma-residence : c’est un lieu d’échange, de services et de discussions entre les voisins.
Copains d’avant et Trombi : permettent de retrouver des anciens camarades de classe. Par contre, RéseauxLycée et Etnoka sont des réseaux pour lycéens et étudiants où il est possible de discuter, organiser des soirées ainsi que partager des cours.
BeGlob : c’est un réseau dédié aux passionnés de voyages, qui permet d’échanger les bons plans, conseils, et expériences.
6. Les réseaux dits de « Politique »
Coolpol : c’est le réseau social du parti socialiste de « toutes celles et de tous ceux qui veulent débattre et agir à gauche! » selon le site. C’est un lieu de discussion ou les sympathisants du parti peuvent échanger. On y retrouve les évènements, débats, partage d’idées, des vidéos, etc. Créateurs de possible : c’est le réseau social de l’UMP lancé en janvier 2010. Il propose des fonctionnalités similaires à Coolpol.
7. Les réseaux dits de « géolocalisation »:
Foursquare et Gowalla : c’est un réseau qui donne la possibilité d’ajouter des amis lorsqu’on se rend dans un endroit précis, ainsi que de signaler sa présence.
Yelp quant à lui son but est de connecter les gens aux meilleurs commerces de prox-imité.

Wikipedia

Wikipedia est un projet d’encyclopédie multilingue, universelle, créé par Jimmy Wales et Larry Sanger le 15 janvier 2001 sous le nom de domaine wikipedia.org. L’encyclopédie est en libre accès, en lecture ainsi qu’en écriture, en d’autres termes, n’importe qui peut y accéder et modifier la quasi-totalité du contenu de ses pages. Tous les rédacteurs des pages Wikipedia sont des bénévoles qui coordonnent leurs travaux au sein d’une communauté collaborative. Le but de Wikipedia est d’offrir un contenu librement réutilisable, objectif et vérifiable. D’après Wikipedia, en 2017, il a été classé comme le sixième site le plus fréquenté au monde et en février 2014, prêt de 500 millions de visiteurs dans le monde l’ont exploré chaque mois.
Il existe plusieurs versions ou éditions de Wikipedia, chacune d’elle dans une langue bien précise. En effet, l’ensemble constitué des pages écrites dans une même langue et des liens existants entre ces pages forment une version de Wikipedia dans cette langue. En 2016, on a compté environ 283 langues parmi lesquelles l’anglais est la principale langue utilisée, qui a toujours conservé cette importance, et avec un nombre de pages qui s’élève à plus de 5 millions.
Une page Wikipedia ou plus simplement page est semi-structurée, c’est-à-dire son con-tenu n’est pas organisé comme dans une base de données, mais comporte néanmoins des métadonnées qui le rend plus facile à traiter par rapport aux données brutes. Chaque page est identifiée par un titre qui donne une idée générale sur son contenu. Ce contenu est généré à partir d’un code appelé wikicode ou wikitexte qui est un langage de balisage léger qui définit la mise en forme de saisies du contenu d’une page Wikipedia . Il existe quatre types de pages Wikipedia : article, désambiguïsation, redirection ou catégorie.
Page article ou encore appelée simplement article. C’est une page dont le contenu décrit un concept ou un sujet bien spécifique tels que des évènements historiques, l’art, des personnes etc. Le titre d’une page de type article désigne le sujet traité dans son contenu. La figure 2.1 est l’entête de l’article ayant pour titre « Paris » dans la Wikipedia française. On constate que les éditeurs de la Wikipedia française ont été majoritairement d’accord sur le fait que le mot « paris » doit être associé à la capitale française. Globalement, si un mot est associé à une page de type article, alors cette page est appelée la page par défaut de ce mot. Par exemple, l’article ayant pour titre « Paris » est la page par défaut du mot « paris ». Cependant, le mot « paris » peut avoir d’autres interprétations, d’où la nécessité d’associer à sa page par défaut une page de désambiguïsation, qui contient toutes ses interprétations possibles.
Figure 2.1: Entête de l’article de la Wikipedia française ayant pour titre Paris.
Page de désambiguïsation. C’est une page dont le titre est une expression ambiguë d’après Wikipedia. De manière générale, une page est ambiguë lorsque les éditeurs de la Wikipedia à laquelle elle appartient, n’ont pas été majoritairement d’accord sur la significa-tion par défaut à associer au titre de cette page. C’est le cas de la page de désambiguïsation de la figure 2.2 associée à l’expression « java » qui est ambiguë car elle peut faire référence entre autres, au langage de programmation Java, à une île en Indonésie, ou encore à un village dans l’état de Virginie aux États-Unis. Le contenu d’une page de désambiguïsation est constitué de toutes les interprétations (homonymes) possibles, qui sont également des pages Wikipedia que peuvent prendre son titre. Quelquefois, certains articles (ayant pour titre title) peuvent être associés à une page de désambiguïsation. Dans ce cas, le titre de la page de désambiguïsation associée est de la forme title(homonymie) dans le cas de la Wikipedia française, title(disambiguation) dans le cas de l’anglaise, etc. Par exemple, la page de désambiguïsation associée à l’article « Paris » sus-cité précédemment, est « Paris (homonymie) ». Cependant, d’autres expressions comme « cryptographie » associée à la page par défaut Cryptographie, ne sont pas ambigües par nature et n’ont donc pas de page de désambiguïsation associée.
Page de redirection ou tout simplement redirection. Ce type de page n’a pas de contenu textuel, il fournit juste un lien vers une page article dont le titre est un alias. En d’autres termes, ce type de page nous redirige vers une page de type article. Le titre d’une page de redirection est un synonyme du titre de la page article vers laquelle elle nous redirige. Par exemple, la page de redirection de titre « Paris (France) » indiquée à la figure 2.3 nous redirige vers la page article ayant pour titre « Paris » de la figure 2.1.
Catégorie. Le titre de ce type de page fait référence à une thématique bien précise par exemple, Sport, Politique, Jeu, etc. De même, le titre d’une page catégorie est préfixé de l’expression « Catégorie: » pour la Wikipedia française, « Category: » pour la Wikipedia anglaise, etc. Chaque page de type article est classée selon sa description dans une ou plusieurs catégories parents, qui sont organisées de manière hiérarchique. En d’autres termes, les catégories sont classées dans d’autres pages catégories ayant une thématique plus large. De proche en proche, on accède à des catégories couvrant des domaines de plus en plus vastes, ce qui constitue donc une arborescence de catégories. Par exemple, l’article https://fr.wikipedia.org/wiki/Football de la Wikipedia française appartient aux catégories ayant pour titre Catégorie:Sport originaire d’Angleterre, Catégorie:Football comme l’indique le schéma 2.4 . En d’autres termes les catégories Catégorie:Football et Catégorie:Sport originaire d’Angleterre sont les catégories directes de l’article Football. On observe que la catégorie Catégorie:Football possède trois catégories parents à savoir Caté-gorie:Sport collectif, Catégorie:Sport olympique, et Catégorie:Sport de ballon. De même, la catégorie Catégorie:Sport originaire d’Angleterre possède une catégorie parent Sport en An-gleterre. Au fur et à mesure qu’on remonte dans l’arbre des catégories Wikipedia on accède à des catégories de plus en plus génériques telles que Sport ou Jeu de ballon.
Type de liens. Les pages d’une même langue sont liées entre elles à travers des liens nommés links. Notamment, les articles ayant pour titre Tour Eiffel et Louvre de la Wikipedia française sont liés par un lien de type link. Par contre les pages appartenant
à deux versions différentes de Wikipedia et traitant le même sujet sont reliées par des liens de type crosslink. Par exemple, l’article Paris de la Wikipedia française est relié à l’article Parigi de la Wikipedia italienne par un lien de type crosslink. Plus clairement, les liens de type crosslink relient deux pages dont le contenu respectif fait référence à un même concept, mais édité dans deux langues différentes. Par ailleurs, les liens de type belongTo existant entre un article et une catégorie, permettent d’identifier les catégories associées à un article. Par contre, les liens de type childOf existant entre deux catégories permettent de mettre en évidence le type de relation existant entre les catégories cibles, c’est-à-dire faire la distinction entre la catégorie la plus spécifique, de celle qui est la plus générique. Sur le schéma 2.4, il existe un lien de type belongTo entre l’article « Football » et les pages catégories « Football » et « Sport originaire d’Angleterre ». De même il existe un lien de type childOf entre la catégorie
Figure 2.3: Page de redirection de la Wikipedia française ayant pour titre Paris (France). « Discipline sportive » et la catégorie « Sport ». La catégorie « Sport » est la catégorie parent.
C’est elle qui est la plus générique par rapport à la catégorie « Discipline sportive ».
Graphe Wikipedia
L’encyclopédie Wikipedia (toutes langues confondues) peut être modélisée comme un graphe orienté W, dont les nœuds sont des pages et les arêtes des liens orientés dont le type est l’un des types indiqués précédemment. Notons pα un nœud ou une page dans la version de Wikipedia dont la langue est α. Plus formellement, W =< V, E > avec V étant l’union des pages (nœuds) de chaque version de Wikipedia c’est-à-dire V = ∪V α. Et E, l’ensemble des arcs tels que le lien (pα1, pβ2 ) relie les nœuds pα1 et pβ2 appartenant respectivement aux versions de la Wikipedia dans les langues α et β. Autrement dit, pα1 ∈ V α et pβ2 ∈ V β avec α 6= β ou α = β.
Pour formaliser les différents types de liens existants entre les nœuds de W, on a défini un ensemble de prédicats. En effet, un prédicat est une fonction qui renvoie une valeurs, vrai ou faux, selon qu’une condition est vérifiée ou pas. Les prédicats définis s’appliquent à deux pages pα1 et pβ2 d’une même version (α = β) ou d’une version différente (α 6= β) de Wikipedia. Pour plus de lisibilité, on note p1 et p2 si α = β. Le prédicat link(p1, p2) avec p1 et p2 deux articles est vrai s’il existe un lien de type link qui part du nœud p1 vers le nœud p2. Et inversement link(p2, p1) est vrai s’il existe un lien de type link qui part du nœud p2 vers le nœud p1. Considérons le graphe de la figure 2.5, dans lequel les nœuds en gris sont des articles, tandis que ceux en violet sont des catégories. Le prédicat link(p4, p1) est vrai, or link(p1, p4) est faux. Quant au prédicat crosslink(pα1, pβ2 ), il est vrai s’il existe un lien de type crosslink entre les nœuds pα1 et pβ2 avec α 6= β. En général, crosslink(pα1, pα2) = crosslink(pβ2 , pβ1 ) car la direction du lien n’a pas d’importance dans ce cas. Ainsi, d’après notre figure 2.5 crosslink(p3, p4) = crosslink(p4, p3) est vrai. Par ailleurs, le prédicat cat(p1, p2) est vrai si et seulement si p1 est une page qui n’est ni une catégorie, ni une redirection, p2 une page de type catégorie et s’il existe un lien de type belongT o entre p1 et p2. Notamment, cat(p1, p9) est vrai, or cat(p15, p1) est faux. Le prédicat childOf(p1, p2) est vrai si et seulement si p1 et p2 sont des pages de type catégorie et s’il existe un lien de type childOf de p1 vers p2. Par exemple, childOf(p9, p11) est vrai, mais childOf(p10, p9) est faux. Et enfin, le prédicat ancestorl(p1, p2) est vrai si et seulement si p1 et p2 sont des pages de type catégories, et la distance du chemin dirigé partant de p1 à p2 en passant uniquement par des liens de type childOf vaut l.
En plus, chaque nœud du graphe W est caractérisé par un ensemble d’attributs ou de mesures qui le distingue des autres, définies comme suit:
• in-neighbors(p1): c’est l’ensemble des liens de type links entrants au nœud p1. On le définit comme suit:
in-neighbors(p1) = {p2 | link(p2, p1) est vrai} (2.1)
D’après la figure 2.5, in-neighbors(p1) = {p4, p7}, et in-neighbors(p7) = {p1, p8, p6}.
• out-neighbors(p1): c’est l’ensemble des liens de type link sortant du nœud p1. Plus formellement il est définit comme suit:
out-neighbors(p1) = {p2 | link(p1, p2) est vrai} (2.2)
De même, sur notre figure 2.5, on a out-neighbors(p1) = {p2, p7}.
• categories(p1): c’est l’ensemble des catégories associées au nœud p1. En d’autres termes ce sont les catégories auxquelles la page de type article ou de desambiguisation p1 appartient. Plus formellement, on le définit comme suit:
categories(p1) = {p2 | cat(p1, p2) est vrai} (2.3)
On a categories(p1) = {p9, p15} et categories(p7) = {p18, p13}.

Wikipedia Link-based Measure

Wikipedia Link-based Measure (WLM) [49] est une mesure de similarité appliquée aux pages Wikipedia, qui utilise essentiellement le graphe Wikipedia constitué uniquement des liens de type link et de tous les nœuds à l’exception des nœuds catégories. Plus précisément, WLM calcule la similarité entre deux articles d’une même version de Wikipedia, qui est représentée par une valeur comprise entre 0 et 1. Plus la valeur est proche de 1, plus les pages sont sémantiquement similaires. Formellement, WLM est la moyenne de deux mesures de similarité inspirées respectivement de la similarité cosinus2 et de la distance de Google normalisée3.
En effet, la similarité cosinus permet de calculer la similarité entre deux vecteurs de n dimensions, en déterminant le cosinus de l’angle entre eux. Deux vecteurs sont dits opposés si leur valeur de similarité cosinus vaut -1. Ils sont dits indépendants ou orthogonaux si elle vaut 0, et similaires si elle vaut 1. Les valeurs intermédiaires permettent d’évaluer le degré de similarité des vecteurs associés. Dans le cas de WLM, on cherche à comparer deux articles Wikipedia p1 et p2, de ce fait chaque article est représenté par un vecteur nommé −−−−→ vecOut dont la taille est fonction du nombre de liens de type link sortant de cet article, −−−−→ c’est-à-dire |vecOut(p1)| = |out-neighbors(p1)|. De manière générale, le vecteur d’un nœud p1 se définit comme suit:
2 https://en.wikipedia.org/wiki/Cosine_similarity
3 https://en.wikipedia.org/wiki/Normalized_Google_distance vecOut(p ) =w= logW
avec pi ∈ out-neighbors(p1), log le logarithme et |W | le nombre de nœuds qui ne sont pas de type catégorie de la version Wikipedia à laquelle appartient le nœud p1 et T la transposée d’une matrice.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

1 INTRODUCTION GÉNÉRALE 
Contexte général
1 Wepingo
2 Motivations et objectifs
3 Contributions de la thèse
4 Plan du manuscrit
2 DÉCOUVERTE DES INTÉRÊTS DES UTILISATEURS DANS LES RÉSEAUX SOCIAUX 
Introduction
1 État de l’art
2 Préliminaires
2.1 Typologie de réseaux sociaux
2.2 Wikipedia
2.3 Wikipedia Link-based Measure
2.4 PageRank
3 Delve: DiscovEr LiVejournal intErests
3.1 Approche proposée
3.2 Expérimentations et évaluations
4 Frisk : Find twitteR InterestS via wiKipedia
4.1 Approche proposée
4.2 Expérimentations et évaluations
Conclusion
3 ANALYSE DES TRAITS DE PERSONNALITÉ DES INDIVIDUS 
Introduction
1 État de l’art
2 Préliminaires
2.1 Modèle des Big5
2.2 Linguistic Inquiry and Word Count
2.3 Receptiviti
3 Ascertain: AnalySis Correlation pERsonality Traits And INterests
3.1 Régression logistique
3.2 Méthodologie
3.3 Expérimentations et analyses
Conclusion
4 RÉCONCILIATION DES PROFILS UTILISATEURS DANS LES RÉSEAUX SOCIAUX 
Introduction
1 État de l’art
2 Préliminaires
2.1 Notations et formalisation
2.2 Description des attributs
3 LIAISON: reconciLIAtion of Individuals profiles across SOcial Networks
3.1 Approche proposée
3.2 Expérimentations et évaluations
Conclusion
5 CONCLUSIONS ET PERSPECTIVES 
Bibliographie 
Annexes 
1 Description des dimensions LIWC
2 Description des dimensions Receptiviti

Télécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *