Analyse
Les ressources documentaires qu’offre l’Internet sont énormes, mais son grand désavantage est que l’information sur les documents n’est pas structurée, c’est à dire qu’aucun document ne recense la totalité des informations émises sur le WEB.
L’utilisateur, comme le dit Marc Verprat9, «se retrouve ainsi confronté à une prolifération de contenus informationnels sans qu’aucune cartographie globale, thésaurus ou sommaire d’ensemble ne soient mis à sa disposition ».
Seuls les outils de recherche, lui permettent d’effectuer une recherche, la préoccupation principale est donc l’efficacité de la recherche et la pertinence de la réponse. Une recherche sur Internet se confronte donc à quatre problèmes majeurs :
La recherche
La recherche est la méthode la plus courante mais elle se heurte aux contraintes du vocabulaire telle que la polysémie -faculté qu’a un mot d’avoir plusieurs sens- et le multilinguisme.
La recherche avec des critères booléens est une méthode qui permet de restreindre le domaine de recherche en incluant ou en excluant des propositions.
Les équations de recherche intègrent plusieurs paramètres qui sont différents suivant les outils de recherche que l’utilisateur doit savoir maîtriser.
Le moteur
Un moteur de recherche est un processus technique qui indexe les pages WEB par rapport à la récurrence des mots dans un texte ou en cherchant dans les méta balises des mots clefs. Mais toutes les pages du WEB ne sont pas référencées, car on ne connaît pas la taille de cet univers, qui croit de façon exponentielle.
Des informations ne sont donc pas référencées, car par exemple il faut 12 jours à Altavista, pour mettre à jour son index et explorer les nouveaux liens.
Les réponses
Les réponses obtenues aux requêtes sur Internet peuvent être de trois ordres :
– Le silence, c’est à dire aucune réponse à la requête.
– Le bruit, c’est à dire un nombre infini de résultats qui rend leur exploitation quasiment nulle.
– La pertinence c’est à dire un nombre fini de résultats correspondant strictement à la requête.
Les sources
Les sources d’information, selon Ismaïl Timimi et Jacques Rouault, sont de trois sortes. Ils les qualifient d’informations blanches, grises et noires ;
L’information blanche étant une information publique, accessible à tout le monde en utilisant des outils « classiques » de recherche d’information. L’information grise est une information sensible d’accès légal, elle ne fait pas l’objet de publicité, pour y accéder, on utilise les techniques avancées de recherche et de traitement de l’information.
L’information noire «fait l’objet d’une haute sécurisation, et y accéder indûment relève de l’espionnage industriel ou scientifique, activités qui sont illégales. Ce genre d’information est très difficile à consulter. »
Les sources sur Internet ne sont pas forcement pertinentes ou fiables car elles ne dépendent d’aucune autorité de contrôle, « pour le néophyte, sur Internet, il est quasiment impossible de bien distinguer l’information fiable du reste », car le concepteur de pages peut donner ou reprendre une information pour la diffuser sans pour cela en contrôler la véracité.
La pertinence du contenu de la page est donc subjective car elle dépend du concepteur.
Une solution pourrait être la création d’un portail Internet c’est à dire d’une interface qui regroupe des ressources documentaires issues d’Internet et qui corresponde le mieux possible au domaine spécifique de la musicologie.
La création d’un portail permettrait de résoudre les problèmes :
– en limitant les recherches aléatoires
– en facilitant l’accès aux néophytes
– en délimitant un champ d’action d’informations pertinentes.
La sélection et la validation des sources permettraient une recherche plus rapide, tant pour les étudiants que pour les enseignants.
L’objectif de la mission sera donc de créer un portail interne, l’interface sera installée sur chaque ordinateur, sa construction permettra son évolution. Il sera conçu afin d’être accessible aux enseignants et étudiants du Département d’Etude Musicale.
LE PORTAIL
Explicitation de la notion de portail
Théories
Le portail désigne la page d’accueil que tout utilisateur d’Internet voit apparaître sur son écran lorsqu’il ouvre son Navigateur pour se connecter au réseau.
Le portail est donc par analogie une page WEB qui «ouvre» sur l’Internet et qui regroupe de façon thématique et ou alphabétique des liens hypertextuels vers des sites.
Le portail est devenu un passage qui permet de regrouper et d’organiser le WEB, il peut être online ou off line. On line quand il ne peut être accessible que par l’intermédiaire d’un serveur et offline quand il est installé sur le disque dur de chaque ordinateur.
Mais qui organise quoi ? Pour qui ? Dans quel but ?
Le portail est désormais l’enjeu commercial d’une bataille féroce, car il apparaît comme le meilleur lieu d’affichage publicitaire et la meilleure vitrine du Net pour les entreprises. Chacun essaie aujourd’hui de concevoir un portail qui soit le plus séduisant possible, pour être sélectionné par le maximum d’utilisateurs.
Mais en ce qui concerne la mission, l’enjeu le plus important, est au-delà de l’aspect économique, c’est l’organisation des connaissances et la validation des informations émises pour permettre la circulation des savoirs et leur appropriation.
Le portail et Internet
L’Internet est un ensemble de réseaux de télécommunications reliés entre eux, autrement dit le réseau des réseaux qui utilisent tous le même langage de communication, le protocole TCP/IP qui relie tous les réseaux, découpe l’information à transmettre en paquets numérotés et ordonnés de façon à ce qu’ils atteignent leur destinataire. Le WEB est le service le plus connu d’Internet qui permet de consulter des millions de documents au format HTML.
L’Internet n’est pas qu’une innovation technologique, l’émergence d’un nouveau médium de télécommunication, c’est aussi une nouvelle pratique culturelle et sociale. Pour ses promoteurs, l’Internet joue un rôle décisif dans l’intensification de la divulgation du savoir, réalisant potentiellement l’utopie d’une « bibliothèque universelle ».
Mais comme le déclare Umberto ECO, lors d’une recherche «je pensais aller dans un site ou il y avait les renseignements (que je cherchais) mais là, il y avait trente hyper mots qui m’ont renvoyé sur un autre site qui concernait tous les actes du concile patristique de la chrétienté et j’ai trouvé un lien qui m’a renvoyé à l’histoire du pape Jean et là, j’ai trouvé un site qui m’a renvoyé à la recherche des dix tribus perdues d’Israël et là il était 2 heures du matin, j’étais fatigué et je me suis rendu compte que j’avais oublié la raison pour laquelle j’étais entré dans le site. »
L’architecture du NET, qui connecte les pages WEB entre elles par des liens hypertextes, peut ne pas permettre à l’utilisateur, d’avoir une navigation structurée, cela dépend de sa culture et de son profil cognitif. L’hypertexte peut s’écrire et se lire de manière non linéaire, alors qu’un document «classique » impose souvent aux lecteurs une lecture ordonnée par la succession de pages. L’hypertexte permet de choisir «son » parcours, mais cette navigation en «surf », liens après liens, peut faire perdre le fil de la recherche initiale.
Ce type de navigation est à la fois enrichissant dans le sens ou l’on peut accéder à des informations intéressantes (information gris) auxquelles on n’aurait pas pensé, mais aussi déstructurant dans le cas d’une recherche «simple » (information blanche) qui n’aboutit pas.
Les signes du portail
Les listes
Une des caractéristique du portail est son image sous forme de liste. Jack Goody décrit la liste comme étant la première étape de classement : « Ranger des mots (ou des «choses ») dans une liste, c’est en soi déjà une façon de classer, de définir un «champ sémantique », puisqu’on inclut certains articles et qu’on en exclut d’autres. De plus, ce rangement place ces articles en ordre hiérarchique en haut de la colonne ceux qui sont «supérieurs », en bas ceux qui sont «inférieurs ». Aux articles ainsi ordonnés on peut affecter des chiffres (des logogrammes représentant des nombres) de manière à les numéroter de i à n tout au long de la liste. » .
Le portail est construit sous forme de liste organisée, comme par exemple le portail Ramdam (disponible en annexe). Ces listes peuvent être de différents types alphabétique, thématique, conceptuelle. Elles permettent différentes appropriations suivant leur usage.
La liste est un élément de classement qui permet d’identifier le portail par un ensemble de données énumérées et hiérarchisées.
Les tableaux
Les tableaux sont d’autres composantes du signe du portail, ils permettent de structurer ce que le concepteur veut mettre en avant mais aussi de s’approprier le contenu. Jack Goody nous présente sa conception du tableau et ses enjeux culturels.
« Ainsi le tableau (…) apparaît comme une méthode graphique d’analyse des concepts et des catégories qui n’est pas sans soulever des problèmes théoriques importants. Un tableau consiste essentiellement en une matrice de Colonnes et de rangées ou bien, sous un autre angle, en une ou plusieurs listes verticales.»
Le tableau est une présentation et une structuration de la liste.
L’image du portail comme tableau est une organisation du contenu informationnel de par sa mise en forme.
Le problème du tableau est son sens de lecture, de haut en bas, ou de droite à gauche.
Ce sens de lecture peut être diffèrent car il dépend de la culture de l’utilisateur. « Ce que j’ai voulu montrer ici, c’est que ce processus de standardisation, qui se résume dans le tableau à n colonnes et x rangées, est essentiellement le résultat de l’application d’une technique graphique à un matériel oral. Cela a souvent pour effet de figer un énoncé solidaire d’un contexte en un système immuable d’oppositions, on peut sans doute ainsi simplifier ce qu’est la réalité pour l’observateur, mais souvent aux dépens d’une véritable compréhension du cadre de référence de l’acteur. Glisser ainsi d’un cadre de références à l’autre et croire qu’avec ces tableaux on atteint la machine qui a découpé le puzzle, c’est prendre notre métaphore pour le mécanisme réel. » .
Les liens
Le signe courant de liens sur Internet est caractérisé par la typographie «souligné ». Sur Internet ce signe prend un autre sens que mettre en évidence ou appuyer un propos, il est pris comme le moyen d’accès à d’autres textes.
Pour Roland Barthes «toute image est polysémique… à un signifiant, une « chaîne flottante » de signifié, dont le lecteur peut choisir certain et ignorer d’autre ».
Ce signe devient donc un élément de la culture de l’Internet, car elle s’approprie le caractère typographique souligné, pour en donner un autre sens.
Le portail comme signe
Le portail est reconnu comme tel de par son image. Cette image du portail est un signe, dans le sens ou il le caractérise comme étant un outil de recherche ayant un certain comportement par rapport aux autres outils de recherche.
Pour Roland Barthes l’image en tant que signe contient «trois messages : un message linguistique, un message iconique codé et un message iconique non-codé ».
Ces messages sont, pour le portail, tout d’abord son nom, car avant même l’apparition de la page on s’attend à un certain environnement de par la dénomination de celui-ci.
Ensuite l’utilisateur reçoit comme message iconique codé, celui du contexte (contexte social, circonstance, …), dans lequel il a trouvé le portail, et enfin le message iconique non codé qui est celui de sa fonction de recherche d’information.
Ces images sont le reflet d’une culture car «le spectateur de l’image reçoit en même temps le message perceptif et le message culturel, »et tous ces messages jouent sur les représentations que l’utilisateur aura lors d’une recherche d’information.
Internet comme ressource documentaire
Comme le déclare Umberto Eco28 «quand je travaille à la campagne et que j’ai besoin d’une citation, la plus rare du monde, je la trouve à 80%. L’Internet est en train de devenir la bibliothèque globale»
L’abondance d’écrits sur Internet permet d’offrir des documents qui sont de plusieurs ordres :
Les hyperdocuments
Jean Pierre Balpe définit l’hyperdocument comme étant un «contenu informatif, informatisé, dont la caractéristique principale est de ne pas être assujetti à une lecture préalablement définie mais de permettre un ensemble plus ou moins complexe, plus ou moins divers, plus ou moins personnalisé de lectures. »
L’hyperdocument fait référence à l’intéraction « homme/connaissance ». Sur Internet les hyperdocuments générant de la connaissance sont nombreux, ils sont souvent issus des milieux scientifiques et de recherches comme par exemple le projet «visible human » , qui permet de visualiser l’intérieur du corps humain en trois dimensions sur Internet.
L’hyperdocument contient du texte mais aussi des images, des graphiques, des vidéos, tous ces différents documents sont connectés par des hyperliens.
La consultation d’un hyperdocument se fait à l’intérieur du document par des liens ou boutons qui déclenchent l’affichage de nouveaux documents multimédias.
Les documents numérisés
Outre les hyperdocuments issus directement de l’Internet, les documents numérisés sont la deuxième source de documents disponibles, ce sont par exemple des oeuvres d’auteur tombé dans le domaine public, ces oeuvres peuvent être des textes, des photos, des vidéos ou de musiques.
La numérisation des documents apparaît comme un prolongement de l’informatisation des ressources documentaires, les capacités de stockage des disques durs augmentant toujours, elle devient une solution de stockage de l’information, par exemples six gigaoctets représentent 12 millions de pages ou 20 000 documents de 100 pages c’est à dire en terme de place : 600 mètres de feuilles recto-verso ou 150 étagères.
Ces documents numérisés sont une ressource documentaire qui peut être à disposition, sur Internet.
Les documents scientifiques
Les publications scientifiques sont rarement rentables pour les éditeurs, certaines publications sont maintenant publiées simplement en ligne, il est important pour les chercheurs d’y avoir accès rapidement sans les rechercher comme les signets, qui sont le stockage dans le navigateur des adresses de pages ou de sites et permet de les atteindre en les sélectionnant, ou les mises à jour immédiates, qui permettent de ne télécharger que les nouveautés d’un site.
La généralisation des écrits scientifiques par Internet remet en cause les publications «papier» qui avant d’être éditées traversaient les filtres des comités de lecture constitués par des «pairs » et qui s’inscrivaient souvent dans un cadre éditorial rigoureux définissant les normes à la fois qualitatives et formelles du texte.
De plus, Internet faciliterait l’évaluation par les pairs, par le biais de la publication en ligne, le risque étant de ne pas se conformer aux exigences de la publication scientifique, et l’échange d’éditions et de rééditions permettraient d’outrepasser ces filtres, de ce fait la validité des écrits scientifiques deviendrait incertaine.
Mais l’avantage de la communication des écrits scientifiques sur Internet serait de permettre de réunir une quantité plus importante d’information et ainsi de confronter plus d’avis (e-mail, colloques en ligne, débats électroniques35 ….) afin d’éviter des erreurs, car même avec les normes des comités de lecture (papier), on peut aboutir à des 36 situations comme l’affaire Sokal.
Les références
La ressource documentaire qu’offre Internet peut aussi s’orienter vers la recherche de référence telle que :
– bibliographique
– discographique
– biographique
– chronologique .
Au-delà des produits documentaires traditionnels, (bases de données, CD ROM,…), la mise à disposition d’un portail permet de regrouper différentes ressources documentaires issues du WEB et de les rendre accessibles à travers cet outil.
Internet la bibliothèque chaotique ?
Quelles techniques pour organiser les sites WEB ?
Faut-il les classer, ou les laisser «en vrac » et s’en remettre aux moteurs de recherche ?
Faut-il indexer toutes les formes de documents et d’informations ?
Amélioration technique ?
L’indexation automatique des pages et l’utilité des moteurs de recherche est incontestable vu le nombre de documents que draine Internet, estimé à 320 millions de pages en 1998 et en croissance exponentielle, une indexation humaine serait plus pertinente mais impossible à réaliser.
L’indexation automatique se perfectionne de plus en plus en tenant compte des problèmes linguistiques, mais cela reste insuffisant, car que faire avec un moteur de recherche qui répond avoir repéré 500 000 documents pertinents, voir plus, à une requête ? Est-ce utilisable ?
Le portail
Le portail est une manière d’organiser le WEB en regroupant, souvent de façon thématique, et en répondant à un besoin spécifique d’organisation.
Il est un élément de première appropriation qui permet d’aller plus loin dans l’exploration du NET.
La mise en place de portails constitue autant de points de repères où l’usager peut s’orienter, il parcourt des corpus sélectionnés volontairement et il choisit les adresses de sites en fonction de sa recherche.
On voit donc la naissance de milliers de portails dédiés à tel ou tel thème qui permettent donc une organisation de connaissance sur le WEB. Pour Umberto ECO, l’Internet «est en train de devenir la bibliothèque globale avec tous ses défauts, le risque dans la culture et dans l’économie, c’est de maîtriser l’abondance d’information, qui peut être mortelle autant que le manque d’information, il faut une éducation à la consultation d’Internet », le portail est un essai de solution.
Le portail est un objet de réécriture
Le portail offre la possibilité de mettre en relation des textes , de par son organisation.
Cette organisation permet une médiation entre ces textes, qui en sont autant de réécritures. Internet en tant que ressource documentaire permet d’avoir accès aux textes, le portail peut donc être pris comme un objet de réécriture de l’Internet, dans le sens ou il organise des ressources provenant de celui ci en les classant et en les hiérarchisant.
Pour Goody «il n’y pas de connaissance sans réécriture » car c’est elle qui permet l’appropriation des textes.
Le portail est un savoir en construction par l’actualisation et la spécialisation de son arborescence, cette réécriture est nécessaire pour permettre aux usagers une meilleure appropriation des ces connaissances. La réécriture est la face cachée de la culture qui permet une réappropriation multiple de ces textes.
Le portail est un savoir en construction par l’actualisation et la spécialisation de son arborescence, cette réécriture est donc toujours en évolution ce qui rend l’appropriation de connaissances toujours plus vaste.
De plus le portail est aussi une réécriture de la discipline elle-même car l’obligation de classer «hiérarchisé » donne forcément un ordre de lecture et d’importance qui impose un sens de lecture. Ce sens de lecture créé à l’intérieur de la discipline en donne une nouvelle interprétation. La réécriture permet l’appropriation des textes par la multiplication de leurs accès.
|
Table des matières
INTRODUCTION
A. Présentation du lieu stage
1. Historique
2. Vers une future bibliothèque d’UFR
B. La mise en place d’une bibliothèque
1. Les enjeux documentaires
2. L’informatisation de la bibliothèque
C. Problématique et analyse
1. Problématique
2. Analyse
3. Une solution : un portail Internet
I LE PORTAIL
A. Exploitation de la notion de portail
1. Internet
2. Internet comme ressource documentaire
3. Internet la bibliothèque chaotique ?
4. Le portail est un objet de réécriture
B. Explicitation de l’objet technique
1. Le portail par rapport aux autres méthodes de recherche
2. Etude de différents portails : sémiologie de portails
II LA SOLUTION APPORTEE
A. Les outils
1. Le guide des études
2. Les outils de recherches
3. Excel
4. Dreamweaver2
5. Firework 1
B. La méthode
1. Extraction de mots clefs
2. Validation des mots clefs
3. Etude de moteurs
4. Requêtes sur les moteurs
5. Mise en ordre des données
6. Validation des sites proposés
III. L ANALYSE ET L ‘EVALUATION DU PORTAIL
A. Structure générale du portail
1. Le texte et sa mise en page
2. Les outils de composition
B. Lisibilité du portail
1. Aspect cognitif des utilisateurs potentiels, situation d’usage
2. Quelle logique ?
C. Evaluation
1. Ce qui aurait pu être fait ou à faire
2. L’intégration dans un système plus large
CONCLUSION
Télécharger le rapport complet