Quelques aspects du traitement documentaire de l’image

L’image dans les Sciences de l’information

Quelques aspects du traitement documentaire de l’image

Une partie des recherches en sciences de l’information consacrées à l’image, celles appartenant au courant dit « orienté système », s’intéressent aux systèmes de recherche d’images. Elles comprennent les travaux menés autour de l’indexation des images, du fonctionnement ou de l’évaluation des systèmes. Rui, Huang et Chang ont proposé il y a quelques années une revue très complète de la littérature sur le sujet (Rui, Huang & Chang, 1999). Ces systèmes peuvent permettre la recherche dans un fonds iconographique, ou l’accès direct à des images numériques. Dans l’un ou l’autre cas, qu’il s’agisse des documents primaires (les images), ou des documents secondaires (les notices catalographiques), il peut être, ou non, possible d’accéder sur le Web à l’interface de recherche du système. Dans le cas d’un système de recherche d’images numériques sur le Web, ces images peuvent être accessibles sous forme de fichiers numériques, ou directement consultables sur le navigateur.
Certains systèmes particuliers, les moteurs de recherche d’images, permettent de consulter des images issues de l’ensemble des pages du Web (Massignon, 2002). Certains travaux « orientés systèmes » s’intéressent particulièrement au fonctionnement et à l’amélioration des moteurs de recherche d’images, en ce qui concerne la collecte des données, l’indexation, la spécification des requêtes, l’extraction, la couverture du Web ou l’évaluation des performances (Kherfi, Ziou & Bernerdi, 2004).
Une des questions les plus travaillées concerne l’indexation des images. Pour que le système puisse proposer des résultats en réponse à une requête, il est en effet nécessaire de décrire les données permettant d’identifier l’image (auteur, titre, date, taille, etc.) et/ou d’indexer celle-ci, c’est-à-dire de représenter son contenu informationnel (Boulogne, 2004).
Pour ce faire, il existe trois méthodes assez différentes : l’indexation manuelle, le recours aux métadonnées ou l’analyse de l’environnement textuel (Ménard, 2010). Hors ce dernier cas, l’indexation de l’image pose de sérieuses difficultés, puisqu’il s’agit de transformer en données textuelles des informations strictement iconographiques.
Une des études les plus importantes sur le sujet est celle de Shatford Layne, qui, à partir de plusieurs modèles théoriques dont celui de Panofsky, a élaboré la notion d’ « attribut » de l’image, définie comme une propriété ou une caractéristique de l’image qui peut être représentée dans un système de traitement de l’information. Shatford Layne distingue, dans son étude, quatre types d’attributs (Shatford Layne, 1994) :
– Les attributs « biographiques », qui concernent la « vie » de l’image, et qui peuvent être des attributs « de création » (auteur de l’image, lieu et date de création) ou des attributs de « voyage » (localisation actuelle, parcours, propriétaire) ;
– Les attributs « de sujet », identifiables à partir d’une analyse de l’image qui distingue les niveaux iconiques, iconographiques et iconologiques de la représentation ;
– Les attributs « d’exemplaire » (original ou copie, numéro de copie, type de reproduction) ;
– Les attributs « de relation à d’autres images », qui indiquent le lien, par exemple, qui peut exister entre un dessin préliminaire et une toile achevée, entre un plan d’architecture et la photographie du bâtiment, etc.
Prolongeant l’étude de Shatford Layne, Jorgensen a tenté d’observer le processus d’attribution de manière expérimentale, en demandant aux participants de son étude de décrire différents types d’images. Il a ainsi pu obtenir une typologie des attributs un peu différente de celle de Layne, qui comporte (Jorgensen, 1995) :
– Des attributs perceptifs [6 classes] : objets identifiables, personnes, couleurs dominantes, éléments visuels (forme, mouvement, composition), lieux, descriptions (« boisé », « urbain », etc.) ;
– Des attributs interprétatifs [5 classes] : relations interpersonnelles (amour, amitié, etc.), informations relatives à l’Histoire de l’art (peintre, style, mouvement, etc.), concepts abstraits (atmosphère, thème, symbole, etc.), contenus ou histoires (référence identifiable à un récit, à un personnage, etc.), relations externes (ressemblance, dissemblance) ;
– Des attributs « de réaction » [1 classe] : réactions visuelles (dégoût, admiration, etc.).
Une fois les différents attributs de l’image identifiés, celle-ci peut être intégrée à un système de recherche d’images. Dans le cas particulier des moteurs de recherche d’images, l’indexation ne passe pas par le processus d’attribution, pour la plupart d’entre eux, mais procède de l’analyse de l’environnement textuel (Boudry & Agostini, 2004). Sur le Web, l’accès aux images peut donc se faire par le recours à un moteur de recherche, spécialisé dans un domaine ou non, à une base de donnée où les images sont indexées manuellement, spécialisée ou non, ou par la navigation hypertextuelle.
L’étude des usages des images sur le Web que nous entendons mener sera circonscrite aux images du Web que l’on peut consulter directement dans leur forme numérique, sur des pages ayant une adresse URL. Nous ne prendrons pas en compte les usages des systèmes de recherche d’images qui ne donnent accès qu’aux références ou aux localisations d’images non numériques. Il pourra être fait une place à part, si le cas se présente, à l’usage des fichiers d’images numériques.

La recherche d’images

Un certain nombre de recherches, contrairement à celles dites « orientées système », s’intéressent aux pratiques des usagers de systèmes de recherche d’images. Ces travaux étudient les interactions entre les usagers et les systèmes de recherche d’images, ou, plus largement, les pratiques de recherche d’images.
Dans le premier cas, les chercheurs s’intéressent au choix des usagers entre navigation et formulation de requêtes dans un système offrant les deux possibilités (Chen, Kochtanek, Sean Burns & Shaw, 2010), au nombre et à la précision des termes de la requête (Goodrum & Spink, 2001, Pu, 2005, Ménard, 2009, Choi, 2010), à l’utilisation des options de recherche avancée que proposent les systèmes (Choi, 2010), au nombre de pages de résultats consultées (Choi, 2010). Ces recherches peuvent aussi s’intéresser aux systèmes préférés des usagers (Choi, 2010, Yoon, 2011) et aux raisons de ce choix, ainsi qu’aux critères de pertinence que les individus attribuent aux images (Hirsh, 1999, Choi et Rasmussen, 2002). Les résultats de ces recherches montrent que les usagers préfèrent la navigation lorsqu’ils en ont l’occasion, que les requêtes sont généralement courtes (trois termes en moyenne), que l’utilisation du moteur de recherche Google Images est largement dominante, que les options de recherche avancée ne sont que très peu utilisées et que peu de pages de résultats sont consultées.
En ce qui concerne les travaux qui étudient plus largement les pratiques de recherche d’images, ils prennent en compte les besoins d’images des usagers, les stratégies que ceux-ci mettent en œuvre pour satisfaire ces besoins, ainsi que les contextes qui président à leurs recherches. Nous reviendrons un peu plus loin sur quelques-uns de ces travaux. Parmi les recherches menées sur les interactions ente les usagers et les systèmes, certains travaux consacrés à l’analyse des requêtes des chercheurs d’images adoptent une perspective particulière. Ceux-ci, en effet, étudient d’importants corpus de requêtes pour comprendre la manière dont les usagers formulent leurs besoins d’images, et ce, dans le but d’améliorer les méthodes d’indexation des images en rapprochant les termes des attributs utilisés par les indexeurs de ceux des requêtes des usagers. La première grande étude de ce type est celle d’Enser, qui a étudié plus de 2700 requêtes d’usagers d’une grande collection d’images d’archive (Enser, 1993). Elle fût suivie de l’étude d’Armitage et Enser (Armitage & Enser, 1997). Ces travaux ont montré que la plupart des requêtes (près de 70 %) concernent une personne, un objet ou un événement. L’étude de Chen va dans le même sens et s’est attachée à vérifier et à compléter les 12 classes d’attributs de Jorgensen à partir de l’étude des requêtes formulées dans un environnement réel (Chen, 2001). D’autres travaux peuvent compléter ces études en observant les pratiques d’indexation des images des documentalistes (Stewart, 2010).
Ces différents travaux permettent de mesurer l’écart entre les termes des formulations de requêtes et ceux utilisés pour l’indexation, dans l’objectif de réduire cet écart, ce qui permettrait d’améliorer les performances des systèmes de recherche d’images. Les études d’usages sont donc ici mis au service de l’amélioration des systèmes. Elles ouvrent pourtant la voie à un autre champ de la recherche qui, au delà des systèmes et des interactions entre les usagers et les systèmes, s’intéresse aux besoins des usagers en termes d’images.

Le besoin d’images

Lorsqu’on recherche une image, c’est qu’on a besoin d’une image, qu’on a un « besoin d’images ». Cette notion est construite à partir de celle de « besoin d’information », qu’étudient les chercheurs en Sciences de l’information. La notion de « besoin d’information » fait l’objet de plusieurs définitions, assez différentes les unes des autres. Nous retiendrons pour l’instant la définition minimale de Taylor qui identifie le besoin d’information au fait de « rechercher une réponse à sa question « (Taylor, 1968). Dans l’étude de Taylor, le besoin d’information est décrit comme un processus en quatre étapes, qui tend vers une meilleure formulation de la question et une représentation plus claire des réponses attendues :
– Le besoin concret, mais inexprimable ;
– Le besoin conscient ;
– Le besoin formalisé, exprimé sous forme de question ;
– Le besoin adapté, c’est-à-dire la question telle qu’elle est présentée au système de recherche d’information.
Dans le cadre du besoin d’images, ce modèle a été repensé par Batley qui a, à son tour, identifié quatre niveaux dans l’élaboration de ce qu’il appelle le « besoin d’informations visuelles » (Batley, 1988) :
– Le besoin subjectif difficile à exprimer verbalement ;
– Le besoin abstrait, exprimable verbalement avec des concepts mais difficile à traduire en question de recherche ou en mots-clefs ;
– Le besoin identifiable, exprimé en une question peu précise ;
– Le besoin spécifique, traduit en mots-clefs ou en une question de recherche très précise.

Étudier les usages des images

« Pôle donnée » et « pôle objet »

Fidel, dans une de ses études, s’est intéressée précisément aux raisons qui poussent les usagers à chercher des images et à l’importance de la tâche au sein de laquelle la recherche d’images s’intègre, ce qui implique d’élargir l’analyse aux contextes qui président à ce type de recherches (Fidel, 1997). Dans son modèle, Fidel distingue deux usages différents que les individus peuvent faire des images, et donc deux types de recherche d’images. L’une s’intéresse au « pôle donnée » de l’image, c’est-à-dire à son contenu informationnel, l’autre, au « pôle objet », c’est-à-dire à certaines caractéristiques de l’image nécessaires à la réalisation d’un objectif précis, qui peut ne pas être directement informationnel. Ces deux « pôles », sont pensés chez Fidel comme les deux points extrêmes d’un continuum plutôt que comme une stricte dichotomie, et concernent moins des propriétés intrinsèques aux images que les manières dont les usagers peuvent les considérer. Une recherche centrée sur le « pôle donnée » s’attachera à trouver une information contenue dans une image, sans nécessairement s’intéresser aux spécificités de l’image en question, tandis qu’une recherche centrée sur le « pôle objet » s’attachera à trouver une image qui corresponde aux exigences d’une situation particulière.
La distinction de Fidel entre « pôle donnée » et « pôle objet » semble recouper l’analyse de l’image comme « double réalité », à la fois objet et représentation. Ce n’est pourtant pas le cas, car si le « pôle donnée » est strictement dépendant de la nature représentative de l’image, le « pôle objet » se construit en considérant l’image à la fois comme objet et comme représentation, et pas seulement comme objet. Fidel donne l’exemple d’une recherche d’une reproduction d’œuvre d’art dont la fonction serait strictement décorative – cas typique de « pôle objet » –, et précise que dans ce cas les attributs de sujet (personnes, lieux, événements) peuvent aussi être des critères de sélection de l’image. En adaptant ce modèle aux images numériques, la considération de l’image comme « donnée » n’implique que sa consultation, alors que son usage en tant qu’objet peut déterminer, selon les situations, la nécessité d’accès au fichier informatique ou son impression.
La nuance que pointe Fidel entre les caractéristiques de l’image et la manière dont les usagers la considèrent permet de redéfinir en partie la notion de « besoin d’images ». Dans cecas, il ne s’agit plus seulement pour l’usager de déterminer l’information visuelle dont il a besoin, mais aussi de savoir quel type de rapports il entend entretenir avec l’image, s’il projette de la considérer comme une source d’information ou comme un objet, et ce en fonction de ces objectifs et de la situation qui le pousse à chercher cette image. Une étude en particulier, celle de Lundh et Alexandersson, permet d’appuyer ce constat, puisque à l’issu d’une observation empirique les deux auteurs ont montré que l’activité de recherche d’image était essentiellement considéré, chez les jeunes élèves, comme une activité ludique façonnée par l’hypothèse que les images sont avant tout des objets décoratifs, et non des informations.
Ce qui mène d’ailleurs certains participants de l’enquête à distinguer clairement la recherche d’image de la recherche d’informations proprement dite (Lundh & Alexandersson, 2012).

Des typologies des usages

Plusieurs études empiriques se sont attachées à observer les pratiques des usagers lorsqu’ils cherchent des images, ou, plus largement, lorsqu’ils utilisent des images, et ont élaboré à partir de ces observations différentes typologies. Conniss, Ashford et Graham, dans leurs travaux, ont ainsi distingué sept fonctions de l’image (Conniss, Ashford & Graham, 2000).

Échantillon

L’échantillon est constitué de seize lycéens. Le choix du niveau lycée est motivé par le fait que les élèves plus âgés ont probablement une pratique du Web plus autonome et plus diversifiée que les collégiens (Martin, 2004).

Dispositif d’observation

Le dispositif d’observation est constitué d’un journal de bord pré-structuré que les observés devront remplir à chaque fois qu’ils prennent conscience qu’ils sont en train de faire usage d’une image sur le Web

Le journal : aspects théoriques

La journal de bord est l’élément central de notre dispositif. La méthode du journal a été employé récemment pour observer les usages des images dans les travaux de Schlak (Schlak, 2010) et de Chew, Rode et Sellen (Chew, Rode & Sellen, 2010). Plus généralement, cette méthode est souvent utilisée pour observer le comportement des usagers du Web (Jean, Rieh, Kim & Yang, 2012). C’est une méthode qualitative, elle permet d’observer des comportements, des usages, des représentations, des intentions, des intérêts, etc. Nous nous attacherons, pour notre part, à identifier les différents types d’usages qui sont fait des images sur le Web, dans leur diversité, leurs spécificités et leurs rapports.

Résultats

Pré-traitement

Un pré-traitement des données a été effectué. Il a permis d’identifier, avant le traitement qualitatif, le nombre de réponses, leur fréquence, ainsi qu’une première distinction entre les grands types d’usages, à partir des questions fermées présentes dans le journal (cf. Annexe 1).
Sur les seize individus interrogés, seuls dix ont fait usage, à une ou plusieurs reprises, d’images du Web durant le temps de l’observation. Sept individus n’ont complété le journal qu’une seule fois, un individu l’a complété deux fois, et deux individus l’ont complété trois fois. En moyenne, le journal a donc été complété une fois par semaine par chaque individu de l’échantillon (15 journaux pour 16 individus), ce qui est très largement inférieur aux résultats de Chew, Rode et Sellen (Chew, Rode & Sellen, 2010), qui ont observé une moyenne de trois activités impliquant des images sur le Web par jour.
Le pré-traitement des données a permis de mettre au jour les résultats suivants (cf. Annexe 2) :
− Les élèves n’impriment que très rarement leurs images (2/15)
− Aucun usage des images comme lien hypertexte n’a pu être observé (0/15)
− Les tâches prescrites n’occupent qu’une place marginale dans les activités des élèves impliquant des images du Web (2/15)
− L’essentiel de ces activités n’est pas lié à une recherche d’informations (4/15).
− Les usages individuels et les usages impliquant d’autres individus sont à peu près équivalents (9 usages individuels / 6 usages impliquant d’autres individus).
− Les usages impliquant plusieurs images et les usages n’en impliquant qu’une seule sont à peu près équivalents (8 usages impliquant plusieurs images / 7 usages n’impliquant qu’une image).
− Les usages des images comme données et les usages des images comme objets sont à peu près équivalents ( 8 images comme objets / 7 images comme données).
− La plupart des activités sont des recherche d’images (10/15).
− Pour la recherche d’images, différentes stratégies ont été mises en œuvre : recherche sur un moteur généraliste (5/10), recherche sur des bases d’images spécialisées (4/10), navigation hypertextuelle (1/10).
− La plupart du temps, les images recherchées sont liées à des thèmes faisant l’objet de recherches fréquentes (7/10).

Discussion

L’objectif de cette étude était d’identifier les usages que font les jeunes élèves des images du Web. L’analyse des résultats permet de cerner six grandes catégories d’usage.
− L’image pour se distraire : il s’agit d’une pratique consistant à consulter une source que l’on connaît, dans un cadre de loisir.
− La recherche d’images pour l’école. Ici, les élèves cherchent des images pour les intégrer à une production prescrite par l’institution scolaire, comme un exposé ou un dossier. Les images sont imprimées et elles ont une fonction d’illustration.
− L’image dans la pratique artistique : il s’agit d’un usage des images comme source d’inspiration.
− L’image de presse, qui illustre un article ou apporte des informations iconiques complémentaires.
− L’image publiée sur les réseaux sociaux, essentiellement destinée à produire de l’interaction sociale.
− L’image comme réponse à un besoin d’information non iconique. Le schéma semble être un type d’image particulièrement adapté à cet usage.
Ces usages ont tous était observé dans les études antérieures. Néanmoins, ils revêtent des caractères particuliers, comme le lien entre tâche prescrite, impression et fonction d’illustration de l’image, ou celui entre distraction et connaissance de la source. Dans la mesure où la même étude n’a pas été soumise à d’autres publics, il n’est pas possible de préciser si ces caractères particuliers sont ou non propre au public des jeunes élèves. De la même manière, une étude sur un échantillon plus large permettrait de mieux identifier les usages spécifiques aux jeunes élèves et ceux partagés par l’ensemble de la population.
Le rôle de l’image dans la recherche d’information peut fait l’objet d’une discussion particulière. Dans l’ensemble des cas observés, l’image n’a qu’un rôle d’information iconique.
Lorsqu’elle a ce rôle, ce n’est jamais à l’issu d’une recherche d’images, mais parce que celle-ci intervient au cours de la recherche d’information et vient résoudre le problème informationnel (comme dans le journal 14), ou apporter des informations complémentaires (comme dans le journal

Les usages décrit par Boubée (Boubée, 2007), n’ont pas été observé ici

Le dispositif méthodologique utilisé, le « journal de bord » permet, c’est son principal avantage, d’observer des usages qui ont lieu essentiellement à domicile. Il est ainsi très approprié pour étudier les pratiques de la vie quotidienne. Il a, par contre, des limites qui, ici, empêchent nos résultats d’être généralisables. Il ne permet pas d’observer tout ce qui se joue à l’insu des individus et il n’a pas permis de recueillir une grande quantité de données. Une étude plus profonde des usages des images du Web pourraient être complétées par des observations directes et des entretiens. Ces derniers notamment, pourrait permettre de préciser les questions, d’interroger les individus plus longuement sur leurs pratiques et, ainsi, de récolter des données plus précises.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières
Introduction
I. État de la question
I. Qu’est-ce qu’une image ?
A. Un objet informationnel complexe
B. Les images sur le Web
II. L’image dans les Sciences de l’information
A. Quelques aspects du traitement documentaire de l’image
B. La recherche d’images
C. Le besoin d’images
III. Étudier les usages des images
A. « Pôle donnée » et « pôle objet »
B. Des typologies des usages
C. L’image dans la recherche d’information
II. Dispositif méthodologique
I. Échantillon
II. Dispositif d’observation
A. Le journal : aspects théoriques
B. Le journal : aspects pratiques
C.Les questions du journal
III. Résultats
I. Pré-traitement
II. Traitement qualitatif
A. Catégorisation et réduction des données
B. Relations saillantes entre catégories
IV. Discussion
Bibliographie
Annexe 1 : Journal
Annexe 2 : Journaux
Journal 1
Journal 2
Journal 3
Journal 4
Journal 5
Journal 6
Journal 7
Journal 8
Journal 9
Journal 10
Journal 11
Journal 12
Journal 13
Journal 14
Journal 15