La bibliothèque de recherche
Pour répondre aux différents besoins, la bibliothèque de recherche du service dispose d’un fonds de plus de 40 000 monographies et thèses (dont 18 000 thèses sur microfiches), 339 titres de journaux imprimés dont 77 abonnements en cours en 2009 et 151 fermés mais prolongés sous format électronique. La bibliothèque dispose également d’un fonds spécialisé en histoire de l’informatique et des mathématiques appliquées (fonds HIMA) ainsi qu’un fonds spécifique adapté aux besoins de l’enseignement et prioritairement réservé aux étudiants de Licence, Master et Doctorat (fonds LMD). La politique documentaire du service se fait également en étroite collaboration avec les laboratoires. Pour ce faire, chaque laboratoire a un représentant CORIST (anciennement « Correspondants Doc ») chargé de relayer les informations du service aux autres membres de son laboratoire, mais également, de faire remonter les éventuels besoins ou problèmes de leurs collègues en matière d’IST. De même, plusieurs membres des laboratoires désignés « Correspondants Acquisitions » se réunissent avec le service IS en une commission « Bibliothèque » chargée d’analyser et de décider des acquisitions à réaliser.
Le catalogue de la bibliothèque, mis aux normes internationales (UNIMARC-SUDOC) en 2008, est intégré au catalogue Rugbis du Service Interétablissements de Coopération Documentaire 1 (SICD 1) réunissant bibliothèques de l’Université Joseph Fourier et de l’Institut Polytechnique de Grenoble et au SUDOC. Pour l’année scolaire 2008-2009, environ 450 lecteurs étaient inscrits à la bibliothèque et 513 emprunts ont été effectués.
Les ressources électroniques
Outre ces services classiques propres à une bibliothèque (prêt, acquisition, abonnements, prêt entre bibliothèques etc.), le service porte un intérêt particulier à la documentation numérique. L’offre en la matière est particulièrement riche et variée. Les membres des laboratoires ont accès au portail de ressources BiblioST2i du CNRS-INIST qui propose un vaste choix de revues électroniques (plus de 4500). L’ensemble des usagers a également accès au service G@el (Grenoble Accès en Ligne) du SICD 1 (plus de 5300 revues) et aux ressources du Réseau National des Bibliothèques de Mathématiques (RNBM) qui propose quelques 200 revues. Enfin, Mi²S a également acquis 83 abonnements en nom propre. L’ensemble de ces ressources est accessible soit par reconnaissance IP soit par login et mot de passe. Pour plus de simplicité, les usagers ont accès aux différents titres via l’interface AtoZ (EBSCO) qui permet de présenter une liste abécédaire de l’ensemble des ressources électroniques disponibles.
Le service propose également des formations aux différents outils documentaires qu’elle met à la disposition des étudiants et des chercheurs : découverte de la bibliothèque et de ses ressources, rédaction bibliographique et gestion d’outils bibliographiques, outils de veille, formation aux archives ouvertes comme Hal (Hyper Articles en Ligne) ou Tel (Thèses en Ligne) . Les usagers ont également accès via le site aux signets de la bibliothèque (sur le site de partage de signets Del.ici.ous ) régulièrement mis à jour et recensant diverses ressources internet utiles pour la recherche d’information et la veille.
Enfin, dans le cadre de ses missions, l’UMS a entrepris en 2009 le développement d’un outil de gestion de la production scientifique. Un prototype, l’outil HALOA, a été créé par le laboratoire Verimag. Répondant aux standards du protocole OAI-PMH, il permet la gestion bibliographique des documents numériques déposés sur l’archive institutionnelle Hal et de générer des listes dynamiques de publications pouvant être facilement intégrées dans des pages web, des rapports d’activité outout autre forme de support.
Les réseaux professionnels
Par ailleurs, l’UMS est particulièrement investie dans des réseaux professionnels. En 2007, elle s’est vu confier l’animation et la coordination du réseau Doc-ST2i . Ce réseau professionnel regroupe documentalistes en Sciences et Technologies de l’Information et de la Communication (STIC) et Sciences pour l’Ingénieur (SPI) du CNRS. Il s’agit de créer un réseau d’échange entre les professionnels de l’IST du domaine et de relayer les questions, besoins et difficultés des chercheurs en matière d’accès à l’information auprès des institutions.
Le réseau Doc-ST2i a également pour mission la mutualisation des outils – le portail BiblioST2i en est la parfaite illustration – et la formation des publics aux différentes méthodes documentaires.
E-science : définitions, enjeux et difficultés
Nos capacités de mesurer, stocker, analyser et visionner les données est de plus en plus la nouvelle réalité à laquelle la recherche devra s’adapter.
Comme le remarque ici John Wilbanks, la recherche entre dans une nouvelle ère de partage et d’exploitation de données. Le développement des nouvelles technologies de l’information et de la communication (NTIC) a fait évoluer les pratiques des chercheurs et les conduisent désormais à investir les nouveaux outils offerts par le web (archives ouvertes, wikis, blogs, réseaux sociaux…) fondés sur une collaboration plus étroite et un partage plus immédiat des ressources. Parallèlement, les nouveaux instruments scientifiques permettent des expériences inédites qui entraînent un véritable déluge de données qu’il s’agit dès à présent de partager et d’exploiter. C’est dansce nouveau contexte qu’est née la e-science.
Qu’est-ce que la e-science ?
Pour comprendre les différents enjeux de la e-science, il faut avant tout percevoir une image précise du contexte dans lequel celle-ci est apparue et saisir les nombreuses notions qu’elle recouvre.
Naissance de la e-science
Le temps des calculs à la main et des longues recherches dans les notices des bibliothèques est pour ainsi dire révolu. Avec l’informatique et Internet, l’échange de ressources, la communication et la mise en commun pour les chercheurs des résultats de leursecherches sont amplement facilités. Mais justement dans cette nouvelle ère du « tout numérique », la masse d’informations circulant sur le net est « diluvienne » [en référence à l’expression devenue commune « data deluge « ]. On a généré plus de données scientifiques depuis 2005 qu’au cours de toute l’histoire de l’humanité !
E-science, e-research, cyberinfrastructure, e-infrastructures …
Il existe un flou terminologique autour du concept d’e-science. En effet, selon les pays ou les disciplines, on peut trouver des termes comme « cyberinfrastructure », « e-research » ou encore « e-infrastructure ». E-Science est un terme plutôt européen, tandis que « cyberinfrastructure » se trouvera plus généralement dans la littérature américaine.
Le terme « cyberinfrastructure » (on trouve aussi le terme « e-infrastructure » en Europe) désigne de manière générale les nouveaux environnements de recherche permis par les nouvelles technologies de l’information et de la communication. Les termes e-science et cyberinfrastructure sont presque synonymes. Le premier est pluslargement utilisé en Europe et se place d’un point de vue scientifique; le second est plusrépandu aux USA et est plus centré sur la prouesse informatique. Les deux termes font référence à l’utilisation d’outils informatiques puissants et en réseau permettantde nouvelles collaborations scientifiques et des méthodes inédites de recherche.
C’est le rapport Atkins de la NSF qui a popularisé le terme « cyberinfrastructure » en 2003. Celui-ci : refers to infrastructure based upon distributedcomputer, information and communication technology. If infrastructure is required for anindustrial economy, then we could say that cyberinfrastructure is required for a knowledge economy.
Il s’agit d’une infrastructure numérique commune fondée sur les notions de collaboration, de libre accès aux données brutes de la recherche et d’interopérabilité. Chaque communauté a ses usages et ses normes. Les données, ressources ou logiciels développés par la recherche sont souvent non-interopérables. Une utilisation efficace d’une cyberinfrastructure par la communauté scientifique permettrait donc de faire tomber les frontières artificielles entre les disciplines que des pratiques trop individualistes ont tendance à isoler.
Si e-science est la théorie, nous pouvons dire que la cyberinfrastructure est la pratique, l’infrastructure informatique permettant cesnouvelles méthodes de recherche. Pour mieux comprendre les différents services que recouvre une cyberinfrastructure, on peut se référer aux travaux du TGE-ADONIS qui synthétise ici les élémentsfournis par le rapport Atkins :
De nouveaux environnements de recherche
Une fois les différentes ressources disponiblessur le réseau, il s’agit donc de permettre aux chercheurs de les exploiter directement. La puissance des outils permet de passer aisément de la recherche de données (datamining) à la simulation etvisualisation des données, puis d’y intégrer la possibilité d’échange communicationnel sur l’utilisation de ces ressources. Cet échange favorise les découvertes scientifiques et installe une proximité entre chercheurs, et éventuellement, permet de nouveaux environnements pour l’enseignement. Le champ de la e-science a donc de multiples objectifs recouvrant l’ensemble du cycle de la recherche scientifique : exploitation de données, découverte scientifique, partage, communication et transfert de connaissances (enseignement). Ce constat est parfaitement illustré par les créateurs de l’un des projets e-science britanniques e-Bank.
E-Science et Données de recherche
Avec la naissance du mouvement vers l’Open Accessdans les années 90, les chercheurs sont de plus en plus amenés à déposer leurs publications dans des bases de données ou archives institutionnelles. Cependant, ces dépôts soulèvent l’un des premiers enjeux de la escience. En effet, de plus en plus de publications sont accompagnées de données (images, graphiques, tableaux etc.) dont l’accès direct et l’exploitation sont entravés par les pratiques individualistes de la plupart des communautés scientifiques (par l’apposition de formats propriétaires par exemple). Mais ces données scientifiques sont également une « production scientifique » dans le sens où elles résultent de l’activité de recherche. Aussi, comment avoir accès à ces données puis comment les exploiter, le challenge premier étant bien évidemmentl’interopérabilité des systèmes ?
Dans ce nouveau contexte, il s’agit donc de maîtriser ces données, de les rendre accessibles, et de les rendre réexploitables. Cette idée générale meut l’ensemble du web et plus particulièrement son fondateur, Tim Berners-Lee, qui appelle l’ensemble de la communauté internaute au partage de données par son slogan :
Il existe déjà des exemples de plateformes présentant articles et données brutes associées (BioLit par exemple). Dans des disciplines telles que la physique ou la bioinformatique, le traitement, le stockage et la diffusion des données a pris une ampleur certaine. Ces disciplines jouissent déjà d’une tradition bien établie d’open access (citons ArXiv pour les publications ou le Protein Data Bank pour les données en bioinformatique).
Dans ces disciplines, des normes de description ont alors été établies et soutenues par les politiques éditoriales des revues qui incitent à déposer certaines données dans des archives disciplinaires, les articles pouvant y faire référence via un identifiant unique.
De même, le projet anglais Integrative Biology réunit des chercheurs anglais spécialisés dans l’activité électrique des cellules cardiaques etdes chercheurs néozélandais spécialisés dans la modélisation des battements du cœur. Ce laboratoire virtuel permet d’interconnecter ces deux groupes et faciliter les échanges de données et le partage des ressources informatiques. À travers ce projet, il s’agit surtout de permettre d’établir des liens entre différentes anomalies génétiques du cœur qui affecteraient l’activité électrique des cellules cardiaques. Aussi, ces nouvelles modalités de partage permettent déjà des avancées scientifiques significatives.
Pour répondre à ces nouvelles exigences de partage, il est plus qu’urgent de développer des systèmes assez performants permettant à la fois d’interconnecter différentes bases de données, d’effectuer des requêtes complexes et d’assurer la pérennité de ces données.
La e-science repose donc sur cette nécessité intrinsèque de concevoir des outils informatiques assez puissants pour permettre la consultation et la manipulation à distance de ces données et de tout autre type de ressource nécessaire à la recherche : publications officielles, cours, workshop, espace de discussion etc. Aussi, les infrastructures conçues pources projets reposent sur des grilles informatiques etdes superordinateurs.
E-Science et Apprentissage
Dans son cycle e-science vu précédemment, le projet anglais e-Bank définit l’apprentissage en ligne (le e-learning ) comme la dernière étape de la chaîne : experimentation, analysis,publication, research, and learning.
Alors que le monde scientifique semble s’emparer progressivement du concept de cyberinfrastructure pour la recherche, peu de projets ont mis en place une cyberinfrastructure commune pour la recherche et l’apprentissage. Les organisations virtuelles sont alors confinées dans des espaces réservés ne permettant que peu l’interaction étudiant/professeur.
Pourtant, les technologies développées par la e-science présentent des opportunités inédites pour mettre en place de nouvelles méthodes d’enseignement et d’apprentissage.
L’accès aux données brutes de larecherche peut permettre à un étudiant, par exemple, de comprendre un peu mieux l’ensemble des concepts parfois obscurs mobilisés pour une expérience. Il s’agit donc maintenant de dépasser les frontières entre e-science et e-learning, de créer des liens entre les communautés de chercheurs, enseignants et étudiants pour établir des collaborations.
L’interactivité et les possibilités de communication (synchrone et asynchrone) des cyberinfrastructures sont un atoutpour la compréhension et la participation des étudiants au processus de recherche. Après lecture d’un cours comprenant des exemples d’expériences, un étudiant pourra aller chercher les jeux de données relatifs à ces expériences, les réutiliser selon les principes qu’il aura appris dans ce cours, et poser directement des questions à la communauté scientifique. L’interactivité des nouveaux outils (visualisation en 3-d …) permet une visualisation de concepts scientifiques parfois obscurs. Le site Nanohub propose des ressources en ligne sur les nanotechnologies (cours, présentation, forum, articles, séminaires …) dont un grand nombre d’outils de simulation etde modélisation. Les utilisateurs peuvent laisser des commentaires et noter l’outil, ou poser des questions quant à son utilisation. C’est là finalement la vraie nature de la recherche scientifique : investigation, recherche, analyse et découverte. L’étudiant pourra donc prendre part à ce processus et ainsi en comprendre un peu mieux les enjeux.
De la prise de conscience à l’implication : informer et conceptualiser la escience
La difficulté est donc d’informer la communauté française sur ce nouveau concept. On imagine aisément les réticences de la communauté scientifique à adopter ces nouvelles méthodes. Nous avons pu constater que la e-science se décrit beaucoup en termes issus du monde informatique : grille, middleware, logiciels etc. Pour le scientifique non informaticien (pensons surtout et au risque deréveiller quelques clichés aux chercheurs en arts et sciences humaines), voilà bien de quoi le rendre réfractaire à ces nouvelles méthodes de travail. Le concept même de grille est souvent perçu comme un équipement informatique complexe permettant de résoudre des problèmes scientifiques de grande échelle et donc réservé à des disciplines comme la physique etla biologie, pionnières dans ce domaine. Si cela a été vrai jadis, il reste à convaincre des communautés scientifiques plus petites ou appartenant aux champs des SHS, Arts et Humanités, des avancées significatives qu’elle permet déjà dans leur domaine : recherche, partage et visualisation de données, peer-reviewinteractif, communautés virtuelles de travail etc.
Pour toucher un large public, il a donc été nécessaire de conceptualiser les méthodes esciences en prenant en considération les différences de pratiques inhérentes à chaque communauté, leur propre culture, leur propre « langage » parfois bien éloigné des considérations informatiques et leur propre intérêt à adopter ces technologies. Il faut informer et vulgariser pour ces disciplines quine sont pas « data-intensive ».
Le site a toujours été pensé selon ces différentes exigences. Par exemple, nous avons opté pour une représentation visuelle des notions recouvertes par la e-science en page d’accueil du site (voir image ci-dessous).
E-science et professionnels de l’IST
Les différentes ressources que nous avons pu trouver sur la e-science ont toujours intégré les professionnels de l’information scientifique comme acteurs primordiaux de ce bouleversement. Considérés comme experts dela structuration de l’information, les documentalistes scientifiques doivent prendre part à cette « révolution » e-science imaginée par Dan Atkins, sans quoi ces nouvelles méthodes scientifiques ne sauraient perdurer dans le temps.
Nouveaux enjeux
Un service d’information – quel qu’il soit – doit sans cesse réadapter ses services en fonction des évolutions technologiques et de leurs impacts sur les pratiques communicationnelles et informationnelles de la communauté qu’ildessert. L’avènement de la e-science que nous connaissons depuis peu (bien qu’il s’agisse d’une réalité encore bien peu tangible en France) est en passe de révolutionner le monde de la recherche et des services qui lui sont associés. Les mouvements initiés ces dernières années par les bibliothèques telles que l’open access et le protocole OAI-PMH ontpermis un nouvel espace de circulation d’informations plus dynamique et universel. Mais la e-science, e-research, cyberinfrastructure ou peu importe le terme qu’on lui donne, recouvre un mouvement bien plus ample de circulation de données qu’il s’agit de gérer, derendre accessibles et bien évidemment de préserver.
L’une des conséquences de la e-science est donc la mise à disposition imminente de larges bases de données issues de la nouvelle génération d’expériences et d’instruments scientifiques. Ce « data deluge » amorcé depuis quelques années entraîne un changement de paradigme radical dans la capture et la diffusion de l’information scientifique et implique de fait de nombreux défis pour les scientifiques qui auront besoin des compétences et des technologies issues de l’informatique et du monde des bibliothèques pour gérer ces données.
Il faudra également mettre en place des outils adéquats de téléchargement, d’exploitation et de visualisation pour l’utilisateur final afin de créer un environnement de travail transparent.
Du document aux données de la recherche
Les bibliothèques ont toujours été les garantes d’expertise en matière d’organisation, d’enrichissement et de diffusion de l’information mais représentent encore un bien lourd héritage du document en tant qu’unité cloisonnée. L’ère numérique n’a pas encore changé cette représentation. On parle toujours de document numérique en tant qu’objet délimité et fermé. Or, de plus en plus de publications intègrent des éléments hétérogènes : tableau de données, extraits audio ou vidéo… La e-science tend à décloisonner ces objets numériques afin de rendre l’ensemble des éléments de la recherche exploitables et liés entre eux. Auparavant, l’échange de données scientifiques pour différentes expériences était difficile : problème d’accès, de droit, d’interopérabilité etc.Les cyber infrastructures se fondent elles sur un partage sécurisé de ces données pour un travail collaboratif bien plus interactif et efficace.
Ces nouvelles opportunités de services de post-publication vont permettre aux bibliothèques de s’éloigner de la représentation statique du document et de créer grâce aux technologies du web un réseau d’ « artefacts » de recherche interconnectés. C’est certainement la partie la plus importante dans la gestion de ces données : les liens qui connectent l’ensemble des éléments d’une recherche (auteur, données, publications, institutions, recherches similaires etc.).
|
Table des matières
Introduction
I. Présentation du centre de documentation
a. L’unité mixte de service MI²S
b. Le service Information scientifique
1. La bibliothèque de recherche
2. Les ressources électroniques
3. Les réseaux professionnels
c. Mission du stage
II. E-science : définitions, enjeux et difficultés
a. Qu’est-ce que la e-science ?
1. Naissance de la e-science
2. E-science, e-research, cyberinfrastructure, e-infrastructures
b. De nouveaux environnements de recherche
1. E-Science et Données de recherche
2. E-Science et Web collaboratif
3. E-Science et Apprentissage
c. France et e-science : Informer et impliquer
1. Position actuelle de la France dans la e-science
2. De la prise de conscience à l’implication : informer et conceptualiser la e-science
III. E-science et professionnels de l’IST
a. Nouveaux enjeux
1. Du document aux données de la recherche
2. Du prestataire au partenaire de la recherche
b. Les domaines d’intervention
1. La gestion des données
2. Les communautés virtuelles
3. Promotion et formation
c. Vers le « e-science librarianship »
1. Quelle formation ?
2. E-Science librarianship : un nouveau métier ?
Conclusion
Glossaire
Ressources
Annexes
I. Le site e-science
II. Mind-map