la bibliothèque ouverte - portail...

12
L’ACCES A L’INFORMATION SCIENTIFIQUE ET TECHNIQUE (IST) est depuis de nombreuses années un enjeu important pour la région Lan- guedoc-Roussillon. Il y existe plus de cent centres de documentation et bibliothèques spécialisés, mais leurs richesses sont difficilement repérables. Des initiatives nationales ou locales ont vu le jour dans les années quatre-vingt pour faciliter l’accès à l’IST. La seule solution disponible à l’époque était la centralisation, illustrée par les catalogues collectifs (par exemple le CCN ou « Monocle » à Grenoble). La centralisation ne pou- vait s’appliquer à des sources hétérogènes. Il a donc fallu trouver des solutions réparties, qui vont voir le jour avec l’essor des nouvelles technolo- gies. On peut souligner ici la volonté des docu- mentalistes de la région qui participent à des ini- tiatives nationales ou locales ou en sont à l’origine. Dès 1985, la Bibliothèque interuniversitaire de Montpellier, le Cirad (Centre de coopération inter- nationale en recherche agronomique pour le déve- loppement) et l’Inra (Institut national de recherche agronomique) étaient parties prenantes d’un pro- jet d’accès unique à des bases hétérogènes et répar- ties : « l’antéserveur régional », financé par la région Languedoc-Roussillon et piloté par le CINES (Centre informatique national de l’ensei- ÉTUDE La Bibliothèque Ouverte : pour un accès unique aux ressources de la recherche et de l’enseignement supérieur en Languedoc-Roussillon Interroger ensemble toutes les bases bibliographiques de l’enseignement supérieur et de la recherche de la région, c’est un rêve qu’ont caressé de nombreux usagers et documentalistes. C’est désormais possible grâce à la collaboration de trois partenaires : l’association Agropolis, la Bibliothèque interuniversitaire de Montpellier et le Pôle universitaire européen de Montpellier et du Languedoc-Roussillon. La Bibliothèque Ouverte a été conçue pour offrir aux chercheurs, enseignants et étudiants une interface unique d’interrogation de contenus hétérogènes : recherche simultanée sur quarante bases spécialisées, localisation des collections, extension de la recherche à des ressources externes. par CHANTAL SALSON, HANKA HENSENS, FRANÇOISE FOURY, MAGGY PEZERIL et SANDRINE MOURET 14 Documentaliste - Sciences de l’information 2004, vol. 41, n° 1

Upload: vudiep

Post on 16-Sep-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

L’ACCES A L’INFORMATION SCIENTIFIQUEET TECHNIQUE (IST) est depuis de nombreusesannées un enjeu important pour la région Lan-guedoc-Roussillon. Il y existe plus de cent centresde documentation et bibliothèques spécialisés,mais leurs richesses sont difficilement repérables.

Des initiatives nationales ou locales ont vu lejour dans les années quatre-vingt pour faciliterl’accès à l’IST. La seule solution disponible àl’époque était la centralisation, illustrée par lescatalogues collectifs (par exemple le CCN ou« Monocle » à Grenoble). La centralisation ne pou-vait s’appliquer à des sources hétérogènes. Il adonc fallu trouver des solutions réparties, qui vontvoir le jour avec l’essor des nouvelles technolo-gies. On peut souligner ici la volonté des docu-mentalistes de la région qui participent à des ini-tiatives nationales ou locales ou en sont à l’origine.

Dès 1985, la Bibliothèque interuniversitaire deMontpellier, le Cirad (Centre de coopération inter-nationale en recherche agronomique pour le déve-loppement) et l’Inra (Institut national de rechercheagronomique) étaient parties prenantes d’un pro-jet d’accès unique à des bases hétérogènes et répar-ties : « l’antéserveur régional », financé par larégion Languedoc-Roussillon et piloté par leCINES (Centre informatique national de l’ensei-

ÉTUDE

La Bibliothèque Ouverte :pour un accès unique aux ressources de la recherche et de l’enseignement supérieur en Languedoc-Roussillon

Interroger ensemble toutes les bases bibliographiques del’enseignement supérieur et de la recherche de la région, c’est un rêve qu’ont caresséde nombreux usagers et documentalistes. C’est désormais possible grâce à lacollaboration de trois partenaires : l’association Agropolis, la Bibliothèqueinteruniversitaire de Montpellier et le Pôle universitaire européen de Montpellieret du Languedoc-Roussillon. La Bibliothèque Ouverte a été conçue pour offrir auxchercheurs, enseignants et étudiants une interface unique d’interrogation decontenus hétérogènes : recherche simultanée sur quarante bases spécialisées,localisation des collections, extension de la recherche à des ressources externes.

par CHANTAL SALSON, HANKA HENSENS, FRANÇOISE FOURY, MAGGY PEZERILet SANDRINE MOURET

14 • Documentaliste - Sciences de l’information 2004, vol. 41, n° 1

gère un portail documentaire régional qui donneaccès aux différents services mis en place [voirpage suivante] et qui permet notamment d’accé-der, une à une, à dix-huit bases bibliographiques.Elle cherche depuis 1998 à créer un accès uniquepour l’interrogation de ses différents catalogues.

En effet, la possibilité d’interroger à distance unensemble de bases de données en une seulerequête, sans être obligé de consulter successive-ment autant de serveurs web qu’il y a de bases àinterroger, serait très apprécié par les documenta-listes et les chercheurs. Et ce d’autant plus qu’onpeut ainsi s’affranchir du temps d’apprentissagenécessaire pour maîtriser les différentes interfacesd’interrogation.

En novembre 1999, la commission IST pose lesbases du projet en recrutant, avec le Pôle euro-péen, une première chargée d’études2 pour faireun état des lieux des catalogues concernés, rédigerun cahier des charges, réaliser une étude de mar-ché des solutions possibles, puis effectuer uneétude comparative (avec tests) de quelques solu-tions, afin de permettre le choix d’un produit.

gnement supérieur, ex-CNUSC). Le projet étaitmis en œuvre par la société TRIEL en coopérationavec un laboratoire de recherche universitaire. Ilfaut se souvenir qu’à l’époque Internet n’était qua-siment pas disponible en France, hors quelqueslaboratoires de recherche. L’antéserveur était acces-sible par Minitel et stations X (via des lignes spé-cialisées). Ce projet était très à l’avant-garde àl’époque, ce qui explique en partie pourquoi il a eudes difficultés à dépasser le stade expérimental.

1Naissance du projet

En 1992, le Pôle universitaire européen conçoitun projet de réseau documentaire régional, qui estmis en œuvre en 1994 sous le nom de Relais(Réseau en Languedoc-Roussillon pour l’informa-tion scientifique), piloté par la Bibliothèque inter-universitaire et hébergé par le CINES. Relais offraitune interrogation multi-bases de vingt-quatre cata-logues de bibliothèques en utilisant une applica-tion client/serveur sur le réseau Internet grâce aulogiciel WAIS (Wide Area Information Server). Celogiciel (lointain ancêtre des moteurs de rechercheactuels), s’appuyant sur la première version de lanorme Z39.501, permettait la recherche en texteintégral sur plusieurs bases bibliographiques à lafois. Les bases indexées étaient des copies expor-tées des bases bibliographiques des organismes oudes bases WAIS réparties localement.

Les établissements membres d’Agropolis, uneassociation locale d’organismes de recherche etd’enseignement supérieur s’intéressant à l’agrono-mie des régions méditerranéennes ou tropicales,dont les quarante-trois centres de documentationsont regroupés dans la commission Informationscientifique et technique [voir page suivante],mènent des actions en concertation pour la valo-risation et la diffusion de l’IST. La commission IST

Chantal SalsonChargée du projet ‘Bibliothèque ouverte’Agropolis, Avenue Agro-polis, F-34394 MontpellierCedex 5, <[email protected]>

Hanka HensensResponsable du dossier‘Interface’ pour la commission Information scientifique et techniqued’AgropolisInstitut de recherche pourle développement (IRD),911 avenue Agropolis, BP 64501, F-34394 Montpellier Cedex 5,<[email protected]>

Françoise FouryChef de projetBibliothèque interuniver-sitaire de Montpellier, service Informatique, 60 rue des États-Géné-raux, F-34965 MontpellierCedex 2,<[email protected]>

Maggy PézerilChargée de missionPôle universitaire européen de Montpellieret du Languedoc-Rous-sillon, 163 rue Auguste-Broussonnet, F-34090 Montpellier,<[email protected]>

Sandrine MouretChargée de l’étude préalableCollège de France - Bibliothèque de l’institutde biologie, 11 place Marcelin-Berthelot, F-75005 Paris, <[email protected]>

1 Le protocole Z39.50 complète TCP/IP (protocole de baseInternet) et organise des sessions entre un client et un ouplusieurs serveurs contrairement à HTTP, protocole du web quine gère que des questions-réponses entre un client et un serveur.La norme Z39.50 comprend un protocole réseau, des services, unlangage de requête spécifique et différents formats de résultats.La norme a pour objectif de normaliser les requêtes, et non plusseulement les données bibliographiques pour permettre uneinterrogation simultanée de bases hétérogènes et réparties.Définition extraite du cours de Dominique Lahary :<http://membres.lycos.fr/vacher/profess/cours/mediadix/z3950/p3.htm>2 Sandrine Mouret, stagiaire DESS Gestion des systèmesdocumentaires d’information scientifique et technique d’Aix-Marseille de novembre 1999 à juillet 2000, puis recrutée en CDDd’octobre 2000 à juillet 2001.

Documentaliste - Sciences de l’information 2004, vol. 41, n° 1 • 15

ÉTUDE LA BIBLIOTHÈQUE OUVERTE

16 • Documentaliste - Sciences de l’information 2004, vol. 41, n° 1

2Publics, objectifs,contraintes

Une série d’entretiens non directifs (grille et ques-tions ouvertes), menés notamment dans les orga-nismes membres d’Agropolis, a permis de recenser,en mars 2000, les catalogues intéressés et leursspécificités : accès, taille, système d’exploitation,logiciel, organisation (champs, etc.), responsables,évolutions prévues, etc. Pour les besoins du pro-jet, les catalogues ont pu être regroupés en troiscatégories : ceux qui sont déjà sur Internet, ceuxqui le seront dans un futur proche de manièreautonome, et ceux qui auront besoin d’une aidepour y être transférés. L’hétérogénéité est extrême,dans tous les domaines, même pour les onze basesprêtes à être interfacées : de 4 800 à 270 000notices, formats et logiciels variés, etc.

Cet inventaire a permis l’établissement d’un pre-mier cahier des charges (mars 2000) dont voici lesprincipales contraintes.

• L’objectif est d’offrir un point d’accès uniqueet homogène aux divers catalogues scientifiquesou techniques de la région et de permettre un gainde temps dans la recherche documentaire.

• L’interface d’interrogation aura pour publicsprincipaux les chercheurs, enseignants et étudiantsde la région, mais également les partenaires étran-gers ou chercheurs expatriés des organismes derecherche et d’enseignement de la région ; d’où lanécessité de l’ouvrir en accès libre sur Internet. Lavisibilité internationale des ressources régionalesen recherche et formation supérieure en sera ainsiaccrue.

• Les principaux utilisateurs étant non profes-sionnels, l’utilisation de l’interface devra êtresimple, quitte à perdre en finesse. Les questionsporteront sur les quelques champs essentiels etcommuns à toutes les bases (auteur, titre, date deparution, mots clés). Après avoir repéré les sourcesd’information de la région sur son sujet, l’utilisa-teur sera donc invité à poursuivre directement sarecherche sur les interfaces web des catalogues desmembres du réseau, qui proposent souvent desservices plus spécifiques.

• L’affichage des résultats devra se faire à lavolée, pour réduire le temps de réponse, dans unformat court homogénéisé. Un format long pourraêtre développé à la demande.

• La solution devra prendre en compte lagrande hétérogénéité des bases à interfacer.

• Le respect des solutions propres à chaque éta-blissement sera privilégié même si des recom-mandations pourront être faites aux organismesne disposant pas encore d’une interface web d’in-terrogation de leur base bibliographique. Le logi-ciel devra s’adapter aux bases existantes et nonl’inverse.

La commission IST d’Agropolis

Cette commission représente :- 43 centres de documentation et services d’édition associés depuis 1985, dansle cadre de l’association Agropolis- plus de 250 professionnels de l’information- plus de 1,5 million de documents- plus de 18 000 collections de périodiquesEn 1994, le Collège des documentalistes devient la commission Informationscientifique et technique dont, depuis 1997, les services d’édition d’Agropolisfont partie. Très vite, une carte de lecteur commune est créée et de nombreuxprojets sont réalisés :- catalogue des périodiques commun (extrait du CCN d’abord imprimé, puisrepris sous SQL et interrogeable en ligne)- bibliographies thématiques communes- actions de communication : plaquettes, stands communs dans desmanifestations locales, nationales ou internationales- organisation de journées d’étude et d’information (parfois en collaborationavec l’ABBS-Languedoc-Roussillon)- mise sur pied de la formation GESIST (formation continue en alternanced’assistants en documentation basée sur les TIC et mise en place avec l’appui duCNAM-Montpellier et de l’ADBS*)- liste de diffusion ouverte à tous les professionnels de l’information d’Agropolis- bookmark commun : l’« Arbre à sites » (avec le logiciel libre ‘Links’), mis à jourpar l’ensemble de la communauté- achat en commun d’une base de données internationale : CAB Abstract(réservée aux membres du consortium d’achat : Agro.M, Cemagref, Cnearc,Engref, IAM.M)

* Voir : Nouvelles compétences et nouvelles formations en IST : l’expérience deGESIST / Marie-Gabrielle Bodart et Geneviève Lago. Documentaliste - Sciencesde l’information, déc. 2001, vol. 38, n° 5-6, p. 290-297

Un portail documentaire régional :www.agropolis.fr/documentation/

L’interface unique d’interrogation des bases documentaires accessibles viaInternet s’intégrera au portail documentaire réalisé par la commission ISTAgropolis, qui permet déjà :- d’accéder, une à une, à 18 bases bibliographiques des membres d’Agropolis- de localiser une revue dans une bibliothèque à Montpellier, Nîmes, Alès ouPerpignan, en interrogeant le catalogue collectif des périodiques- de situer une ressource électronique (encyclopédie, base de donnéesbibliographiques, etc.) dans ces bibliothèques- d’obtenir des renseignements pratiques sur ces bibliothèques (heuresd’ouverture, adresses, couverture thématique, services, etc.)- de trouver des sites web riches en information relatives aux thématiquesd’Agropolis sur l’Arbre à sites- d’interroger une base internationale : CAB Abstract- de se former à la recherche d’informations sur le Guid’Ari (Guide d’aide à larecherche d’information) et le site miroir du célèbre GIRI (Guide d’initiation à larecherche dans internet, du CREPUQ), de s’informer sur la formation continueen alternance d’assistants en documentation (GESIST)

Documentaliste - Sciences de l’information 2004, vol. 41, n° 1 • 17

• La centralisation des données sera évitée afinde maintenir la maîtrise des bases dans chacun desorganismes et d’assurer ainsi une mise à jour desdonnées plus efficace.

• La solution devra prendre en compte la fai-blesse des ressources en personnel informatiquemobilisables à long terme sur le projet.

• Le produit recherché devra être un produitcommercial (garanties d’assistance, de mise à jour,d’appui sur l’expérience d’autres utilisateurs, etc.).

3Choix et mise en place de la solution retenue

Les différentes solutions techniques ont ensuitefait l’objet d’une étude [2] qui passait en revuel’extraction des données, l’utilisation de moteursd’indexation et de recherche (en particulierVerity), les interfaces et l’accès par protocoles.

Les deux premiers procédés ont été abandonnésen raison des contraintes humaines et organisa-tionnelles qu’elles induisaient, ainsi que de lanécessité de disposer d’importantes ressourcesmachine et réseau, les fichiers étant relativementvolumineux.

Le protocole Z39.50 a été plus particulièrementétudié, mais il n’a pu être retenu car trop peu deserveurs Z39.50 étaient installés ou projetés.

Enfin, les « interfaces », qui interrogent lessources de données choisies lors de chaque requêtede l’utilisateur, ont été examinées. Ces dernières neconstituent pas d’index mais traduisent et trans-mettent la requête directement aux logiciels d’in-terrogation de chaque base, récupèrent les résultatset les affichent en les homogénéisant. On peutaussi les appeler méta-moteurs ou traducteurs derequête. C’est sur ce type de produits, permettantd’intégrer une passerelle Z39.50 et de développerdes passerelles vers les sources web, que la com-mission IST d’Agropolis décide finalement de faireporter une étude comparative.

Deux progiciels ont été présélectionnés carleurs développeurs (et donc l’assistance technique)étaient installés en France, et parce qu’ils avaientdéjà été utilisés sur des projets d’interrogation decatalogues de bibliothèques. En effet, les basesbibliographiques, très structurées, et les recherchesdocumentaires, très exigeantes, sont assez spéci-fiques. Il s’agit de Book-Line, d’Archimed, utilisépar le Pôle universitaire de Lille3, entre autres,

3 <www.poleuniv-lille-npdc.fr/rd/rdfba.html>4 Réseau documentaire du site de Grenoble, alors animé parN. Leon-Serrano, malheureusement disparu depuis. Voir <http://askonce.grenet.fr/redoc/>

Déroulement du projet

Début de la veille sur le sujet par la commission IST d’AgropolisÉtude parallèle par le Pôle d’une solution de remplacement aulogiciel WAIS pour le réseau RELAIS

1999 Stage de DESS, qui sera suivi du recrutement d’une chargée deprojet (Sandrine Mouret)

2000 Premier état des lieux des bases de données à interfacerCahier des charges et étude de marchéPrésentation du projet au Bureau d’Agropolis

2001 Signature d’une convention Pôle/Agropolis pour le financementde l’étudeLettre commune des présidents du Pôle et d’Agropolis auxresponsables des organismes membres d’Agropolis et desuniversitésÉvaluation du projet : moyens nécessaires (financiers etpersonnels)Rédaction des CAAP et CCTPDébut des discussions avec XeroxSignature d’une convention tripartite Agropolis/BIU/Pôleuniversitaire pour le financement du projet

2002 Signature d’un contrat Rank Xerox/PôleInstallation AskOnce V2 à AgropolisRecrutement d’une ingénieure-documentaliste, chargée duprojet (Chantal Salson)Formations au développement de passerelles (Chantal Salson,Jean Cerda)Nouvel état des lieux des bases à interfacerDébut du développement des passerellesPrésentation conjointe Xerox-Agropolis-BIU-Pôle à unreprésentant de la région Languedoc-Roussillon

2003 Installation d’AskOnce V3 + formations + extension de licences(de 20 à 60 utilisateurs simultanés)Tests de montée en chargeInstallation d’AskOnce V3.0.1 et nouveaux tests de montée enchargeRéunion des directeurs des organismes partenaires du projetpour renouveler la convention et envisager les suites du projetPhase de validation par les professionnels : ouverture du siteaux organismes participants au projetInstallation d’AskOnce V3.0.2Délibération sur la suite du projetOuverture de la Bibliothèque ouverte auprès de la communautéscientifique

Été1998

ÉTUDE LA BIBLIOTHÈQUE OUVERTE

18 • Documentaliste - Sciences de l’information 2004, vol. 41, n° 1

l’écran de l’usager [voir le schéma ci-contre].Le système ne crée pas d’index comme dans le

cas de moteurs de recherche sur le texte intégral,mais dispose d’un système de traduction des com-mandes d’interrogation du logiciel interrogé enlangage requête AskOnce. Si une source ne gèrepas certains opérateurs ou critères d’interrogation,AskOnce compensera la requête en l’adaptant dansun premier temps. Dans un deuxième temps, lesrésultats de la recherche sont analysés et filtréspour vérifier la cohérence entre la recherche et lerésultat.

Ainsi, une recherche sur des mots du titre s’ef-fectuera non seulement grâce aux commandes dulogiciel d’interrogation, mais les mots devront éga-lement être retrouvés et identifiés dans les titresdes résultats. Par ailleurs, si une source n’autorisequ’une recherche sur toute la notice sans spécifi-cation du champ de recherche, l’analyse des attri-buts dans les résultats autorisera AskOnce à réali-ser une requête plus fine, sur des champs tels quele titre, les mots clés, etc.

Le nombre de sources interrogeables via le webn’est limité que par la rapidité du réseau et la puis-sance des serveurs interrogés.

Cette interface permet d’interroger, en une seulerequête, des sources d’information hétérogènes entermes de contenus, de structures, de localisationsgéographiques. Elle offre la possibilité de compo-ser des équations de recherche et de les lancer surdes bases documentaires régionales, mais aussi surles autres ressources du web.

Une recherche avancée permet de choisir lescritères de recherche – titre, auteur, mots clés,texte intégral – fonction très utile dans le cas debanques de données structurées (comme les cata-logues de bibliothèques), et de combiner ces cri-tères entre eux.

Les résultats sont affichés à la volée (au fur et àmesure des envois de résultats des serveurs inter-rogés). Un aperçu des documents est proposé,ainsi que la mise en valeur des termes de larecherche. On peut aisément identifier l’origine dechacun des résultats.

Une fois les résultats reçus, des possibilités detris (par auteur, titre, ou base interrogée) sontoffertes à l’utilisateur, ainsi que l’impression et l’ex-portation des notices.

fondé sur le langage XML, et de AskOnce deXerox/MKMS, utilisé par le Pôle universitaire deGrenoble (projet Redoc4), écrit en Java, tous deuxtrès prometteurs.

Des fiches techniques sont rédigées à l’issue detests poussés. Elles permettent une comparaisonfine des deux solutions sur tous les plans :contraintes matérielles, techniques, financières ethumaines, fonctions et prestations offertes, déve-loppement informatique, etc.

Book-Line ne correspondant pas au cahier descharges pour l’interrogation de bases non norma-lisées et la récupération des résultats, c’est finale-ment le logiciel AskOnce qui est choisi. Une ver-sion d’évaluation est installée sur un serveuracheté par Agropolis international pour l’occasion.

Reste alors à lister les moyens nécessaires pourmettre en place la solution choisie. Tous calculsfaits, le budget total sur trois ans s’élève à 223 000euros (logiciel, licences, formations, matérielinformatique, étude préalable, salaires de l’infor-maticien d’Agropolis international mis à disposi-tion à temps partiel et de la documentaliste-chef deprojet chargée de l’installation et du paramétragede la solution) : une somme bien supérieure à ceque l’association Agropolis pouvait engager.

Le Pôle universitaire européen de Montpellier,qui avait participé au financement de l’étude, estalors devenu partenaire du projet, bientôt rejointpar la Bibliothèque interuniversitaire. Une conven-tion tripartite est signée en décembre 2001, for-malisant cette collaboration.

Après l’étape cruciale de réalisation d’un cahierdes charges, validé par tous les partenaires, le Pôleeuropéen a rédigé le CCAP (cahier des clausesadministratives particulières) et le CCTP (cahierdes clauses techniques particulières ), documentsqui ont permis de lancer la consultation à l’issue delaquelle une négociation serrée s’est engagée avecla société Xerox pour ajuster prestations et prix :la politique tarifaire (fondée sur les utilisateursnommés et identifiés) a notamment été remise enquestion. La signature d’un contrat pour la mise enœuvre de l’interface a eu lieu en janvier 2002 entrele Pôle européen et Xerox. Une extension delicence sera négociée fin 2002, afin de multiplierpar trois les possibilités de connexions simulta-nées (de vingt à soixante utilisateurs concurrents).

Le système retenu, principe de fonctionnementLe logiciel choisi, AskOnce de Xerox, est une

interface ou méta-moteur qui permet d’accéder àdes contenus hétérogènes : bases documentaireset sources de données, en les laissant en l’état surleurs sites. Grâce à des passerelles spécifiques, lesrequêtes sont transmises en temps réel de l’utili-sateur aux interfaces d’interrogation des différentesbases, de façon transparente pour l’utilisateur. Lesrésultats sont homogénéisés et s’affichent sur

5 Chantal Salson, co-signataire de cet article.6 Comité de suivi constitué des quatre premiers signataires de cetarticle et de Jean Cerda (informaticien à Agropolis international).

Documentaliste - Sciences de l’information 2004, vol. 41, n° 1 • 19

d’avoir des réponses encore plus rapidement. Deplus, cela permet de s’affranchir des problèmessuscités par toute modification dans la présenta-tion des formulaires d’interrogation ou de l’affi-chage des résultats HTML, qui, dans le cas dewrappers HTTP, demande de revoir la passerelledéveloppée et notamment la grammaire qui per-met l’analyse des résultats.

C’est pourquoi l’installation de serveurs Z39.50,encore peu répandus parmi les organismes parti-cipants (il n’y en a que deux actuellement), serapréconisée afin d’assurer la pérennité et la stabilitéde l’interrogation des sources.

AskOnce offre également la possibilité d’inter-roger des bases de données relationnelles (tellesque SQL, Oracle, etc.). Une passerelle vers unebase MySQL, compatible JDBC/ODBC, sans passerpar le formulaire d’interrogation développé enPHP, a été développée.

Un des atouts de la solution retenue est la capa-cité de l’équipe locale à prendre en main le para-métrage du système et le raccordement des bases,ce qui garantit une évolution du système et unélargissement progressif du nombre de bases àinterroger.

Développement, intégration de sources documentaires hétérogènes

AskOnce permet d’intégrer des sources HTTP,des bases serveurs Z39.50 et des bases de donnéescompatibles JDBC/ODBC.

Pour chacun des catalogues interrogeables parun CGI (comon gateway interface), il faut créer lesfichiers de configuration et les fichiers de traduc-tion des commandes d’interrogation de la source,puis réaliser des grammaires afin d’analyser lesrésultats. Ces différents éléments constituent unepasserelle (développée en Java) pour interrogerune source HTTP. On pourrait penser que deuxcatalogues utilisant le même logiciel documentaireauront une passerelle identique, mais ce n’est passystématique. En effet, chaque organisme décided’un formulaire d’interrogation et d’un affichagede résultats en HTML en fonction de son public.Des passerelles vers dix-neuf catalogues ont étéréalisées à ce jour [voir le tableau pages 22-25].

Pour interroger les serveurs Z39.50, il faut uti-liser un wrapper spécifique, passerelle fournie parXerox, qu’il faut cependant paramétrer en fonc-tion du format des données bibliographiques(USMarc, Unimarc) et qui, attaquant directementla base, sans passer par l’interface web, permet

Fonctionnement de l’interface

ÉTUDE LA BIBLIOTHÈQUE OUVERTE

20 • Documentaliste - Sciences de l’information 2004, vol. 41, n° 1

Mise en œuvreLa mise en commun des compétences et des

moyens des trois partenaires – Agropolis, Biblio-thèque interuniversitaire de Montpellier et Pôleuniversitaire européen de Montpellier et du Lan-guedoc-Roussillon – a permis de réaliser des éco-nomies d’échelle et s’est traduite par l’acquisitiond’une seule licence, d’un seul contrat de mainte-nance, d’un seul serveur, et l’engagement de res-sources humaines co-financées et formées.

Début 2002, le logiciel AskOnce a été installédans les locaux d’Agropolis sur un serveur dédié.

Une nouvelle chargée de projet5 a été recrutéeen juin 2002, pour dix-huit mois, sur un profil deposte diffusé via les réseaux professionnels : listesde diffusion, DESS en informatique documentaire,etc. Elle a pu, après une semaine de formation, seconsacrer au développement de passerelles versles bases de données et à la paramétrisation dulogiciel, en collaboration avec l’informaticiend’Agropolis.

Un comité de pilotage6 regroupant un profes-sionnel de l’information des trois structures par-tenaires du projet, l’informaticien et la chargée duprojet, se réunit tous les mois pour évaluer le tra-vail accompli et décider du programme à venir.

Le développement de quatorze passerelles versdes catalogues de bibliothèques a d’abord été réa-lisé sur la version 2 du logiciel AskOnce.

Une présentation de l’état d’avancement du pro-jet aux représentants des trois organismes parte-naires et de la région Languedoc-Roussillon a étéorganisée fin 2002 ; tous ont manifesté leur vifintérêt pour le projet. Le financement d’une exten-sion de licence de 20 à 60 utilisateurs simultanésa été décidé lors de cette réunion : cela permet auprojet d’entrer dans sa phase de validation par lesdocumentalistes, puis d’ouverture au public.

Le public visé par le projet (documentalistes etbibliothécaires, chercheurs, étudiants et ensei-gnants de la région, mais aussi du monde entier)étant difficilement quantifiable, il nous a été diffi-cile d’évaluer le nombre de connexions simulta-nées nécessaires, et supportables par un serveurordinaire.

Début 2003, la version 3 du logiciel négociéedans le contrat a été installée, suivie fin mars de laversion 3.01. Le changement de version a apporté,notamment à l’utilisateur, des fonctions étenduesd’aperçu et de navigation et a nécessité des déve-loppements réalisés en interne par l’équipe encharge du projet.

Après les premiers tests de montée en charge, lesdysfonctionnements constatés tant au niveau duserveur que du côté du logiciel ont pu être réglés,d’une part en augmentant la capacité mémoire duserveur et d’autre part, avec l’aide du support tech-nique de la société Xerox, en optimisant les capa-cités du logiciel. Lors de ces tests, nous avons

contacté plus de cent personnes afin de tester l’in-terrogation simultanée par soixante utilisateursconcurrents (limite de notre licence).

La personnalisation de l’interface pour l’adapteraux besoins du projet, tant du point de vue gra-phique que du point de vue fonctionnel, réaliséesous la version 2, n’a pu être maintenue dans lanouvelle version dont les possibilités de person-nalisation ont été considérablement réduites.

Le projet, qui a dû s’adapter à deux versions delogiciel en l’espace de dix mois, doit être stabilisépour permettre de terminer les développementsnécessaires. Parallèlement, une validation par lesprofessionnels et un échantillon d’usagers a étéeffectuée, étape décisive avant l’ouverture au grandpublic.

Dans une première phase de communicationayant pour cible les professionnels (documenta-listes, enseignants et chercheurs) des organismesparticipants au projet, une plaquette de présenta-tion de l’interface a été produite. Elle permet d’in-former des fonctionnalités du système, et de véri-fier non seulement l’usage, mais aussi différentsparamètres (capacité du serveur, et du réseau,ergonomie de l’interface), et surtout d’informer lesétablissements des conséquences techniques pré-visibles sur leurs serveurs.

4Perspectives : vers laconstruction d’un réseau

documentaire régional

Le logiciel AskOnce, utilisé pour fédérer des conte-nus hétérogènes dans le cadre de ce projet docu-mentaire interinstitutionnel, n’est pas un produitdéveloppé pour les besoins spécifiques des biblio-thèques, mais un méta-moteur qui permet d’at-teindre toute source accessible via Internet et/ouintranet, et d’interroger simultanément des sourcestrès disparates. Les catalogues de bibliothèquesconstitués d’informations très structurées offrentdes possibilités de tri, ce méta-moteur propose desfonctionnalités similaires pour des données nonstructurées. Il offre, par exemple, la possibilitéd’extraire des termes et parties d’un document afind’en afficher un aperçu ; cette fonctionnalité esttrès intéressante pour des pages disponibles sur leweb, car elle permet un tri plus efficace de l’infor-mation. Tous les types d’information seront inter-rogeables simultanément, en tenant compte de ladifférence de nature et de niveau de validation del’information.

En même temps que se mettent en place despasserelles pour les banques de données biblio-graphiques déjà accessibles en ligne, une assis-

Documentaliste - Sciences de l’information 2004, vol. 41, n° 1 • 21

Pour en savoir plus

[1] Étude de marché sur les interfaces d’interrogationuniques via le Web des bases de données bibliographiques,hétérogènes et distantes des établissements d’Agropolis :rapport de projet / Sandrine Mouret. – DESS Gestion dessystèmes documentaires d’information scientifique ettechnique, Univ. Aix-Marseille III, 2000. – 10 p. + 35 p.d’annexes[2] Une interface sur le site Web d’Agropolis pourinterroger en une requête les bases bibliographiques desétablissements : étude de marché des solutions possibles /Sandrine Mouret ; sous la dir. de Hanka Hensens,documentaliste IRD, et de Marie-Claire Allaya,informaticienne IAM.M, pour la commission IST d’Agropolis,dans le cadre du stage de DESS Gestion des systèmesdocumentaires d’information scientifique et technique, Univ.Aix-Marseille III, 2000. – 26 p + 27 p. d’annexes. –www.agropolis.fr/ist/infos/memoires/SandrineMouret.pdf[3] Vers un accès unique aux ressources documentairesrégionales = Towards a single access to regionaldocumentary resources. In : Images d’Agropolis = Focus onAgropolis. – Montpellier : Agropolis, 2002. – P. 32-35. –www.agropolis.fr/pdf/focus2002/FocusAgropolis2002.pdf[4] Vers un accès unique aux sources documentairesrégionales / Hanka Hensens. – La lettre d’Agropolis, mars2002, n° 91, p. 1. – www.agropolis.fr/actualiteevenements/lettre91/[5] Vers un accès unique aux sources documentairesrégionales / Chantal Salson. – La lettre d’Agropolis,novembre-décembre 2002, n° 97, p. 4, – www.agropolis.fr/pdf/lettre/lettre-97.pdf[6] Vers un accès unique aux ressources documentairesrégionales : la mise en route / Chantal Salson, HankaHensens. – Notes d’actualité Agropolis, décembre 2002, n° 4,p. 3-4. – www.agropolis.fr/pdf/notesactus/dec2002/Agropolis_IST_ressources.pdf[7] Interface : un accès unique aux ressourcesdocumentaires régionales en Languedoc-Roussillon. –Poster présenté au colloque « Campus numériques etuniversités numériques en région », Montpellier, UO-MLR,1er et 2 octobre 2003[8] Interface : un accès unique aux ressourcesdocumentaires régionales en Languedoc-Roussillon /Chantal Salson, Hanka Hensens, Françoise Foury, MaggyPézeril. In : Actes du colloque « Campus numériques etuniversités numériques en Région », Montpellier, UO-MLR,1er et 2 octobre 2003. – 2 p. – www.agropolis.fr/bomlr/Communication_colloque_UNR.pdf[9] www.bomlr.info, La Bibliothèque ouverte : un outil pourfaciliter les recherches documentaires / Chantal Salson. –La lettre d’Agropolis, novembre 2003, n° 105, p. 1. –www.agropolis.fr/pdf/lettre/lettre-105.pdf

tance par l’équipe en charge du projet sera appor-tée aux autres organismes spécialisés qui n’offrentpas d’accès web à leur base, afin de les associer àce projet.

La couverture de l’offre documentaire régionaleau niveau de la recherche et de l’enseignementsupérieur n’est certes pas exhaustive. Dix-neufcatalogues sont actuellement accessibles [voirpages 22-25. L’utilisateur lance sa recherche sur unvolume d’un million et demi de notices, avec par-fois un lien vers le texte intégral du document. Cechiffre est en constante évolution, au fur et àmesure du raccordement des bases sur des critèrestechniques et à la demande des organismes.

Si la couverture disciplinaire des bases était plu-tôt liée aux thématiques d’Agropolis, cela s’ex-plique par la prompte adhésion de ces organismesau projet. Petit à petit, les autres domaines scien-tifiques voient leur nombre de sources s’étoffer,par l’adhésion de nouveaux organismes spéciali-sés, en complément des catalogues des biblio-thèques universitaires et interuniversitaires de larégion.

Un accompagnement et un suivi des organismesmembres de ce réseau documentaire font partiedu projet afin de pérenniser et consolider le travaileffectué.

Il aura fallu une succession de projets piloteset, pour celui-ci, presque six ans pour passer del’expression du besoin au déploiement opération-nel et permettre, en un seul clic de souris, de savoirce que contiennent les bibliothèques scientifiqueset techniques de la région. Ce fut et c’est encore untravail de longue haleine où de nombreuses per-sonnes de multiples organismes se sont investies.Ce projet porteur a permis à des organismes detravailler ensemble dans un partenariat étroit et,pour le réseau Agropolis, il a contribué sans douteà crédibiliser la commission IST auprès des déci-deurs. En 2003, l’« Interface », rebaptisée « Biblio-thèque Ouverte » est sur le point d’intégrer l’offrede services de l’Université numérique en région(UNR) pour les étudiants, les enseignants et leschercheurs, ce qui pérennise le projet.

La puissance du logiciel ouvre de nombreusesperspectives. L’interface permet déjà d’interrogerles catalogues de périodiques, en plus des cata-logues d’ouvrages. Elle permettra d’interrogerd’autres sources accessibles sur le web : basesbibliographiques achetées en commun, produc-tions en texte intégral (la littérature grise particu-lièrement recherchée en IST : thèses, rapports,etc.), sites web, archives ouvertes, etc.

Et pourquoi ne pas rêver de relier un jour plu-sieurs passerelles régionales...

DÉCEMBRE 2003

ÉTUDE LA BIBLIOTHÈQUE OUVERTE

22 • Documentaliste - Sciences de l’information 2004, vol. 41, n° 1

Organisme

Agro.M - INRA : Pôled’enseignementsupérieur et derecherche AGROMontpellier - INRA(réseau DIAM)

CEFE-CNRS : Centred’écologie fonctionnelleet évolutive

Cemagref - Groupementde Montpellier

CNEARC - Centrenational d’étudesagronomiques desrégions chaudes

CIHEAM/IAM.M : Centreinternational deshautes étudesagronomiquesméditerranéennes /Institut agronomiqueméditerranéen deMontpellier

URL

www.agro-montpellier.fr/documentation/bibAGRO.htm

http://bib.cefe.cnrs-mop.fr

www.montpellier.cemagref.fr/doc/

www.biblio.siarc.cnearc.fr/

www.iamm.fr/html/ress_sc/docu/default.html

Domaines

ÉconomieEnvironnement etécologieGestionAlimentation et agro-industriePlantes et productionsvégétalesSciences du vivant et del’ingénieurSciences humainesViticulture-oenologieBiologie despopulationsDynamique dessystèmes écologiquesBiodiversité etfonctionnement desécosystèmesÉcologie chimiqueGénie des équipementspour l’agriculture et laforêtGénie instrumentalpour la qualité agro-alimentaireIrrigationRessourcesichtyologiques en pland’eauDéveloppementagricole,développement ruralAgronomie tropicaleÉconomie et sociologieruralesAgricultureAgro-alimentaireAlimentationÉconomieCommerce internationalDéveloppementPlanificationPolitique publiqueCoopérationinternationaleAfrique du NordProche OrientEuropeUnion européennePartenariat euro-méditerranéen

Volume

Bibl. de l’Agro. : 11 200 notices

36 248 notices

3 000 notices

29 050 notices

20 000 notices

Logiciel

Doris

Reference Manager

Base SQL

Ex-Libris

Cindoc + CDS-ISIS

Web/Z39.50

Doris/Web

Reference Web Poster

ASP (intranet)

Ex-Libris/web

wwwisis/PHP

Catalogues accessibles par la Bibliothèque Ouverte Montpellier-Languedoc-RoussillonPasse-relle

*

*

*

*

* L’astérisque indique l’existence, début 2004, d’une passerelle vers le catalogue de l’organisme cité.

Documentaliste - Sciences de l’information 2004, vol. 41, n° 1 • 23

Organisme

Cirad : Centre decoopérationinternationale enrecherche agronomiquepour le développement

EMA : École des minesd’Alès

ENGREF : Écolenationale du génierural, des eaux et desforêtsENSIA / SIARC : Écolenationale supérieuredes industries agro-alimentaires / Sectioningénieurs industriesagro-alimentaires pourles régions chaudesINIBAP - Réseauinternational pourl’amélioration de labanane et de la bananeplantainINRA - Économie etsociologie rurales -Centre Pierre Bartoli

INRA - Pathologiecomparée (Alès)

IRD - Institut derecherche pour ledéveloppement

URL

www.agropolis.fr/documentation/cirad.html

http://doc.ema.fr/

www.engref.fr/resdoc.htm, ensuite :catalogues

www.biblio.siarc.cnearc.fr

www.inibap.org/bdd/bdd_fre.htm

www.montpellier.inra.fr/ESR/doc_bartoli/

www.agropolis.fr/documentation/inra.html#12

www.mpl.ird.fr/doc.htm

Volume

197 000 notices

15 486 notices

15 000 notices

2 700 notices

7 685 notices

25 900 notices

1 428 notices + 20 000tirés à part

74 719 notices

Logiciel

Loris

Alexandrie

Ex-libris

Ex-Libris

Winisis

Doris

Texto

Texto et Verity

Web/Z39.50

Loris/web (intranet)

Alexandrie/Web

Ex-Libris/Web

Ex-Libris/Web

TeXMerge

Doris/Web

changement de systèmeen cours

Catalogues accessibles par la Bibliothèque Ouverte Montpellier-Languedoc-Roussillon (suite)Passe-relle

*

*

*

*

*

Domaines

Agriculture des régionschaudes Productions végétalesÉconomie dudéveloppement et del’environnementPolitiques économiqueset agricolesMéthodes etmodélisationéconomiquesSciences de la terreGénie civil et minierMatériauxEnvironnementindustrielProductiqueIntelligence artificielleGestion de l’eauForesterie tropicaleAgroforesterieEnvironnementAgro-alimentaireAlimentationPays tropicaux

Bananiers et bananiersplantain

Économie et gestionrurale - Gestion -Économie générale -Innovation etconnaissance -Méthodes quantitatives- Sciences humaines -Droit - LégislationPathologie desinvertébrésVirologie, biologiecellulaireBiologie moléculaireMycotoxines Sciences del’environnementSciences de la vieSciences humaines(travaux Orstom-IRD)

ÉTUDE LA BIBLIOTHÈQUE OUVERTE

24 • Documentaliste - Sciences de l’information 2004, vol. 41, n° 1

Organisme

ISTEEM - UniversitéMontpellier 2 :bibliothèque del’Institut des sciencesde la terre, del’environnement et del’espace de Montpellier

Maison de latélédétection enLanguedoc-Roussillon

Maison des sciences del’eau

Observatoireocéanologique -laboratoire Arago

Tela botanica

URL

www.isteem.univ-montp2.fr/

www.teledectection.fr

www.maisondeleau.org/documentation.php3

www.obs-banyuls.fr/biblio/Biblio.htm

www.tela-botanica.org/

Domaines

Géologie généraleGéologie régionale(notamment africaine)GéophysiqueGéochimieSédimentologieTectoniqueHydrogéologieEnvironnementAstronomieAstrophysiqueAgricultureEnvironnementAménagement duterritoireSIGPérimètres irriguésÉcosystèmes forestierset rurauxUrbanismeRessources en eauRessources naturellesMilieux aquatiquesSIRS et représentationsspatialesTélédétectionaérospatialeModèles numériques deterrain (MNT)Localisation précise parsatellite (GPS)Sciences de l’eauTélédétectionClimatologieDroit et législationInformatiqueAménagement duterritoireRégions françaises(principalementméditerranéennes) etrégions tropicalesOcéanographie etbiologie marineBiologie (biologiecellulaire etmoléculaire)ÉcologieZoologieBotanique (algologie)Sciences de la terreBotanique

Volume

12 484 notices

2 000 notices + tirés àpart, cartes, etc.

11 000 notices

10 000 notices+ de 50 000 tirés à part

+ de 21 000 notices

Logiciel

Cindoc

Texto sous WindowsProchainement Ex-Libris

Texto et Verity - baseHorizon (IRD)

Bibliotech + 4d

MySQL

Web/Z39.50

Changement desystème en cours

changement de système en cours

PHP

Catalogues accessibles par la Bibliothèque Ouverte Montpellier-Languedoc-Roussillon (suite)Passe-relle

Documentaliste - Sciences de l’information 2004, vol. 41, n° 1 • 25

Organisme

Université de Perpignan- bibliothèqueuniversitaire

Université Paul Valery(Université Montpellier3) : centres dedocumentation

Universités Montpellier1,2,3 et Nîmes Vauban :BIU Montpellier

URL

www.univ-perp.fr/web/BU/buweb.htm

http://alexandrie.univ-montp3.fr/

www.biu.univ-montp1.fr/

Domaines

LettresDroitSciences économiquesSciences exactes etnaturellesSciences humaines etsociales (géographie,aménagement, histoire,ethnologie, langues,etc.)Droit et scienceséconomiquesMédecinePharmacieSciencesLettres et scienceshumainesThéologie protestante

Volume

131 000 notices

113 000 notices

900 000 notices

Logiciel

Absys

Alexandrie

Aleph

Web/Z39.50

Z39.50

Alexandrie/web -Z39.50 en test

Z39.50

Catalogues accessibles par la Bibliothèque Ouverte Montpellier-Languedoc-Roussillon (suite)Passe-relle

*

*

*

Les auteures tiennent à remercier Marie-Claire Allaya (informaticienne IAM.M), Jean Cerda (service Informatique d’Agropolis inter-national), Gérard Ghersi (correspondant de la CIST au bureau d’Agropolis durant la première phase du projet), Carole Giansily(déléguée de la CIST pendant la première phase du projet), Philippe Vaïsse (service Informatique de la BIU de Montpellier).