10 años de repositorios cooperativos

19
10 a 10 a ñ ñ os de repositorios cooperativos os de repositorios cooperativos Ricard de la Vega Jefe del Servicio de Portales y Repositorios Centre de Supercomputació de Catalunya 4as. Jornadas OS-Repositorios Barcelona, 3-5 marzo de 2010

Upload: ricard-de-la-vega-sivera

Post on 09-Jul-2015

575 views

Category:

Documents


0 download

DESCRIPTION

En 1999 empezaron los trabajos que culminaron con la puesta en funcionamiento de TDX/TDR, el primer repositorio creado en España. Desde entonces la cooperación entre las universidades de Catalunya y la Biblioteca de Catalunya ha permitido poner en funcionamiento 5 repositorios cooperativos (TDX/TDR, RECERCAT, RACO, MDC y MDX). Esto ha sido posible por una división de tareas en la que las bibliotecas son las responsables de la introducción de contenidos, el CESCA de la preparación del software y el hardware y el CBUC de la coordinación de los procesos.Este taller dividido en 4 partes, tiene la finalidad de explicar las diferentes fases que han vivido los repositorios cooperativos, las actuaciones llevadas a cabo en estos 10 años para llenarlos de contenido (estándares, aspectos legales, ayudas de digitalización, etc.), la experiencia de una de las universidades -la UPF- que participa en estos repositorios cooperativos y que a la vez dispone del suyo propio y la infraestructura técnica en la que se han desarrollado y evolucionado.La presentación se corresponde con la parte de infraestructura del taller

TRANSCRIPT

Page 1: 10 años de repositorios cooperativos

10 a10 añños de repositorios cooperativosos de repositorios cooperativos

Ricard de la Vega

Jefe del Servicio de Portales y Repositorios

Centre de Supercomputació de Catalunya

4as. Jornadas OS-Repositorios

Barcelona, 3-5 marzo de 2010

Page 2: 10 años de repositorios cooperativos

Un taller en 5 partesUn taller en 5 partes

� Las diferentes fases que han vivido los repositorios

cooperativos � Lluís M. Anglada

� Actuaciones llevadas a cabo en estos 10 años para

llenarlos de contenido � Sandra Reoyo

� Experiencia de la UPF como participante en estos

repositorios y con uno institucional � Anna Casaldàliga

� Infraestructura técnica en que se han desarrollado y han

evolucionado � Ricard de la Vega

� Los retos a los que se enfrentan los repositorios

cooperativos � Lluís M. Anglada

Page 3: 10 años de repositorios cooperativos

Centre de SupercomputaciCentre de Supercomputacióó de Catalunya de Catalunya

� Consorcio público

� Creado en 1991

� Formado por:

• Generalitat de Catalunya

• Fundació Catalana per a la

Recerca i la Innovació

• 9 universidades catalanas

• Consejo Superior de Investigaciones Científicas

� Anella Científica creada en

1993

Page 4: 10 años de repositorios cooperativos

Nuestros serviciosNuestros servicios

Page 5: 10 años de repositorios cooperativos

ÍÍndicendice

� Introducción

� Software

• ETD-db (TDR)

• DSpace (RECERCAT, MDX)

• Open Journal Systems (RACO)

• CONTENTdm (MDC)

� Hardware

• 2001 � 2010

� Conclusiones

Page 6: 10 años de repositorios cooperativos

SoftwareSoftware

� Se ha hecho un estudio inicial para cada repositorio con el objetivo de conocer qué software sería el más adecuado en cada caso

� La mayoría de repositorios son software de código abierto, hecho que ha permitido, entre otras ventajas, la adaptación a las necesidades concretas de cada proyecto

� Interoperatividad a través de OAI-PMH• Proveedores de datos

• Proveedores de servicios

Page 7: 10 años de repositorios cooperativos

ETDETD--dbdb (2000, TDR)(2000, TDR)

� Gestión de contenidos � ETD-db

• Proyecto de colaboración entre:

− Graduate School at Virginia Tech

− Digital Library and Archives (DLA)

− National Digital Library of Thesis and Disertations (NDLTD)

• 1 instancia de ETD-db para cada institución

� Indexación y publicación �Glimpse y Webglimpse

• Consultas globales al repositorio

� Módulo para la exportación por OAI-PMH y de estadísticas

� Desde 2007, recolector de tesis españolas

� Módulo MetaIndex + librerías X-Server de Ex Libris

Page 8: 10 años de repositorios cooperativos

DSpace DSpace (2005, RECERCAT; 2009, MDX)

� Software para repositorios digitales

� Desarrollado por MIT i HP

Actualmente bajo DURASPACE

� Software de código abierto

� Unas 700 instalaciones

� OLD Dominion University plugin para la recolección por OAI-PMH

� Desarrollos propios

• Módulo de estadísticas

• Herramienta de importación desde REPEC

Page 9: 10 años de repositorios cooperativos

Open Journal Systems (2006, RACO)Open Journal Systems (2006, RACO)

� Herramienta para la gestión editorial + repositorio

� Public Knowledge Project (PKP)• Simon Fraser University Library

• School of Education at Stanford University

• Simon Fraser University

• Faculty of Education at the University of British Columbia

� Software de código abierto

� Casi 3.000 instalaciones

(1-N revistas)

� Desarrollos propios• Módulo de publicación simplificado

• Módulo de gestión de instituciones

• Módulo de estadísticas

Page 10: 10 años de repositorios cooperativos

CONTENTdmCONTENTdm (2006, MDC)(2006, MDC)

� Gestor de colecciones digitales

� Online Computer Library Center (OCLC)

� Licencia privativa basada en el número de documentos

� Unas 1.400 instalaciones

� Las colecciones pueden estar formadas por diferentes tipos de ficheros: imágenes, pdf, audio, video...

� Extensión OCR para colecciones digitalizadas. Permite incluir el transcript

Page 11: 10 años de repositorios cooperativos

MMáás alls alláá del del software software de base...de base...

� Adaptación del software de base

• Diseño gráfico, traducciones y adaptación de textos

• Configuración de parámetros (stop words…)

• Corrección de errores

• Ampliación de funcionalidades (diacríticos…)

� Instalación de módulos o plugins

• Para la exportación o importación OAI-PMH, Manakin…

� Desarrollo de módulos propios

• Estadísticas, ingesta masiva de datos, módulos de RACO…

� Software complementario

• Intranets, páginas de novedades, herramientas de monitorización…

Page 12: 10 años de repositorios cooperativos

ÍÍndicendice

� Introducción

� Software

• ETD-db (TDR)

• DSpace (RECERCAT, MDX)

• Open Journal Systems (RACO)

• CONTENTdm (MDC)

� Hardware

• 2001 � 2010

� Conclusiones

Page 13: 10 años de repositorios cooperativos

Hardware

� ~80 GB y 7.690 consultas

� HP V2500 (cálculo)

• 16 procesadores

• 4 GB de memoria

• 227 GB de disco

� StorageTek TimberWolf 9740

• 2,7 TB en cintas

2001 2005 2006 2006 2009

Page 14: 10 años de repositorios cooperativos

Hardware

� En 2003 ~100 GB y 278.710 consultas

� HP rp5430 (servidor)

• 2 procesadores PA8700

• 704 GB de memoria

� HP EVA V.2 (cabina de discos)

• 2,8 TB de disco

� StorageTek TimberWolf 9740

• 5 TB en cintas

2001 2005 2006 2006 2009

Page 15: 10 años de repositorios cooperativos

2005 2006 2006 2009

Hardware

2001 2005 2006 2006 2009

� En 2010 ~2 TB y 8.019.930 consultas (TDR+RECERCAT+RACO)

� Clúster de e-Información

• 32 nodos Proliant DL360

• 291 GB de memoria

� NetApp FAS3140

• 100 TB de disco

� ADIC Scalar i2000

• 156 TB en cintas

Page 16: 10 años de repositorios cooperativos

Hardware Hardware en 2010en 2010

� Escalable

� Alta disponibilidad

� Balanceo de carga

� Virtualización

Entorno de desarrollo

Entorno de preproducción

Entorno de producciónRed de almacenamiento

Nodos dedicados

� GAIA (3)� PADICAT (7)

� Metalib (1)

� MDC (1)

Balanceadores

Servicios

Datos

Repositorios

Page 17: 10 años de repositorios cooperativos

ÍÍndicendice

� Introducción

� Software

• ETD-db (TDR)

• DSpace (RECERCAT, MDX)

• Open Journal Systems (RACO)

• CONTENTdm (MDC)

� Hardware

• 2001 � 2010

� Conclusiones

Page 18: 10 años de repositorios cooperativos

ConclusionesConclusiones

Con la cooperación se consigue:

� Adopción de procedimientos comunes

� Mayor visibilidad

� …

� Economías de escala• En software

• En hardware

• En el equipo humano

Page 19: 10 años de repositorios cooperativos