cómo publicar metadatos manuel vargas del valle ([email protected]) coordinador de la unidad de...

25
Cómo publicar metadatos Manuel Vargas Del Valle ([email protected]) Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad de Costa Rica (INBio) Buenos Aires (Argentina) 28 de septiembre de 2011 Curso sobre la publicación de datos sobre biodiversidad en la red de GBIF y su aptitud para el uso, edición 2011

Upload: renata-alvizo

Post on 28-Jan-2016

218 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Cómo publicar metadatos Manuel Vargas Del Valle (mvargas@inbio.ac.cr) Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad

Cómo publicar metadatos

Manuel Vargas Del Valle ([email protected])Coordinador de la Unidad de Desarrollos InformáticosInstituto Nacional de Biodiversidad de Costa Rica (INBio)

Buenos Aires (Argentina)28 de septiembre de 2011

Curso sobre la publicación de datos sobre biodiversidad en la red de GBIF y su aptitud para el uso, edición 2011

Page 2: Cómo publicar metadatos Manuel Vargas Del Valle (mvargas@inbio.ac.cr) Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad

Proceso de publicaciónde información

Page 3: Cómo publicar metadatos Manuel Vargas Del Valle (mvargas@inbio.ac.cr) Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad

Agenda

- ¿Por qué metadatos?

- El perfil EML de GBIF

- Estándares para metadatos

- Preparación de los metadatos

- ¿A dónde se van esos metadatos?

- Preparación de los metadatos (ejemplos)

Page 4: Cómo publicar metadatos Manuel Vargas Del Valle (mvargas@inbio.ac.cr) Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad

Agenda

- ¿Por qué metadatos?

- El perfil EML de GBIF

- Estándares para metadatos

- Prepación de los metadatos

- ¿A dónde van los metadatos?

- Preparación de los metadatos (ejemplos)

Page 5: Cómo publicar metadatos Manuel Vargas Del Valle (mvargas@inbio.ac.cr) Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad

”Ciencia con uso intensivo de datos”

”Cuarto paradigma de la ciencia”

e-Infrastructure Reflection Group (European Strategy Forum on Research Infrastructures). Report on Data Management, November 2009. http://www.e-irg.eu/images/stories/publ/task_force_reports/dmtfjointreport.pdf

”Diluvio digital de datos”

The Fourth Paradigm: Data-Intensive Scientific Discovery http://research.microsoft.com/en-us/collaboration/fourthparadigm/contents.aspx

Alta calidad en los metadatos para una curación a largo plazo y para el uso de los recursos de datos.

Requisito clave:

¿Por qué metadatos?

Page 6: Cómo publicar metadatos Manuel Vargas Del Valle (mvargas@inbio.ac.cr) Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad

¿Por qué metadatos?

William K. Michener, Meta-information concepts for ecological data management, Ecological Informatics, Volume 1, Issue 1, January 2006, Pages 3-7, ISSN 1574-9541, DOI: 10.1016/j.ecoinf.2005.08.004.

¡La información se deteriora con el tiempo!

Page 7: Cómo publicar metadatos Manuel Vargas Del Valle (mvargas@inbio.ac.cr) Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad

¿Por qué metadatos?

Los metadatos permiten:

- El descubrir información- Interpretar/Evaluar

- Procedencia- Calidad- Aptitud para el uso

- Reutilización

Page 8: Cómo publicar metadatos Manuel Vargas Del Valle (mvargas@inbio.ac.cr) Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad

Agenda

- ¿Por qué metadatos?

- El perfil EML de GBIF

- Estándares para metadatos

- Preparación de los metadatos

- ¿A dónde van los metadatos?

- Preparación de los metadatos (ejemplos)

Page 9: Cómo publicar metadatos Manuel Vargas Del Valle (mvargas@inbio.ac.cr) Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad

Estándares para metadatosEcological Metadata Language (EML) v2.1.1http://knb.ecoinformatics.org/software/eml/

Dublin Core http://dublincore.org/documents/dcmi-terms/

Directory Interchange Format (DIF)http://gcmd.nasa.gov/User/difguide/difman.html

ISO 19115/19139 Geographic MetadataISO 19115: http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=26020ISO 19139: http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=32557

Page 10: Cómo publicar metadatos Manuel Vargas Del Valle (mvargas@inbio.ac.cr) Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad

Natural Collections Descriptions (NCD)http://www.tdwg.org/standards/312/

Federal Geographic Data Committee (FGDC) Biological Profile* http://www.fgdc.gov/standards/projects/FGDC-standards-projects/metadata/biometadata/

* Una extensión del FGDC CSDGM (Content Standard for Digital Geospatial Metadata)

Multimedia Resources Metadata Schema http://www.tdwg.org/charters/article/view/448/36

Estándares para metadatos

Page 11: Cómo publicar metadatos Manuel Vargas Del Valle (mvargas@inbio.ac.cr) Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad

ISO 19115/19139Perfil Norteamericano del ISO 19139

http://www.fgdc.gov/standards/projects/incits-l1-standards-projects/NAP-Metadata/napMetadataProfileV101.pdf/view

Existen diversas posibilidades para ver y convertir metadatos

EML to FGDC Biological Profilehttps://code.ecoinformatics.org/code/eml/trunk/lib/eml2tonbii/

# FGDC CSDGM to ISO Transform# FGDC CSDGM to ISO Crosswalk# ISO XML to HTML View: # FGDC BIO to ISO Transform# FGDC BIO to ISO Crosswalkhttp://www.ncddc.noaa.gov/technology/metadataandxml/view

FGDC CSDGM

ISO 19139

EML to ISO 19139http://code.google.com/p/gbif-metadata/source/browse/trunk/metadata/src/main/resources/eml2iso19139.xsl

Open source INSPIRE-compliantMD editor (multilingual)http://www.inspire-geoportal.eu/EUOSME/

Page 12: Cómo publicar metadatos Manuel Vargas Del Valle (mvargas@inbio.ac.cr) Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad

Metadatos y los idiomas

A Multilingual Metadata Catalog for the ILTER: Issues and Approaches. Vanderbilt, K.L., et al., Ecological Informatics, Volume 5, Issue 3, May 2010, Pages 187-193, doi:10.1016/j.ecoinf.2010.02.002

Utilizar un único idioma. (e.g. inglés)- Los proveedores de datos dan los metadatos básicos en inglés- Los metadatos ampliados se provee en idioma local

“Keywords” en idioma local desde un thesaurus. e.g., GEMET, AGROVOC

- GEMET: http://www.eionet.europa.eu/gemet/- AGROVOC: http://www4.fao.org/agrovoc/default.htm

Solución (a largo plazo): Ontologías plurilingües.

¿problemas? - Carga adicional → herramientas y estándares

Page 13: Cómo publicar metadatos Manuel Vargas Del Valle (mvargas@inbio.ac.cr) Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad

Agenda

- ¿Por qué metadatos?

- El perfil EML de GBIF

- Estándares para metadatos

- Preparación de los metadatos

- ¿A dónde van los metadatos?

- Preparación de los metadatos (ejemplos)

Page 14: Cómo publicar metadatos Manuel Vargas Del Valle (mvargas@inbio.ac.cr) Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad

Perfil EML de GBIF- Requerimientos

- GBIF Metadata Task Grouphttp://www2.gbif.org/GBIF-MIFTG-Report.pdf

- EML; ISO 19115; NCD; INSPIRE Directive http://community.gbif.org/mod/file/download.php?file_guid=10915 http://community.gbif.org/mod/file/download.php?file_guid=5656

http://rs.gbif.org/schema/eml-gbif-profile/1.0/eml-gbif-profile.xsd

- GBIF EML schema

http://community.gbif.org/pg/groups/5258/gbif-metadata-network/

- Comunidad GBIF: Metadata network

- Perfil GBIF: Documentaciónhttp://links.gbif.org/gbif_metadata_profile_how-to_en_v1http://links.gbif.org/gbif_metadata_profile_guide_en_v1

Page 15: Cómo publicar metadatos Manuel Vargas Del Valle (mvargas@inbio.ac.cr) Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad

Agenda

- ¿Por qué metadatos?

- El perfil EML de GBIF

- Estándares para metadatos

- Preparación de los metadatos

- ¿A dónde van los metadatos?

- Preparación de los metadatos (ejemplos)

Page 16: Cómo publicar metadatos Manuel Vargas Del Valle (mvargas@inbio.ac.cr) Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad

Preparación de los metadatos

- Editores de metadatose.g., IPT, Spreadsheet template, Morpho, EUOSME,

Cassia.

- Scripting- Tomarlo directamente de una base de datos de

metadatos.- Convertir de una estándar de metadatos a EML

- Creando el XML de manera directa- Es esencial que se valide cuidadosamente el resultado.

Page 17: Cómo publicar metadatos Manuel Vargas Del Valle (mvargas@inbio.ac.cr) Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad

Agenda

- ¿Por qué metadatos?

- El perfil EML de GBIF

- Estándares para metadatos.

- Preparación de los metadatos

- ¿A dónde van los metadatos?

- Preparación de los metadatos (ejemplos)

Page 18: Cómo publicar metadatos Manuel Vargas Del Valle (mvargas@inbio.ac.cr) Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad

¿A dónde van esos metadatos?

http://metadata.gbif.org

Page 19: Cómo publicar metadatos Manuel Vargas Del Valle (mvargas@inbio.ac.cr) Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad

Fuentes de metadatos- Cache de datos de GBIF

- Instalaciones del IPT registradas - Catálogos a nivel nacional, regional, organizaciones. - Catálogos por tema. e.g., OBIS

GBIF: -No imponemos un estándar de metadatos o una

implementación de catálogo para los participantes.

- Participantes de GBIF

- Redes externas- e.g. Knowledge Network for Biocomplexity (KNB)

Page 20: Cómo publicar metadatos Manuel Vargas Del Valle (mvargas@inbio.ac.cr) Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad

Metadatos de GBIF: Arquitectura

GBIF metadata catalogue specification: http://links.gbif.org/gbif_metadata_catalogue_specification.pdf

Page 21: Cómo publicar metadatos Manuel Vargas Del Valle (mvargas@inbio.ac.cr) Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad

OAI-PMHOpen Archives Initiative Protocol for Metadata Harvesting

Provee un mecanismo para la interoperabilidad en múltiples repositorios de metadatos distribuidos.

Proveedores de datos: exponen sus metadatos.

Proveedores de servicios: recolectan metadatos a travez de software conocido como recolector (harvester) que realiza solicitudes de servicio OAI-PMH sobre HTTP

http://www.openarchives.org/pmh/

GBIF: Mantiene un rol tanto de

recolector como de proveedor

Page 22: Cómo publicar metadatos Manuel Vargas Del Valle (mvargas@inbio.ac.cr) Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad

Agenda

- ¿Por qué metadatos?

- El perfíl EML de GBIF

- Estándares para metadatos

- Preparación de los metadatos

- ¿A dónde van los metadatos?

- Preparación de los metadatos (ejemplos)

Page 23: Cómo publicar metadatos Manuel Vargas Del Valle (mvargas@inbio.ac.cr) Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad

GBIF: procesador de hojas de cálculo

1. Descargar las plantillas desde el sitio http://tools.gbif.org/spreadsheet-processor/*

1. Rellenar la plantilla

1. Convertirla a un perfil GBIF de metadatos utilizando el procesador de hojas de cálculo. http://tools.gbif.org/spreadsheet-processor/

El procesador de hojas de cálculo no publica un archivoen GBIF, solo genera un archivo DwC-A listo para publicar.

* Vínculo directo: http://tools.gbif.org/spreadsheet-processor/templates/metadata/metadata-1_v1.xls

Page 24: Cómo publicar metadatos Manuel Vargas Del Valle (mvargas@inbio.ac.cr) Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad

IPT: Editor de metadatos1. Crear un nuevo recurso en el IPT2. Completar los metadatos

– Recurso de datos (Resource).– Proyecto.– Involucrados (personas e instituciones).– Keywords.– Cobertura.– Cobertura taxonómica.– Cobertura geográfica.– Cobertura temporal– Derechos de propiedad intelectual– Métodos– Metadatos adicionales– Descripciones de los datos.

3. ¡Publíquelo!– Metadatos para recursos publicados y no publicados forman parte del

archivo DwC-A (eml.xml)

Page 25: Cómo publicar metadatos Manuel Vargas Del Valle (mvargas@inbio.ac.cr) Coordinador de la Unidad de Desarrollos Informáticos Instituto Nacional de Biodiversidad

Cómo publicar metadatos

Manuel Vargas Del Valle ([email protected])Coordinador de la Unidad de Desarrollos InformáticosInstituto Nacional de Biodiversidad de Costa Rica (INBio)

Buenos Aires (Argentina)28 de septiembre de 2011

Curso sobre la publicación de datos sobre biodiversidad en la red de GBIF y su aptitud para el uso, edición 2011