cómo publicar metadatos manuel vargas del valle ([email protected]) coordinador de la unidad de...
TRANSCRIPT
Cómo publicar metadatos
Manuel Vargas Del Valle ([email protected])Coordinador de la Unidad de Desarrollos InformáticosInstituto Nacional de Biodiversidad de Costa Rica (INBio)
Buenos Aires (Argentina)28 de septiembre de 2011
Curso sobre la publicación de datos sobre biodiversidad en la red de GBIF y su aptitud para el uso, edición 2011
Proceso de publicaciónde información
Agenda
- ¿Por qué metadatos?
- El perfil EML de GBIF
- Estándares para metadatos
- Preparación de los metadatos
- ¿A dónde se van esos metadatos?
- Preparación de los metadatos (ejemplos)
Agenda
- ¿Por qué metadatos?
- El perfil EML de GBIF
- Estándares para metadatos
- Prepación de los metadatos
- ¿A dónde van los metadatos?
- Preparación de los metadatos (ejemplos)
”Ciencia con uso intensivo de datos”
”Cuarto paradigma de la ciencia”
e-Infrastructure Reflection Group (European Strategy Forum on Research Infrastructures). Report on Data Management, November 2009. http://www.e-irg.eu/images/stories/publ/task_force_reports/dmtfjointreport.pdf
”Diluvio digital de datos”
The Fourth Paradigm: Data-Intensive Scientific Discovery http://research.microsoft.com/en-us/collaboration/fourthparadigm/contents.aspx
Alta calidad en los metadatos para una curación a largo plazo y para el uso de los recursos de datos.
Requisito clave:
¿Por qué metadatos?
¿Por qué metadatos?
William K. Michener, Meta-information concepts for ecological data management, Ecological Informatics, Volume 1, Issue 1, January 2006, Pages 3-7, ISSN 1574-9541, DOI: 10.1016/j.ecoinf.2005.08.004.
¡La información se deteriora con el tiempo!
¿Por qué metadatos?
Los metadatos permiten:
- El descubrir información- Interpretar/Evaluar
- Procedencia- Calidad- Aptitud para el uso
- Reutilización
Agenda
- ¿Por qué metadatos?
- El perfil EML de GBIF
- Estándares para metadatos
- Preparación de los metadatos
- ¿A dónde van los metadatos?
- Preparación de los metadatos (ejemplos)
Estándares para metadatosEcological Metadata Language (EML) v2.1.1http://knb.ecoinformatics.org/software/eml/
Dublin Core http://dublincore.org/documents/dcmi-terms/
Directory Interchange Format (DIF)http://gcmd.nasa.gov/User/difguide/difman.html
ISO 19115/19139 Geographic MetadataISO 19115: http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=26020ISO 19139: http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=32557
Natural Collections Descriptions (NCD)http://www.tdwg.org/standards/312/
Federal Geographic Data Committee (FGDC) Biological Profile* http://www.fgdc.gov/standards/projects/FGDC-standards-projects/metadata/biometadata/
* Una extensión del FGDC CSDGM (Content Standard for Digital Geospatial Metadata)
Multimedia Resources Metadata Schema http://www.tdwg.org/charters/article/view/448/36
Estándares para metadatos
ISO 19115/19139Perfil Norteamericano del ISO 19139
http://www.fgdc.gov/standards/projects/incits-l1-standards-projects/NAP-Metadata/napMetadataProfileV101.pdf/view
Existen diversas posibilidades para ver y convertir metadatos
EML to FGDC Biological Profilehttps://code.ecoinformatics.org/code/eml/trunk/lib/eml2tonbii/
# FGDC CSDGM to ISO Transform# FGDC CSDGM to ISO Crosswalk# ISO XML to HTML View: # FGDC BIO to ISO Transform# FGDC BIO to ISO Crosswalkhttp://www.ncddc.noaa.gov/technology/metadataandxml/view
FGDC CSDGM
ISO 19139
EML to ISO 19139http://code.google.com/p/gbif-metadata/source/browse/trunk/metadata/src/main/resources/eml2iso19139.xsl
Open source INSPIRE-compliantMD editor (multilingual)http://www.inspire-geoportal.eu/EUOSME/
Metadatos y los idiomas
A Multilingual Metadata Catalog for the ILTER: Issues and Approaches. Vanderbilt, K.L., et al., Ecological Informatics, Volume 5, Issue 3, May 2010, Pages 187-193, doi:10.1016/j.ecoinf.2010.02.002
Utilizar un único idioma. (e.g. inglés)- Los proveedores de datos dan los metadatos básicos en inglés- Los metadatos ampliados se provee en idioma local
“Keywords” en idioma local desde un thesaurus. e.g., GEMET, AGROVOC
- GEMET: http://www.eionet.europa.eu/gemet/- AGROVOC: http://www4.fao.org/agrovoc/default.htm
Solución (a largo plazo): Ontologías plurilingües.
¿problemas? - Carga adicional → herramientas y estándares
Agenda
- ¿Por qué metadatos?
- El perfil EML de GBIF
- Estándares para metadatos
- Preparación de los metadatos
- ¿A dónde van los metadatos?
- Preparación de los metadatos (ejemplos)
Perfil EML de GBIF- Requerimientos
- GBIF Metadata Task Grouphttp://www2.gbif.org/GBIF-MIFTG-Report.pdf
- EML; ISO 19115; NCD; INSPIRE Directive http://community.gbif.org/mod/file/download.php?file_guid=10915 http://community.gbif.org/mod/file/download.php?file_guid=5656
http://rs.gbif.org/schema/eml-gbif-profile/1.0/eml-gbif-profile.xsd
- GBIF EML schema
http://community.gbif.org/pg/groups/5258/gbif-metadata-network/
- Comunidad GBIF: Metadata network
- Perfil GBIF: Documentaciónhttp://links.gbif.org/gbif_metadata_profile_how-to_en_v1http://links.gbif.org/gbif_metadata_profile_guide_en_v1
Agenda
- ¿Por qué metadatos?
- El perfil EML de GBIF
- Estándares para metadatos
- Preparación de los metadatos
- ¿A dónde van los metadatos?
- Preparación de los metadatos (ejemplos)
Preparación de los metadatos
- Editores de metadatose.g., IPT, Spreadsheet template, Morpho, EUOSME,
Cassia.
- Scripting- Tomarlo directamente de una base de datos de
metadatos.- Convertir de una estándar de metadatos a EML
- Creando el XML de manera directa- Es esencial que se valide cuidadosamente el resultado.
Agenda
- ¿Por qué metadatos?
- El perfil EML de GBIF
- Estándares para metadatos.
- Preparación de los metadatos
- ¿A dónde van los metadatos?
- Preparación de los metadatos (ejemplos)
¿A dónde van esos metadatos?
http://metadata.gbif.org
Fuentes de metadatos- Cache de datos de GBIF
- Instalaciones del IPT registradas - Catálogos a nivel nacional, regional, organizaciones. - Catálogos por tema. e.g., OBIS
GBIF: -No imponemos un estándar de metadatos o una
implementación de catálogo para los participantes.
- Participantes de GBIF
- Redes externas- e.g. Knowledge Network for Biocomplexity (KNB)
Metadatos de GBIF: Arquitectura
GBIF metadata catalogue specification: http://links.gbif.org/gbif_metadata_catalogue_specification.pdf
OAI-PMHOpen Archives Initiative Protocol for Metadata Harvesting
Provee un mecanismo para la interoperabilidad en múltiples repositorios de metadatos distribuidos.
Proveedores de datos: exponen sus metadatos.
Proveedores de servicios: recolectan metadatos a travez de software conocido como recolector (harvester) que realiza solicitudes de servicio OAI-PMH sobre HTTP
http://www.openarchives.org/pmh/
GBIF: Mantiene un rol tanto de
recolector como de proveedor
Agenda
- ¿Por qué metadatos?
- El perfíl EML de GBIF
- Estándares para metadatos
- Preparación de los metadatos
- ¿A dónde van los metadatos?
- Preparación de los metadatos (ejemplos)
GBIF: procesador de hojas de cálculo
1. Descargar las plantillas desde el sitio http://tools.gbif.org/spreadsheet-processor/*
1. Rellenar la plantilla
1. Convertirla a un perfil GBIF de metadatos utilizando el procesador de hojas de cálculo. http://tools.gbif.org/spreadsheet-processor/
El procesador de hojas de cálculo no publica un archivoen GBIF, solo genera un archivo DwC-A listo para publicar.
* Vínculo directo: http://tools.gbif.org/spreadsheet-processor/templates/metadata/metadata-1_v1.xls
IPT: Editor de metadatos1. Crear un nuevo recurso en el IPT2. Completar los metadatos
– Recurso de datos (Resource).– Proyecto.– Involucrados (personas e instituciones).– Keywords.– Cobertura.– Cobertura taxonómica.– Cobertura geográfica.– Cobertura temporal– Derechos de propiedad intelectual– Métodos– Metadatos adicionales– Descripciones de los datos.
3. ¡Publíquelo!– Metadatos para recursos publicados y no publicados forman parte del
archivo DwC-A (eml.xml)
Cómo publicar metadatos
Manuel Vargas Del Valle ([email protected])Coordinador de la Unidad de Desarrollos InformáticosInstituto Nacional de Biodiversidad de Costa Rica (INBio)
Buenos Aires (Argentina)28 de septiembre de 2011
Curso sobre la publicación de datos sobre biodiversidad en la red de GBIF y su aptitud para el uso, edición 2011