estado de situación del acceso abierto en argentina: gestión de datos científicos
TRANSCRIPT
![Page 1: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/1.jpg)
Estado de situación del Acceso Abierto en Argen3na: Ges3ón de Datos Cien8ficos
Fernando Ariel López @fernando__lopez | [email protected]
Quién es Quién 2016 “Creando futuro: tecnologías
e innovación en las bibliotecas universitarias”
7 de octubre de 2016
![Page 2: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/2.jpg)
¿Qué es el Acceso Abierto? El acceso libre, gratuito, inmediato y sin restricciones a la literatura cienMfica, a través de Internet. Cualquier persona puede leer, descargar, copiar, distribuir, imprimir, comparQr y enlazar los textos completos de producción cienMfica, sin barreras financieras, legales o técnicas. La única limitación es citar al autor y respetar la integridad de la obra.
![Page 3: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/3.jpg)
Caminos para lograr el Acceso Abierto
vía DORADA
REVISTAS CIENTÍFICAS
• Portales de Revistas CienMficas: – Regionales – TemáQcos – InsQtucionales
vía VERDE
REPOSITORIOS
• InsQtucionales • TemáQcos • Cosechadores • de Datos …
![Page 4: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/4.jpg)
vía DORADA
• LaQndex = 3774 revistas en Directorio = 670 revistas en Catálogo
• SciELO = 126 revistas (118 vigentes) • NBR = 217 revistas • Redalyc = 75 revistas (22.640 arMculos y 1872 fascículos) • DOAJ = 128 revistas (en proceso de reevaluación)
Portales de Facultades y Universitarios
![Page 5: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/5.jpg)
vía VERDE SNRD (MINCYT): * Datos al 14/06/2016
-‐ 40 repositorios digitales adheridos al SNRD (proyectos, en desarrollo e implementados)
-‐ 18 repositorios digitales adheridos e integrados al Portal SNRD.
-‐ 74.391 objetos digitales disponibles en Acceso Abierto a través del Portal SNRD.
-‐ 9 proyectos financiados por el SNRD.
-‐ $ 2.310.626 es el monto total aprobado para los proyectos de financiamiento.
Ley 26.899 Creación de Repositorios Digitales Ins3tucionales de Acceso Abierto, Propios o Compar3dos (noviembre de 2013)
• producción cienMfico-‐tecnológica: arMculos de revistas, trabajos técnico-‐cienMficos, tesis académicas, entre otros.
• 6 meses después de la fecha de su publicación oficial o de su aprobación. • DATOS PRIMARIOS: 5 años del momento de su recolección.
![Page 6: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/6.jpg)
Los DATOS son el petróleo…
… pero si no se ges3onan NO SIRVEN
![Page 7: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/7.jpg)
BIG DATA à REDES SOCIALES + IOT + Smart City
![Page 8: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/8.jpg)
CIENCIA à Ciencia Abierta GOBIERNO à Gobierno Abierto
![Page 9: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/9.jpg)
LEGISLACIÓN • LEY 26.899 (2013)
Creación de Repositorios Digitales InsQtucionales de Acceso Abierto, Propios o ComparQdos
• RESOLUCIÓN 538 de JFG (2013) Sistema Nacional de Datos Públicos
• DECRETO 117 (2016) Plan de Apertura de Datos
• Ley Acceso a la Información Pública (2016) Acceso a la Información Pública
![Page 10: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/10.jpg)
¿De qué DATOS me hablas? LEY 26.899 (2013)
• Datos Primarios (data set) • Plan de Ges3ón de Datos (DMP) • Deposito “data set” en Repositorio de Datos • Fecha: Diciembre de 2018
DECRETO 117 (2016) • Datos Públicos (organigramas del EjecuQvo; declaraciones juradas de funcionarios; personal contratado; escalafones y escalas salariales; contrataciones públicas; y las solicitudes de AIP).
• Relanzamiento del “Portal Nacional de Datos Públicos” • Fecha: 11 de Julio de 2016
![Page 11: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/11.jpg)
→ hechos, observaciones o experiencias (basado argumento, teoría o prueba)
→ pueden ser numéricos, descriptivos o visuales.
→ pueden ser en estado bruto o analizado, → pueden ser experimentales u observacionales.
→ pueden ser abiertos o cerrados
¿Qué son los datos de invesQgación? ¿Qué son los datos de investigación?
![Page 12: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/12.jpg)
Los datos incluyen: cuadernos de laboratorio, cuadernos de campo, datos de investigación primaria (incluidos los datos en papel o en soporte informático), cuestionarios, cintas de audio, videos, desarrollo de modelos, fotografías, películas, y las comprobaciones y las respuestas de la prueba.
Las colecciones datos para la investigación pueden incluir diapositivas; diseños y muestras.
En la información sobre la procedencia de los datos también se podría incluir: el cómo, cuándo, donde se recogió y con que (por ejemplo, instrumentos). El código de software utilizado para generar, comentar o analizar los datos también pueden ser considerados datos.”
¿Qué son los datos de invesQgación? ¿Qué son los datos de investigación?
![Page 13: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/13.jpg)
Observacionales: datos capturados en tiempo real, comúnmente únicos e Experimentales: datos provenientes de resultados experimentales Ej: Aquellos que provienen de aparatos de medición en laboratorios, comúnmente reproducibles, pero caros. Simulación: datos generados de modelos de prueba donde el modelo y los metadatos pueden ser mas importantes que los datos de salida del modelo. Ej: Modelos económicos o climáticos. Desarrollados o compilados: resultado de procesar y/o combinar datos “crudos”, comúnmente reproducibles pero caros. Ej. Bases de datos compiladas,Resultados de text mining, Datos de censos
consolidados. Reference or canonical: Una (estática u orgánica) conglomeración o colección de datasets mas pequeños (revisados por pares), la mayor parte de ellos publicados y “curados” Ej. Bancos de datos genéticos, bases de datos cristalográficas.
¿Qué son los datos de invesQgación? Tipos de Datos Científicos
![Page 14: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/14.jpg)
● Es una colección de datos reunidos durante la ejecución de un proyecto de invesQgación.
● Son objetos digitales compuestos y heterogéneos. ● ConsQtuye la base de la invesQgación y va asociado a una publicación
cienMfica (resultado de la invesQgación). ● Se almacena y gesQona en Repositorios Interoperables conforme a
estándares internacionales.
Es el objeto específico de control, organización,
descripción y preservación de datos científicos
DATASET
![Page 15: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/15.jpg)
BENEFICIOS #DatosAbiertos
● Ayuda a verificar los resultados. ● Evitar la fabricación y falsificación de datos. ● Diferentes interpretaciones o enfoques aplicados a datos existentes contribuyen a los avances cienMficos.
● OpQmización en el uso de recursos. ● Preservación a largo plazo bien gesQonada, permite mantener la integridad de los datos.
TenopirC, Allard S, Douglass K, AydinogluAU, et al. (2011) Data Sharing by Scientists: Practices and
Perceptions. PLoSONE 6(6): e21101. doi:10.1371/journal.pone.0021101 http://www.plosone.org/article/info:doi/10.1371/journal.pone.0021101
![Page 16: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/16.jpg)
ACTORES INVOLUCRADOS Bibliotecario embebido Curador de Datos Bibliotecarios de Datos / DataLabririan
![Page 17: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/17.jpg)
CIENCIA
Líneas de Trabajo:
1. POLÍTICA DE DATOS CIENTÍFICOS 2. CICLO DE VIDA DE LOS DATOS CIENTÍFICOS 3. PLAN DE GESTIÓN DE DATOS CIENTÍFICOS
4. E-‐INFRAESTRUCTURAS
![Page 18: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/18.jpg)
![Page 19: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/19.jpg)
1. Diseño y planificación de la creación/extracción de datos
2. Creación/Extracción de Datos 3. Limpieza, Normalización y Descripción de Datos
4. Almacenamiento y Preservación de Datos
5. Exploración, Explotación y Visualización de Datos 6. DataMining & Knowledge Discovery
CICLO DE VIDA DE LOS DATOS CIENTÍFICOS
![Page 20: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/20.jpg)
![Page 21: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/21.jpg)
![Page 22: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/22.jpg)
¿Qué es un PGD? Un plan de ges3ón de datos cien8ficos (Data Management Plan -‐ DMP) es un documento elaborado por el invesQgador o grupo de invesQgación donde se define:
• qué datos van a ser creados y cómo,
• cómo se van a describir, organizar, almacenar y gesQonar los datos
• de qué forma van a ser comparQdos, explicando cualquier restricción de uso
• que pueda ser aplicada.
• Quién o quiénes serán los responsables de realizar cada una de estas
• acQvidades.
• de qué forma van a ser comparQdos, explicando cualquier restricción de uso
• que pueda ser aplicada.
![Page 23: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/23.jpg)
DMP ArgenQna (CAICYT-‐CONICET)
Propuesta para Proyecto de InvesQgación: • Bloque de Datos administraQvos • Bloque de Recolección de datos • Bloque de Documentación y metadatos • Bloque de Almacenamiento y copias de
seguridad • Bloque de Selección y preservación • Bloque de Re-‐uso de Datos
![Page 24: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/24.jpg)
e-‐INFRAESTRUCTURAS Repositorio Interoperable de Datos• Datos Públicos Argentina (CKAN, OKF),• Zenodo (Invenio, CERN)• DRYAD, PLICSS, LAGOS (DSpace, MIT & HP),• Harvard DATAVERSE (Eprints)
Plataforma de Trabajo para Investigadores• OSF, HubZero, MyExperiment.org, etc.
Cluster de Almacenamiento y/o Procesamiento
![Page 25: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/25.jpg)
NUEVOS PERFILES
![Page 26: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/26.jpg)
La profesión del futuro. Es el encargado en extraer el conocimiento de los datos. Para ello deber tener sólidos conocimientos estadísQcos, poseer destrezas para resolver problemas, hacer preguntas y explicar los resultados obtenidos.
Data Scien3st / Cien8ficos de Datos
![Page 27: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/27.jpg)
Bibliotecari@ de Datos / Data Librarian
Es un término ad-hoc, es la aplicación de los principios y las prácticas tradicionales de los bibliotecarios a los datos.El perfil del bibliotecario de datos requiere:• Competencias informáticas• Conocimiento de la disciplina (corpus, prácticas de
investigación y flujos de trabajo)• Gestión de datos:
q adquisición (desarrollo de la colección),q organización (catalogación y metadatos),q preservación y conservación a largo plazoq implementación de servicios adecuados para los
usuarios.
![Page 28: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/28.jpg)
NUEVAS COMPETENCIAS
![Page 29: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/29.jpg)
COMPETENCIAS
• Estadística, Algebra y Programación• Tecnologías y Formatos Abiertos• XML, PYTHON, R, etc.• Herramientas de normalización, procesamiento
y visualización.• Comunicación (visual y audiovisual)
• Diseño Centrado en el Usuario (UX)
![Page 30: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/30.jpg)
![Page 31: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/31.jpg)
![Page 32: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/32.jpg)
OPORTUNIDADES Comunidad Cien8fica:
• Acordar estándares de trabajo, normalización y ges3ón de datos
• Empoderar en Ges3ón de Datos Cien8ficos
• Contribuir al avance de la ciencia, maximizando la visibilidad y el
impacto de la inversión en Inves3gación
• Financiamiento y Desarrollo de e-‐infraestructuras para el
aprovechamiento de la Big Data Cien8fica
• Encuentro con otras comunidades de Gobierno Abierto, Periodismo
de Datos, HackAcQvismo Cívico, IoT, etc.
• Repensar formas de producción, medición e impacto cien8fico
![Page 33: Estado de situación del acceso abierto en Argentina: gestión de datos científicos](https://reader030.vdocuments.site/reader030/viewer/2022020203/588429da1a28ab485c8b717b/html5/thumbnails/33.jpg)
¿PREGUNTAS?