p información digital - imaginar.org · 11:00 a 12:00 digitalización y gestión de almacenamiento...
TRANSCRIPT
1
SeminarioPreservación de Información
Digital
Hugo Carrión G.www.imaginar.org
Hugo Carrión G. 2
Agenda
Proyectos de preservación de información digital16:00 a 17:00
La gestión de documentos electrónicos – Norma ISO 15849
15:00 a 16:00
Descanso12:00 a 15:00
Digitalización y Gestión de almacenamiento11:00 a 12:00
Amenazas a la información digital10:00 a 11:00
Información digital9:00 a 10:00
ActividadHora
3
Información Digital
Hugo Carrión G. 4
Qué es información digital?
• El concepto de información digital se aplica para todo aquello que esta representado medianteceros y unos dentro de una computadora.
• La información digital no sólo son textoselectrónicos, también se incluyen las imágenes, el audio y el video, que al igual que los textostienen diferentes formatos, codificaciones y representaciones en el mundo electrónico
Hugo Carrión G. 5
Objetos Digitales?Analógico Digital
Digitalización1011010010101011110101
1001011111010111
110101111100
6
Podemos Imaginar el Mundo sin laTecnología Digital ?
Hugo Carrión G. 7
Ventajas del documento digital• Mejor acceso, transmisión y distribución de la
información• Más campos de indíces para consulta• Más recurso para tratamiento de la imagen:
– Filtros– Imagen en color
• Permite ofrecer nuevos servicios:– Venta de colecciones digitales en CDs ó DVDs– Consulta rápida de la información
• Terminales con bases de datos• Internet
Mundo DigitalMundo Digital
Hugo Carrión G. 8
Unidades Digitales
• Bit (b) 1 or 0• Byte (B) 8 bits• Kilobyte (KB) 1,000 bytes• Megabyte (MB) 1,000 KB• Gigabyte (GB) 1,000 MB• Terabyte (TB) 1,000, GB• Petabyte (PB) 1,000 TB• Exabyte (EB) 1,000 PB• Zettabyte (ZB) 1,000 EB
Hugo Carrión G. 9
El Universo Digital
Cuando:• Enviamos un email,• Tomamos una fotografía,• Bajamos una canción MP3• Visitamos Youtube.com….Creamos información digital
Hugo Carrión G. 10
El Universo Digital
• Youtube.com, almacena 100 millones de videos• Expertos dicen que más de un billón de
canciones MP3 se comparten por internet• En Londres, 200 cámaras de vigilancia envían
64 trillones de bits diarios a la central• La Crevron, acumula 2 TB (2000 GB) de
información al día.…. Cada vez se producen más bits
Hugo Carrión G. 11
El Universo Digital
• En el 2006, la cantidad de información creada, capturada y replicada fue de 1,28x1018 bits
• Es decir 161 billones de GB• 27 GB por persona en el mundo• Esto es 3 millones de veces la información
contenido en todos los libros escritos en todo la historia del mundo
• Entre el 2006 y 2010, se calcula un crecimiento de 6 veces. De 161 EB a 988 EB.
Hugo Carrión G. 12
Crecimiento Información Digital
Hugo Carrión G. 13
Dispositivos digitales
Dispositivos Millones en 2006Teléfonos celulares 1.600PC 900Cámaras Teléfonos 600Cámaras Digitales 400Audio Player 550TV Plasma 70
Hugo Carrión G. 14
El Universo Digital
• Esto será incrementado sobre todo por las imágenes digitales, la voz digital y la televisión digital.
• IDC estima que el 20% de la información estásujeta a la aplicación de reglas estándares y el 30% sujeta a políticas de seguridad
• Se cree que en 2007 por primera vez la información creada, sobrepasará a la capacidad disponible.
Hugo Carrión G. 15
Hay un problema de almacenamiento
Hugo Carrión G. 16
Dónde está la información?
Hugo Carrión G. 17
Crecimiento de internet
Hugo Carrión G. 18
Crecimiento del Email
Hugo Carrión G. 19
Crecimiento de las Imágenes
Hugo Carrión G. 20
Creadores de Información
Hugo Carrión G. 21
Tipos de almacenamiento
Hugo Carrión G. 22
Mercado de la Infraestructura
Hugo Carrión G. 23
Mercado de la Seguridad
Hugo Carrión G. 24
En resumen…
• Vivimos en una época de “obesidad digital”
• Las sociedad de la información poco a poco se convierte en sociedad de “infoxicación”
• Somos capaces de manejar esa información?
25
Amenazas a la Información Digital
Hugo Carrión G. 26
La información digital,tiene muchas ventajas,
pero…
Hugo Carrión G. 27
Hugo Carrión G. 28
• Depende de:– Hardware (máquina y tecnología)– Software (Sistema Operativo, Programa y formato de la Imagen)
• La tecnología se deterioran o “evaporación” de Bit– Debido a efectos físicos, químicos, magnéticos, etc.
• No es aceptado como medio legal de reproducción... en algunos países
Pero el Archivo Digital también esvulnerable
Pero el Archivo Digital también esvulnerable
Hugo Carrión G. 29
Obsolecencia Digital
• En el final de los años 90• 20 % de los datos recolectados por la misión
Vikingo a Marte ahora son inaccesibles• Las cintas magnéticas de la Selva Amazônica
de los años 70 ya no se pueden leer• En la Universidad de Pensilvania – 14% de los
históricos escolares no se pueden accesar
•• MuchoMucho mmáás se s se haha perdido, perdido, ustedusted no no lolo sabesabe•• Hasta Hasta comprobarlocomprobarlo ............. .
Hugo Carrión G. 30
Hugo Carrión G. 31
• Discos Floppy / Diskettes 8 ½ , 5 ¼ , 3 ½
• Cinta DAT
• CD ROM
• WORM
• DVD
• Disco Óptico Regrabable
• Zip Drive
• Pen Drive
Tipos de Medios DigitalesTipos de Medios Digitales
Hugo Carrión G. 32
Duración de los medios• La preservación digital, plantea nuevos desafíos para la
disciplina de la conservación. Si tomamos en consideración que la preservación está orientada a largo plazo, nos encontramos con un primer problema.
• La información digital, no ha sido pensada para sumantenciónen el tiempo. A diferencia de materialestradicionales, que tienden a ir desapareciendo de manera gradual, desvaneciéndose o amarilleándose con el paso del tiempo la información digital no se pierde de manera paulatina, esta existe o simplemente no existe.
Hugo Carrión G. 33
Duración de los medios
• En los materiales análogos el conservador contará con la ventaja de poder visualizar el síntoma de deterioro en un momento oportuno para suposterior intervención.
• En el caso del patrimoniodigital, en el momento en quese detecta el síntoma, la información se ha perdidoirreparablemente.
• Esto obligaráal conservador a desenvolversenecesariamente, siempre un paso adelante a la manifestación del deterioro.
Hugo Carrión G. 34
Tiempo de duración
Hugo Carrión G. 35
Continuidad Digital
• Soportes de almacenamiento inestables, se deterioran• Medios de acceso, combinación compleja de equipos y
programas informáticos• Sujetos a desastres, averías de equipos, virus, ataques• Barreras de acceso, claves, cifrados• Valor reconocido, una ver perdido o modificado• Falta de recursos• Podría resultar imposible la negociación de
autorizaciones legales.• Bienes bien protegidos, pero mal identificados
Hugo Carrión G. 36
Inestabilidad del Internet
• Recursos de información inestables• Los usuarios no tienen casi ninguna posibilidad
de controlar si la información sigue disponible• Ajustes frecuentes• Información descentralizada, un solo cambio,
puede destruir todo el conjunto• Administración informal• No hay planes de información. Información
efímera.
Hugo Carrión G. 37
“La información digital -la evidencia del mundo en que vivimos- es más frágil que
los fragmentos de papiros que se encontraron enterrados junto con los
faraones”.
Paul Conway, 1996“La Preservación en el Mundo Digital”
38
Digitalización y Gestión de Almacenamiento
Hugo Carrión G. 39
Digitalización
• Las imagenes digitales son fotoselectrónicas tomadas de una escena o escaneadas de documentos -fotografías, manuscritos, textos impresos e ilustraciones.
• Proceso digitalización– Muestreo– Cuantificación– Codificación
Hugo Carrión G. 40
Propiedades digitales
• Resolución• Dimensión• Profundidad• Rango Dinámico• Tamaño• Compresión• Formato
Hugo Carrión G. 41
Resolución
Hugo Carrión G. 42
Profundidad
Hugo Carrión G. 43
Criterios de digitalización
Hugo Carrión G. 44
Tamaño
Hugo Carrión G. 45
Compresión
Hugo Carrión G. 46
Razones para digitalizar
• Facilitar nuevas formas de acceso y uso• Preservación• Mejorar el acceso público
Selección de criterios• Contenido• Demanda• Estado físico
Hugo Carrión G. 47
Tipos de escáneres
Hugo Carrión G. 48
Tipos de escáneres
Hugo Carrión G. 49
Tipos de escáneres
Hugo Carrión G. 50
Interfases
• Interfaz nivel físico– SCSI 5-80 Mbps– Paralelo 1 Mbps– USB 1) 12 Mbps 2) 480 Mbps
• Interfaz nivel lógico– TWAIN– ISIS
Hugo Carrión G. 51
Interfaz lógico - parametros
• Resolución (óptica o interpolada)
• Resolución de escaneado
• Área de exploración• Velocidad –
profundidad• Formato de archivos.
TIFF, JPEG, PDF
Hugo Carrión G. 52
Sistemas de Gestión de Información Digitalizada
Hugo Carrión G. 53
Sistemas de Gestión Electrónica de Documentos
• Escáneres• Almacenamiento• Unidad de Proceso• Comunicaciones• Impresoras
Hugo Carrión G. 54
Metadatos• El uso de los metadatos mencionado más
frecuentemente es la refinación de consultas a buscadores.
• La representación del conocimiento usa metadatos para categorizar informaciones. La misma idea facilita la inteligencia artificial al deducir conclusiones automáticamente.
• Los metadatos facilitan el flujo de trabajo convirtiendo datos automáticamente de un formato a otro.
• Algunos metadatos hacen posible una compresión de datos más eficaz.
• Otra idea de aplicación es la presentación variable de datos.
Hugo Carrión G. 55
MOA2, Administrative Metadata Elements (Elementos de MetadatosAdministrativos); National Library of Australia, Preservation Metadata for Digital Collections (Biblioteca Nacional de Australia, Metadatos de Preservaciónpara Colecciones Digitales).
Datos técnicos tales como tipoy modelo de escáner, resolución, profundidad de bit, espacio de color, formato de archivo, compresión, fuentede luz, propietario, fecha del registro de derecho de autor, limitaciones en cuanto al copiado y distribución, información sobre licencia, actividades de preservación(ciclos de actualización, migración, etc.).
facilitan la gestión y procesamiento de lascolecciones digitales tanto a corto como a largo plazo•incluyen datos técnicos sobre la creación y el control de calidad;•incluyen gestión de derechos y requisitos de control de acceso y utilización;•información sobre acción de preservación.
Metadatosadministrativos
SGML; XML; Encoded Archival Description, EAD (Descripción de Archivo Codificado); MOA2, Structural Metadata Elements(Elementos de Metadatos Estructurales); Unión Electrónica Electronic Binding, Ebind).
rótulos de estructuracióncomo por ejemplo página de título, tabla de contenidos, capítulos, partes, fe de erratas, índice, relación con un sub-objeto (por ejemplo, fotografía de un periódico).
facilitan la navegación y presentación de recursos electrónicos•proporcionan información sobre la estructurainterna de los recursos, incluyendo página, sección, capítulo, numeración, índices, y tablade contenidos; •describen la relación entre los materiales(por ejemplo, la fotografía B fue incluida en el manuscrito A);•unen los archivos y los textos relacionados(por ejemplo, el ArchivoA es el formato JPEG de la imagen de archivo del ArchivoB).
Metadatosestructurales
Handle; PURL (Persistent Uniform Resource Locator - Localizador de Recursos Uniforme y Continuo); Dublin Core; MARC;Meta Rótulos HTML (HTML Meta Tags).vocabularios controlados, como porejemplo:Tesauro sobre Arte y Arquitectura; Categorías para la Descripción de Obrasde Arte.
•identificadores únicos (PURL, Handle); •atributos físicos (medios, condición de lasdimensiones);•atributos bibliográficos (título, autor/ creador, idioma, palabras clavess).
Descripción e identificación de recursos de información•en el nivel (sistema) local para permitir la búsqueda y la recuperación (por ejemplo, búsqueda de una colección de imágenes para encontrar pinturas con ilustraciones de animales); •en el nivel Web, permite a los usuariosdescubrir recursos (por ejemplo, búsqueda en la Web para encontrar coleccionesdigitalizadas sobre poesía).
Metadatosdescriptivos
IMPLEMENTACIONES DE MUESTRAELEMENTOS DE MUESTRAOBJETIVOTIPO
56
Gestión de Documentos Electrónicos
Norma ISO 15489:2001MoReq
Hugo Carrión G. 57
“Para volver accesible la cantidad de informes y artículos dados cada día en la prensa cotidiana, en las revistas,
para conservar folletos, informes, prospectos, documentos oficiales; para encontrar materias dispersas
en los libros, para hacer un todo homogéneo de esas masas incoherentes, son precisos procedimientos
nuevos”.
Paul Otlet,1934
Hugo Carrión G. 58
Origen
Norma ISO 15489• Norma internacional elaborada por ISO
TC 46 InformationandDocumentation/ SC 11, RecordsManagement
MoReq• Modelo encargado por la Comisión
Europea en el marco del programa IDA a una consultora especializada.
Hugo Carrión G. 59
Alcance y objetivo
Norma ISO 15489• Guía para la gestión de documentos de archivo
de una organización, sea cual sea su soporte.
MoReq• Modelo de requisitos para el diseño y/o
evaluación de aplicacionesde gestión de documentos electrónicos de archivo.
Hugo Carrión G. 60
Contenido
Norma ISO 15489• Principios generales de la gestión de
documentos de archivo.
MoReq• Requisitos funcionales de una aplicación
de gestión de documentos electrónicos de archivo.
Hugo Carrión G. 61
Elementos
3. Cuadro de Clasificación9.5. Clasificación9.5.1. Clasificación de actividades9.5.2. Sistema de clasificación
6.1. Captura9.4 Registro
12. Requisitos de los metadatos9.3. Integración
5.1.Normas de conservación9.2.Definición de plazos de conservación
6.1. Captura9.1. Selección de los documentosde archivo que debenintegrarse en el sistema
MoReqNorma ISO 15489
Hugo Carrión G. 62
Elementos
4.1. Acceso9.7. Acceso
11.7. Conservación a largo plazo
9.6. Almacenamiento y Mantenimiento
7. Referencias9.5.5. Atribución de signaturas
8.1. Búsqueda y recuperación
9.5.3. Vocabularioscontrolados
9.5.4. Indización
MoReqNorma ISO 15489
Hugo Carrión G. 63
Elementos
11. Requisitos no funcionales11.1 Facilidad de uso
9.10. Documentación del sistema
5. Conservación, eliminación o transferencia
9.9. Aplicación del destinofinal
4.2. Pistas de Auditoría4.4. Control del movimiento
dedocumentos de archivo
9.8. Trazabilidad9.8.1. Generalidades9.8.2. Seguimiento de las
operaciones9.8.3. Seguimiento de la
localización
MoReqNorma ISO 15489
64
Proyectos de Preservaciónde Información Digital
Hugo Carrión G. 65
Patrimonio Digital?
Objeto Digital
Objeto Digital
Objeto Digital
Valor
Patrimonio Digital
Hugo Carrión G. 66
Carácter Patrimonial de los Proyectos de Preservación
• No todos los objetos digitales merecen ser conservados.
• El patrimonio digital está constituido únicamente por aquellos que se considera que poseen un valor permanente.
Hugo Carrión G. 67
Qué es preservación digital?
• Consiste en mantener la capacidad de presentar los elementos esenciales de objetos digitales auténticos
• Debe hacer frente a peligros que pueden amenazar cualquiera de los elementos del objeto digital: material, lógico, conceptual y esencial.
Hugo Carrión G. 68
Cómo empezar?
• Punto de partida. Decisión de preservar!• No todos tienen que hacer todo, y no todo
tiene que hacerse de inmediato.• Lo deseable: Programas de preservación
completos y solventes• Más vale avanzar a pequeños pasos que
no avanzar.• La responsabilidad debe exponerse
explícita y seriamente
Hugo Carrión G. 69
Tipos de patrimonio digital
• Publicaciones electrónicas (web, CD, DVD, disquetes, etc)
• Documentos “semipublicados” artículos, tesis• Registros de actividades, correspondencia:
correo electrónico, grupos de discusión, blogs• Datos registrados para fenómenos científicos• Materiales educativos• Bases de datos, programas informáticos• Productor de entretenimiento• Obras gráficas y fotografías• Copias digitales de imágenes, sonidos, textos y
objetos tridimensionales
Hugo Carrión G. 70
Contexto
100101111010111101001
Metadatos
100101111010111101001
Metadatos
100101111010111101001
Metadatos
Información PatrimonialObjeto Digital
Objeto Digital
Objeto Digital
Equipos y Programas
AccesibilidadColección DigitalMedios
Escencial
ConceptualLógicoMaterial
Hugo Carrión G. 71
Comprender los materiales que se preservan
• Objetos materiales: discos, cintas, (incluso la información en línea está en discos)
• Objetos lógicos: código compresible por computadoras, no está vinculado a un medio específico.
• Objetos conceptuales: tienen significado para los seres humanos. Textos, fotografías, etc.
• Objetos esenciales: elementos que contienen el mensaje, el propósito, la razón para preservar
Hugo Carrión G. 72
Comprender los programas de preservación digital
• Conjunto de decisiones aplicadas para hacer efectiva la preservación digital.
• Concepto amplio que incluye una política y aspectos prácticos para su ejecución.– Lugar seguro o un archivo– Paquetes de información: conjunto de objetos
digitales
Hugo Carrión G. 73
Funciones de los programas
• Creación o búsqueda de un lugar seguro– Puede ser un depósito administrado por un tercero– La tercerización no anula la responsabilidad del
programa.• Absorción: recibir, preparar y transferir los
objetos digitales al sistema de archivos– Políticas de recolección, etiquetar, fijar períodos de
retención, evaluar formatos, cambiar formatos, modificar documentación.
• Almacenamiento en archivos– Sistema de almacenamiento: adecuado, seguro y
solvente
Hugo Carrión G. 74
Funciones de los programas
• Planificación de la preservación: investigar amenazas, adelantarse
• Gestión de datos: gestión de paquetes para administrar el archivo
• Acceso: Permite a los usuarios descubrir el contenido y hacer copias. (acceso controlado)
• Coordinación• Funciones de gestión y administración:
vigilancia
Hugo Carrión G. 75
Quién asume la responsabilidad?
• Entidades existentes, podrían ser: bibliotecas, archivos, museos
• Creación de una institución dedicada exclusivamente
• Otros custodios de confianza: universidades, editores, creadores de contenido digital
Hugo Carrión G. 76
Gestión de programas
• Decisiones: Finalidad del programa, magnitud del programa, prioridades
• Riesgos y su gestión: – Reconocer amenazas: apremiantes, amenazas de
acción inmediata y no, amenazas no controlables, amenazas imposibles de contrarrestar (legales)
– Decidir: asignación de recursos, medidas prioritarias, pertinencias, medidas de acción
– Planificar– Justificar decisiones
Hugo Carrión G. 77
Gestión de programas
• Relación con otras partes interesadas: productores, proveedores, organismos de normalización
• Durabilidad y modelos económicos– Financiamiento por la comunidad en general
(impuestos o subvenciones)– Financiamiento por una comunidad específica– Financiamiento central– Pagos de los usuarios del material– Pago de los productores que confian en la custodia– Patrocinio o ayuda filatrópica
Hugo Carrión G. 78
Protección de datos
• Almacenamiento y protección de datos• Autenticidad
– Confianza en su identidad (es lo que dice ser)– Confianza en su integridad (sin modificación que
cambie su significado)• Amenazas sobre la integridad
– Errores naturales de los sistemas de almacenamiento– Averías de los soportes– Ataques malintencionados: virus, piratas, intrusos.– Actos hostiles: disturbios, terrorismo– Catástrofes naturales– Quiebra comercial
Hugo Carrión G. 79
Estrategias de protección de datos
• Clara asignación de las responsabilidades.• Infraestructura técnica apropiada: sistemas, dispositivos
de almacenamiento y soportes• Mantenimiento, asistencia técnica y programas de
reemplazo de activo• Transferencia periódica y sistemática de los datos a
soportes nuevos• Condiciones adecuadas de almacenamiento pp.120• Alto nivel de redundancia como garantía contra los fallos
de una copia o un componente único• Alto nivel de seguridad del sistema, control de acceso a
los datos almacenados.• Planes de prevención de catástrofes.
Hugo Carrión G. 80
Estrategias de accesibilidad
• Estrategias “de inversión”– Utilización de normas– Extracción y estructuración de datos– Encapsulación– Restricción de la variedad de formatos que se
han de gestionar– Enfoque “UVC” (computadora virtual
universal)
Hugo Carrión G. 81
Estrategias de accesibilidad
• Estrategias a corto plazo (las que darán los mejores resultados a corto plazo solamente)– Preservación de la tecnología– Compatibilidad “hacia atrás” y migración de
versiones– Migración (que también puede funcionar
durante periodos más largos)
Hugo Carrión G. 82
Estrategias de accesibilidad
• Estrategias a mediano y largo plazo (que pueden funcionar durante periodos más largos)– Migración– Visualizadores– Emulación– Enfoque UVC
• Estrategias alternativas– Enfoques no digitales– Recuperación de datos (arqueología de datos)
• Combinaciones de varias estrategias
Hugo Carrión G. 83
Conclusiones
• La preservación de la información digital es una nuevo reto que se nos presenta
• No estamos preparados… pero podemos dar los primeros pasos
• Lo primero es tomar conciencia• La tecnologia facilita• Los procesos viabilizan• Las personas… hacen la diferencia