análisis documental

32
Análisis Documental Descripción Física Análisis de Contenidos Indización Resumen Clasificación Otros datos Palabras Clave Descriptores

Upload: lourdes-castillo

Post on 04-Jul-2015

939 views

Category:

Education


2 download

DESCRIPTION

Operaciones que configuran el análisis documental, definiciones normativas de AD, análisis de páginas web, metadatos, Dublin Core Metadata

TRANSCRIPT

Page 1: Análisis documental

Análisis Documental

Descripción Física Análisis de Contenidos

Indización Resumen Clasificación

Otros datos

Palabras Clave Descriptores

Page 2: Análisis documental

Teoría integradora AD > AC

AD = DF + AC

Teoría restrictiva AD=AC

Page 3: Análisis documental

Definición de AD

El análisis documental es un conjunto de operaciones* encaminadas a representar un documento y su contenido bajo una forma diferente de su forma original, con la finalidad posibilitar su recuperación** posterior e identificarlo

*Unas intelectuales y otras mecánicas**A partir de los máximos elementos posibles y de modo automatizadoBBDD

Page 4: Análisis documental

ADDefinición de la norma UNE 50-113

Operación que consiste en examinar un documento para encontrar sus elementos esenciales y las relaciones entre ellos

Page 5: Análisis documental

En el análisis documental se

produce un triple proceso 1.- Un proceso de comunicación, ya que

posibilita y permite la recuperación de información para transmitirla

2.- Un proceso de transformación, en el que un documento primario sometido a las operaciones de análisis se convierte en otro documento secundario de más fácil acceso y difusión

3.- Un proceso analítico-sintético, porque la información es estudiada, interpretada y sintetizada minuciosamente para dar lugar a un nuevo documento que lo representa de modo abreviado pero preciso

Page 6: Análisis documental

Toda la información registrada, en el soporte que sea, puede ser objeto de análisis documental

Page 7: Análisis documental

Núm.Registro:255203Autores:KEEFER, ALICETítulo:FIRSTSEARCH: SERVICIO EN LINEA PARA EL USUARIO FINALTítulo otros idiomas: FIRSTSEARCH: SERVEI EN LINIA PER A L'USUARI FINALISSN:0214-0349Revista:Item. Revista de Biblioteconomía i Documentació Datosfuente:1994,(16):34-42Tipodocumento:Artículo de revistaLengua:CatalánResumen: FirstSearch es el nuevo servicio de teledocumentación de OCLC, que cubre tanto el acceso y la consulta de bases de datos como la obtención del documento original. 5.753 instituciones lo utilizan actualmente. En Europa hay 152 bibliotecas usuarias: 68 universitarias, 6 bibliotecas públicas y 78 de empresas.

De las 50 bases de datos que el servicio ofrece, 5 se distribuyen exclusivamente a través del mismo. Se describen ArticleFirst, ContentsFirst, FastDoc, NetFirst y PapersFirst.

Se describen las modalidades de consulta y los resultados de una encuesta que revelan una gran aceptación por parte de los usuarios y se ilustran los costes de obtención de documentos a partir de diversos proveedores y medios de envíoDescriptores: Catálogos de acceso público en línea ;Bases de datos ; Acceso a la información ; Acceso al documentoIdentificadores:OCLC ; FIRSTSEARCHClasificación: 200501 Catálogos convencionales y automatizados (OPACS)

200402 Catalogación

Page 8: Análisis documental

•PUBLICACIO: EL PAIS

•DATA DE PUBLICACIO: 24-06-2001

•MES DE PUBLICACIO: JUNIO

•ANY DE PUBLICACIO: 2001

•PAGINA INICIAL:30

•PAGINA FINAL:30

•RESUMEN: Evolución de los incendios forestales en España de 1994 a 2000

•AMBIT: ESPANYA

•CLASSIFICACIO: MEDI AMBIENT

•DESCRIPTORS: INCENDIS FORESTALS

•PARAULES CLAU: SUPERFICIE FORESTAL CREMADA

•DATA DE CARREGA: 26-06-2001

•TIPUS DE DOCUMENT:DADES ESTADISTIQUES

•NOTES:

•ANALISTA:tmdo10

Page 9: Análisis documental
Page 10: Análisis documental

<HTML> 

 <HEAD>

 <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">

<META NAME="keywords" CONTENT="MALVINE, Manuscripts and letters, ONE, Metadata, EAD, Encoded Archival Description, library, museum, ANSI Z39.50, Z3950, Distributed Search, Retrieval, query broadcasting">

<META NAME="description" CONTENT="MALVINE opens new and enhanced access to disparate holdings  of modern manuscripts and letters, kept and catalogued in European  libraries, archives, documentation centres and museums.">

<META NAME="LANGUAGE" CONTENT="de-an">

<META NAME="security" CONTENT="public">

<META NAME="AUTHOR" CONTENT="JOANNEUM RESEARCH, MALVINE CONSORTIUM">

<TITLE>MALVINE - Manuscripts and Letters via Integrated Networks in Europe</TITLE>

<LINK HREF="styles.css" REL="STYLESHEET">

</HEAD>

. . .

. . .

</HTML>

OJO! Representación del documento dentro del documentometadatos

Page 11: Análisis documental

• El análisis documental representa la información de un documento en un registro estructurado, reduce todos los datos descriptivos físicos y de contenido en un esquema uniforme

Page 12: Análisis documental

Análisis Documental

Descripción Física Análisis de Contenidos

Indización Resumen Clasificación

Otros datos

Palabras Clave Descriptores

Page 13: Análisis documental

• Descripción externa del documentoIdentifica los datos físicos de un documento que lo distinguen de otro

• Actúa sobre el soporte

• Su finalidad principal es permitir localizar los documentos.

Descripción Física

Page 14: Análisis documental

Datos a consignar: Depende del tipo de documento, de lo que se considere como unidad documental y del soporte.

Artículo de revista Noticia de un informativo

Título del artículo Título de la noticia

Autor/es del artículo ProgramaTítulo de la publicación ParteNúmero de la publicación DirectorFecha publicación ColaboradoresMes ( o periodo) Fecha de emisiónAño de publicación Fecha de grabaciónPágina inicial FormatoPágina final Número de cinta

Time code inicioTime code final...

Descripción Física

Page 15: Análisis documental

Opera sobre el contenido temático del documentoLogra una representación de la información tratada

Se divide en varias operaciones: IndizaciónResumenClasificación

Análisis de Contenidos

Page 16: Análisis documental

• Indización o descripción característica 

Análisis de ContenidosINDIZACIÓN

Palabras clave Descriptores

Por asignaciónPor extracción

Page 17: Análisis documental

Análisis de ContenidosIndización

Palabras clave - Descriptores

• Hay dos modalidades diferentes pero complementarias de indización

– Palabras clave y Descriptores

• Se consignan en campos diferentes (Ver formularios)• Con frecuencia se usa el término palabra clave como sinónimo de

descriptor pero esto es INCORRECTO• Las palabras clave pueden ser términos simples o compuestos y

sus sinónimos, cuasisinónimos, antónimos, variaciones ortográficas...

• No suele existir un control estricto del vocabulario empleado en el campo de palabras clave, sin embargo:

– Las palabras clave con una frecuencia alta acaban siendo descriptores

– Las palabras clave son una de las fuentes a considerar a la hora de actualizar (tarea de mantenimiento) los lenguajes documentales empleados en un centro de documentación

Page 18: Análisis documental

Las palabras clave se pueden obtener de dos maneras:

Por extracción o derivación: los términos se toman del texto que se indiza.

Consultando fuentes externas

Indización orientada por documentos ya indizados (IOD)

Por asignación:Indización orientada por peticiones (IOP)

Los términos NO figuran en el texto

Pensando

Norma UNE 50-121

Análisis de ContenidosIndización

Palabras clave

Page 19: Análisis documental

• Son términos normalizados, formalizados, homologados que pertenecen a un lenguaje documental o controlado

• Representan sin ambigüedad los conceptos tratados ya que hacen referencia a un único semantema

• Son los términos preferentes de un lenguaje controlado

Análisis de ContenidosIndización

Descriptores

Page 20: Análisis documental

• Resumen o descripción sustancial– Indicativo o descriptivo: indica el tipo de

documento, los principales temas tratados y cómo se tratan

– Informativo o analítico: facilita la máxima información posible cuantitativa o cualitativa, o ambas, contenida en un documento

– Selectivo:refleja sólo aquellas partes del texto que parecen esenciales para una categoría de usuarios determinada

» Leer ejemplos

– Mixtos; de conclusiones; estructurados.

Análisis de ContenidosRESUMEN (ABSTRACT)

Page 21: Análisis documental

• Clasificar: Ordenar o disponer por clases definidas según el contenido del propio documento

• Los sistemas clasificatorios se caracterizan por sus estructuras jerárquicas– De los conceptos más amplios a los más

específicos» Ejemplos:

Análisis de ContenidosCLASIFICACIÓN

Page 22: Análisis documental

• TRABAJO– Empleo– Paro– Conflictividad laboral– Legislación laboral

• Calendario laboral– Negociación colectiva

• Concertación social• Convenios• Salarios

– Organizaciones empresariales

-----------------------------------------------------------------------------------------------------------------------

Producción científica

Revistas científicas

Factor de impacto

Análisis bibliométrico

Evaluación de revistas

Gestión de la información

Gestión del conocimiento

Selección de documentos

Inteligencia competitiva

Intranets

Page 23: Análisis documental

• Idioma original del documento

• Filiación del autor

• Número de referencias que aporta el documento

• Tipo de documento

• Nivel

• URL

Otros datos

Page 24: Análisis documental

Reflejo del AD en los campos de un registro

• Campos descriptivosse derivan de la descripción física

• Campos analíticosse derivan del análisis de contenidos

• Campos de control

comentar lo del dossier

Page 25: Análisis documental

“Análisis de páginas web”

“Reinvención” de la Documentación:

Crecimiento de la información en Internet imposibilidad de recuperarla de modo preciso necesidad de estructurarla para recuperarlaanálisis documental

a.- externo al documento

b.- en el propio documento

Page 26: Análisis documental

Análisis documental de páginas web – Los metadatos

• El término metadato aplicado a la información distribuída en Internet se define como “datos sobre de datos”.

• cualquier dato usado para ayudar a identificar, describir y localizar los recursos electrónicos en un entorno de red

• propiedades identificativas o descriptivas que se pueden asociar a un recurso de información electrónico

• “Información legible por ordenador sobre recursos web” (Tim Berners-Lee )

Docs. Electrónicos – En el documento

Page 27: Análisis documental

• Necesidad de los lenguajes de marcas que permitan identificar las sintaxis en las que se definen las estructuras de metadatos

• Existen diversas iniciativas de metadatos para normalizar la información incluída en un documento web e intentar facilitar una recuperación fiable por parte de los motores de búsqueda.– DC

– TEI

– GILS

– EAD

– ...

Page 28: Análisis documental

• Información que contienen los metadatos– Descriptiva– Contenidos

– Valoración contenidos– Para el tratamiento de los datos

Los metadatos a diferencia de los lenguajes de marcado se incluyen todos juntos al principio del documento web.

Page 29: Análisis documental

Dublin Core Metadata• <META NAME=”DC.Título” CONTENT=”

· Título: Nombre o título asignado al documento o a la fuente.<META NAME=”DC.Autor” CONTENT=” · Autor o creador: Creador intelectual del contenido del documento o de la fuente. <META NAME=”DC.Materia” CONTENT=” · Materia: Palabras claves o frases que resumen el contenido de un documento o de la fuente, el empleo de vocabularios controlados y esquemas de clasificación formales es aconsejable.

<META NAME=”DC.Resumen” CONTENT=” · Resumen: Se trata de un resumen o descripción textual del documento en caso de documentos como objetos y se hará descripción del contenido para fuentes visuales. <META NAME=”DC.Editor” CONTENT=”

·Editor: Editor o entidad responsable de la publicación del documento.

Page 30: Análisis documental

• <META NAME=”DC.Otras contribuciones” CONTENT=” · Otras contribuciones: Otros colaboradores u otras menciones de responsabilidad, que hayan contribuído al contenido intelectual del documento pero cuyas aportaciones sean secundarias respecto al elemento autor o creador<META NAME=”DC.Fecha” CONTENT=” · Fecha de publicación: Fecha de creación de la fuente. <META NAME=”DC.Tipo de recurso” CONTENT=” · Tipo de recurso: Categoría del recurso, tales como revista, diccionario, poema, informe técnico, directorio. Se espera que el elemento “Tipo de recurso” pueda escogerse de una relación de tipos predefinida.<META NAME=”DC.Formato” CONTENT=” · Formato: Sirve para identificar el programa informático y el equipo material, como texto/html; ASCII; fichero postscript; imagen JPEG, etc. El elemento Formato se asignará desde una lista predefinida, como la de Internet Media Types (MIME Media types). Actualmente la única opción disponible es texto/html.

Page 31: Análisis documental

• <META NAME=”DC.Identificador” CONTENT=” · Identificador del recurso: Código o número único, individualizado e internacional que identifica la fuente. Por ejemplo el URL (Uniform Resource Locator)<META NAME=”DC.Fuente” CONTENT=” · Fuente actual: Para versiones, adaptaciones, revisiones de documentos originales. Trabajo, impreso o electrónico, del que proviene el recurso, si esto ocurre.<META NAME=”DC.Lengua” CONTENT=” · Lengua: Lengua o lenguas en la que está el contenido intelectual de la obra, Ejemplos: en, de, es, fi, fr, ja, th, zh. <META NAME=”DC. Relación CONTENT=” · Relación : Relaciones con otros recursos.

Page 32: Análisis documental

• <META NAME=”DC.Cobertura” CONTENT=” · Cobertura: Cobertura espacio temporal. Se refiere a una región física, uso de coordenadas (longitud y latitud) o nombres de lugares. La temporal se refiere a la temporalidad del contenido del recurso, no a la fecha de creación. <META NAME=”DC.Derechos” CONTENT=” · Derechos: Copyright u otros.

• Comentar división bibliografía