1ª aula indexacao 2013
DESCRIPTION
1ª Aula para o curso de Biblioteconomia da Universidade Federal do Rio Grande (FURG), Rio Grande, RS, Brasil.TRANSCRIPT
![Page 1: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/1.jpg)
Relembrando fundamentos da representação temática
Universidade Federal do Rio Grande (FURG) Disciplina Indexação: T & P (2013)Profa. Gisele Dziekaniak
[email protected] http://indexacaoteoriaepraticafurg.blogspot.com.br/
![Page 2: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/2.jpg)
Classificação
Para James Duff Brown a classificação é umPara James Duff Brown a classificação é um “processo mental” constantemente executado de “processo mental” constantemente executado de forma consciente e inconsciente por qualquer ser forma consciente e inconsciente por qualquer ser humano, ainda que não reconhecido como tal.humano, ainda que não reconhecido como tal.
Para Piedade (1983, p. 16) “Classificar é dividir em grupos ou classes, segundo as semelhanças e diferenças.”
Para Ranganathan classificar era traduzir o nome dos assuntos dos documentos da linguagem natural para a linguagem artificial adotada pelos sistemas de classificação bibliográfica. (PIEDADE, 1983)
![Page 3: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/3.jpg)
Característica, classe e categoria
Característica Qualidade ou atributo escolhido para servir de base à
classificação ou à divisão. Pode-se classificar adotando características distintas
para o mesmo objeto. Exemplos: Livros
- Tamanho- Cor- Língua- Assunto
“Há tantas possibilidades de classificar quantas forem as semelhanças e diferenças existentes entre os objetos ou ideias a classificar.” (PIEDADE, 1983, p. 17)
■ Literatura
- Lugar
- Língua
- Período
![Page 4: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/4.jpg)
Classificação cruzada
Pode-se classificar adotando várias características, mas empregando uma de cada vez e aplicando-a a todos os membros da classe. Ex.: característica Sexo para dividir animais racionais, não poderemos empregar, ao mesmo tempo, a característica faixa etária.
O emprego simultâneo de mais de uma característica se chama Classificação cruzada, quando as classes não são mutuamente excludentes, gerando confusão.
![Page 5: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/5.jpg)
Classificação cruzada
Exemplo correto:
Animais Racionais
_________________________
Homens Mulheres
____________ _____________
Crianças Adolescentes Adultos Crianças Adolescentes Adultos
![Page 6: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/6.jpg)
Classificação cruzada
Exemplo incorreto: Se empregássemos, ao mesmo tempo duas características (Língua e lugar)
Literatura
____________________________________
Em língua Do Brasil De Portugal Em língua Do Chile Do Peru etc.
portuguesa espanhola
![Page 7: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/7.jpg)
Característica, classe, categoria
ClasseÉ o conjunto de coisas ou ideias que possuem
um ou vários atributos, predicados ou qualidades em comum. Ex.: Mamíferos, Vertebrados, Canários, Animais.
Categoria São as maiores classes de fenômenos, as
classes mais gerais que podem ser formadas.São as grandes classes. Ex: na categoria Lugar,
pode-se distinguir as facetas: Lugar físico, Lugar político, Orientação (norte, sul etc.).
![Page 8: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/8.jpg)
Aristóteles e a classificação
Aristóteles dividiu o conhecimento com base em três critérios (NUNES, 2007): Critério de ausência ou presença do homem
nos seres investigados; critério de imutabilidade e critério de modalidade prática.
Trata-se de uma hierarquização conceitual que divide um tema geral em espécies a partir de uma característica classificatória.
![Page 9: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/9.jpg)
Aristóteles e a classificação
Aristóteles desenvolveu um sistema filosófico baseado em uma concepção rigorosa do Universo. Em seus tratados biológicos, apresentou o sistema de classificação dos animais que não se encontrava completo e que, originariamente em número de quatro, foram os seguintes:
Gênero Espécie Diferença Propriedade, e Acidente.
![Page 10: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/10.jpg)
Aristóteles e a classificação
Metafísica
![Page 11: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/11.jpg)
Porfírio e a classificação
A partir de Aristóteles, Porfírio descreve como as qualidades atribuídas às coisas
podem ser classificadas,
quebrando o conceito filosófico
da substância como um
genus/espécie do
relacionamento:
![Page 12: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/12.jpg)
Bacon e a classificação
Na classificação baconiana, apesar de algumas de suas classes e divisões se tornarem imbricadas, este sistema foi considerado um dos mais influentes nas diversas tentativas feitas para classificar o conhecimento. A classificação de Bacon está baseada na figura abaixo:
![Page 13: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/13.jpg)
Bacon e sua classificação
MIR (Memória, Imaginação e Razão)
Foi a base para a criação da CDD
![Page 14: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/14.jpg)
Indexação - conceito
![Page 15: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/15.jpg)
Etapas do tratamento temático
Análise de assunto Processo de ler um documento para extrair
conceitos que traduzam a essência do seu conteúdo. (DIAS, NAVES, 2007, p. 9)
Envolve cultura do indexador, experiência, conhecimento linguístico, cognitivo e lógico.
Também chamada de análise conceitual, análise documentária, análise da informação e subject analysis.
![Page 16: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/16.jpg)
Etapas do tratamento temático
1) Fases da Análise de assunto Leitura técnica do documento (leitura
documental) Extração de conceitos que representam a obra Atinência - termos em LN (do que trata a obra?)
Sugestão de leitura: Dias e Naves (2007)
![Page 17: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/17.jpg)
Etapas do tratamento temático
2) Tradução Passagem dos termos de linguagem natural
(LN) para linguagem artificial/documentária (LA/LD).
Eleição descritores autorizados pela LD (cabeçalhos de assunto, palavras-chave, termos de indexação).
Sugestão de leitura: Lancaster (2004)
![Page 18: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/18.jpg)
Análise documentária
“A análise documentária é definida como um conjunto de procedimentos efetuados com o fim de expressar o conteúdo dos documentos, sob formas destinadas a facilitar a recuperação da informação.” (DIAS, NAVES, 2007, p. 11)
Metainformação (informação da informação)
![Page 19: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/19.jpg)
Leitura do bibliotecário (LUCAS, 2000)
Questões ideológicas Equívoco da neutralidade Ilusão da completude Sujeitos leitores
Organizam arquivos Autorizados a ler, escrever e interpretar
Tipos de leitura Como apreensão do documento (literal) Como leitura interpretativa
Dica de leitura: Lucas (2000)
![Page 20: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/20.jpg)
![Page 21: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/21.jpg)
Subordinação, superordenação e coordenação
Meio de transporte
Aéreo AquáticoTerrestre
Carro Moto
Superordenação Subordinação
Coordenação
![Page 22: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/22.jpg)
Recuperação da Informação - RI
Information Retrieval: Termo cunhado por Calvin Mooers (década de 1950) que engloba aspectos intelectuais da descrição de informações e suas especificidades para a busca, além de quaisquer sistemas, técnicas ou máquinas empregados para o desempenho da operação.
É a responsável pela criação e desenvolvimento da Ciência da Informação. (SARACEVIC, 1996)
O objetivo é recuperar informações através da busca por alguma entrada catalogada a priori.
![Page 23: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/23.jpg)
Sistema de Recuperação da Informação - SRI Um sistema de informação coleta, processa,
armazena, analisa e dissemina informações e é constituído por um conjunto de componentes relacionados entre si. (GROSSI, 2008).
São sistemas de operações interligadas para identificar dentre um grande conjunto de informações, aquelas que sejam úteis, de acordo com a demanda expressa pelo usuário. (LOPES, 2002)
Objetivo de um SRI é permitir que um usuário recupere documentos através de características como: autor, título, assunto ou qualquer combinação desses elementos.
![Page 24: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/24.jpg)
Atividades em um SRI
Representação das informações contidas nos documentos;
Armazenamento; Gestão física e/ou lógica desses documentos
e de suas representações; Recuperação da informação representada e
dos próprios documentos armazenados (links).
Disseminação da informação.
![Page 25: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/25.jpg)
Sistema de Recuperação da Informação - SRI “Localização de documentos e itens de
informação que tenham sido objeto de armazenamento.” (ROWLEY, 2002, p. 114)
Para Cendón (2006) catálogos de bibliotecas, bases de dados bibliográficas, e motores de busca na internet são exemplos de SRI. (GROSSI, 2008)
![Page 26: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/26.jpg)
Subsistemas dos SRIs
Subsistemas de entrada: Seleção/aquisição, descrição, representação, organização de arquivos, armazenamento.
Subsistemas de saída: Análise e negociação de questões, estratégia de busca/recuperação, disseminação/acesso ao documento.
Subsistema de avaliação:Não se refere especificamente nem à entrada, nem à saída, mas a ambos, ao sistema como um todo.
![Page 27: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/27.jpg)
Avaliação dos SRI
Cobertura:Representa quanto o sistema contém informações
relevantes.
Exaustividade:Este conceito relaciona-se ao grau de profundidade com que os assuntos dos documentos são representados.
Precisão: Relaciona-se com a proporção de itens recuperados que são relevantes.
![Page 28: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/28.jpg)
Avaliação dos SRI
Tempo de resposta: É o intervalo médio entre o momento da consulta e a apresentação do resultado.
Esforço do usuário:É o esforço despendido para obter resultados na busca.
Formato: como os resultados são apresentados. São várias as características e tipologias comuns aos diversos sistemas de recuperação da informação, porém um módulo que todos devem possuir, por ser fundamental, é o módulo de interface com o usuário. (ARAUJO, 1994).
![Page 29: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/29.jpg)
![Page 30: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/30.jpg)
Estratégias de busca em um SRI
Estratégia de busca é o conjunto de decisões tomadas e de procedimentos adotados durante uma busca.
É a técnica ou conjunto de regras para tornar possível o encontro entre uma pergunta formulada e a informação armazenada em uma base de dados. (LOPES, 2002).
É a técnica ou conjunto de regras para tornar possível o encontro entre uma pergunta formulada e a informação armazenada em uma base de dados.
Uma boa estratégia de busca implica em conhecer a base de dados, as fórmulas de busca, o assunto que se busca e/ou a bibliografia que é objeto de busca.
Identificar a Necessidade de Informação (NI).
![Page 31: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/31.jpg)
NI fórmula de busca = resultado SRI
Estratégia de busca
Resposta insatisfatória = RUÍDO = Usuário insatisfeito = Nova estratégia de busca Resposta satisfatória = NI satisfeita= Item recuperado = usuário satisfeito
![Page 32: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/32.jpg)
Objetivos da estratégia de busca
Recuperar um número suficiente de registros relevantes e evitar que: Sejam recuperados itens irrelevantes; Sejam recuperados um número excessivo de
itens; Sejam recuperados um número insignificante
de registros.
![Page 33: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/33.jpg)
Problemas em recuperação da informação Os autores nem sempre usam as mesmas
palavras que os usuários para descrever o mesmo conceito.
Má formulação da consulta.
![Page 34: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/34.jpg)
Lógica de busca: Operadores booleanos
AND E
OR OU
NOT NÃO
Os operadores booleanos tem por objetivo definir como será a combinação feita entre os termos ou expressões de uma pesquisa.
![Page 35: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/35.jpg)
Lógica de busca: Operadores booleanos OR/OU Amplia a pesquisa e tem a
intenção de buscar ou esse ou aquele termo. Ou seja, qualquer uma das palavras.
Exemplo:A or B
A B
![Page 36: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/36.jpg)
Lógica de busca: Operadores booleanos AND/E Restringe a pesquisa e
significa a expressão que tenha todas as palavras. O resultado da busca deve recuperar ambos os termos.
Exemplo:A and B
![Page 37: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/37.jpg)
Lógica de busca: Operadores booleanos NOT/NÃO Exclui um dos termos da
pesquisa. Equivale dizer: sem a seguinte palavra.
Exemplo:
A not B
![Page 38: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/38.jpg)
Lógica de busca: Operadores booleanos Podem ser usados em expressões mais
complexas, onde se adotam os parênteses. Ex: (A or B) and CA pesquisa será feita 1º combinando a OR b e o
resultado se combina com AND
![Page 39: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/39.jpg)
Exercícios Operadores booleanos
Crie buscas usando assuntos que representem os seguintes conjuntos:
1. 3.
2. 4.
![Page 40: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/40.jpg)
Linguagem de indexação e de busca
Linguagem de indexação: Termos ou códigos usados como pontos de acesso em
um índice. Geralmente adota linguagem controlada (LC)
Linguagem de busca: Termos que são usados por um consulente ao
especificar uma necessidade de busca. Podem ser Linguagem natural (LN) ou LC, desde que o
usuário tenha acesso à linguagem documentária adotada pelo sistema de recuperação da informação.
![Page 41: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/41.jpg)
Linguagem natural e linguagem artificial ou controlada (LOPES, 2002)
CONCEITUE LINGUAGEM NATURALÉ a linguagem usada habitualmente na fala e na escrita representadas na base de dados pelos termos do título e resumo.
CONCEITUE A LINGUAGEM CONTROLADA É o conjunto de termos organizados de forma
hierarquizadas e/ou alfabética, com o objetivo de possibilitar a recuperação de informação temáticas, reduzindo substancialmente a diversidade de terminologia.
Tarefa: Pesquisar conceitos de LN e LA/LC/LD em outras fontes de informação da área. Entrega: Próxima aula. (não esquecer de referenciar as fontes adotadas).
![Page 42: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/42.jpg)
Diferenças entre Linguagem natural (LN) e linguagem controlada (LC, LC)
Linguagem natural ou livre (LN)
Linguagem controlada (LC, LA, LD)
Busca direta no texto Depende de uma LD
Usa linguagem comum do usuário
Distancia-se da linguagem do usuário
Oferece mais pontos de acesso
Os pontos de acesso são limitados pelo indexador
Oferece maior revocação Oferece menor revocação
Oferece menos precisão Oferece maior precisão
Tarefa: Ler o texto LOPES, I. L. Uso das linguagens controlada e natural em bases de dados: revisão de literatura. Ci. Inf., v. 31, n.1, Brasília, p.41-52, jan./abr. 2002 e CRIAR QUADRO COMPARATIVO ENTRE LN E LC Entrega: próxima aula.
![Page 43: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/43.jpg)
Revocação e Relevância (Lancaster, 2004)
Revocação (recall) Capacidade de um SRI em recuperar itens
existentes na base de dados. Precisão mede quantos documentos
relevantes foram recuperados
Relevância (Precisão) Capacidade de um SRI em recuperar itens
úteis ao usuário e minimizar a recuperação de documentos inúteis.
![Page 44: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/44.jpg)
Fórmulas para avaliar um SRI (Revocação e Relevância)
Itens não recuperados Relevantes (D)
Itens não recuperados Relevantes (D)
Itens não recuperados não Relevantes (C)
Itens recuperados Relevantes (A)
Itens recuperados não Relevantes (B)
Revocação = relevantes recuperados/ total de itens relevantes que existem no sistema
Precisão = relevantes recuperados/ total de itens recuperados
Revocação R= A / (A+D)
Relevância P = A / (A+B)
![Page 45: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/45.jpg)
Revocação e Relevância
Esses dois parâmetros são inversamente relacionados, significando que a melhoria de um implica na piora do outro.
Tradicionalmente, existem dois fatores muito importantes que governam a eficiência da indexação de um documento e consequentemente, influenciam na revocação e na precisão: Exaustividade: Define o número de diferentes
conceitos (tópicos) que estão indexados. Especificidade: Define o grau de precisão da
linguagem de indexação em descrever um dado documento.
![Page 46: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/46.jpg)
Referências
ARAUJO JUNIOR, R. H. Precisão no processo de busca e recuperação da informação. Brasília: Thesaurus, 2004.
DIAS, M. M. L.; DIAS, E. W. Análise de assunto: teoria e prática. Brasília: Briquet de Lemos, 2007.
GROSSI, M.G. R. Estudo das características de software e implantação de um software livre para gerenciamento de bibliotecas universitárias federais brasileiras. 2008. Tese (Doutorado em Ciência da Informação) – UFMG, Belo Horizonte, 2008.
LANCASTER, F. W. Indexação e resumos: teoria e prática. 2.ed. Brasília: Briquet de Lemos, 2004.
LOPES, I. L. Uso das linguagens controlada e natural em bases de dados: revisão de literatura. Ci. Inf., v. 31, n.1, Brasília, p.41-52, jan./abr. 2002.
![Page 47: 1ª aula indexacao 2013](https://reader036.vdocuments.site/reader036/viewer/2022062308/5586719bd8b42a2e278b4767/html5/thumbnails/47.jpg)
Referências
NUNES, L. Da Classificação das Ciências à classificação da Informação: uma análise do acesso ao conhecimento. 2007. Dissertação (Mestrado em Ciência da Informação) - PUC de Campinas, 2007. Disponível em <http://www.bibliotecadigital.puc-campinas.edu.br/tde_busca/arquivo.php?codArquivo=340 > Acesso em 22 nov. 2009
PIEDADE, M. A. R. Introdução à teoria da classificação. Rio de Janeiro: Interciência, 1977.
ROWLEY, J. A biblioteca eletrônica. 2.ed. Brasília: Briquet de Lemos, 2002.
SARACEVIC, T. Ciência da informação: origem, evolução e relações. Perspec. Ci. Inf., Belo Horizonte, v. 1, n.1, p.41-62, jan./jun. 1996.