indexação e busca baseada em metadados em um sistema p2p híbrido

17
Indexação e busca baseada em metadados em um sistema P2P Híbrido Centro de Informática Universidade Federal de Pernambuco Marco André Santos Machado [email protected]

Upload: marco-machado

Post on 04-Aug-2015

273 views

Category:

Education


1 download

TRANSCRIPT

Page 1: Indexação e busca baseada em metadados em um sistema P2P Híbrido

Indexação e busca baseada em metadados em um sistema P2P Híbrido

Centro de InformáticaUniversidade Federal de Pernambuco

Marco André Santos [email protected]

Page 2: Indexação e busca baseada em metadados em um sistema P2P Híbrido

2

Agenda● Indexação e Buscas● Metadados● Trabalhos Relacionados● Proposta● Análise Comparativa

Page 3: Indexação e busca baseada em metadados em um sistema P2P Híbrido

3

Indexação e Buscas

Page 4: Indexação e busca baseada em metadados em um sistema P2P Híbrido

4

Metadados

● ID● Nome● Tamanho (Kb)● Path● Datas de criação, indexação, modificação● Interesses do usuário● Categoria● Conteúdo

Page 5: Indexação e busca baseada em metadados em um sistema P2P Híbrido

5

Trabalhos Relacionados

Page 6: Indexação e busca baseada em metadados em um sistema P2P Híbrido

6

Trabalhos Relacionados● Sixearch

– Composto por muito componentes:– Crawler– Sistema para Indexação – Mecanismo de Recuperação– Sistema de aprendizado baseado em

contexto● Index local, aggregated, em clustering)

Page 7: Indexação e busca baseada em metadados em um sistema P2P Híbrido

7

Trabalhos Relacionados● Minerva

– Cada peer descobre e indexa seus arquivos

– Envia um conjunto de metadados baseado em termos para um index global

– Possui um index local e global (2-steps)

Page 8: Indexação e busca baseada em metadados em um sistema P2P Híbrido

8

Trabalhos Relacionados● eSearch

– Indexação baseado em palavras-chave

– Possui peer divididos por palavras-chave para armazenar o index

– Index local e global

– Local: documento X contêm os termos a, b

– Global: termos a está nos documentos X, Z

Page 9: Indexação e busca baseada em metadados em um sistema P2P Híbrido

9

Proposta● Indexação

– Extrair o conteúdo (Apache Tika)– Extrair metadados– Indexar (Lucene)– Local– SearchServer

● Busca– Local– Global– Distribuída

Page 10: Indexação e busca baseada em metadados em um sistema P2P Híbrido

10

Análise Comparativa

●Cenário 1● Index local, global, distribuído

Page 11: Indexação e busca baseada em metadados em um sistema P2P Híbrido

11

Análise Comparativa

●Cenário 1● Index local, global, distribuído

Page 12: Indexação e busca baseada em metadados em um sistema P2P Híbrido

12

Análise Comparativa

● Cenário 1

– Index local, global, distribuído– Vantagens

● A busca sempre retornará resultados● SearhServer ON => index completo

– Desvantagens● Dupla indexação● Maior quantidade de mensagens● Sobrecarga do SearchServer● Busca distribuída => Flood

Page 13: Indexação e busca baseada em metadados em um sistema P2P Híbrido

13

Análise Comparativa

●Cenário 2● Index global

Page 14: Indexação e busca baseada em metadados em um sistema P2P Híbrido

14

Análise Comparativa● Cenário 2

– Index global

– Vantagens● Única indexação● Menor qnt. de mensagens● SearhServer ON => index completo

– Desvantagens● Sobrecarga do SearchServer● A busca pode NÃO retorna resultados

(SearchServer => OFF)

Page 15: Indexação e busca baseada em metadados em um sistema P2P Híbrido

15

Análise Comparativa

●Cenário 3● Index local / distribuído

Page 16: Indexação e busca baseada em metadados em um sistema P2P Híbrido

16

Análise Comparativa

● Cenário 3– Index local / distribuído

– Vantagens● Única indexação● Menor qnt. de mensagens para indexar

– Desvantagens● A busca só retorna resultados do peers

online● Não possui um index completo

Page 17: Indexação e busca baseada em metadados em um sistema P2P Híbrido

17

Obrigado!