18/6/2014 [email protected] sites de busca

16
08/05/22 08/05/22 [email protected] [email protected] www.scientiavinces.com/ana www.scientiavinces.com/ana 1 Sites Sites de Busca de Busca

Upload: internet

Post on 18-Apr-2015

115 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 18/6/2014 drajulia@terra.com.br  Sites de Busca

11/04/2311/04/[email protected] [email protected] www.scientiavinces.com/anawww.scientiavinces.com/ana 11

SitesSites de Busca de Busca

Page 2: 18/6/2014 drajulia@terra.com.br  Sites de Busca

11/04/2311/04/[email protected] [email protected] www.scientiavinces.com/anawww.scientiavinces.com/ana 22

Surgimento dos primeiros sistemas de

busca AltaVista, foi desenvolvido durante a

primavera de 1995 por cientistas no Laboratório de Pesquisas da Digital Equipment Corporation em Palo Alto, Califórnia (EUA) = primeiro banco de dados textual pesquisável da Web.

Google, foi fundado por Larry Page e Sergey Brin, dois estudantes do curso de Doutorado de Stanford em 1998.

Page 3: 18/6/2014 drajulia@terra.com.br  Sites de Busca

11/04/2311/04/[email protected] [email protected] www.scientiavinces.com/anawww.scientiavinces.com/ana 33

Não recomendado para:Não recomendado para:

Ortografia:Ortografia: ““inguinoranteinguinorante” ”

12.900 ocorrências12.900 ocorrências ““poblemapoblema” 172.000 ” 172.000

ocorrências, mas ocorrências, mas em português em português foram 78.300 foram 78.300

““excessão”excessão” 11700 11700 ocorrênciasocorrências

““...... Fazer compras em Fazer compras em XXX é o mesmo que XXX é o mesmo que comprar em qualquer comprar em qualquer cidade grande com cidade grande com uma uma excessãoexcessão: : língua.” (Guia de língua.” (Guia de compras).compras).

Era do Estado de Era do Estado de Direito ou Era da Direito ou Era da excessão?excessão? ... “ (autor- ... “ (autor- Produtor Cultural - Produtor Cultural - SIC)SIC)

Page 4: 18/6/2014 drajulia@terra.com.br  Sites de Busca

11/04/2311/04/[email protected] [email protected] www.scientiavinces.com/anawww.scientiavinces.com/ana 44

Invisible WebInvisible Web

Objetivo dos Objetivo dos sitessites de busca de busca Quem patrocina?Quem patrocina? Páginas com inclusão prioritáriaPáginas com inclusão prioritária Páginas com exclusão automática Páginas com exclusão automática

(Power points, .doc, entre outros)(Power points, .doc, entre outros)

– CONCLUSÃO: CONCLUSÃO:

Page 5: 18/6/2014 drajulia@terra.com.br  Sites de Busca

11/04/2311/04/[email protected] [email protected] www.scientiavinces.com/anawww.scientiavinces.com/ana 55

““Remédios”Remédios”

Tomar ciência de sua Tomar ciência de sua existênciaexistência

““ContornarContornar” os ” os limites da weblimites da web

Acesso aos bancos Acesso aos bancos de dados (de dados (databasedatabase) ) e bibliotecas (e bibliotecas (librarylibrary))

Criar seus próprios Criar seus próprios bancos de dados bancos de dados ((CorporaCorpora))

Page 6: 18/6/2014 drajulia@terra.com.br  Sites de Busca

11/04/2311/04/[email protected] [email protected] www.scientiavinces.com/anawww.scientiavinces.com/ana 66

Ferramentas de Auxílio à Ferramentas de Auxílio à Tradução (Tradução (CAT toolsCAT tools))

Machine Machine TranslationTranslation

CAT (Computer-CAT (Computer-Assisted Translation)Assisted Translation)

Segmentation and Segmentation and Translation MemoryTranslation Memory

Translation UnitTranslation Unit

GlossariesGlossaries

Page 7: 18/6/2014 drajulia@terra.com.br  Sites de Busca

11/04/2311/04/[email protected] [email protected] www.scientiavinces.com/anawww.scientiavinces.com/ana 77

                                                                                                                                                                                                           

                                                                                                     CAT CAT toolstools

Page 8: 18/6/2014 drajulia@terra.com.br  Sites de Busca

11/04/2311/04/[email protected] [email protected] www.scientiavinces.com/anawww.scientiavinces.com/ana 88

Page 9: 18/6/2014 drajulia@terra.com.br  Sites de Busca

11/04/2311/04/[email protected] [email protected] www.scientiavinces.com/anawww.scientiavinces.com/ana 99

Dilemas das Dilemas das CAT toolsCAT tools

Cobrança por palavrasCobrança por palavras Cobrança por “palavras novas”Cobrança por “palavras novas” Memórias compartilhadas, memórias Memórias compartilhadas, memórias

“enviadas” “enviadas” Texto “sujo”Texto “sujo” Estigma da TMEstigma da TM

Page 10: 18/6/2014 drajulia@terra.com.br  Sites de Busca

11/04/2311/04/[email protected] [email protected] www.scientiavinces.com/anawww.scientiavinces.com/ana 1010

Listas de Discussão e Grupos de Listas de Discussão e Grupos de Ajuda Mútua (Ajuda Mútua (Profissão: TradutorProfissão: Tradutor yahoogroupsyahoogroups))

Page 11: 18/6/2014 drajulia@terra.com.br  Sites de Busca

11/04/2311/04/[email protected] [email protected] www.scientiavinces.com/anawww.scientiavinces.com/ana 1111

Page 12: 18/6/2014 drajulia@terra.com.br  Sites de Busca

11/04/2311/04/[email protected] [email protected] www.scientiavinces.com/anawww.scientiavinces.com/ana 1212

Pesquisa de Pesquisa de corpuscorpus

DefiniçãoDefiniçãoWhat is a What is a CorpusCorpus??– A collection of linguistic data, either A collection of linguistic data, either

written texts or a transcription of written texts or a transcription of recorded speech, which can be used as a recorded speech, which can be used as a starting-point of linguistic description or starting-point of linguistic description or as a means of verifying hypotheses about as a means of verifying hypotheses about a language a language

David Crystal, A Dictionary of Linguistics and David Crystal, A Dictionary of Linguistics and Phonetics, Blackwell, 3rd Edition, 1991.Phonetics, Blackwell, 3rd Edition, 1991.

– The plural is corpora. The plural is corpora.

Page 13: 18/6/2014 drajulia@terra.com.br  Sites de Busca

11/04/2311/04/[email protected] [email protected] www.scientiavinces.com/anawww.scientiavinces.com/ana 1313

Page 14: 18/6/2014 drajulia@terra.com.br  Sites de Busca

11/04/2311/04/[email protected] [email protected] www.scientiavinces.com/anawww.scientiavinces.com/ana 1414

Page 15: 18/6/2014 drajulia@terra.com.br  Sites de Busca

11/04/2311/04/[email protected] [email protected] www.scientiavinces.com/anawww.scientiavinces.com/ana 1515

CorporaCorpora Prontos Prontos

BNC – BNC – monolingual, synchronic, monolingual, synchronic, general, written texts, British Englishgeneral, written texts, British English

CobuildCobuild (Collins Birmingham University (Collins Birmingham University International Language Database )International Language Database )

CORIS/CODIS CORIS/CODIS Corpus of Written ItalianCorpus of Written Italian FLLOC – FLLOC – French Learner Language Oral French Learner Language Oral

CorporaCorpora

Page 16: 18/6/2014 drajulia@terra.com.br  Sites de Busca

11/04/2311/04/[email protected] [email protected] www.scientiavinces.com/anawww.scientiavinces.com/ana 1616

http://www.natcorp.ox.ac.uk/