18/6/2014 drajulia@terra.com.br sites de busca
Post on 18-Apr-2015
115 Views
Preview:
TRANSCRIPT
11/04/2311/04/23drajulia@terra.com.br drajulia@terra.com.br www.scientiavinces.com/anawww.scientiavinces.com/ana 11
SitesSites de Busca de Busca
11/04/2311/04/23drajulia@terra.com.br drajulia@terra.com.br www.scientiavinces.com/anawww.scientiavinces.com/ana 22
Surgimento dos primeiros sistemas de
busca AltaVista, foi desenvolvido durante a
primavera de 1995 por cientistas no Laboratório de Pesquisas da Digital Equipment Corporation em Palo Alto, Califórnia (EUA) = primeiro banco de dados textual pesquisável da Web.
Google, foi fundado por Larry Page e Sergey Brin, dois estudantes do curso de Doutorado de Stanford em 1998.
11/04/2311/04/23drajulia@terra.com.br drajulia@terra.com.br www.scientiavinces.com/anawww.scientiavinces.com/ana 33
Não recomendado para:Não recomendado para:
Ortografia:Ortografia: ““inguinoranteinguinorante” ”
12.900 ocorrências12.900 ocorrências ““poblemapoblema” 172.000 ” 172.000
ocorrências, mas ocorrências, mas em português em português foram 78.300 foram 78.300
““excessão”excessão” 11700 11700 ocorrênciasocorrências
““...... Fazer compras em Fazer compras em XXX é o mesmo que XXX é o mesmo que comprar em qualquer comprar em qualquer cidade grande com cidade grande com uma uma excessãoexcessão: : língua.” (Guia de língua.” (Guia de compras).compras).
Era do Estado de Era do Estado de Direito ou Era da Direito ou Era da excessão?excessão? ... “ (autor- ... “ (autor- Produtor Cultural - Produtor Cultural - SIC)SIC)
11/04/2311/04/23drajulia@terra.com.br drajulia@terra.com.br www.scientiavinces.com/anawww.scientiavinces.com/ana 44
Invisible WebInvisible Web
Objetivo dos Objetivo dos sitessites de busca de busca Quem patrocina?Quem patrocina? Páginas com inclusão prioritáriaPáginas com inclusão prioritária Páginas com exclusão automática Páginas com exclusão automática
(Power points, .doc, entre outros)(Power points, .doc, entre outros)
– CONCLUSÃO: CONCLUSÃO:
11/04/2311/04/23drajulia@terra.com.br drajulia@terra.com.br www.scientiavinces.com/anawww.scientiavinces.com/ana 55
““Remédios”Remédios”
Tomar ciência de sua Tomar ciência de sua existênciaexistência
““ContornarContornar” os ” os limites da weblimites da web
Acesso aos bancos Acesso aos bancos de dados (de dados (databasedatabase) ) e bibliotecas (e bibliotecas (librarylibrary))
Criar seus próprios Criar seus próprios bancos de dados bancos de dados ((CorporaCorpora))
11/04/2311/04/23drajulia@terra.com.br drajulia@terra.com.br www.scientiavinces.com/anawww.scientiavinces.com/ana 66
Ferramentas de Auxílio à Ferramentas de Auxílio à Tradução (Tradução (CAT toolsCAT tools))
Machine Machine TranslationTranslation
CAT (Computer-CAT (Computer-Assisted Translation)Assisted Translation)
Segmentation and Segmentation and Translation MemoryTranslation Memory
Translation UnitTranslation Unit
GlossariesGlossaries
11/04/2311/04/23drajulia@terra.com.br drajulia@terra.com.br www.scientiavinces.com/anawww.scientiavinces.com/ana 77
CAT CAT toolstools
11/04/2311/04/23drajulia@terra.com.br drajulia@terra.com.br www.scientiavinces.com/anawww.scientiavinces.com/ana 88
11/04/2311/04/23drajulia@terra.com.br drajulia@terra.com.br www.scientiavinces.com/anawww.scientiavinces.com/ana 99
Dilemas das Dilemas das CAT toolsCAT tools
Cobrança por palavrasCobrança por palavras Cobrança por “palavras novas”Cobrança por “palavras novas” Memórias compartilhadas, memórias Memórias compartilhadas, memórias
“enviadas” “enviadas” Texto “sujo”Texto “sujo” Estigma da TMEstigma da TM
11/04/2311/04/23drajulia@terra.com.br drajulia@terra.com.br www.scientiavinces.com/anawww.scientiavinces.com/ana 1010
Listas de Discussão e Grupos de Listas de Discussão e Grupos de Ajuda Mútua (Ajuda Mútua (Profissão: TradutorProfissão: Tradutor yahoogroupsyahoogroups))
11/04/2311/04/23drajulia@terra.com.br drajulia@terra.com.br www.scientiavinces.com/anawww.scientiavinces.com/ana 1111
11/04/2311/04/23drajulia@terra.com.br drajulia@terra.com.br www.scientiavinces.com/anawww.scientiavinces.com/ana 1212
Pesquisa de Pesquisa de corpuscorpus
DefiniçãoDefiniçãoWhat is a What is a CorpusCorpus??– A collection of linguistic data, either A collection of linguistic data, either
written texts or a transcription of written texts or a transcription of recorded speech, which can be used as a recorded speech, which can be used as a starting-point of linguistic description or starting-point of linguistic description or as a means of verifying hypotheses about as a means of verifying hypotheses about a language a language
David Crystal, A Dictionary of Linguistics and David Crystal, A Dictionary of Linguistics and Phonetics, Blackwell, 3rd Edition, 1991.Phonetics, Blackwell, 3rd Edition, 1991.
– The plural is corpora. The plural is corpora.
11/04/2311/04/23drajulia@terra.com.br drajulia@terra.com.br www.scientiavinces.com/anawww.scientiavinces.com/ana 1313
11/04/2311/04/23drajulia@terra.com.br drajulia@terra.com.br www.scientiavinces.com/anawww.scientiavinces.com/ana 1414
11/04/2311/04/23drajulia@terra.com.br drajulia@terra.com.br www.scientiavinces.com/anawww.scientiavinces.com/ana 1515
CorporaCorpora Prontos Prontos
BNC – BNC – monolingual, synchronic, monolingual, synchronic, general, written texts, British Englishgeneral, written texts, British English
CobuildCobuild (Collins Birmingham University (Collins Birmingham University International Language Database )International Language Database )
CORIS/CODIS CORIS/CODIS Corpus of Written ItalianCorpus of Written Italian FLLOC – FLLOC – French Learner Language Oral French Learner Language Oral
CorporaCorpora
11/04/2311/04/23drajulia@terra.com.br drajulia@terra.com.br www.scientiavinces.com/anawww.scientiavinces.com/ana 1616
http://www.natcorp.ox.ac.uk/
top related