daisy pail. analisar as árvores do bosque na versão extented individualizar os nodos...
TRANSCRIPT
Daisy Pail
• Analisar as árvores do bosque na versão extented• Individualizar os nodos função:forma• Propor nodos que proporcionem maior
uniformidade de distribuição• Utilizar nodos que aumentem a recursividade da
árvore
• Apresentação da árvore conforme aparece em visl• Descrição das escolhas e justificativas das tags e
subtags da floresta sintática e do visl• Discussão sobre os problemas que essa versão
apresenta• Proposta de uma solução em busca de árvore
mais recursiva e uniforme
• Árvores deitadas: Descrição do formato e descrição das opções de análise na Floresta Sintá(c)tica.
• Xtag- Thecnical report• Manual de etiquetas da floresta sintática• Manual de etiquetas do palavras
• Projeto de construção de um treebank em• colaboração entre a Linguateca e o projeto VISL.
Contém textos em português (do Brasil e de Portugal) anotados (analisados) automaticamente pelo analisador sintático PALAVRAS (Bick 2000) e revistos por linguistas.
• Como, além da indicação das funções sintáticas, a análise também explicita hierarquicamente informação relativa à estrutura de constituintes, dizemos que uma frase sintaticamente analisada se parece com uma árvore, donde um conjunto de árvores constitui uma floresta sintática
• Quatro partes, que diferem quanto ao gênero textual, quanto ao modo (escrito vs falado) e quanto ao grau de revisão linguística: o Bosque, totalmente revisto por linguistas; a Selva, parcialmente revista, a Floresta Virgem e a Amazônia, não revistos.
• Cerca de 261 mil frases (6,7 milhões de palavras) sintaticamente analisadas
• Ferramentas de busca e extração
• O conteúdo pode ser levantado de 4 formas, de acordo com o site:
• Milhafre• Águia• Corpuseye• AC/DC• Mas também está disponível na página do moodle
para tgrep.
• As árvores do bosque• http://
beta.visl.sdu.dk/visl/pt/parsing/nonautomatic/floresta.php
• Separar os nodos F:f
• Não deixá-los como dependentes• Manter os nodos de função gramatical como
nodos de substituição da árvore • Deixar o determinante mais alto que o H e o outro
DN
α2
• Manual do conjunto de categorias do palavras. Disponível em: http://beta.visl.sdu.dk/visl/pt/info/symbolset-manual.html. Acesso em: 29 nov. 2010.
• The Constraint Grammar category set of "Palavras”. Disponível em: http://beta.visl.sdu.dk/visl/pt/info/portsymbol.html. Acesso em: 29 nov. 2010.
• Glossário de etiquetas florestais. Disponível em: http://www.linguateca.pt/floresta/BibliaFlorestal/anexo1.html. Acesso em: 29 nov. 2010.
• Bíblia Florestal: Um manual lingüístico da Floresta Sintá(c)tica. Disponível em: http://www.linguateca.pt/floresta/BibliaFlorestal/. Acesso em: 29 nov. 2010.