lingüística computacional - marcos maia

14
29/01/2015 Setor de Lingüística http://www.museunacional.ufrj.br/linguistica/membros/maia/pub411.htm 1/14 >Membros >Docentes >Marcus Maia >Publicações Gramática e Parser Marcus Maia UFRJ Resumo: A subárea da Psicolingüística conhecida como Processamento de Frases constitui um campo de pesquisas extremamente produtivo, embora ainda relativamente pouco praticado no Brasil. O objetivo central das teorias de processamento de frases é o de identificar os procedimentos psicologicamente reais que colocamos em jogo ao produzir e compreender frases. A distinção entre um nível de representação gramatical e um nível de acesso a essas representações, consubstanciada na dicotomia competência x desempenho (Chomsky 1965), permitiu um balizamento da área em que perfilam modelos que pressupõem a independência entre a gramática e o processador como um postulado básico. No âmbito do Programa Minimalista (Chomsky, 1995,1998, 1999), podese indentificar uma aproximação crescente a questões diretamente relacionadas ao processamento, cuja caracterização passou, inclusive, por uma reconceituação fundamental de Chomsky (1995) para Chomsky (1998), abrindo caminho para a identificação progressiva entre a gramática e o processador ou parser. Este trabalho pretende resenhar brevemente algumas questões importantes da área, comparando aspectos dos principais modelos de processamento de frases, a saber, a Teoria da Complexidade Derivacional (Fodor, Bever & Garret, 74), a teoria do “garden path” (Frazier & Rayner, 1982), o modelo de “construal” (Frazier & Clifton, 1996), o modelo incrementacional interativo(Crain & Steedman, 1985; Altmann & Steedman, 1988), o modelo de satisfação de condições (MacDonald, Perlmutter & Seidenberg, 1994) e o modelo de processamento minimalista (Weinberg, 1999). I – Introdução A existência de um analisador sintático ou parser distinto da representação da gramática na mente tem sido um pressuposto da Psicolingüística cuja origem costuma ser atribuída à famosa dicotomia competência x desempenho proposta por Chomsky (1965). Esta distinção é ilustrada, por exemplo, com orações relativas de encaixe central, aparentemente bem formadas gramaticalmente, mas de difícil compreensão: (1) ? A atriz que o novo diretor que o produtor contratou demitiu decidiu processar a emissora. Por outro lado, os estudos de produção psicolingüística têm investigado os “slips of the tongue” ou escorregadas de língua, que parecem indicar um problema no acesso à representação e não na representação em si mesma, já que, geralmente, o erro é corrigido imediatamente. Marslen Wilson, por exemplo, nota os seguintes tipos de erros, que são ilustrativos não de um armazenamento cognitivo inadequado, mas de um processo de busca, que “erra” como se erra ao fazer uma conta: (2) Tipos de Erros: a. Antecipações: bake my bike por take my byke Museu Nacional UFRJ Departamento de Antropologia Setor de Lingüítica Quinta da Boa Vista s/n, Rio de Janeiro, RJ Tel.: +55 215681314 ramal: 244

Upload: eric9r

Post on 15-Apr-2016

22 views

Category:

Documents


0 download

DESCRIPTION

Resumo sobre Gramática e Parser do museu da língua portuguesa.

TRANSCRIPT

Page 1: Lingüística Computacional - Marcos Maia

29/01/2015 Setor de Lingüística

http://www.museunacional.ufrj.br/linguistica/membros/maia/pub411.htm 1/14

>Membros >Docentes >Marcus Maia>Publicações

Gramática e Parser

Marcus Maia ­ UFRJ

Resumo: A subárea da Psicolingüística conhecida como Processamento de Frasesconstitui um campo de pesquisas extremamente produtivo, embora ainda relativamentepouco praticado no Brasil. O objetivo central das teorias de processamento de frases éo de identificar os procedimentos psicologicamente reais que colocamos em jogo aoproduzir e compreender frases. A distinção entre um nível de representação gramaticale um nível de acesso a essas representações, consubstanciada na dicotomiacompetência x desempenho (Chomsky 1965), permitiu um balizamento da área em queperfilam modelos que pressupõem a independência entre a gramática e o processador como um postulado básico. No âmbito do Programa Minimalista (Chomsky, 1995,1998,1999), pode­se indentificar uma aproximação crescente a questões diretamenterelacionadas ao processamento, cuja caracterização passou, inclusive, por umareconceituação fundamental de Chomsky (1995) para Chomsky (1998), abrindocaminho para a identificação progressiva entre a gramática e o processador ou parser. Este trabalho pretende resenhar brevemente algumas questões importantes da área, comparando aspectos dos principais modelos de processamento de frases, a saber, aTeoria da Complexidade Derivacional (Fodor, Bever & Garret, 74), a teoria do “garden­path” (Frazier & Rayner, 1982), o modelo de “construal” (Frazier & Clifton, 1996), omodelo incrementacional interativo(Crain & Steedman, 1985; Altmann & Steedman,1988), o modelo de satisfação de condições (MacDonald, Perlmutter & Seidenberg,1994) e o modelo de processamento minimalista (Weinberg, 1999).

I – Introdução

A existência de um analisador sintático ou parser distinto da representação da gramáticana mente tem sido um pressuposto da Psicolingüística cuja origem costuma seratribuída à famosa dicotomia competência x desempenho proposta por Chomsky (1965). Esta distinção é ilustrada, por exemplo, com orações relativas de encaixecentral, aparentemente bem formadas gramaticalmente, mas de difícil compreensão:

(1) ? A atriz que o novo diretor que o produtor contratou demitiu decidiu processar aemissora.

Por outro lado, os estudos de produção psicolingüística têm investigado os “slips of thetongue” ou escorregadas de língua, que parecem indicar um problema no acesso àrepresentação e não na representação em si mesma, já que, geralmente, o erro écorrigido imediatamente. Marslen Wilson, por exemplo, nota os seguintes tipos de erros,que são ilustrativos não de um armazenamento cognitivo inadequado, mas de um processo de busca, que “erra” como se erra ao fazer uma conta:

(2) Tipos de Erros:

a. Antecipações: bake my bike por take my byke

Museu Nacional ­ UFRJDepartamento de

AntropologiaSetor de Lingüítica

Quinta da Boa Vista s/n, Riode Janeiro, RJ

Tel.: +55­ 21­568­1314ramal: 244

Page 2: Lingüística Computacional - Marcos Maia

29/01/2015 Setor de Lingüística

http://www.museunacional.ufrj.br/linguistica/membros/maia/pub411.htm 2/14

b. Perseveração: painted the poor por painted the door/ tentou a torte por tentou asorte

c. Reversão: Katz e Fodor ­> Fatz e Kodor / bortou o colo por cortou o bolo

d. Blending: grave erro ­> grerro

As diversas teorias psicolingüísticas têm, de uma forma ou de outra, sido balizadas poressa dicotomia, especialmente na subárea conhecida como Processamento de frases.Ainda recentemente, quando de sua vinda ao Brasil, em 1996, Noam Chomsky, instadoa posicionar­se sobre a relevância do binômio, afirmou sua naturalidade conceitual,lembrando que “as pessoas sabem coisas e as pessoas fazem coisas”, havendo, poisque se distingüir os dois processos, até no que se refere aos aspectos não estritamentelingüísticos da cognição. Não obstante, a dicotomia apresenta tensão variável ao longoda história da Psicolingüística, sendo particularmente interessante observar­se suareformulação no âmbito do programa minimalista, etapa mais recente da teoriagerativa. Nosso objetivo nessa comunicação é o de colocar em perspectiva a relaçãoGramática/Parser, resenhando, ainda que esquematicamente, as questões básicas aíenvolvidas, bem como sua caracterização divergente em alguns dos principais modelosde processamento de frases da psicolingüística moderna. Entre essas questões,destaca­se a investigação sobre os aspectos particulares e universais da representaçãoe do acesso. As teorias universalistas, tais como a teoria do Garden­Path tendem aassumir a existência de um conjunto uniforme de princípios de parsing aplicáveis atodas as línguas. No outro extremo do espectro encontram­se teorias como algunsmodelos conexionistas que propõem os chamados “totally data shaped parsers”, isto é,parsers totalmente customizados pelo corpus a que se aplicam. No meio termo, hámodelos que procuram conciliar princípios universais e parâmetros particulares.

Nas seções abaixo, revisamos brevemente alguns conceitos fundamentais de parsing e discutimos modelos teóricos que implementam esses conceitos de forma diversa e atéadversa. Assim procedendo, queremos desenhar um quadro geral onde se poderácompreender melhor ao menos algumas das pesquisas reportadas nesse simpósio. Alémdisso, faremos referência particularmente, nesta última seção, a investigações emcurso sobre o compreensão de frases em língua portuguesa, que vêm se desenvolvendono âmbito da linha de pesquisa sobre processamento sintático, no programa de pós­graduação em lingüística da UFRJ.

II– Modelos de Processamento de frases

(3) Modelos de Processamento de Frases

Incrementacional­ Satisfação

DTC Garden Path Construal Interativo de condições Conexionismos

|­­­­­­­­ | ­­­­­­­­­­­­­­­­­­ | ­­­­­­­­|­­­­­­­ | ­­­­­­­­­­­­­­­­­­­­­­­­­­­| ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­|

Minimalista Teorias Paramétricas

Page 3: Lingüística Computacional - Marcos Maia

29/01/2015 Setor de Lingüística

http://www.museunacional.ufrj.br/linguistica/membros/maia/pub411.htm 3/14

+Sintático + Semântico

3.1. DTC ­ A teoria da complexidade derivacional

Esta é a primeira grande teoria em Psicolingüística. A partir de 1950, G.A. Miller eassociados demonstraram através de diferentes paradigmas experimentais, tais comotécnicas de reportagem parcial e total, locação de clicks, identificação de palavras embackground de ruído, etc., a realidade psicológica de estruturas sintáticas. Na década de60, com o advento do primeiro modelo transformacional (kernel & tags), diferentesinvestigações experimentais procuraram demonstrar a identidade entre a históriaderivacional das frases e a sua complexidade perceptual. A hipótese forte propunha atransparência entre a gramática e o parser, isto é, frases com maior número detransformações seriam mais difícil de processar do que frases com menostransformações. Segundo Miller, ao ouvirmos uma frase, computamos o marcadorfrasal superficial e a partir daí as estruturas subjacentes são recuperadas, revertendo­seas transformações que se aplicam na derivação da frase. Por exemplo:

(4) Patrícia querer Patrícia vestir Patrícia

Refl => Patrícia querer Patrícia vestir­se

SS I => Patrícia querer vestir­se

Conc => Patrícia quer vestir­se

Neg => Patrícia não quer vestir­se

Os primeiros experimentos, por exemplo, McMahon (1963) pareceram indicar que ojulgamento do valor de verdade de orações como as exemplificadas abaixo revelavagrau de dificuldade variável, requerendo as negativas e passivas mais tempo deavaliação do que as afirmativas ativas. Aparentemente, haveira menos operaçõesgramaticais envolvidas na derivação das frases ativas afirmativas do que nas outras.

(5) McMahon(1963)

Afirmativa ativa

5 precedes 13 pequena diferença

Afirmativa passiva

13 is preceded by 5 diferença significativa

Negativa ativa

Page 4: Lingüística Computacional - Marcos Maia

29/01/2015 Setor de Lingüística

http://www.museunacional.ufrj.br/linguistica/membros/maia/pub411.htm 4/14

13 does not precede 5 pequena diferença

Negativa passiva

13 is not preceded by 6

Entretanto, diversos outros experimentos subseqüentes (cf. Fodor, Bever & Garrett(1974)), vieram demonstrar que a teoria da complexidade derivacional, ao menos emsua versão mais forte, era falsa. Por exemplo, Bever, Fodor, Garrett & Mehler (1966)descobriram que uma frase como (6) em que havia uma transformação adicional demovimento de partícula não era mais difícil de processar do que (7)

(6) John phoned the girl up

(7) John phoned up the girl

Outros estudos, utilizando uma variedade de técnicas experimentais, estabeleceramconclusivamente que não havia diferenças significativas entre passivas e ativas,apagamento de elementos, etc. As diferenças inicialmente encontradas, prinicpalmenteentre afirmativas e negativas vieram a ser atribuídas a fatores semânticos, nãosintáticos. Como conseqüência da falência da DTC, registrou­se um afastamento entre aa Lingüística e a Psicolingüística que se aproximou gradualmente da PsicologiaCognitiva, durante a década de 70.

3.2. A Teoria do Garden­Path

Ao compreendermos uma frase precisamos integrar um conjunto complexo deinformações, envolvendo desde a análise sintática da frase que nos permite determinare relacionar constituintes formados por itens lexicais que nos são apresentados emcertas ordens. A informação contida nesses itens lexicais, tais como propriedadescategoriais, grade de subcategorização, grade temática, propriedades morfológicas,prosódicas, ortográficas tem que ser acessada em algum ponto do processo – e aquestão de que ponto é esse é objeto de controvérsia acirrada entre os modelos, comoveremos. É uma das questões, inclusive, abordada pela pesquisa de Melo, a serreportada nesse simpósio. O fato é, no entanto, que somos muito bons e rápidos nesseprocesso, que ocorre em milésimos de segundos, aparentemente mais como ato reflexo,automático, do que como ato de reflexão consciente. Geralmente só nos damos conta doprocesso quando ele falha, como ocorre quando nos deparamos com frases ambíguas,como a clássica de Tom Bever em (8) ou uma frase em português equivalente, como em(9):

(8) The horse raced past the barn… fell.

(9) Mãe suspeita de assassinato do filho…foge.

Trata­se de ambigüidades locais e temporárias cuja resolução nos fornece pistas sobre omodo de proceder do parser. Aparentemente vamos integrando cada novo item naestrutura incrementacionalmente e quando chegamos no último vocábulo não temoscomo anexá­lo. Devemos, então, retornar e refazer a estrutura, como indicado nasanálises em (10a) e (10b), referentes à frase em (9):

Page 5: Lingüística Computacional - Marcos Maia

29/01/2015 Setor de Lingüística

http://www.museunacional.ufrj.br/linguistica/membros/maia/pub411.htm 5/14

(10a) VP

/ \

Mãe V’

/ \

suspeita SP

/ \

de SN

\

N’

/ \

assassinato SP

/__\

do filho foge?

(10b) VP

/ \

SN foge

/____\

Mãe suspeita de assassinato do filho

O estudo de como o processador lida com as ambiguidades tem sido uma áreaparticularmente produtiva dos estudos sobre a compreensão de frases. Frazier & Clifton(1995) procedem a uma tipologia das ambiguidades conforme indicado no quadro aseguir:

(11) Diferentes tipos de ambigüidade sintática

AMBIGUIDADES ESTRUTURAIS

1. Complementação nominal ou sentencial

(a) Eu vi Maria/(b) Eu vi Maria sair: MA, (a) é mínimo, (b) não­mínimo.

2. Oração substantiva ou adjetiva

Page 6: Lingüística Computacional - Marcos Maia

29/01/2015 Setor de Lingüística

http://www.museunacional.ufrj.br/linguistica/membros/maia/pub411.htm 6/14

(a) O diretor contou à aluna que o professor beijou(a) a secretária/(b) a estória.

MA, (a) é mínimo, (b) não mínimo.

3. Aposição de SP a SV ou SN

(a) O guarda viu o rapaz com o binóculo/ (b) o guarda viu o rapaz com o revólver

MA, (a) é mínimo, (b) não mínimo.

4. Oração principal ou relativa reduzida

(a) The horse raced bast the barn and fell/The horse raced past the barn fell

MA, (a) é mínimo, (b) não mínimo.

5. Coordenação de SN’s ou de Orações

(a) Eu vi a menina e sua irmã/(b) Eu vi a menina e sua irmã riu

MA e LC: (a) é mínimo, (b) não mínimo.

6. SN complemento ou Sujeito de oração principal

(a) Como João sempre corre (a)um km, ele não ficou cansado (b) um km é fácil p/ele.

LC: (a) é mínimo, (b) não mínimo.

7. Aposição baixa ou alta de oração relativa

O doutor visitou (b) o filho (a)da enfermeira que se machucou

LC: (a) é mínimo, (b) não mínimo.

8. Aposicão baixa ou alta de SAdv

(a) Maria disse que choveu ontem/ (b) Maria disse que vai chover ontem

LC: (a) é mínimo, (b) não mínimo.

Um princípio assumido pela TGP é o Princípio da Imediaticidade (Just e Carpenter(1980/87). É um princípio de parsing global, descreve características gerais doprocesso e não estratégias específicas de construção. Basicamente, as mensagenslingüísticas consitem de cadeia de palavras, encontradas uma a uma. Uma vezpronunciadas estas palavras desaparecem, pois sua retenção perceptual na memóriasensorial é de cerca de 4 segundos, conforme estabelecido experimentalmente (Darwin,Turvey & Crowder, 1972). Como então conseguimos processar frases complexas, querequerem operações mentais diversas tão rápidas? A questão é tratada pelo Princípioda Imediaticidade da Análise, segundo o qual as palavras são estruturadas logo queencontradas. Observe­se que há três alternativas lógicas a esse respeito:

(a) O parser atrasa a computação até que o ponto de ambiguidade sejaidentificado e só então

constrói a árvore correta;

(b) O parser computa todas as análises distintas em paralelo

(c) O parser computa uma única análise sintática imediatamente e a mantématé que seja contradita, quando então deve retornar para reanalisar a frase.

Page 7: Lingüística Computacional - Marcos Maia

29/01/2015 Setor de Lingüística

http://www.museunacional.ufrj.br/linguistica/membros/maia/pub411.htm 7/14

A imediaticidade é justificada pelo garden­path e porque tem a vantagem de evitar aexplosão computacional, ou seja, a memória de curto prazo teria dificuldades emmanter diferentes alternativas sintáticas e semânticas ativas até que uma delas fosse aescolhida. Seria uma carga pesada demais para a memória de curto prazo. Na verdade aprópria existência de garden path indica qual a opção mais viável. Frazier & Rayner(82) fornece comprovação em tempo real para este princípio: Mediram­se através deEye­tracker os tempos de fixação ocular para frases em inglês equivalentes a

(12) Antes de você montar o cavalo este está sempre bem tratado.

(13) Antes de você montar o cavalo está sempre bem tratado.

Trata­se de ambigüidade sintática decorrente do fato de que em (12) o SN o cavalodeve ser ligado no marcador frasal como objeto de montar enquanto que em (13), apreferência por esta ligação (attachment) leva a garden path, pois o SN aí deve serinterpretado como sujeito da próxima frase. Ao lermos a palavra cavalo nas frases há,portanto, ambiguidade. A hipótese dos autores era a de que o princípio daimediaticidade seria obedecido. Há aqui também uma outra hipótese muito importanteque é o Princípio da Ligação Mínima, pois a Imediaticidade pode se dar em qualquerdos dois sentidos. Se o sentido escolhido for o que toma o SN o cavalo como objeto (ejá veremos porque esta é a interpretação preferida), esta será a decisão correta para12 e a incorreta para 13, logo espera­se que haja maior tempo de processamento em13, do que em 12. É o que ocorre. Tal fato apóia a hipótese de que uma decisão deparsing imediata é tomada sobre a palavra cavalo em ambas as frases.

A afirmação fundamental da Teoria do Garden Path é que: (1) o parser usa uma porçãodo seu conhecimento gramatical isolado do conhecimento de mundo e outrasinformações para a identificação inicial das relações sintagmáticas; (2) o parserconfronta­se com sintagmas de aposição ambígua e compromete­se com umaestrutura única; (3) Pressionado pela arquitetura do sistema de memória de curtoprazo, que tem um limite estreito de processamento e armazenamento, o parser segueum princípio psicológico na escolha desta estrutura: use o menor número possível denós (M.A.) e, se duas aposições mínimas existem, aponha cada nova palavra aosintagma corrente (LC).

Embora haja evidências substanciais em favor de MA e LC , há também questionamentos à sua existência, tal como Cuetos e Mitchell (1988), que demonstramque tal não ocorre em Espanhol. Em Português, estudos como o de Ribeiro (2000) eMaia & Maia (2000) demonstram a preferência pela aposição alta da relativa. Estesexperimentos colocam em cheque a afirmação de Frazier (1987) de que é possível remover a gramática da língua inglesa da teoria universal do processamento de frases,plugar a gramática de qualquer outra língua, e obter a teoria de processamentoadequada para aquela língua. A TGP será alvo também de outro tipo dequestionamento, como, por exemplo, aqueles levantados pela Teoria Incrementacional­Interativa.

3.3. O Modelo Incrementacional­Interativo

O objetivo principal das teorias atuais em Compreensão de Frases é identificar os tiposde informação que as pessoas utilizam ao ler ou ouvir frases e determinar osprincípios seguidos ao usar a informação disponível. A hipótese de que o conhecimentolingüístico é usado de forma modular tem levado a avanços substanciais nacompreensão destes princípios. Obviamente, todas as informações relevantes podem serusadas em algum momento da compreensão. Assim, uma teoria modular deveespecificar a natureza e o como/quando dos módulos. A teoria “interativa­

Page 8: Lingüística Computacional - Marcos Maia

29/01/2015 Setor de Lingüística

http://www.museunacional.ufrj.br/linguistica/membros/maia/pub411.htm 8/14

incrementacional” de Altmann & Steedman (1988) é uma teoria modular que permiteinteração mais elaborada entre os módulos sintático e semântico/referencial. Altmann &Steedman (1988) escolheram um subconjunto dos fenômenos explicados pela TGP (construções com modificadores pós­nominais) para explicá­lo em termos de processosreferenciais. Nestes exemplos, a modificação do SN é a alternativa não preferida. A&Ssugerem que tal ocorre não por causa de fatores estruturais, mas em virtude de fatosreferenciais: a modificação do SN não é licenciada pelo contexto discursivo. É oPrincípio de Suporte Referencial: Uma análise de SN que seja referencialmenteapoiada é preferível a uma que não o seja. Em “o livro” pressupõe­se a existência deum único livro no modelo de discurso; já em “o livro que eu comprei” pressupõe­se umconjunto de entidades. O Princípio de Suporte Referencial é, de fato, um caso especialde um princípio mais geral, o Princípio de Parsimônia: Uma interpretação com menospressuposições não­apoiadas é favorecido sobre outra que tenha mais. Um SNmodificado tem mais pressuposições do que um SN não modificado. Por isso um SN nu(bare) será preferido a um que tenha modificadores como um SP, uma relativa, etc.

Comparando a TGP com a TII, nota­se que ambas as arquiteturas são modulares, istoé, diferentes fontes de informação são usadas separadamente. A&S propõem que hajauma avaliação progressiva dos referentes que se tornama gradualmente mais restritos à medida que a análise progride palavra por palavra. Há uma diferença crucial entre aTGP e a TII: A TGP afirma que uma análise única de uma estrutura é construídainicialmente, enquanto a TII propõe que o componente sintático do sistema deprocessamento ofereça todas as alternativas gramaticais para o componente semânticoem paralelo para serem avaliadas. Frazier propõe que haja um processador temáticopós­sintático que permita chegar a interpretação mais plausível. A&S oferecem umargumento funcional contra um sistema em que as escolhas são feitas inicalmente peloprocessador sintático e posteriormente corrigidas pelo procerssador temático levandoem conta semântica e contexto. A&S dizem que se informação discursiva e referencialestá disponível, só um processador muito estranho não a levaria em conta. Contudo umpartidário da TGP poderia dizer que a informação sintática está sempre disponívelenquanto que a informação semântica e pragmática nem sempre está disponível,podendo ser ultarapassada pela informação sintática que é o default. Um argumentobaseado em princípios de design e arquitetura eficiente concluiria que seria mais eficaz decidir a base de informação sintática inicial antes de consultar outros tipos menoscertos de informação.

Evidência Empírica

De um lado a hipótese TII: processador paralelo, interativo­incremental; de outro, aTGP: processador serial, sintático inicial e semântico posterior. Ferreira e Clifton (86),por exemplo, apresentam um experimento que mede fixação ocular durante a leitura defrases como:

(14)The evidence (that was) examined by the lawyer ....

(15)The defendant (that was) examined by the lawyer...

A inconsistência semântica de (14) não bloqueou o garden path em (15). Concluem,então, que o significado não bloqueia o efeito labirinto, mas apenas apressa arecuperação dele. Os autores mencionam, no entanto, que diferentes experimentos,com diversas técnicas, tem demonstrado que o significado pode impedir o efeitolabirinto. Há controvérsia, portanto.

A&S replicam com outro experimento, com a técnica de leitura auto­controlada, em queobtém resultados diametralmente opostos. Segundo esses autores, o processadorresolve ambigüidade de aposição comparando as análises sintáticas rivais em termosdas propriedades referenciais de suas interpretações com respeito ao contextodiscursivo representado como um modelo.

Page 9: Lingüística Computacional - Marcos Maia

29/01/2015 Setor de Lingüística

http://www.museunacional.ufrj.br/linguistica/membros/maia/pub411.htm 9/14

Ao contrário de Frazier (1978), que explica a preferencia pelo SN simples em termos deMA, S&A argumentam que a resolução da ambigüidade em (16):

(16) The teacher told the girl that the boy kissed to feed the gerbils.

pode ser explicada em termos do grau de suporte referencial pelo contexto. Se ocontexto suporta uma única garota, a análise do SN simplex será a preferida. Por outrolado, se o contexto suporta mais do que uma garota, a análise do SN complexo será aescolhida. Na ausência de contexto, o princípio de parsimônia favoreceria a análisesimplex.

No modelo de S&A há uma influência de processos interpretativos sobre oprocessamento sintático no sentido de avaliar a adequacidade da análise sintática aocontexto, sendo a análise em si mesma produzida autonomamente em paralelo. Ainterpretação é incremental, palavra por palavra sendo construída antes que a análisesintática esteja completa. O processador temático posterior da TGP, segundo A&S,seria um mecanismo ad hoc, proposto tardiamente ao modelo. Evidências como a doexperimento reportado por A&S comprovariam que manipulações do contextoreferencial poderiam não só prevenir os clássicos efeitos de labirinto, como tambémpoderiam criar efeitos onde não haveria a princípio nenhum. O problema para oprocessador serial seria o de que , sendo cego para o contexto referencial, este deveproduzir uma análise que é depois revista em termos do contexto referencial nareanálise. Ora, este processador é muito estranho, pois tem visão da compatibilidadecontextual na reanálise e, no entanto, não utiliza esta informação inicialmente. Oprocessador temático, segundo Frazier (1987), acessa a grade temática do predicado viaentrada lexical, selecionando a atribuicão temática mais plausível. Se este quadro não écompatível com o primeiro passe do parser, então o processador temático alerta oprocessador sintático para uma análise potencialmente mais plausível. Segundo A&Sesta proposta surpeendentemente colocaria em risco a própria noção de modularidade,pois poderia se pensar que a atribuição theta seria independente da sintaxe, podendoser interpetada como afetando as prioridades do parser e resultando em interação forte(parece­me a técnica do espantalho). Se não for este o caso, o processador temático,segundo A&S seria idêntico à proposta de interação fraca que advogam. A&S concluem:o processador paralelo interativo incrementacional tem a vantagem da parsimônia:porque advogar dois mecanismos trabalhando independentemente (um processadorsintático à base da Aposição Mínima e um processador temático acessando informaçãolexical, discursiva e conhecimento geral do mundo) quando pode­se explicar tudo emtermos de um mecanismo único?

O questionamento da TGP, no que se refere ao acesso à informação não estritamentesintática pelo parser também no que se refere à resolução anafórica será ainda debatidopela palestra da Maria de Fátima Melo que apresentará um experimento onde sedemonstra o acesso reapido a informação sobre controle verbal a tempo de influenciar o proecesso de coreferência anafórica em português.

(4) Teorias paramétricas

Esta classe de modelos assume que há uma prioridade atribuída a certas operações noportfolio de estratégias do parser. Como conseqüência do processo de fixação deparâmetros na aquisição, há mudanças não apenas nos princípios gramaticais, mastambém nas estratégias de parsing.

Page 10: Lingüística Computacional - Marcos Maia

29/01/2015 Setor de Lingüística

http://www.museunacional.ufrj.br/linguistica/membros/maia/pub411.htm 10/14

a) Competição entre princípios universais e estratégias locais

(Cuetos e Mitchell, 1988; Mitchell e Cuetos, 1991a)

Propriedades paramétricas das línguas específicas determinam a existência deestratégias locais que competem com princípios universais de parsing. Por exemplo,Cuetos e Mitchell sugerem que a ambiguidade de aposição de relativas altas/baixas éresolvida em termos altos por línguas com modificadores pós­nominais em que, porexemplo, o adjetivo geralmente se segue ao substantivo. Neste caso há uma pressãolocal para apor o modificador ao primeiro N que compete e vence a estratégia derecência (late closure). ‘E o que ocorre em Espanhol, Italiano, Francês e Português, aocontrário da aposição baixa em Inglês, Alemão e Holandês.

b) Construal

A própria Frazier (1995) propõe que suas estratégias universais só se aplicariama um subconjunto de ambiguidades: as relações primárias, argumentais; as relaçõessecundárias (adjuntos) não são estruturadas de forma fixa, mas “construed” em posiçãodescomprometida (buffer), ficando a decisão final para o processador temático.

c) Competição Predicado/Recência

(Gibson et alii, 1995)

Modelo de competição parametrizada mais elaborado que propõe que o que está emjogo é uma preferência mais geral em apor modificadores mais altos (proximidade dopredicado) ou mais baixos (recência). Haveria variação entre as línguas a esse respeito.Analisar­se­iam aqui não somente a aposição de relativas, mas também a aposição deSP’s.

(5) A teoria de “satisfação de condições”

Os modelos desse tipo propõe que não há limites arquiteturais aos tipos deinformação que podem ser assessados pelo parser, sendo que algumas condiçõespodem influenciar o processamento mais cedo do que outros, em função de umaestratégia de competição de pesos. A influência da informação lexical é um dos fatorespreponderantes na análise sintática, bem como fatores pragmáticos e discursivos.Assim, por exemplo, esse modelo explicaria o garden path que se obtém na fraseabaixo em termos do maior peso dado ao acesso da forma de pretérito imperfeito doverbo entrar do que à forma de presente do verbo entravar, muito menos freqüente:

(17) Um navio brasileiro entrava na baía um navio japonês.

Além de conceber o mecanismo de processamento como sensível à freqüência deocorrência dos itens lexicais, os proponentes desse modelo têm procurado demonstrara importância das condições de natureza pragmática na resolução das ambigüidadesestruturais. Por exemplo, Thornton, MacDonald & Gil (1997) desenvolvemexperimentos de leitura auto­monitorada que indicam a influência do fatormodificabilidade na aposição de SPs ao SN mais alto ou mais baixo. Segundo essesautores, um SN mais modificado é identificado de maneira mais inequívoca nodiscurso, sendo menos provável que receba modificação adicional. Assim, para essesautores, a aposição mais alta da relativa seria menos favorecida em (18) do que em(19):

Page 11: Lingüística Computacional - Marcos Maia

29/01/2015 Setor de Lingüística

http://www.museunacional.ufrj.br/linguistica/membros/maia/pub411.htm 11/14

(18) A filha do coronel que sofreu o acidente

(19) A filha mais velha à direita do coronel que sofreu o acidente.

(6) Os Modelos Conexionistas

Trata­se de modelos baseados em experiência. Amaquinaria computacional é montada abase de exposição ao corpus. McClelland & Rumelhart, 1981,; Bates & MacWhiney,1987; Bod, 1998)O Modelo PDP de McClelland, St. John & Taraban, por exemplo, negade início a necessidade de representação estrutural, propondo que o único requisitonecessário é que a representação forneça base suficiente para o desempenhoadequado de tarefas. Quais são as tarefas, ou demandas impostas? Os autorespropõe a seguinte concepção da tarefa de compreensão de frases: uma seqüência depalavras é apresentada e o compreendedor deve formar uma representação que lhepermita responder corretamente quando testado de vários modos. Em geral, os testes podem tomar uma ampla gama de formas, requerendo ações, respostas verbais, como,por exemplo, responder perguntas usando a representação. Assim, ao ouvir “O homemmexeu o café”, espera­se que a representação ­ qualquer que seja ­ (mas, aqui nãoestamos no modelo estímulo ­resposta, com a mente como caixa preta!?) permitaresponder: Quem mexeu? O que mexeu? Com quê? Uma vez que o modelo não estipulaexatamente que forma a representação assume, é a performance do modelo quedetermina se as representações são adequadas. Assim, os autores concebem oprocesso de compreensão como um processo de satisfação de condições.

Na compreensão de frases isoladas há dois tipos de condições: os impostos pelaseqüência de palavras e aqueles impostos pelo conhecimento sobre como taisseqüências devem ser interpretadas. Ambos são graduais, ou seja, agem comoforças que influenciam a formação da representação e tem magnitudes que determinamo grau de sua influência. A seqüência de palavras (the string) é instanciada como umasérie de padrões de ativação sobre um conjunto de unidades de processamento. Cadanova palavra é vista como uma atualização deste padrão de ativação da representaçãoda frase.. O conhecimento de como esta atualização é desempenhada está armazenadonas conexões que permitem que estes inputs atualizem a representação da frase.

Referimo­nos fundamentalmente a teorias recentes sobre o processamento de frases,tais como os modelos de Weinberg (99) e Frampton e Guttmann (99). A idéia central éa de que a faculdade de linguagem é extremamente bem desenhada, de modo que osmesmos princípios que governam a faculdade de linguagem também contribuem para ateoria de processamento de frases. Em outras palavras, como afirmam Frampton eGuttman, as computações da teoria sintática são psicologicamente reais, isto é,correspondem às computações mentais. Este passo nos remete à hipótese detransparência entre a gramática e o parser da DTC. Agora, não se fala de a gramáticae o parser, como no título desta palestra, e sim que a gramática é o parser. . É o maismínimo, em vez de dois, um. Este passo se tornou possível pela mudança na concepçãode processamento que se observa de Chomsky 95 para Chomsky 98.

Nos termos propostos em “The Minimalist Program” (Chomsky , 1995, p. 1­11), afaculdade humana de linguagem teria dois subcomponentes ­ um sistema cognitivo derepresentação do conhecimento lingüístico e um sistema de acesso a este conhecimentopara utilizá­lo de diferentes maneiras. O sistema cognitivo pode ser concebido como umsistema de princípios gramaticais universais e parâmetros específicos às diferenteslínguas. O que dizer, no entanto, do segundo componente da faculdade de linguagem, o sistema de acesso ou de processamento? Seria lícito também pensá­lo em termos deprincípios universais e parâmetros de desempenho particulares? Em outras palavras, avariação lingüística seria restrita ao sistema cognitivo ou poderia também ser estendidaao sistema de processamento? Segundo Chomsky (1995), a presunção mais simples é ade que o sistema de processamento seria invariável, não admitindo parâmetrosespecíficos às línguas particulares. Muito embora esta seja uma questão aberta à

Page 12: Lingüística Computacional - Marcos Maia

29/01/2015 Setor de Lingüística

http://www.museunacional.ufrj.br/linguistica/membros/maia/pub411.htm 12/14

verificação empírica, se a hipótese mais simples for a correta, como pensar um sistemade competência gramatical variável e um sistema de processamento invariável sepostulamos que se trata essencialmente de um mesmo e único objeto? Uma medida quepermite aferir o impacto recente dos estudos psicolingüísticos sobre a própria caracterização da faculdade da linguagem é a sua abordagem contrastante em Chomsky (1995) e Chomsky (1998). Conforme apontamos em Maia (2000), enquantoChomsky (1995) assume a hipótese de que o processamento, ao contrário do sistemada competência gramatical, é invariável, Chomsky (1998) propõe, à base de evidênciaspsicolingüísticas recentes, que os sistemas de processamento podem variar de línguapara língua, sendo modulados pela gramática de cada língua específica. Estasevidências são, por exemplo, estudos na área da percepção da fala, como o trabalho deMehler, Dommergues, Frauenfeld e Seguí (1981), complementados por Cutler, Mehler,Norris e Seguí (1986) que demonstraram a existência de efeitos silábicos nasegmentação do sinal acústico em francês, mas não em inglês. Mais recentemente, Bosch e Sebastián­Gallés (1997) investigaram as habilidades de reconhecimento de falapor bebês de quatro meses, demonstrando a existência de efeitos de discriminaçãoentre o Espanhol e o Catalão, variáveis em função do ambiente monolíngüe oubilíngüe a que os bebês estejam expostos. Além desses, vários trabalhos recentes vêm também descobrindo a existência de estratégias de segmentação da falaespecíficas para diferentes línguas, tais como, o Japonês, o Holandês, o Italiano e oPortuguês (cf. Sebastián­Gallés, 1996).

No processamento minimalista, ao contrário da TGP, as restrições características damemória de curto­prazo não são invocadas para explicar as decisões do parser. Aocontrário, argumenta­se que o processamento é função da satisfação incrementacionalrápida das condições gramaticais em jogo na derivação da frase na gramática, taiscomo, a satisfação do critério temático. Assim, por exemplo, Weinberg ilustra apreferência pelo objeto direto na ambiguidade abaixo entre SN objeto direto / oraçãoobjetiva direta, como função da computação sintática em si que optimiza a checagem detraços na derivação em termos de condições de economia. A aposição como objetodireto permitiria a checagem de traços theta do argumento pelo núcleo verbal, deforma mais imediata e econômica do que a aposição como oração objetiva direta, emque o SN “his sister” só poderia ter seus traços theta checados após a computação doverbo da encaixada. Assim a estrutura em (a) é a preferida, pois permite a satisfação decondições gramaticais mais rapidamente e de forma mais econômica, envolvendo menosoperações gramaticais.

(20) The man believed his sister …. went to the market (21) VP

/ \ V DP | /___\

believed his sister went to the market?

(22) VP

/ \ V IP | / \

believed DP VP

/__\ /___\

his sister went to the market

REFERÊNCIAS BIBLIOGRAFICAS

Page 13: Lingüística Computacional - Marcos Maia

29/01/2015 Setor de Lingüística

http://www.museunacional.ufrj.br/linguistica/membros/maia/pub411.htm 13/14

Altmann, G & Steedman, M. (1988). Interaction with context during human sentenceprocessing. Cognition, 30, 191­238.

Chomsky, N. (1965). Aspects of the Theory of Syntax. Cambridge, MA: MIT Press.

Chomsky, N. (1995).The Minimalist Program. Cambridge: The MIT Press.

Chomsky, N. (1996). New Horizons in the Study of Language. In: DELTA, vol. 13, nºespecial.

Chomsky, N. (1998).Minimalist Inquiries: the Framework. MIT, manuscript.

Cuetos , F., e D.C. Mitchell. Crosslinguistic differences in Parsing: Restrictions on theuse of the Late Closure strategy in Spanish. Cognition, 30, 73­105, 1988.

Fodor, J.A., Bever, T. and M. Garrett. (1974). The Psychology of Language. New York:McGraw­Hill.

Frazier, L. (1978) On comprehending sentences: Syntactic parsing strategies. Doctoraldissertation, University of Connecticut. Distributed by Indiana Linguistics Club.

Frazier, L. & C. Clifton Jr. Construal. Cambridge: The MIT Press, 1995.

Frazier, L. & K. Rayner. (1982). Making and correcting errors during sentencecomprehension: eye movements in the analysis of structurally ambiguous sentences.Cognitive Psychology, 14.

Gibson,E., & Loomis, J. (1995). A corpus analysis of recency preference and predicateproximity. Proceedings of the Sixteenth Annual Conference of the Cognitive ScienceSociety, 351­362.

Mclelland, J.L., St. John, M. & Taraban, R.(1989). Sentence Comprehension: A ParallelDistributed Processing Approach. Language and Cognitive Processes, 1989, 287­335

MacDonald, M.C., Pearlmutter, N.J., and Seidenberg, M.S. (1994). The lexical nature ofsyntactic ambiguity resolution. Psychological Review, 101, 676­703.

Maia, M. 2000. A Compreensão de relações espaciais em Karajá. A aparecer na RevistaPalavra.

Maia, M. & Maia, Juliana.(2000) A aposição de orações relativas por falantes bilíngüesde Português e de Inglês. Ms, UFRJ.

Ribeiro, A.J.C. (2000). O Processamento de Orações Relativas no Português do Brasil.Trabalho apresentado no GT de Psicolingüística da XV ANPOLL, UFF, Niterói.

Thornton,R. MacDonald, M.C. and Gil, M.(1997). Pragmatics Constrain the initialinterpretation complex noun phrases in English and Spanish. Unpublished manuscript,USC.

© 2000 ­ Setor de Lingüística ­ UFRJ. All Rights ReservedAtualizado em 14 de maio 2002.

Page 14: Lingüística Computacional - Marcos Maia

29/01/2015 Setor de Lingüística

http://www.museunacional.ufrj.br/linguistica/membros/maia/pub411.htm 14/14

Web Designer

ClickCaption Advertisement