willian_w4a_presentation
Post on 28-Nov-2014
482 Views
Preview:
DESCRIPTION
TRANSCRIPT
FACILITA: READING ASSISTANCE FOR THE FUNCTIONALLY ILLITERATE
ADAPTING WEB CONTENT FOR LOW-LITERACY READERS BY USING LEXICAL ELABORATION AND NAMED ENTITIES
LABELLING
Willian Massami Watanabe, Arnaldo Candido Jr.,Marcelo A. Amâncio, Matheus de Oliveira,Thiago A. S. Pardo, Renata P. M. Fortes and
Sandra M. Aluísio
1
W4A 2010 - Raleigh - North Carolina
ACKNOWLEDGEMENTS
CAPES, FAPESP, Microsoft Research (MSR), Google and the PorSimples project team
2
AGENDA
•Brazilian Context
•PorSimples project
•Facilita
•Educational Facilita
•Future Works3
BRAZILIAN CONTEXT
4
BRAZILIAN CONTEXT
10% illiterate (IBGE, 2009)
90%
10%
Illiterate Literate
2008
5
BRAZILIAN CONTEXT
21% functionally illiterate (IBGE, 2009)
79%
21%
Functionally Illiterate Literate
2008
6
WEB ACCESSIBILITY
Difficulties in reading
Users
7
WEB ACCESSIBILITY
Difficulties in reading
Users
Accessibility barriers to the functionally
illiterate8
PORSIMPLES PROJECT
9
PORSIMPLES PROJECT
User Web contentAssistive technologies
Automatic textual content adaptation
10
NLP
PORSIMPLES PROJECT
Automatic textual content adaptation
11
• Automatic Summarization
• Syntactic Simplification
• Lexical Elaboration
• Named Entities Recognition and pos-classification
NLP
PORSIMPLES PROJECT
Automatic textual content adaptation
12
NLP
FacilitaEducational
Facilita
FACILITA
13
http://vinho.intermidia.icmc.usp.br :3001
Automatic textual content adaptation
14
• Automatic Summarization
• Syntactic Simplification
• Lexical Elaboration
• Named Entities Recognition and pos-classification
NLP
FACILITA
15
FACILITA
O começo deste verão é o mais abrasador dos últimos 11 anos no Rio Grande do Sul. As médias de temperatura máxima oscilam entre 28°C e 34°C nas diferentes regiões do Estado, chegando a alcançar três graus acima dos padrões históricos. A escassez de chuva - as precipitações passageiras registradas esta semana não foram suficientes para resfriar a atmosfera por muito tempo-, o fenômeno El Niño e o processo de aquecimento global ajudam a explicar o calorão gaúcho. Embora temperaturas próximas a 40°C sejam comuns no verão rio-grandense, a temporada 2006/2007 conquistou um lugar na História. Conforme mapas climatológicos do Centro de Previsão de Tempo e Estudos Climáticos (Cptec), ligado ao Instituto Nacional de Pesquisas Espaciais (Inpe), desde 1995 a média dos picos diários de calor não era tão elevada em dezembro. Esse padrão se manteve no início de janeiro, tornando tórridos os primeiros dias do ano. Dia 17, por exemplo, Campo Bom registrou 40,8°C - apenas 1,8 abaixo do recorde gaúcho. Uma das razões apontadas para o Sul arder com as altas temperaturas é a falta de chuvas intensas e freqüentes. As frentes frias passam pelo Estado, provocam chuvas passageiras e acabam concentrando a precipitação na Região Sudeste. - Esse é um padrão para esta época, mas este ano está mais intenso. Como chove mais no Sudeste, falta umidade aqui. Isso faz com que sopre mais vento quente do Norte e aumente ainda mais a temperatura - avalia Flávio Varone, do 8o Distrito de Meteorologia. O meteorologista do Cptec Lincoln Alves afirma que ventos na alta atmosfera estão soprando com menor intensidade do Pacífico Sul rumo ao Brasil, o que estaria contribuindo para as frentes frias passarem rapidamente. - Ou elas passam de forma muito rápida ou se deslocam por sobre o Atlântico - explica. A ocorrência atual de um fenômeno El Niño (aquecimento das águas do Pacífico) de intensidade moderada também estaria favorecendo a elevação dos termômetros. - O verão deve ser mais quente devido ao El Niño. O curioso é que ele deveria aumentar a chuva no Sul, o que amenizaria o calor, mas isso não está ocorrendo. Em 2004, aconteceu a mesma coisa, não sabemos por quê - diz o pesquisador do Inpe Carlos Nobre, especialista em mudanças climáticas e meteorologia tropical. Para Flávio Varone, a explicação pode estar no fato de que os efeitos do El Niño são mais marcantes na primavera do que no verão. A inconsistência climática abre espaço para conjecturas sobre o papel do aquecimento global na atmosfera gaúcha. Segundo o pesquisador Carlos Nobre, o gradual aumento do calor não pode ser responsabilizado por mudanças bruscas no clima, como variações de um ano para outro, por se tratar de um processo lento e gradual. Nos últimos 50 anos, a temperatura média aumentou 0,7 grau no Brasil. A mudança progressiva pode influenciar indiretamente uma maior incidência de fenômenos como ondas de calor, tempestades e secas. - Não podemos eliminar a possibilidade de que o aumento da variabilidade climática seja um primeiro sintoma do aquecimento global. Isso significa secas mais freqüentes, como as que vêm ocorrendo no Rio Grande do Sul, e ondas de calor ou de frio fora do normal - diz Nobre.
O começo deste verão é o mais abrasador dos últimos 11 anos no Rio Grande do Sul . As médias de temperatura máxima oscilam entre 28 ° C e 34 ° C nas diferentes regiões do Estado , chegando a alcançar três graus acima dos padrões históricos . Embora temperaturas próximas a 40 ° C sejam comuns no verão rio-grandense , a temporada 2006 /2007 conquistou um lugar na História .Conforme mapas climatológicos do Centro de Previsão de Tempo e Estudos Climáticos ( Cptec ) , ligado ao Instituto Nacional de Pesquisas Espaciais( Inpe ) , desde 1995 a média dos picos diários de calor não era tão elevada em dezembro . Dia 17 , por exemplo , Campo Bom registrou 40,8 ° C- apenas 1,8 abaixo do recorde gaúcho . As frentes frias passam pelo Estado , provocam chuvas passageiras e acabam concentrando a precipitação na Região Sudeste . - O verão deve ser mais quente devido ao El Ni ño .
Automatic Summarization
16
FACILITA
Automatic Summarization
• EPC-R (Keyword Extraction by Stem Frequency)
•Precision rates
•Not time consuming
17
FACILITA
Syntactic Simplification
Queiroz became crazy as he was very exalted.
Queiroz was very exalted. Thus, Queiroz became crazy.
18
FACILITA
Syntactic Simplification
Queiroz became crazy as he was very exalted.
Queiroz was very exalted. Thus, Queiroz became crazy.
Effect
Effect
Cause
Cause
19
FACILITA
Syntactic Simplification
• Sentence splitting• Change of discourse markers• Change for the active voice• Inversion of clause order• Subject-Verb-Object order• Topicalization and de-topicalization
20
FACILITA
21
FACILITA
22
FACILITA
23
FACILITA
EDUCATIONAL FACILITA
24
http://vinho.intermidia.icmc.usp.br/watinha/Educational-Facilita
Automatic textual content adaptation
25
• Automatic Summarization
• Syntactic Simplification
• Lexical Elaboration
• Named Entities Recognition and pos-classification
NLP
EDUCATIONAL FACILITA
26
EDUCATIONAL FACILITALexical Elaboration
Text Complex words markup
Synonyms presentation
• Tagger• Lemma extraction• Simple words dictionary
• BP Thesaurus Search
27
EDUCATIONAL FACILITANamed Entities Recognition and Pos-classification
28
EDUCATIONAL FACILITA
29
EDUCATIONAL FACILITA
30
EDUCATIONAL FACILITA
31
EDUCATIONAL FACILITA
32
FUTURE WORKS
33
FUTURE WORKS
• Educational Facilita development
• Performance issues
• Evaluation of Facilita and Educational Facilita
34
REFERENCES
• A. P. Freire, C. M. Russo e R. P. De Mattos Fortes. Perception of accessibility in web development by academy, industry and goverment: a survey of the brazilian scenario. New Review of Hypermedia and Multimedia, 14(2):149-175, December 2008
• W3C. Web content accessibility guidelines (wcag) 2.0. W3C Recommendation, December 2008. Available at: http://www.w3.org/tr/wcag20.
• I. P. Montenegro and A. Educativa. INAF Brasil - Indicador de Analfabetismo Funcional, 2009. Available at: http://www.ibope.com.br/ipm/relatorios/relatorio_inaf_2009.pdf.
• IBGE - Instituto Brasileiro de Geografia. Síntese dos Indicadores Sociais - Uma Análise das Condições de Vida. 2009. Available at: http://www.ibge.gov.br/home/estatistica/populacao/condicaodevida/indicadoresminimos/sinteseindicsociais2009/indic_sociais2009.pdf.
35
QUESTIONS ?
W4A 2010 - Raleigh - North Carolina
top related