universidade estadual de maringá centro de tecnologia ... britta... · prof. dra. heloise manica...
TRANSCRIPT
Universidade Estadual de Maringá
Centro de Tecnologia - Departamento de Informática
Especialização em Desenvolvimento de Sistemas para Web
Acessibilidade na Web:
Simplificando o suporte de websites à navegação guiada por áudio
Romulo Britta
Prof. Dra. Heloise Manica Paris Teixeira
Orientadora
Maringá, 2013
Universidade Estadual de Maringá
Centro de Tecnologia - Departamento de Informática
Especialização em Desenvolvimento de Sistemas para Web
Romulo Britta
Acessibilidade na Web:
Simplificando o suporte de websites à navegação guiada por áudio
Trabalho submetido à Universidade Estadual de Maringá
como requisito para obtenção do título de Especialista
em Desenvolvimento de Sistemas para Web.
Orientadora: Prof. Dra. Heloise Manica Paris Teixeira
Maringá, 2013
Universidade Estadual de Maringá
Centro de Tecnologia - Departamento de Informática
Especialização em Desenvolvimento de Sistemas para Web
Romulo Britta
Acessibilidade na Web:
Simplificando o suporte de websites à navegação guiada por áudio
Maringá, 18 de Março de 2013.
Prof. Dr. Dante Alves de Medeiros Ass.: _____________________________
Prof. Me. Munif Gebara Junior Ass.: _____________________________
Prof. Dra. Heloise M. P. Teixeira (Orientadora) Ass.: _____________________________
RESUMO
A área de acessibilidade digital inclui o desenvolvimento de softwares para utilização
de computadores e periféricos por portadores de algum tipo de deficiência. Para auxiliar o
acesso à web, alguns desses softwares podem ser especialmente configurados. Todavia,
projetos de websites muitas vezes são concebidos fora dos padrões de qualidade e segurança,
ignorando também recursos de acessibilidade. Funcionalidades avançadas para deficientes
visuais demandam tempo e custo de desenvolvimento que poucos projetos comportam.
Assim, estes elementos acabam ficando em segundo plano ou mesmo desconsiderados. O
presente trabalho teve como objetivo estudar e desenvolver um protótipo para simplificar e
aperfeiçoar a navegação guiada por áudio. A ferramenta proposta poderá ser facilmente
incorporada aos websites durante seu desenvolvimento e, desta forma, os usuários deficientes
visuais poderão acessá-los sem a necessidade de softwares especiais instalados em seus
computadores. Uma avaliação preliminar mostra que o protótipo desenvolvido tem potencial
para tornar-se uma ferramenta relevante no sentido de contribuir com a inclusão digital de
deficientes visuais.
Palavras-chave: Acessibilidade, deficientes visuais, framework.
ABSTRACT
The area of digital accessibility includes the development of softwares for various
purposes in using computers and peripherals, for people with a disability. To assist web
access, some of these softwares can be specially configured. However, website projects are
mostly designed and implemented without any standard of quality and safety, also ignoring
accessibility features. Advanced features for visually impaired users demand time and cost of
development that a few projects can afford, which causes these elements be in the
background, or even not considered. The present work intended to study and develop a tool
that can simplify and enhance the audio-guided navigation. The proposed tool will be able to
be easily incorporated to websites in their development and, by this way, the visually
impaired users will access and understand the website without any kind of special software
installed on their computers. A preliminary evaluation shows that the developed prototype has
the potential to become an important tool in helping with the digital inclusion of the visually
impaired.
Keywords: accessibility, visually Impaired, framework.
6
SUMÁRIO
1 INTRODUÇÃO ........................................................................................................... 7
1.1 Objetivos ............................................................................................................... 8
1.2 Procedimentos Metodológicos .............................................................................. 9
1.3 Organização do Trabalho ...................................................................................... 9
2 REVISÃO DE LITERATURA .................................................................................. 10
2.1 Acessibilidade na web e inclusão digital ............................................................ 10
2.2 Acessibilidade e deficiência visual ..................................................................... 12
2.2.1 Deficientes visuais: dificuldades na web ......................................................... 14
2.3 Trabalhos Correlatos ........................................................................................... 15
2.3.1 LentePro e Magic ............................................................................................. 15
2.3.2 Dosvox ............................................................................................................. 16
2.3.3 Virtual Vision ................................................................................................... 16
2.3.4 Jaws .................................................................................................................. 17
3 DETACHED VISION ............................................................................................... 19
3.1 Tecnologias Adotadas ......................................................................................... 19
3.1.1 DTD - Definição de Tipo de Documento ......................................................... 20
3.1.2 Frameworks e Serviços .................................................................................... 22
3.2 Módulos .............................................................................................................. 24
3.2.1 Módulo Servidor (PHP) ................................................................................... 26
3.2.2 Módulo Cliente (Javascript) ............................................................................. 29
4 CONCLUSÃO ........................................................................................................... 34
4.1 Trabalhos Futuros ............................................................................................... 35
REFERÊNCIAS ........................................................................................................... 37
7
1 INTRODUÇÃO
A revolução tecnológica tem transformado o meio digital em um grande universo em
que, paralelamente à sociedade convencional, status, interação social, relações de trabalho e
vínculos afetivos vão sendo desenvolvidos, o que torna a Internet condição sine qua non para
o desenvolvimento dos indivíduos. As novas tecnologias da comunicação e da informação
começam a potencializar a construção de uma sociedade que, ao empunhar a bandeira da
inclusão social, aproxima-se (ainda que esteja bem ao longe) da utopia possível de inserção
para todos os seus atores sociais.
Ante os desafios das novas possibilidades que se abrem com a incorporação das novas
ferramentas digitais, acreditando que as mudanças ocasionadas pelos recursos computacionais
não podem ser apagadas da história e, principalmente, conscientes de que cada nova
tecnologia criada pelo homem traz em si um elevado poder de inclusão ou exclusão, é
necessário discutir a revolução conceitual necessária para potencializar as novas tecnologias
da informação e da comunicação como elementos co-estruturantes à superação da exclusão ao
engendrar um movimento de inovação rumo à construção de uma sociedade verdadeiramente
inclusiva. Enquanto o progresso das “próteses” físicas e cognitivas, uma tecnologia de base
digital que transformará nossas capacidades físicas e intelectuais, não se torne uma realidade,
apontamos para a pertinência de pesquisas internacionais que começam a desencadear um
processo global de discussão sobre a acessibilidade, falando especificamente do mundo
digital.
Neste âmbito, a acessibilidade pode ser abordada sob diferentes perspectivas. Entre
elas, pode-se citar a acessibilidade ao computador, com softwares de acesso que incluem
diferenciados tipos de ajudas técnicas podendo ser especialmente programadas para o acesso à
web; ou à acessibilidade aos navegadores mais utilizados na atualidade, como o Mozilla
Firefox ou o Google Chrome. Existem também navegadores específicos que oferecem
facilidade de acesso a diferentes usuários, como o Lynx (2012), que é um navegador web
exclusivamente textual para sistemas baseados em console ou com poucos recursos gráficos.
Contudo, a acessibilidade não se limita apenas a ferramentas, também se faz presente no
planejamento de páginas web em variados aspectos, onde a escolha das ferramentas de
construção influencia diretamente nos recursos de suporte a diferentes tipos de usuários.
Funcionalidades avançadas para deficientes visuais hoje consideradas acessórios –
visto que são raramente encontradas em websites – demandam tempo e custo de
desenvolvimento que poucos projetos comportam, o que faz com que estes elementos fiquem
8
em segundo plano ou até mesmo nem sejam considerados. Em razão dessas dificuldades,
diversas ferramentas de acessibilidade surgiram nos últimos anos, sendo, em sua grande
maioria, navegadores com a capacidade de transformar o conteúdo visual em auditivo, mas
sem o poder de discernir os melhores fluxos para navegação e determinados conteúdos entre
as páginas de um domínio qualquer.
A maior parte dos trabalhos realizados, em relação ao desenvolvimento de pesquisas e
elaboração de softwares para acesso à Internet são feitos em outros países com contextos
diferentes dos nossos, principalmente no que se refere ao idioma, perfil do usuário e recursos
financeiros necessários para sua implementação. Estes fatores, na maioria dos casos, tornam
inadequado o aproveitamento dos sistemas desenvolvidos no exterior (MATOS, 2009).
Neste sentido, o presente trabalho objetivou estudar e desenvolver um protótipo capaz
de simplificar e aperfeiçoar a navegação guiada por áudio, sem que o usuário necessite
navegadores ou softwares especiais instalados em seu computador. Procurou-se também
considerar a facilidade da ferramenta em ser incorporada a websites por seus desenvolvedores.
1.1 Objetivos
GERAL
Este projeto tem como objetivo geral a proposta de uma ferramenta que auxilie os
desenvolvedores de web sites a incluirem em seus projetos recursos de acessibilidade para
deficientes visuais.
ESPECÍFICOS
Facilitar a integração de recursos de acessibilidade para deficientes visuais em
websites desenvolvidos em HTML, Javascript e PHP.
Permitir a utilização da ferramenta em projetos concluídos ou em andamento.
Promover uma navegação guiada para deficientes visuais por meio da transformação
do conteúdo visual em áudio.
9
1.2 Procedimentos Metodológicos
Por meio de pesquisa bibliográfica, foram identificados os principais trabalhos que
proveem funcionalidades à navegação guiada por áudio em websites. Nesta etapa foram
identificados pontos importantes das ferramentas propostas na literatura, que contribuíram
para a definição dos requisitos da ferramenta proposta neste trabalho.
Para implementação da ferramenta foram utilizadas as linguagens Javascript no cliente
e PHP no servidor. Foram relacionadas e adotadas boas práticas de desenvolvimento, que
proporcionam, por exemplo, o baixo acoplamento entre camadas, podendo integrar uma nova
implementação de servidor sem qualquer alteração no módulo cliente. Da mesma forma, é
possível trocar o serviço de sintetização de voz sem custos para o projeto.
Por fim, foram realizados testes em um website desenvolvido para demonstrar a
utilização da ferramenta proposta.
1.3 Organização do Trabalho
Este trabalho está organizado como segue. A seção 2 apresenta uma revisão da
literatura e aborda conceitos, dados e softwares relacionados ao tema da pesquisa. A seção 3
apresenta o desenvolvimento da ferramenta proposta, incluindo suas definições e
comportamento. Por fim, a seção 4 apresenta as considerações finais.
10
2 REVISÃO DE LITERATURA
2.1 Acessibilidade na web e inclusão digital
Podemos definir inclusão, segundo Sposati (2006), como o processo estabelecido
dentro de uma sociedade mais ampla que busca satisfazer necessidades relacionadas com
qualidade de vida, desenvolvimento humano, autonomia de renda e equidade de
oportunidades e direitos para os indivíduos e grupos sociais que em alguma etapa da sua vida
encontram-se em situação de desvantagem com relação a outros membros da sociedade. Da
mesma forma que inclusão social, o termo inclusão digital é empregado em diferentes
contextos, sendo raro que alguém defina o conceito em sua positividade. Por outras palavras,
fala-se de exclusão digital em termos da falta de recursos computacionais e de rede e da
debilidade de acesso e de produção de informação em função disso.
Falando especificamente da Internet, as ideias e preocupações de inclusão, bem como
as de acessibilidade, devem objetivar não apenas com uma boa interface e uma navegação
intuitiva, mas também prover os meios para que indivíduos portadores de algum tipo de
necessidade especial (visual, auditiva, cognitiva, neurológica e física) possam usufruir os
recursos da maneira mais natural possível. A partir da evolução computacional da web e da
preocupação em torná-la mais acessível, surge o termo acessibilidade digital, que representa o
processo de disponibilização de conteúdos da web para o maior grupo de pessoas possível,
incluindo os portadores de necessidades especiais, em termos de interface entre o conteúdo e
o usuário (ABRA, 2012).
A acessibilidade digital é, portanto a democratização do acesso à informação e da
interação dos usuários que possuam algum tipo de necessidade especial no que se refere aos
mecanismos de navegação e de apresentação dos sites, à operação com software e com
hardware e às adaptações aos ambientes e situações. A acessibilidade passa a ser entendida
como sinônimo de aproximação, um meio de disponibilizar a cada usuário interfaces que
respeitem suas necessidades e preferências (ABRA, 2012).
No que diz respeito à acessibilidade de sistemas de informação computadorizados,
como páginas na Web, existem quatro situações basilares com que podem se deparar usuários
com necessidades especiais:
1. Dificuldades na utilização do mouse: pessoas com deficiências visuais e pessoas
com amputações ou dificuldades de movimentos sentem várias dificuldades na utilização do
mouse, portanto deve-se viabilizar um acesso ao computador sem mouse.
11
2. Dificuldades na utilização do teclado: pessoas com amputações ou restrições de
movimentos têm dificuldades para usar um teclado tradicional. Nesses casos, deve-se
viabilizar um acesso ao computador sem teclado, ou seja, a interação deve poder ser feita
através de um periférico especial ou pelo reconhecimento da voz.
3. Dificuldades na visualização do monitor: como a informação processada por um
computador é exibida em um monitor de vídeo, os cegos ou pessoas com dificuldades visuais
graves precisam recorrer a outro dispositivo para obter a informação da tela. Deve então ser
fornecido um programa leitor de tela, isto é, um software capaz de captar a informação do
vídeo e enviá-la para um sintetizador de voz ou para um terminal Braille.
4. Dificuldades na obtenção de sons de dispositivos de áudio: pessoas com problemas
de audição possuem dificuldade em acessar informações disponíveis somente através de
dispositivos de áudio. Deve-se emitir a informação também de outra forma (BRASIL, 2007).
Outra questão com a qual a acessibilidade tem de lidar é o preconceito existente em
relação à utilização por parte de indivíduos portadores de necessidades especiais de sites e
ferramentas web. Esse preconceito tem mais a ver com a ignorância dos desenvolvedores de
sites e aplicações web, em não enxergar a utilidade das suas aplicações para estes indivíduos.
Os desenvolvedores parecem desconhecer o verdadeiro objetivo da acessibilidade, que é o de
garantir, a cada cidadão, a plenitude dos benefícios que a Internet pode oferecer (NUNES,
2002).
Tendo como base estes pressupostos, pode-se concluir que acessibilidade é o processo
estabelecido dentro de uma sociedade mais ampla que busca satisfazer necessidades
relacionadas com qualidade de vida, desenvolvimento humano, autonomia de renda e
equidade de oportunidades e direitos para os indivíduos e grupos sociais que em alguma etapa
da sua vida encontram-se em situação de desvantagem em relação a outros membros da
sociedade. É, em suma, o direito de acesso ao mundo digital para o desenvolvimento
intelectual (educação, geração de conhecimento, participação e criação) e para o
desenvolvimento de capacidade técnica e operacional (SCHLÜNZEN, 2005).
No Brasil, no dia 2 de dezembro de 2004, foi assinado o Decreto-lei 5296
regulamentando as Leis n°s 10.048, de 8 de novembro de 2000 (prioriza o atendimento a
pessoas com necessidades especiais) e 10.098, de 19 de dezembro de 2000 (estabelece normas
e critérios para garantir a acessibilidade). Esse decreto estabeleceu um prazo de doze meses
para que todos os portais e sites eletrônicos da administração pública passem por um processo
de acessibilização de modo a viabilizar o acesso das pessoas portadoras de deficiência visual,
garantindo-lhes o pleno acesso às informações. Portais e sites eletrônicos de interesse público
12
que recebem algum financiamento do governo também devem assegurar a acessibilidade. Foi
criado também um Comitê, CB-40 da ABNT, com a finalidade de se dedicar à normalização
da acessibilidade, atendendo aos preceitos de desenho universal e definindo normas de
acessibilidade em todos os níveis, desde o espaço físico até o virtual (BRASIL, 2007).
Foi criado ainda um Comitê da ABNT incumbido de comparar as normas de
acessibilidade de vários países e analisar as diretrizes propostas pelo W3C (comitê
internacional que regula os assuntos ligados à Internet). Como resultado, foi desenvolvido um
Modelo de Acessibilidade Brasileiro (eMAG) para fazer com que a acessibilização dos sites
ocorra de forma padronizada e fácil. Com a normalização da acessibilidade, muitas
organizações terão que adaptar suas instalações, serviços e sistemas de informações a fim de
obter a certificação de acessibilidade.
Assim, surge um novo desafio: administrar e projetar sites em conformidade com as
diretrizes para a acessibilidade e, ao mesmo tempo, orientados à usabilidade e atraentes.
2.2 Acessibilidade e deficiência visual
O termo "deficiência visual" pode ser referido como uma situação irreversível de
diminuição da resposta visual, em virtude de causas congênitas ou hereditárias, mesmo após
tratamento clínico e/ou cirúrgico e uso de óculos convencionais. A diminuição da resposta
visual pode ser leve, moderada, severa ou profunda (que compõem o grupo de visão
subnormal) e ausência total de resposta visual (cegueira). Conforme VANDERHEIDEN
(1992), a deficiência visual abrange as pessoas que possuem desde visão fraca (ou baixa
visão), passando por aquelas que conseguem distinguir luzes, mas não formas, até aquelas que
não conseguem distinguir sequer a luz. Para fins de discussão ou didáticos, essas pessoas são
divididas em dois grupos: visão subnormal e cegueira.
De maneira genérica, podemos considerar que em países em desenvolvimento, como o
nosso, as principais causas de deficiência visual são: infecciosas, nutricionais, traumáticas e
causadas por doenças como a catarata. Em países desenvolvidos, destacam-se as causas
genéticas e degenerativas. De acordo com CHAPMAN & STONE (2012), as causas mais
freqüentes de problemas de visão são: catarata congênita, nistagmus, retinopatia, glaucoma
congênito, atrofia ótica, miopia, estrabismo, aniridia, degenerações retinianas, alterações
visuais corticais e outras doenças, como diabetes, descolamento da retina e traumas oculares.
13
Embora a visão seja o canal mais importante no relacionamento do indivíduo com o
mundo exterior, responsável pela captura e identificação de imagens, sabe-se que nem todas
as pessoas podem fazer uso deste órgão do sentido, seja por impedimento parcial ou total. No
Censo 2010, o total de pessoas que declararam possuir pelo menos uma deficiência severa no
país foi de 12.777.207, representando 6,7% da população total (IBGE, 2010).
GIL (2000) nos relata que, segundo a OMS, cerca de 1% da população mundial
apresenta algum grau de deficiência visual. Mais de 90% encontram-se nos países em
desenvolvimento. Estima-se que em países como o Brasil, cerca de 1 a 1,5% da população
apresenta essa deficiência.
O IBGE investigou, no questionário da amostra, as deficiências visual, auditiva,
motora e mental. Para as três primeiras, foram verificados ainda os graus de severidade:
alguma dificuldade, grande dificuldade e não consegue de modo algum. As pessoas agrupadas
na categoria “deficiência severa” são as que declararam, para um tipo ou mais de deficiência,
as opções “grande dificuldade” ou “não consegue de modo algum”, além daquelas que
declararam possuir deficiência mental. A deficiência visual severa foi a que mais incidiu
sobre a população: em 2010, 3,5% das pessoas declararam possuir grande dificuldade ou
nenhuma capacidade de enxergar (IBGE, 2010).
O grande número de pessoas com necessidades especiais serve de alerta para a
importância da utilização das boas práticas de usabilidade e principalmente de acessibilidade
no desenvolvimento de aplicações e ferramentas web Vários produtos estão sendo
pesquisados e desenvolvidos, visando reduzir as dificuldades que os indivíduos portadores de
necessidades especiais enfrentam ao utilizarem a Internet, graças a grupos de pessoas que se
preocupam com as questões de acessibilidade e usabilidade na web, surgindo daí a
necessidade de se criar padrões para tais ferramentas (ABRA, 2012).
No que tange a deficiência visual, a importância da Internet é tão grande quanto
inquestionável. Desde que o código Braille fora inventado em 1829, seguramente nada teve
tanto impacto nos programas de educação, reabilitação e emprego quanto o recente
desenvolvimento da informática para os cegos. É fato que um indivíduo com deficiências
visuais pode ter algumas limitações, as quais poderão ser grandes obstáculos ao seu
aproveitamento produtivo na sociedade. Entretanto, grande parte destas limitações pode ser
eliminada através de duas ações: uma educação adaptada a realidade destes sujeitos e o uso da
tecnologia para diminuir as barreiras (BORGES, 1996).
14
2.2.1 Deficientes visuais: dificuldades na web
A Internet pode ajudar portadores de deficiência física a superar problemas de
mobilidade, limitações físicas ou discriminação social. Em outro contexto, todas as
tecnologias têm influência sobre a estruturação das relações humanas; seu propósito real seria,
então, reestruturar as comunicações e as relações entre os indivíduos. Não somente isso, a
Internet é fator essencial na promoção do desenvolvimento sócio-cognitivo de deficientes
visuais e, por isso, constitui-se em uma prática de inclusão digital. Se o uso do computador no
ensino é capaz de favorecer o processo educacional, no caso de um deficiente visual, este é
um recurso que favorece a sua vida, já que se trata de um meio de comunicação, de produção,
de construção, de diagnóstico, entre outros (SCHLÜNZEN, 2005).
Apesar de muitas pessoas não perceberem, um computador e seu sistema operacional
em suas configurações comuns de fábrica não é adequado para o uso de qualquer usuário. Os
indivíduos com necessidades especiais precisam encontrar formas de compensar suas
dificuldades através de programas e acessórios. Se não bastasse a dificuldade imposta por
suas necessidades, estes indivíduos enfrentam ainda desvantagens econômicas e técnicas na
compra de tais programas e acessórios devido ao alto custo e à sua restrita funcionalidade.
Porém, estas dificuldades podem e devem ser superadas por estes indivíduos, já que terão
acesso a um imenso conjunto de fontes de formação e informação, podendo estabelecer
contatos e trocar informações com outras pessoas (ABRA, 2012).
O Grupo GUIA, aponta algumas dificuldades enfrentadas pelos usuários com
deficiências visuais:
Usuários cegos:
• obter informações apresentadas visualmente;
• interagir usando dispositivo diferente do teclado;
• navegar através de conceitos espaciais;
• distinguir entre outros sons e a voz produzida pelo sintetizador.
Usuários amblíopes ou daltônicos:
• distinguir cromáticas de contraste ou de profundidade;
• utilizar informações dependentes das dimensões;
• distinguir tipos diferentes de letras;
• localizar e/ou seguir ponteiros, cursores, pontos ativos e locais de recepção de
objetos, bem como, manipular diferentes objetos gráficos (GUIA, 2012).
15
Ademais, os portadores de necessidades especiais esbarram, também, em questões
técnicas. Para viabilizar o uso da Internet pelos deficientes visuais, poucas iniciativas
concretas estão sendo realizadas no país. Consequentemente, sem uma tecnologia de acesso
adequada, os deficientes visuais podem ficar gravemente limitados quanto à quantidade e a
qualidade das informações que podem acessar, o que inibe, ou até mesmo impossibilita que
eles utilizem plenamente as potencialidades deste meio de comunicação.
2.3 Trabalhos Correlatos
Para que deficientes visuais possam utilizar os computadores da forma que foram
concebidos, eles necessitam valer-se de programas que atuam como Tecnologias Assistivas
(NOWILL, 2001). Estes softwares utilizam basicamente ampliadores de tela para aqueles que
possuem perda parcial da visão, recursos de áudio e sintetização de voz, teclado e impressora
em Braille para os sujeitos cegos. Tais programas podem ser classificados quanto ao nível de
suporte proporcionado aos usuários que geralmente possuem desde uma leve deficiência, ou
baixa capacidade, até ausência total de visão. No Brasil, destacam-se as ferramentas: Dosvox,
Jaws, LentePro, Magic e Virtual Vision.
2.3.1 LentePro e Magic
No grupo das ferramentas mais utilizadas por pessoas com baixo grau de visão,
LentePro (2012) e Magic (2012) são softwares que se assemelham a lupas, permitindo um
alto grau de ampliação das imagens visíveis na região do cursor, tornando possível a
percepção de detalhes por aqueles com grau muito baixo de acuidade visual. Enquanto o
gratuito LentePro, criado pelo Núcleo de Computação Eletrônica da Universidade Federal do
Rio de Janeiro, na versão 1.4 permite um aumento na imagem de até 9 vezes, a ferramenta
paga Magic, desenvolvida pela Freedom Scientific (EUA), garante uma ampliação de até 36
vezes em sua versão 12, podendo incluir recursos para alteração de cores e contrastes,
rastreamento do cursor, localização do foco do documento e personalização da área da tela
antes ou após a ampliação. Este último aplicativo também pode fazer a leitura da tela através
de voz sintetizada, na língua inglesa (HOGETOP e SANTAROSA, 2002). Ambos os
programas estão disponíveis para ambiente Windows.
16
2.3.2 Dosvox
O Dosvox (OLIVEIRA, 1996), por sua vez, é um sistema operacional complementar
ao DOS do Windows, que se comunica com o usuário através de um hardware de bolso capaz
de sintetizar a voz, viabilizando, desse modo, o uso de computadores por deficientes visuais.
O sistema, criado a partir do trabalho de um aluno com deficiência visual, vem sendo
desenvolvido desde 1993 pelo NCE - Núcleo de Computação Eletrônica da UFRJ
(Universidade Federal do Rio de Janeiro) sob a coordenação do professor José Antônio dos
Santos Borges. Uma das importantes características desse sistema é que ele foi desenvolvido
com tecnologia totalmente nacional, sendo o primeiro sistema comercial a sintetizar
vocalmente textos genéricos na língua portuguesa brasileira. Tanto o software quanto o
hardware são projetos originais, de baixa complexidade, adequados à realidade deste país.
Esta ferramenta comporta uma série de programas complementares, como impressor /
formatador de Braille, caderno de telefones, agenda de compromissos, calculadora,
preenchedor de cheques, cronômetro, jogos, ampliador de telas, programas para educação de
crianças deficientes visuais, etc. Porém, dentre suas limitações, podemos destacar o acesso à
Internet, que apresenta algumas restrições pelo fato de a maioria das páginas apresentarem
figuras, gráficos e frames, o que torna difícil para o deficiente visual compreender o que está
sendo exibido na tela.
2.3.3 Virtual Vision
A primeira versão desta ferramenta desenvolvida pela MicroPower, empresa de
Ribeirão Preto – SP, foi lançada em janeiro de 1998. Atualmente o software pode ser utilizado
nos ambientes mais modernos de Windows 64 bits e seus aplicativos, sendo basicamente uma
aplicação da tecnologia de síntese de voz, um "leitor de telas", capaz de informar aos usuários
quais os controles (botão, lista, menu, etc.) estão ativos em determinado momento. Pode ser
utilizado inclusive para navegar na Internet. Atualmente em sua versão 7, o Virtual Vision
(2012) destaca-se pela infinidade de recursos, como a pronúncia de palavra digitadas, letra por
letra, palavra por palavra, linha por linha, parágrafo por parágrafo ou todo o texto. O próprio
usuário pode determinar suas preferências sobre o programa, como ativar o programa de
rastreamento do mouse que digitaliza o que está embaixo do cursor em movimento. Apesar de
depender do Sistema Operacional Windows, esta ferramenta não requer nenhum outro
17
equipamento adicional, dispensando sintetizador externo (CONFORTO e SANTAROSA,
2002).
2.3.4 Jaws
Desenvolvido pela empresa norte-americana Henter-Joyce, pertencente ao grupo
Freedom Scientific, o Jaws (2012) para Windows é um leitor de telas que permite facilmente
o acesso ao computador por deficientes visuais. Através desse programa, qualquer usuário
invisual pode utilizar o computador, por meio de teclas de atalho. Sua utilização é fácil,
eficiente e a velocidade pode ser ajustável conforme o nível de cada usuário.
O software, na versão 14, destaca-se já em sua instalação, que possui apoio por voz
durante o processo. É atualizado por volta de duas vezes ao ano e utiliza da síntese de voz em
vários idiomas, incluindo o português do Brasil (a partir da versão 3.7). Com esta ferramenta
é possível até mesmo obter indicação sobre fontes, estilos e tamanhos de letras utilizadas,
tendo também junto ao cursor um rastreador que permite a leitura do conteúdo que estiver sob
ele. Em qualquer ponto de uma aplicação, pode-se obter ajuda, possui dicionários, geral ou
específico, que permitem controlar a maneira como as palavras ou expressões são
pronunciadas e as definições de configuração podem ser ajustadas para a generalidade das
aplicações, ou apenas para aplicações específicas. Uma das grandes vantagens do Jaws é a
possibilidade da movimentação do cursor através do teclado padrão utilizado nos
computadores, possibilitando o acesso a programas que, anteriormente, eram dificultados ou
mesmo impossíveis com outros leitores de tela. Outra importante função do Jaws é que ele
permite que o usuário configure a intensidade da leitura.
O recurso mais importante para deficientes visuais: a sintetização de voz para leitura
do conteúdo disponível em determinado contexto. A tabela 1, a seguir, faz uma breve
comparação entre as ferramentas identificadas com maior destaque no Brasil, incluindo a
ferramenta proposta neste trabalho, descrita no capítulo seguinte.
18
Ferramenta Classificação Sintetização
de voz Linguagem
Sintetizador
externo Contexto
Dosvox Sistema
Operacional Sim Português (BR) Sim Geral
Jaws Software Sim Multilinguagem Não Geral
LentePro Software Não Português (BR) - Geral
Magic Software Sim Inglês Não Geral
Virtual
Vision Software Sim Português (BR) Não Geral
Ferramenta
proposta
Biblioteca para
websites Sim Multilinguagem Sim Websites
Tabela 1 – Trabalhos correlatos.
Dentre as ferramentas identificadas na literatura, excluindo-se a ferramenta proposta,
80% delas possuem recursos para a sintetização de voz, enquanto que 3/4 destas
disponibilizam-no na linguagem português do Brasil e apenas uma destas suporta mais de
uma linguagem, nas versões estudadas.
Os cinco softwares foram desenvolvidos para contemplar uma acessibilidade geral
sobre o computador, de acordo com o propósito de cada, não sendo para uma razão específica
como a ferramenta proposta, que mais se assemelha a uma biblioteca de funcionalidades para
desenvolvimentos de websites.
19
3 DETACHED VISION
Como visto no capítulo anterior, as ferramentas mais utilizadas por deficientes visuais
para navegação em websites partem do princípio que estes últimos devem ser interpretados e
lidos para o usuário, que em meio a um emaranhado de caracteres e imagens, busca suas
informações desejadas. O conceito da DVision (Detached Vision) é inverter tal ciclo, podendo
ser o website capaz de dizer para o usuário seu conteúdo da melhor forma possível, focando
em informações relevantes para pessoas que navegam na rede com auxílio auditivo.
Funcionalidade muitas vezes confusa, até mesmo nas melhores ferramentas, a navegação
guiada a áudio é especializada no framework desenvolvido, sob a forma de funções pré-
definidas que se comportam de acordo com o fluxo da estrutura HTML do website.
Partindo do princípio que esta ferramenta deve prover ao website a capacidade de “ler”
seu próprio conteúdo e transformá-lo em áudio, definições de comportamento são essenciais.
No mesmo sentido, assim como na maioria dos projetos bem estruturados, a adoção de
padrões e frameworks já estabelecidos no mercado se faz tão importante e necessária quanto
quaisquer outras definições de negócio, uma vez que há um crescente anseio por qualidade e
praticidade no desenvolvimento web.
Segundo Fayad e Schmidt (1997) um framework é um conjunto de classes que
colaboram para realizar uma responsabilidade para um domínio de um subsistema da
aplicação, agilizando todo o processo de desenvolvimento e maturação das aplicações. Assim,
além de valer-se da utilização de frameworks, à ferramenta proposta também cabe tal
definição.
3.1 Tecnologias Adotadas
Dezenas de linguagens são utilizadas no desenvolvimento de websites atualmente,
como exemplos mais comuns: C#, Java, Php, Flash e Javascript. Muitas delas são passíveis de
combinação, algumas executadas no cliente, outras no servidor, relação que hoje é o ponto
crucial na definição da construção de uma aplicação. Enquanto a escolha do servidor é
realizada em concordância com a linguagem principal e a complexidade de um projeto web,
também é levado em consideração o leque de ferramentas adjacentes compatíveis que
atenderão a necessidades específicas e gerais do negócio. A fim de abranger a configuração
20
mais comum de desenvolvimento de websites, o escopo definido para este framework provê
suporte à linguagem Php no lado servidor e faz uso de Javascript no lado cliente.
Definidas as principais linguagens a serem empregadas no desenvolvimento da
DVision, sua compreensão estrutural derivada da definição de características torna necessário
o uso de frameworks e serviços pré-existentes, descritos no capítulo “3.1.2 Frameworks e
Serviços”.
Assim como para um website, a criação de um framework que tenha seu propósito
voltado para web requer um ambiente de desenvolvimento semelhante ao do primeiro. Uma
das ferramentas mais completas para este fim, o Netbeans (2012) é um IDE (Integrated
Development Environment) que em sua versão completa, atual 7.3 com suporte a HTML5,
possui todos os recursos necessários já integrados para o desenvolvimento voltado às
linguagens definidas neste trabalho: PHP e Javascript.
Apesar da excelência da IDE citada, o Servidor XAMPP (2012), que agrega vários
recursos em uma única aplicação, foi escolhido para suprir a necessidade do ambiente
servidor PHP. Dentre suas características, destacam-se a fácil instalação e utilização,
possuindo um servidor de banco de dados MySQL integrado. NetBeans e XAMPP são de
utilização gratuita, com suporte aos sistemas operacionais Windows, Linux, Mac e Solaris.
Diversas versões para download estão disponíveis em seus respectivos sites. Com propósitos
complementares, as duas aplicações descritas proveem todo o ambiente necessário ao
desenvolvimento da DVision, respeitando a configuração mínima de software e hardware
exigido por cada uma.
Todavia, para a criação de um produto bom, não basta um qualificado ambiente de
desenvolvimento. Padrões são essenciais, tanto estruturais quanto de comportamento,
facilitando a compreensão, criação e manutenção de códigos.
3.1.1 DTD - Definição de Tipo de Documento
DTD (Document Type Definition) é um padrão estrutural para documentos utilizados
principalmente na web como HTML e XML. Com suas definições estruturais, ele pode ser
utilizado para determinar quais elementos podem ser utilizados na criação de websites
baseados em HTML (HyperText Markup Language), estabelecendo uma espécie de contrato,
que permite diferentes aplicações interpretarem corretamente um conteúdo com garantia
estrutural.
21
Primeiro elemento em um arquivo HTML, a tag DOCTYPE determina qual padrão o
documento deve possuir, se corretamente redigido. Esta tag aponta para um arquivo DTD,
que contém as regras estruturais de escrita do arquivo. No caso da DVision, houve a
necessidade da criação de novos elementos, importantes para controlar a navegação correta
por áudio em meio a milhares de caracteres existentes em um site. Por esta razão, foi criado
um novo DTD, herdando as características principais já configuradas dos DTDs utilizados
como padrão e acrescentando novos atributos aos elementos pré-existentes. A figura 1,
abaixo, representa o conteúdo do arquivo DTD criado, onde é possível visualizar a nova
configuração estrutural definida para páginas que utilizarem a ferramenta proposta. Nas linhas
de 3 a 9 estão declarados atributos a serem usados em todas as entidades do arquivo, nenhum
obrigatório de acordo com a configuração, mas sim para a linguagem. Na linha 11 é declarado
o atributo “version” para a entidade HTML e, por fim, nas linhas de 13 a 16 é realizada a
importação de um DTD base pré-definido e disponível na w3, com todas as outras definições
padrões já adotadas por websites.
Abaixo, a lista de atributos utilizados por este framework:
Atributo “lang”: Obrigatório no elemento “html”, indica a linguagem padrão da página
neste contexto. Seu uso é opcional nos demais elementos, podendo indicar trechos onde a
linguagem é outra, para a correta pronunciação do conteúdo.
Figura 1- Conteúdo do arquivo DTD criado para a ferramenta proposta
22
Atributo “version”: Obrigatório e presente apenas no elemento “html”, indica a versão
da página, para que a ferramenta perceba caso haja mudanças no conteúdo, sem a necessidade
de complexas verificações. Também é importante para que seja inibido o recurso de cache dos
navegadores, que poderia ocasionar a reprodução de um som defasado.
Atributo “id”: Obrigatório no elemento “body” (o principal) e em todos os elementos
que estejam relacionados com o fluxo de navegação guiada por áudio, é responsável pela
associação do som ao elemento, pois garante a unicidade dentro da página contexto.
Atributo “title”: Também obrigatório em todos os elementos envolvidos no fluxo, é a
leitura prévia do elemento. Utilizado como título do conteúdo.
Atributo “content”: Opcional nos elementos. É utilizado quando a leitura do conteúdo
deve diferir do conteúdo da página. Ao invés do conteúdo interno do elemento, o conteúdo
deste atributo será lido em seu lugar.
Atributo “links”: Obrigatório para o elemento “body” e opcional para os demais, é
responsável pela definição das opções de navegação. Cada elemento que possuir este atributo,
ao final da leitura de seu conteúdo, terão seus links informados como opções. Este atributo no
elemento “body” define as opções principais, que serão lidas sempre que a ferramenta chegar
a um elemento sem opções para prosseguir.
A estrutura de um website pode ser validada através de ferramentas disponíveis na
internet, como o Markup Validation Service, da W3C (World Wide Web Consortium), que
verifica se o conteúdo está em acordo com sua definição de tipos.
É importante ressaltar que certos padrões de projeto, como o DTD, de nada valem se
não obedecidos, uma vez que o desenvolvimento web em geral é versátil o suficiente para
permitir a criação e utilização de sites com ausência notável de qualidade e segurança, o que
torna a Internet um mundo mais obscuro para deficientes visuais do que já é para pessoas com
visão normal.
3.1.2 Frameworks e Serviços
Exigência da constante evolução tecnológica, cada vez mais desenvolvimentos de
aplicações são requeridos da noite para o dia e a menos que se tenha uma excelente equipe,
passa a ser uma tarefa inviável, talvez impossível, sem o uso de ferramentas “inteligentes”
que auxiliem no desenvolvimento através de funcionalidades centralizadas e variados padrões
23
entendidos por bons hábitos, principalmente no âmbito da web, onde não existe um consenso
na forma como os navegadores interpretam uma mesma página.
A ferramenta proposta neste trabalho valeu-se de dois grandes frameworks: JQuery
(2012) e JPlayer (2012), ambos utilizados no desenvolvimento de HTML com Javascript.
Com o slogan “Escreva menos, faça mais” o JQuery é atualmente um dos mais
utilizados no mercado quando se trata de programação em Javascript, proporcionando os mais
diversos recursos, desde interface a requisições para servidores. Sua utilização por grandes
empresas como Google, Dell e Bank of America é garantia de qualidade e suporte, desta
ferramenta que simplifica rotinas complexas e enfadonhas. Por sua vez, o JPlayer, criado
utilizando também o JQuery, fornece um vasto controle sobre execuções de áudio e vídeo via
HTML5 ou FLASH, dependendo do suporte disponível no navegador utilizado, sendo o ponto
terminal da DVision, onde os sons são organizados e executados.
A manipulação de sons, derivando sua criação de textos em conjuntos de caracteres
não é uma tarefa trivial. Apenas este processo por si só caberia a criação de um framework
extremamente complexo, com análise gramatical e idiomática, sendo inviável a ferramenta
proposta caso isso fosse necessário. Felizmente esta necessidade não existe. Existem muitos
sintetizadores de voz no mercado que cumprem tal tarefa. A Microsoft disponibiliza sob uso
limitado um serviço online para realizar a conversão de texto em áudio, chamado Microsoft
Translator V2 (2012). Sua limitação é com relação ao número de caracteres convertidos
mensalmente, porém é suficiente para qualquer site que não possua textos exorbitantes, uma
vez que o framework desenvolvido, via de regra, solicita apenas sons não presentes em seu
repositório. É preocupante a possibilidade deste serviço gratuito tornar-se cada vez mais
limitado, como ocorreu com um similar do Google, o Google Translate API (2012), que hoje
é passível de utilização apenas mediante pagamento. Todavia, pela excelência e suporte a
multi-idiomas, o Microsoft Translator V2 cumpre plenamente o papel de sintetizador de voz
online que a DVision requer, juntamente com uma interface para a utilização deste último,
que com baixo acoplamento, permite a fácil substituição, por preferência ou necessidade
futura.
Valendo-se das ferramentas citadas até então, cabe ao protótipo deste trabalho integrá-
las ao seu fluxo, de uma forma que permita o seu fácil acoplamento a websites já
desenvolvidos ou em desenvolvimento. Estes websites devem possuir um servidor PHP e ter a
estruturação do HTML de seu front-end condizente com as normas também já citadas, que
24
garantem um comportamento adequado da página independente do navegador utilizado pelo
usuário.
3.2 Módulos
A DVision é dividida em duas partes principais: um módulo executado no cliente e
outro no lado servidor. O lado servidor é basicamente responsável pela geração, organização e
armazenamento dos sons que são requisitados pelo lado cliente. Ao módulo cliente cabe as
responsabilidades: oferecer ao usuário opções para navegação, identificar a solicitação deste
último, requisitar ao lado servidor os sons e reproduzi-los, controlando a sequência e timing
da execução de acordo com o trecho do site em que o usuário esteja navegando. A figura 2,
abaixo, ilustra a organização dos módulos e frameworks utilizados nesta ferramenta, citados
anteriormente.
A disposição destes módulos na DVision, sob uma estrutura de pastas e arquivos, pode
ser entendida através da figura 3. Na pasta “access” encontra-se o módulo servidor incluindo
o armazenamento dos arquivos de áudio, enquanto que na pasta “js” estão os scripts do
módulo cliente, incluindo a dependência do JPlayer.
Figura 2 - Diagrama dos módulos e ferramentas utilizados
25
Tendo a visão macro, apresentada na figura 3, a figura 4 (a seguir) detalha o módulo
servidor, escrito em PHP. Abaixo da pasta “access”, o diretório “MSTranslatorV2” contém
todos os arquivos necessários ao acesso ao Serviço de sintetização de voz da Microsoft. Estes
arquivos são gerenciados pelo arquivo “Service.php” que recebe todas as requisições
provenientes do módulo cliente e as redireciona para seu devido fluxo. Os arquivos de som
gerados ficam armazenados na pasta “audio”, que nada mais é do que um repositório auto-
estruturado de acordo com a organização das páginas HTML do site.
Semelhante ao módulo servidor, a estruturação do módulo cliente dá-se a partir da
pasta “js”. Nela encontra-se o diretório “lib”, onde estão os scripts especializados e as
dependências necessárias ao framework JPlayer. A figura 5 ilustra tal organização, onde o
arquivo “detached_vision.js” é o ponto de inicialização da ferramenta proposta.
Figura 3 - Disposição macro dos módulos
Figura 4 - Organização do módulo servidor
26
3.2.1 Módulo Servidor (PHP)
Parte menor do framework, porém de maior complexidade, o módulo escrito em PHP
é basicamente responsável pela intermediação entre o módulo Javascript e o serviço Microsoft
Translator V2. A este módulo cabe a verificação e o armazenamento dos arquivos de som
gerados pelo sintetizador de voz, bem como a garantia de que cada versão de página tenha
seus sons criados na linguagem correta e estejam sempre disponíveis.
O módulo cliente pode requisitar ao módulo servidor sons de diferentes classificações,
de acordo com as configurações realizadas, porém todas as solicitações são feitas através de
uma chamada de método semelhante à da figura 6, logo mais abaixo. Esta imagem representa
o conteúdo básico de um método em Javascript, utilizando-se do framework JQuery,
evidenciado pela característica chamada “$.ajax” utilizada em requisições tanto assíncronas
quanto síncronas ao servidor. Esta função solicita a execução de uma rotina presente em
determinado endereço no servidor – endereço substituído na linha 121 por uma constante –
onde o resultado de sucesso desta execução é retornado na linha 129, dentro do atributo
“response”.
Figura 5 - Organização do módulo cliente
27
O trecho de código da figura 6 não realiza qualquer ação sobre o atributo “response” e
de fato não é necessário, uma vez que a rotina do servidor realizará o download do áudio ou já
o terá disponibilizado no caminho que é informado pelo módulo cliente, sendo uma
convenção da ferramenta a organização dos sons em uma hierarquia de pastas que refletem a
estrutura de tags do HTML. Se tratando de uma chamada síncrona, após o sucesso,
certamente o arquivo de áudio estará no endereço conhecido pelo script ou uma mensagem de
erro será lançada pelo módulo servidor.
A requisição de som realizada pelo cliente é recebida pelo servidor, conforme exemplo
da figura 7, onde o conteúdo recebido é validado e repassado aos métodos auxiliares que
solicitam a tradução ao serviço da Microsoft e armazenam o som gerado por este último. Caso
o som já exista naquele específico local do repositório, a requisição é ignorada. Para realizar a
requisição do som ao serviço da Microsoft, o módulo PHP estabelece uma conexão com a
API do Microsoft Translator, baseada em chaves de identificação. Esta conexão deve ser
renovada a cada 10 minutos de inatividade, não sendo necessário realizar o procedimento a
cada chamada, o que tornaria o processo extremamente custoso em termos de tempo e
recursos.
Figura 6 - Requisição de som realizada do módulo cliente para o módulo servidor
28
O framework da Microsoft possui inúmeras funções para tradução de textos, em
diversas linguagens, bem como a sintetização de voz utilizada pela DVision. As requisições
são realizadas através de rotinas simples, que possuem vários exemplos no site de seu
desenvolvedor, em diferentes linguagens como Javascript e C#.
Após realizar a requisição e receber o arquivo de áudio da Microsoft, o protótipo em
seu módulo PHP simplesmente cria o arquivo de áudio no ponto específico da estrutura de
pastas do projeto em que o módulo Javascript informou. O processo tem sua continuidade
natural retornando para o cliente o fim da execução do servidor.
Os arquivos de som devem ser criados em dois formatos: “wav” e “mp3”, conforme
demonstrado na figura 7. Esta necessidade dá-se devido aos diferentes navegadores utilizados
por usuários, onde cada qual possui capacidades diferentes de executar sons sob um ou outro
formato. Disponibilizando ambas as possibilidades, há garantia de funcionamento em grande
parte dos navegadores, senão todos os mais utilizados.
Figura 7 - Ponto onde é recebida a requisição de áudio no módulo PHP e realizada a solicitação de
sintetização de voz ao Service da Microsoft, recebendo um arquivo de som.
29
3.2.2 Módulo Cliente (Javascript)
Desenvolvido sob uma espécie de orientação a objetos provida pela linguagem, este
módulo é composto por pouco mais de uma dúzia de arquivos escritos em Javascript que
agrupam funcionalidades semelhantes e correspondentes. A cargo destas últimas, fica a
responsabilidade de compreender o website a que foram incorporadas, permitindo a
navegação de seu conteúdo e a realização de requisições de sons ao módulo em PHP,
desconhecendo se há ou não a necessidade de download junto ao Service da Microsoft.
Para a integração da DVision a um website, apenas o módulo cliente precisa ser
ajustado e declarado no documento em questão. Esta declaração consiste basicamente na
informação de um doctype e na inclusão de atributos próprios à ferramenta na tag “html”,
conforme ilustra a figura 8. Estes atributos indicam a linguagem padrão da página, ou seja, a
língua sob a qual a maior parte do conteúdo está escrito e a versão do código, necessária para
o controle da ferramenta de áudio e importante para evitar bugs causados pelo cache dos
navegadores.
Estando o documento em sua declaração correta, os navegadores saberão como
interpretá-lo, resultando em um comportamento padrão. Após esta configuração, a importação
do módulo cliente à página HTML pode ser realizada em quase qualquer ponto do
documento, porém em conformidade com boas práticas, as referências necessárias podem ser
realizadas no conteúdo da tag “head” do documento (figura 9).
Figura 8 - declaração doctype e html
30
O framework JQuery deve ser importado sob a versão 1.8.3 ou superior, tanto o core,
quanto sua bibliteca gráfica. Esta ferramenta pode ser vinculada diretamente a partir de um
link da internet, como demonstrado nas linhas de número 13 a 17 ou baixada e incorporada ao
website de outra forma, desde que o protótipo desenvolvido tenha acesso a ela. O JQuery é
utilizado em quase todos os scripts do módulo cliente, uma vez que garante um bom
desempenho no desenvolvimento e na execução, bem como disponibiliza milhares de funções
úteis.
Todavia, o arquivo principal do módulo cliente é o “detached_vision.js”, sendo o
ponto de partida da ferramenta. Seu procedimento de inicialização engloba automaticamente a
inclusão de todos os outros scripts, bem como configuração de informações pré-definidas no
arquivo “configuration.xml”. Atrelado ao elemento document, a ferramenta inicializa logo
que o DOM termina sua configuração. A figura 10 demonstra o método de inicialização
principal.
Figura 9 - Importação dos scripts necessários
Figura 10 - Rotina de inicialização do módulo cliente
31
Após ter as informações necessárias inicializadas, a ferramenta desenvolvida localiza
o corpo da página, onde através das tags “title” e “links” é capaz de dizer ao usuário uma
mensagem de boas vindas e quais opções principais este tem de navegação na página.
A figura 11, acima, demonstra a utilização das primeiras tags lidas no fluxo do módulo
cliente, configurando a recepção que o usuário terá no website. O atributo “links” corresponde
aos menus de ações disponíveis ao usuário após o término da leitura de um conteúdo. Na
linha 30 é possível identificar duas opções dadas ao usuário: empresa e contato. Estas opções,
quando escolhidas, direcionam a DVision para o elemento que possuir o id determinado,
conforme a figura 12, a seguir, exemplifica. Ao escolher a opção “email”, o usuário terá o
conteúdo interno do bloco de id “email” lido, exceto quando há a presença da tag “content”.
Este último atributo é lido ao invés do conteúdo interno ao nó. É uma funcionalidade útil
quando a leitura passa a ser demasiada complexa para um sintetizador de voz automatizado,
dando a opção de soletrar conteúdos ou até mesmo criar onomatopeias a partir da combinação
subjetiva de caracteres.
Figura 11 - título e menu principal da página
Figura 12 - Modelo de código funcional utilizando a ferramenta proposta
32
Qualquer passagem por conteúdos mapeados pela DVision, como menus, conteúdos
internos a nós, ou trechos de ligação (configurados no arquivo “configuration.xml”) culmina
por requisitar ao módulo servidor a tradução do texto em som e sua disponibilização nos
formatos mp3 e wav. Todo este fluxo é passível der visualização através de um console
desenvolvido para auxiliar a aplicação da ferramenta à página. Nele é possível ter
informações sobre o passo-a-passo da ferramenta e manipular uma instância visual do player
e seus arquivos de som. Para exibi-lo, basta passar o parâmetro “dvconsole=true” na url da
página.
Todo som disponibilizado pelo módulo servidor é atribuído à playlist do player citado,
que executa os arquivos em fila, sendo removidos e acrescentados a todo instante em que o
usuário indica uma ação. Este controle não é trivial e o framework que cumpre o papel de
administrar a execução em fila dos arquivos de som é o JPlayer. Esta ferramenta, utilizada
juntamente com uma implementação extra denominada JPlayerPlaylist é passível de inúmeras
configurações. As utilizadas pela ferramenta proposta resumem-se a execução contínua e
automática dos arquivos de áudio na playlist, remoção de qualquer controle visível ao usuário
em condições normais de utilização, maximização do volume e definição dos dois tipos de
arquivos suportados: wav e mp3, conforme exemplificado na figura 13.
Figura 13 - Inicialização do JPlayer na ferramenta proposta.
33
Depois de inicializado o objeto “_jPlayer”, à DVision cabe a execução dos arquivos de
áudio, evocando as funções do framework para adicionar arquivos ou limpar a lista, iniciando
ou interrompendo a continuidade da fila de sons. Para chegar até ponto onde são definidos os
sons que serão executados para o usuário em determinado contexto, a ferramenta proposta
depende de rotinas desenvolvidas para receber qualquer entrada via teclado, uma vez que
todas as ações do usuário são realizadas por este canal, porém, pré-determinadas pela
ferramenta proposta.
Para simplificar a interação do usuário com o módulo cliente, a utilização do teclado
na tomada de decisões foi adotada devido a todos os computadores possuírem este tipo de
entrada ou a possibilidade de fácil integração a este recurso. Toda a configuração de teclas
permitidas e vinculadas a funcionalidades específicas como interrupção ou repetição dos sons
pode ser feita através de um arquivo XML, influenciando diretamente no comportamento da
ferramenta.
O protótipo pode ser experimentado em: http://everyware.com.br/detachedvision/teste
e acrescentando o parâmetro “dvconsole=true” à url é possível visualizar seu console de
debug.
34
4 CONCLUSÃO
O futuro é uma dimensão que não pode ser esquecida, pois é preciso estar preparado
para a rápida evolução tecnológica destes novos tempos, que influencia e modifica a nossa
relação com a construção do conhecimento. Para a estimulação da pessoa com deficiência, a
tecnologia da informação é fundamental, pois a velocidade da renovação do saber e as formas
interativas da web trazem uma nova expectativa de educação para essa clientela. É necessário,
portanto, criar serviços e propostas educativas abertas e flexíveis que atendam às necessidades
de mudanças.
A web não só demonstra que a maior parte do conhecimento adquirido por uma pessoa
no início de sua vida educacional estará ultrapassada ao final de certo tempo, como também
aponta novas formas de habilitação e reabilitação de pessoas com necessidades educativas
especiais. Esse fenômeno de captação de transformações constantes deve ser posto ao alcance
das pessoas com necessidades especiais.
A prática da desmarginalização de portadores de deficiência deve ser parte integrante
de planos nacionais de educação, que objetivem atingir educação para todos. A inclusão social
traz no seu bojo a equiparação de oportunidades, a mútua interação de pessoas com e sem
deficiência e o pleno acesso aos recursos da sociedade. Cabe lembrar que uma sociedade
inclusiva tem o compromisso com as minorias e não apenas com as pessoas portadoras de
deficiência. A inclusão social é, na verdade, uma medida de ordem econômica, uma vez que o
portador de deficiência e outras minorias tornam-se cidadãos produtivos, participantes,
conscientes de seus direitos e deveres, diminuindo, assim, os custos sociais. Dessa forma,
lutar a favor da inclusão social deve ser responsabilidade de cada um e de todos
coletivamente.
As tecnologias desenvolvidas para ajudar os portadores de necessidades especiais
podem ser utilizadas também por pessoas sem estas necessidades, para facilitar suas
atividades ou, até mesmo, melhorar a forma como algumas tarefas são realizadas. Isso se
confirma com o uso de software para reconhecimento de voz na digitação de textos, hoje
muito utilizado nas empresas. Vale a pena lembrar que a utilização da acessibilidade não
beneficia apenas portadores de necessidades especiais, podendo auxiliar também crianças no
aprendizado tanto do uso do computador quanto no desenvolvimento de suas capacidades de
fala e leitura, já que o computador serve de exemplo. O mesmo vale para adultos em processo
de alfabetização. A acessibilidade visa ajudar a todos aqueles com necessidades especiais, e
35
nesse grupo não se encontram apenas os indivíduos portadores de necessidades especiais, mas
também pessoas idosas ou com dificuldades.
Neste contexto, o framework proposto cumpre seu objetivo, possibilitando a usuários a
identificação do conteúdo de páginas de website apenas através do áudio, da forma mais direta
possível, uma vez que o fluxo de leitura é definido pelo criador da página, que indica
exatamente o que esta pessoa precisa saber sobre o conteúdo disponibilizado.
Além de comportar dezenas de idiomas diferentes disponibilizados pelo serviço da
Microsoft, foi cuidado um dos propósitos principais, sendo extremamente simples sua
implantação, porém, por se tratar de um protótipo, recursos como preenchimento de
formulários e transição entre páginas não foram desenvolvidos neste momento, mas que
devem ser considerados importantes itens para trabalhos futuros. Neste mesmo caminho estão
elementos como a flexibilização estrutural dos arquivos da ferramenta proposta e recursos
como aumento da velocidade de reprodução do som, uma vez que deficientes visuais
comumente têm este sentido mais aguçado.
Como propósito, a inversão do controle de leitura do conteúdo de websites deve trazer
vantagens na obtenção da informação desejada pelo usuário, porém há de se realizar uma
avaliação em cenário de experimento, com as métricas estabelecidas a fim de permitir uma
comparação entre esta abordagem e a dos softwares descritos neste artigo. É pertinente
destacar que o contexto considerado neste trabalho vale apenas a partir do acesso a uma
página de website, uma vez entendido que deveria ser papel do sistema operacional prover
acessibilidade até este ponto da experiência.
4.1 Trabalhos Futuros
O protótipo da DVision foi concebido sob o básico conceito de interpretar uma página
web e transformar seu conteúdo em áudio para o usuário que apenas consegue avançar sobre
as opções fornecidas, sem desvincular do fluxo predetermiado. A possibilidade de realizar
pesquisas na página para iniciar a navegação guiada a áudio a partir de um fluxo aleatório ou
descobrir conteúdos não mapeados no fluxo é de extrema importância para tornar este
framework flexível, bem como a capacidade de pesquisar imagens e vídeos em todo o
contexto do website que estejam vinculadas a alguma descrição, organizando-as por
semelhança de contexto ou localidade.
36
No mesmo sentido, a navegação entre hyperlinks, que possibilitaria a transição entre
páginas também não foi considerada para esta versão, bem como o suporte a preenchimento
de formulários. Todas as funcionalidades citadas são fundamentais a uma interação
satisfatória, porém demandam tempo de análise e desenvolvimento.
Concluindo o projeto, seria interessante a realização de experimentos com métricas
estabelecidas e um público controlado a fim de avaliar a DVision em comparação às
ferramentas mais utilizadas no Brasil no que diz respeito à navegação em websites.
37
REFERÊNCIAS
ABRA Associação Brasileira de Acessibilidade. Disponível em:
<http://www.acessibilidade.org.br/> Acesso em: ago. 2012.
BORGES, José Antônio. Dosvox – um novo acesso dos cegos à cultura e ao trabalho. Revista
Benjamin Constant, n. 3. Mai. 1996.
BRASIL. Modelo de Acessibilidade - Recomendações de Acessibilidade para a
Construção e Adaptação de Conteúdos do Governo Brasileiro na Internet -
Departamento de Governo Eletrônico - Secretaria de Logística e Tecnologia da Informação -
Ministério do Planejamento, Orçamento e Gestão. Mai. 2007.
CHAPMAN & STONE. Deficiência Visual. Disponível em: <http://www.drec.min-edu.pt/>
Acesso em: ago. 2012.
CONFORTO, Débora e SANTAROSA, Lucila M. C. Acessibilidade à Web: Internet para
Todos. Revista de Informática na Educação: Teoria, Prática – Porto Alegre, Vol. 5, n.2
(Nov/2002).
DOSVOX: Projetos de Acessibilidade. Núcleo de Computação Eletrônica da Universidade
Federal do Rio de Janeiro. Disponível em:
<http://intervox.nce.ufrj.br/dosvox/dosvox.html> Acesso em ago. 2012.
FAYAD, M. E. e SCHMIDT, D. C. Object-oriented application frameworks. Revista
Communications of the ACM – Nova Iorque, USA, Vol. 40, n.10, p.32-38 (Out/1997)
GIL, M. Deficiência visual. Cadernos da TV Escola. Secretaria de educação à Distância,
Brasília: MEC, p.80, 2000.
GOOGLE Translate API Pricing. Disponível em:
<https://developers.google.com/translate/v2/pricing> Acesso em out. 2012.
38
GUIA: Grupo Português pelas Iniciativas de Acessibilidade. Disponível em:
<http://www.acessibilidade.net> Acesso em set. 2012.
HOGETOP, L e SANTAROSA, L.M.C, Tecnologias Adaptiva/Assistiva Informáticas na
Educação Especial: viabilizando a acessibilidade ao potencial individual. Revista de
Informática na Educação: Teoria, Prática – Porto Alegre, Vol. 5, n.2 (Nov/2002).
IBGE- Instituto Brasileiro de Geografia e estatística. Disponível em:
<http://www.censo2010.ibge.gov.br/> Acesso em: set. 2012.
MATOS, Gláucio Brandão de. Usabilidade e Acessibilidade na Web: Uma análise destes
conceitos do ponto de vista de um deficiente visual. Monografia. Instituto Federal Minas
Gerais – Campus Bambuí. 2009.
JAWS: Screen Reading Software. Freedom Scientific. Disponível em:
<http://www.freedomscientific.com/products/fs/jaws-product-page.asp> Acesso em dez.
2012.
JQUERY: Fast and concise JavaScript Library. Disponível em: <http://www.jquery.com>
Acesso em out. 2012.
JPLAYER: HTML5 Audio & Video for JQuery. Disponível em: <http://www.jplayer.org>
Acesso em out. 2012.
LENTE PRO: Projetos de Acessibilidade. Núcleo de Computação Eletrônica da Universidade
Federal do Rio de Janeiro. Disponível em:
<http://intervox.nce.ufrj.br/dosvox/dosvox.html> Acesso em ago. 2012.
LYNX: The text web browser. Disponível em: <http://lynx.isc.org/> Acesso em set. 2012
MAGIC: Screen Magnification Software. Freedom Scientific. Disponível em:
<http://www.freedomscientific.com/products/lv/magic-bl-product-page.asp> Acesso em
dez. 2012.
39
MICROSOFT TRANSLATOR V2 Disponível em: <http://msdn.microsoft.com/en-
us/library/ff512423.aspx> Acesso em nov. 2012.
NETBEANS IDE: The Smarter and Faster Way to Code. Disponível em:
<http://netbeans.org> Acesso em nov. 2012.
NOWILL, Dorina de Gouvêa. Aspectos Políticos e científicos na educação, na saúde e no
trabalho da pessoa com deficiência visual. Revista Con-tato: Conversas sobre deficiência
visual. São Paulo, Laramara, n.7, dez/2001, p.27.
NUNES, Sérgio Sobral. A Acessibilidade na Internet no Contexto da Sociedade da
Informação. Universidade Federal de Minas Gerais – UFMG. Mestrado em Gestão de
Informação, Janeiro de 2002.
OLIVEIRA, Vera Barros de (org.). Informática em Psicopedagogia. São Paulo: Editora
SENAC SP, 1996.
SCHLÜNZEN, E. T. M. A tecnologia como inclusão de Pessoas com Necessidades Especiais
(PNE). In: PELLANDA, N. et al. Inclusão digital: tecendo redes afetivas/cognitivas. Rio de
Janeiro: DP&A, 2005.
SPOSATI, A.A fluidez da inclusão/exclusão social. Ciência e Cultura, vol. 58, no. 4, São
Paulo, Out/Dec. 2006.
VANDERHEIDEN, Gregg C. Making software more accessible for people with
disabilities. A white paper on the design of software. Trace R & D. Madison, USA:
University of Wisconsin, 1992.
VIRTUAL VISION: Acessibilidade para Deficientes Visuais. MicroPower, Improving
Performance Getting Results. Disponível em: <http://www.virtualvision.com.br> Acesso
em dez. 2012.
XAMPP: PHP Server. Disponível em: <http://www.apachefriends.org/pt_br/xampp.html>
Acesso em nov. 2012.