pós-graduação em ciência da computação · ao meu marido, jaildes, pelo apoio e incentivo. ao...
TRANSCRIPT
Pós-Graduação em Ciência da Computação
“PERSONAWEB: ferramenta de criação de personas para auxiliar na concepção de jogos digitais”
Por
Ana Luiza do Nascimento Leite
Dissertação de Mestrado
Universidade Federal de Pernambuco [email protected]
www.cin.ufpe.br/~posgraduacao
RECIFE, JULHO/2011
UNIVERSIDADE FEDERAL DE PERNAMBUCO
CENTRO DE INFORMÁTICA PÓS‐GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
ANA LUIZA DO NASCIMENTO LEITE
“PersonaWeb – ferramenta de criação de personas para auxiliar na
concepção de jogos digitais”
ESTE TRABALHO FOI APRESENTADO À PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO DO CENTRO DE INFORMÁTICA DA UNIVERSIDADE FEDERAL DE PERNAMBUCO COMO REQUISITO PARCIAL PARA OBTENÇÃO DO GRAU DE MESTRE EM CIÊNCIA DA COMPUTAÇÃO.
ORIENTADOR: SILVIO ROMERO LEMOS MEIRA, D.Sc. CO-ORIENTADOR: ANDRÉ M. MARQUES DAS NEVES, D.Sc.
RECIFE, JULHO/2011
AGRADECIMENTOS
Ao meu marido, Jaildes, pelo apoio e incentivo.
Ao meu filho, Augusto César, pelas horas que tive de deixá-lo para dedicar-me a
conclusão deste trabalho.
A minha mãe, Sônia, minhas irmãs, Isabel e Poliana e meu sobrinho, José Luiz, por
sempre estarem ao meu lado e servirem de incentivo nos momentos mais difíceis durante este
processo.
Ao meu pai, Luis, que faleceu sem chegar a ver esta minha conquista, mas que sempre
deixou claro seu orgulho.
A Ricardo, por confiar e incentivar a ir sempre além nos meus estudos.
A Silvio Meira e André Neves, pela orientação, que foi essencial ao desenvolvimento
deste trabalho.
Aos amigos, Francisco Oliveira, Anderson Rocha, Simone Araujo, Francisco Melo,
Milton, Márcio, Camila e João.
A André Marllus pela força enorme que deu, ajuda importante na hora certa.
A Noca e Jane, que muitas vezes cuidaram do meu filho para eu poder escrever e
implementar.
A todos, meu sincero obrigada.
RESUMO
A Indústria de Jogos Digitais é um mercado em constante ascensão. Essa perspectiva destaca
o interesse teórico e empírico de muitos pesquisadores com jogos digitais, apresentando
algumas questões, debates sobre metodologias e aspectos teóricos. Um dos maiores desafios
no desenvolvimento de jogos é a concepção, etapa essencial no ciclo de produção de um jogo,
que é muitas vezes deixada de lado. Outro problema é que há pouca preocupação com
pesquisa do usuário e experiência de uso do jogador, o que se configura num problema mais
humano do que técnico. XDM, denominada eXtensible Design Methods é uma metodologia
desenvolvida nos últimos anos no Departamento de Design da UFPE, que visa ajudar na
concepção de jogos e artefatos digitais e possui abordagem centrada no usuário através da
técnica personas. A importância de focar na experiência do usuário é que o segredo de um
bom projeto é conhecer bem as pessoas que irão usufruir do mesmo. O presente trabalho dá
enfoque a implementação de um sistema, o PersonaWeb, que cria personas de forma
automática, levando em consideração algumas particularidades que compõem seu cenário,
resultando em cartas, que são úteis na metodologia XDM.
Palavras-chave: Jogos digitais – Metodologia de design – XDM – Personas
ABSTRACT
The Digital Game Industry is a constantly ascending market. This perspective highlights the
theoretical and empirical interest of many researchers with digital games, featuring some
questions, discussions on methodologies and theoretical aspects. One of the biggest
challenges in game development is the design, essential step in the production cycle of a
game, which is often overlooked. Another problem is that there is little concern with user
research and user experience of the player, which configures a problem more human than
technical. XDM, called eXtensible Design Methods is a methodology developed in recent
years in the Departamento de Design of UFPE, which aims to help in the design of games and
digital artifacts and features user-centered design through the personas technique. The
importance of focusing on the user experience is that the secret of a good design is to know
the people who will enjoy it. This paper focuses the implementation of a system, the
PersonaWeb, which automatically creates personas, taking into account some peculiarities
that make its scenario, resulting in cards, which are useful in the methodology XDM.
Keywords: Digital Game – Design Methodology – XDM – Personas
SUMÁRIO
1 INTRODUÇÃO ............................................................................................ 13 1.1 Motivação ................................................................................................................. 13 1.2 Objetivo .................................................................................................................... 14 1.3 Estrutura do Trabalho ............................................................................................... 14
2 MÉTODOS GERAIS DE DESIGN ............................................................. 16
2.1 Métodos de design .................................................................................................... 16 2.1.1 Asimov ................................................................................................................. 16 2.1.2 Lobach .................................................................................................................. 16 2.1.3 Jones ..................................................................................................................... 17
2.2 Metodologias de Design para Jogos ......................................................................... 17 2.2.1 Tim Hutsman ........................................................................................................ 18 2.2.2 Pascal Luban ......................................................................................................... 19 2.2.3 Eric Zimmerman ................................................................................................... 20 2.2.4 Ernest Adams e Andrew Rollings ........................................................................ 20 2.2.5 Brathwaite e Ian Schreiber ................................................................................... 21
2.3 XDM WEB – GDRLab UFPE ................................................................................. 22 2.4 Considerações finais ................................................................................................. 24
3 PERSONAS .................................................................................................. 25
3.1 Sobre a técnica .......................................................................................................... 25 3.2 Cards Persona ........................................................................................................... 28
3.2.1 Inspiração ............................................................................................................. 28 3.2.2 Descrição do modelo ............................................................................................ 29 3.2.3 Cartas .................................................................................................................... 30 3.2.4 Limitações ............................................................................................................ 30
3.3 Considerações finais ................................................................................................. 32 4 KDD E MINERAÇÃO DE DADOS ........................................................... 33
4.1 Descoberta de Conhecimento em Bases de Dados ................................................... 33 4.2 Mineração de dados .................................................................................................. 34
4.2.1 Classificação ......................................................................................................... 35 4.2.2 Regressão .............................................................................................................. 36 4.2.3 Agrupamento (Clustering) .................................................................................... 37
4.3 Considerações finais ................................................................................................. 39 5 PERSONAWEB ........................................................................................... 40
5.1 Recursos utilizados pela PersonaWeb ...................................................................... 40 5.1.1 Weka ..................................................................................................................... 40 5.1.2 SimpleKmeans ...................................................................................................... 42 5.1.3 IMDB .................................................................................................................... 43 5.1.4 LastFM ................................................................................................................. 44
5.2 Descrição da ferramenta ........................................................................................... 45 5.2.1 Primeira fase – Pré-processamento....................................................................... 47 5.2.2 Segunda fase – Mineração dos dados ................................................................... 48
5.2.3 Terceira fase – Interpretação e construção das cartas ........................................... 49 5.3 Arquitetura ................................................................................................................ 51 5.4 Fluxo Navegacional .................................................................................................. 52
6 ESTUDO DE CASO .................................................................................... 58
6.1 Olimpíadas de Jogos Digitais e Educação ................................................................ 58 6.2 Características da base de dados ............................................................................... 58 6.3 Utilizando o PersonaWeb ......................................................................................... 58
7 CONSIDERAÇÕES FINAIS ....................................................................... 68
7.1 Contribuição ............................................................................................................. 69 7.2 Trabalhos Futuros ..................................................................................................... 69
8 REFERÊNCIAS ........................................................................................... 70
LISTA DE FIGURAS
Figura 1: Etapas do desenvolvimento de jogos .................................................................. 17
Figura 2: Processo iterativo de design ................................................................................ 19
Figura 3: Processo de design de jogos digitais ................................................................... 20
Figura 4: Tela da ferramenta XDM WEB (Persona e seu cenário) ..................................... 22
Figura 5: Tela do XDM Web completa .............................................................................. 22
Figura 6: Fragmento de persona apresentada na forma tradicional ................................... 24
Figura 7: Exemplo da carta de um planeswalker Jace Belen .............................................. 27
Figura 8: Exemplo da carta principal ................................................................................ 29
Figura 9: Exemplo de cartas auxiliares .............................................................................. 29
Figura 10: Etapas do processo de KDD ............................................................................ 32
Figura 11: Exemplo de uma árvore de decisão .................................................................. 36
Figura 12: Exemplo de um arquivo arff ............................................................................. 37
Figura 13: Fluxograma do Algoritmo K-means ................................................................. 40
Figura 14: Fragmento dos métodos da API da LastFM ..................................................... 41
Figura 15: Arquitetura PersonaWeb .................................................................................. 42
Figura 16: Fases do PersonaWeb ........................................................................................... 44
Figura 17: Fase de pré-processamento – PersonaWeb ....................................................... 46
Figura 18: Fase de mineração de dados – PersonaWeb ...................................................... 47
Figura 19: Arquivo de saída do SimpleKmeans ................................................................ 47
Figura 20: Fase de interpretação e visualização – PersonaWeb ......................................... 48
Figura 21: Tela inicial PersonaWeb .................................................................................... 49
Figura 22: Tela pré-processamento do PersonaWeb .......................................................... 49
Figura 23: Tela para preenchimento das imagens das cartas ............................................. 52
Figura 24: Tela para escolha da imagem da carta principal ............................................... 52
Figura 25: Tela Final do PersonaWeb ................................................................................ 53
Figura 26: Arquivo Arff da base da OJE ........................................................................... 58
LISTA DE TABELAS
Tabela 1: Exemplo de uma base de dados ......................................................................... 33
LISTA DE QUADROS
Quadro 1: Atributos relevantes e atributos excluídos ............................................................ 55
LISTA DE GRÁFICOS
Gráfico 1: Quantidade e porcentagem dos clusters obtidos ............................................... 58
LISTA DE ABREVIAÇÕES
UFPE Universidade Federal de Pernambuco
GDRLab Game Design Research Lab
UPA Usability Professionals' Association
OJE Olimpíada de Jogos Digitais e Educação
KDD Knowledge discovery in databases
WEKA Waikato Environment for Knowledge Analysis
ARFF Attribute-Relation File Format
XML eXtensible Markup Language
API Application Programming Interface
ISO International Organization for Standardization
IMDB Internet Movie Database
JSF JavaServer Faces
JDBC Java Database Connectivity
13
1 INTRODUÇÃO Este capítulo relata as principais motivações para realização deste trabalho, mostra o objetivo
e, mostra como está estruturada o restante desta dissertação.
Motivação
O jogo é uma forma de prazer e divertimento mais primitivo do que a cultura
[HUIZINGA 2007]. É um processo essencial na socialização e formação da personalidade do
indivíduo [BRIGHETTI 2003].
Na década de 70, surgiram os jogos digitais. A sua propagação se deu devido ao
surgimento de consoles em espaços domésticos, que serviam de plataforma para sua
execução. Aarseth destaca um amplo interesse pelos jogos digitais [AARSETH 2003]. Essa
perspectiva destaca o interesse teórico e empírico de muito pesquisadores com jogos digitais,
cada um apresentando debates sobre metodologias, perspectivas teóricas e questões que
buscam responder sobre o mesmo [BRYCE e RUTTER 2006].
Entre os três maiores desafios no desenvolvimento de jogos, está o processo de
concepção de jogos, etapa muito importante no ciclo de produção de um jogo, que é muitas
vezes deixada de lado e que é essencial para maturidade da empresa [LUBAN 2006]. Neste
trabalho são mostradas algumas metodologias de desenvolvimento de jogos, que mostram
estudos relacionados ao desenvolvimento, onde é possível ver algumas dificuldades no
projeto do jogo, como pouca preocupação com a experiência de uso do jogador. Também será
mostrada uma metodologia, resultado de pesquisas desenvolvidas nos últimos anos no
Departamento de Design da UFPE, denominada eXtensible Design Methods - XDM.
XDM é um processo de design adequado à contemporaneidade cibernética [NEVES
2008]. Visa ajudar na concepção de jogos e artefatos digitais (foco inicial da ferramenta).
Possui abordagem de concepção centrada no usuário, onde a primeira fase da metodologia
abrange pesquisa com o usuário. Inserida na mesma, está a técnica de personas, objeto de
estudo do presente trabalho, que são arquétipos, cuja metas e padrões de comportamento,
servem como guia para orientação das decisões sobre recursos do produto, navegação,
interação e até mesmo design visual [GOODWIN 2001].
O Estado de Pernambuco possui por volta de 10 empresas de jogos, dentre elas se
destacam a Manifesto, a i2, a Playlore, a Preloud, a Meantime, a Jynx. A OJE - Olimpíadas
14
de jogos de Pernambuco [NEVES 2009] é um consórcio formado pela Jynx, Manifesto,
Meantime e CESAR, através da parceira do Porto Digital com a UFPE. É um
empreendimento do Estado de Pernambuco com o Porto Digital, voltado para alunos e
professores da rede de ensino, desenvolvido em forma de uma gincana de jogos digitais, onde
o principal interesse é estimular o aprendizado e participação dos alunos e já conta com mais
de 100.000 usuários online [OJE].
O Departamento de Design da UFPE, através do GDRLab, motiva-se a fazer pesquisas
de métodos e ferramentas que venham a melhorar a competitividade das empresas de jogos
pernambucanas [NEVES 2009]. A metodologia XDM, citada anteriormente, é o resultado de
uma dessas pesquisas. Essa metodologia utiliza a técnica de personas através do modelo
Cards Persona. Sendo que o mesmo possui limitações quanto à criação das personas, pelo fato
de todo o processo ser manual, o que acarreta dificuldades tanto na geração das personas,
quanto na análise e visualização dos dados, caso se tenha uma amostra grande. O presente
trabalho irá desenvolver uma melhoria para essa metodologia, o qual automatizará a criação
dessas personas, fazendo uso da base de dados do Consórcio da Olimpíada de Jogos Digitais e
Educação. A solução proposta possui um processo próprio de pré-processamento,
interpretação e criação das personas, essa última com base na metodologia XDM, e a fase de
mineração de dados implementada a partir da API da Weka.
Objetivo
Esta pesquisa tem como objetivo automatizar a construção de personas, no intuito de
auxiliar na concepção de jogos digitais, através do uso da solução proposta na metodologia
XDM WEB.
Estrutura do Trabalho
Este trabalho será apresentado da seguinte forma: o capítulo 2 discorre sobre o estado
da arte: metodologias de design, metodologias de design para jogos e personas. O capítulo 3
fala sobre Personas e o modelo Cards Persona. O capítulo 4 faz uma explanação sobre o
Processo de Descoberta de Conhecimento em Base de Dados e descreve a ferramenta
proposta neste trabalho, PersonaWeb, enquanto que o capítulo 5 mostra os resultados obtidos
15
na aplicação da base de dados da OJE na ferramenta PersonaWeb. E o capítulo 6 faz algumas
considerações finais.
16
2 MÉTODOS GERAIS DE DESIGN
Este capítulo irá abordar de forma geral métodos de design e metodologias de design
para jogos. Métodos de design
Os primeiros estudos sobre métodos de design começaram na década de 60, devido a
complexidade de desenvolvimento de um novo produto, que dava maior responsabilidade ao
designer sobre a sua concepção [VAN AKEN 2005]. Todo esse período teve suas gerações, a
que o processo de design era estruturado de forma linear, em seguida veio a geração em que
as fases eram cíclicas. Com as pesquisas em metodologia e o amadurecimento da atividade do
design, vêem-se agora métodos centrados no usuário, argumentativos, orientados pela
satisfação, onde contam com o usuário como parceiro.
Algumas metodologias de design existentes na literatura e seus respectivos autores
serão apresentados a seguir.
Asimov
Modelo prescritivo, composto por três fases, sendo que dentro de cada fase há os
procedimentos de análise, sintetização, avaliação, decisão, aperfeiçoamento e revisão
[ASIMOV 1962].
I. Levantamento das necessidades do projeto e definição de parâmetros de
design. Geração de alternativas analisadas pela viabilidade econômica;
II. Preliminar de design. Escolha da solução que tem o melhor conceito;
III. Linha e produção. Elaboração de detalhes menores do design e criação e
avaliação de um protótipo.
Lobach
Divide o processo de design em quatro fases referente à fase de concepção.
I. Análise do problema. Levantamento das variáveis do projeto e suas influências
para a configuração do novo produto;
17
II. Geração de alternativas. Busca das melhores idéias para solução do problema,
devem fluir livremente, fazendo uso de todo um processo criativo;
III. Avaliação das alternativas. As idéias geradas são analisadas até que ocorra a
escolha da melhor solução;
IV. Realização da solução. Construção do primeiro protótipo com documentação
contendo suas especificações técnicas.
Esse processo é iterativo, as fases interagem entre si com avanços e retrocessos
[LOBACH 2001].
Jones
Divide o processo de concepção em três fases: análise (dividir o problema em
pedaços), síntese (reagrupar os problemas de várias maneiras) e avaliação (testes da aplicação
prática de cada novo reagrupamento).
Jones [JONES 1992] denomina essas fases em:
I. Divergência. Testar a estabilidade e instabilidade de tudo que está ligado ao
produto, a fim de identificar possíveis caminhos a serem seguidos junto aos
usuários, mercado, produtores e patrocinadores do projeto;
II. Transformação. O projeto deve ser guiado de acordo com uma idéia central.
Objetivos e limites do projeto são definidos. Nessa fase ocorre a divisão do
problema em sub-problemas a fim de quebrar a complexidade;
III. Convergência. Agrupamento das informações colhidas, redução de incertezas
secundárias, a fim de escolher dentre as várias alternativas a que será realizada.
Compreender as falhas que um novo produto poderá apresentar e tentar corrigi-las, a
fim de evitar um aprendizado tardio é um dos principais benefícios de fazer uso de
metodologias de concepção [JONES 1992].
Metodologias de Design para Jogos
Esforços vêm sendo feito quanto a métodos que melhor contribuam para a concepção,
desenvolvimento e avaliação ao longo do processo de um jogo. Braimstorming, Game Design,
Document Design, Cronograma, Level Design, Beta, Teste, Versão final e Demo são as
18
etapas de desenvolvimento de um jogo [PERUCIA 2005]. Essas etapas podem ser
visualizadas na Figura 1.
Figura 1: Etapas do desenvolvimento de jogos [AMAZONAS 2007]
Serão mostradas a seguir opiniões de autores que apresentam trabalhos relacionados a
alguma das etapas do processo de desenvolvimento de jogos.
Tim Hutsman
Divide o processo de design em três seções: o que fazer para preparar um jogo, o que
pensar enquanto está fazendo o jogo, e o que necessita para definir o mesmo, ou seja, o que
fazer, em que pensar e como avaliar necessidades. Para saber o que precisa para o jogo, é
necessário ter um conhecimento do que está acontecendo ao redor. Conhecer o mercado, saber
o que a empresa quer ou o que não quer. É uma fase para perguntas, tipo: quais as tendências
atuais, o que os jogadores estão procurando (ter uma idéia sobre o que as pessoas querem) e
quais ferramentas atuais se tem acesso. Pensar é estar envolvido com o processo de
concepção. É estar atento a detalhes como: boa quantidade de conteúdo, equilíbrio entre
níveis de dificuldades. O autor destaca ainda que para se ter uma visão geral dos riscos e
minimizá-los é necessário vincular o game design com orçamento de projeto e tempo. Avaliar
19
as necessidades nada mais é do que ver o que é preciso para se chegar à definição do jogo
[HUTSMAN 2000].
Hustman dá ainda algumas dicas, como:
• não se deve complicar um jogo, quando dá para ajudar através de enredo,
regras e controles, tentar reutilizar o que de melhor já foi implementado em
outros jogos;
• deixar o controle com o jogador, evitando explicações que em nada
contribuem;
• ter conhecimento de todos os tipos de controles que o usuário terá para jogar, e
avisar antes ao usuário, caso ocorra alguma quebra ou se estabeleça novas
regras.
“Não se é um bom design apenas quando se tem um bom conjunto de idéias, e sim
quando se consegue implementá-las”
Pascal Luban
Diante das divergências de opiniões entre os envolvidos no projeto do jogo, Luban
propõe um método para promover o processo de criatividade, construindo um consenso na
equipe, tentando identificar as melhores escolhas. Procura-se deixar a etapa de concepção
mais transparente, permitir a todos os envolvidos ver o que e como se estão produzindo idéias.
O método está dividido em quatro etapas. 1ª etapa – definir objetivos e organizá-los:
aqui ocorre a preparação da equipe. 2ª etapa – identificar os parâmetros e pesquisar seus
valores: ou seja, identificar as características do jogo e valores associados. Essa é uma etapa
importante, e deve haver clareza entre os parâmetros. 3ª etapa – filtragem de idéias e definição
de preferências: na etapa anterior é feita uma pesquisa de valores para os parâmetros. Na
etapa atual é feita uma análise de combinação entre os valores de cada parâmetro, onde ocorre
a exclusão de pares de valores incompatíveis e a definição de preferências por pares de
valores que parecem promissores. 4ª etapa: análise de hipóteses de acordo com prioridades:
estabelece um conjunto de critérios a fim de definir o melhor conceito possível. Em seguida,
atribui-se pesos a cada critério. Posteriormente, ocorre a conciliação das hipóteses, já que
podem ocorrer divergências, daí cada hipótese deve ser avaliada por ângulos diferentes: tanto
os gestores quanto os jogadores. E após a melhor escolha, a hipótese conceitual do jogo
poderá ser detalhada com segurança, já que conta com o respaldo de todos da equipe
[LUBAN 2001].
20
Eric Zimmerman
Zimmerman busca desenvolver um jogo através de um ciclo iterativo, baseado na
prototipação, análise e refinamento ao longo do processo até se encontrar o estágio ideal. O
processo iterativo está representado na Figura 2. O design iterativo em jogos significa
playtesting, ou seja, jogar o jogo. Durante o processo de concepção e desenvolvimento do
jogo, ele precisa ser jogado, seja pela equipe, pelo design, por outras pessoas do escritório,
visitantes, o objetivo nesse caso é observar e questionar e em seguida ajustar e testar
novamente. Esse processo iterativo irá resultar em um produto robusto e bem sucedido. É
importante ter a experiência dos jogadores jogando. Isso possibilita a investigação e
experimentação, permitindo a descoberta de respostas para perguntas que nem se tinha idéia,
tornando uma poderosa forma de pesquisa em design [ZIMMERMAN 2003].
Figura 2: Processo iterativo de design [ZIMMERMAN 2003]
Ernest Adams e Andrew Rollings
Game design é o processo de: imaginar um jogo, definir a forma como ele funciona,
descrever os elementos que compõem o jogo e transmitir as informações para a equipe que
construirá o jogo. A concepção do jogo requer tanto criatividade quanto planejamento
cuidadoso. O game design reúne as melhores idéias de uma equipe. A metodologia proposta
Prototipar
Analisar
Refinar
21
por esses autores é a de criação de jogos centrado no jogador. A concepção de um jogador
imaginário permite que o designer tenha a tarefa de entreter e criar empatia junto ao mesmo
[ADAMS e ROLLINGS 2006].
Ao se produzir um jogo com uma abordagem centrada no usuário, deve-se evitar dois
erros: o primeiro é pensar que quem está produzindo o jogo é o próprio jogador. O que deve
ser feito são pesquisas que mostrem o público a ser atingido. O segundo erro é ter o jogador
como oponente. Hoje os jogos são vistos como ferramentas de passatempo, forma de
entretenimento, ou seja, além dos desafios, procura-se socialização e interação entre os
jogadores.
Concepção (definição do estilo, gênero, público-alvo, papel do jogador e criação do
mundo ficcional), elaboração (define a maior parte de detalhes do jogo, adiciona
características se necessário– e gera testes para todos esses conceitos) e ajuste (pequenos
ajustes - exclui ou melhora alguns conceitos). São os três estágios do processo de design
centrado no jogador proposto por Adam e Rollings, como mostra a Figura 3.
Figura 3: Processo de design de jogos digitais [ADAMS e ROLLINGS 2006]
Brathwaite e Ian Schreiber
Focalizam mais no mercado e sugerem uma pesquisa de público-alvo para o jogo,
tanto na fase inicial como na fase de desenvolvimento. Indicam questões chaves a serem
respondidas, como: foco de audiência e classificação pretendida pelo jogo, existência da pré-
Concepção Elaboração
Ajuste
22
concepção de gênero ou categoria e se existe alguma particularidade que se deseja ver no jogo
[BRATHWAITE e SCHREIBER 2009].
XDM WEB – GDRLab UFPE
O Departamento de Design da UFPE, através do GDRLab, motiva-se a fazer pesquisas
de métodos e ferramentas de design aplicados à concepção de mídia digital, com ênfase em
jogos digitais [NEVES 2009]. A metodologia XDM, é o resultado de uma dessas pesquisas.
eXtensible Design Methods –XDM é uma metodologia que auxilia o processo de
concepção de jogos e artefatos digitais. Possui uma abordagem centrada no usuário e é
inspirada nos jogos de cartas colecionáveis. O conceito de extensible dessa metodologia está
relacionado ao fato de que o design pode utilizar sub-conjuntos dos métodos que a mesma
possui, como também adicionar novos [NEVES 2008].
Esta metodologia ganhou uma versão digital, com o objetivo de criar jogos digitais de
forma mais simples e rápida, a XDM WEB. Essa ferramenta inicia-se com a escolha da
persona apropriada. Cada persona é bem detalhada, composta de outras cartas que constituem
seu cenário, como: filmes, lugares, hobbies e músicas, a Figura 4 mostra essa tela. Essas
cartas foram criadas de acordo com o modelo Cards Persona (será detalhado no próximo
capítulo). Depois da seleção da Persona, os designers escolhem referências para o produto a
ser criado, e a mesma é classificada com os mesmos conceitos antagônicos da etapa anterior,
fazendo assim uma associação às preferências da persona. A etapa seguinte às referências é a
escolha aleatória das cartas de biônica e cinética – apresentam elementos externos para
servirem de inspiração na composição do produto. Todas as cartas servirão para montar a
Caixa Morfológica, apresentada na Figura 5, também chamada de Creative Board, que tem a
persona como centro, a fim de oferecer subsídios para a criação livre de várias alternativas
[NETO 2010].
23
Figura 4: Tela da ferramenta XDM WEB (Persona e seu cenário)
Figura 5: Tela do XDM Web completa [NETO 2010]
24
Considerações finais
Neste capítulo foram apresentadas de forma geral as metodologias de design e
metodologia de design para jogos. Com o amadurecimento das atividades de design, é
possível notar a inserção de novos métodos com foco no usuário. Como também em relação a
jogos, métodos que melhor contribuam para o processo de desenvolvimento, desde a
concepção até a avaliação. Dentre as metodologias de jogos, foi apresentada a XDMWEB,
metodologia que possui abordagem centrada no usuário, utilizando a técnica personas, através
do modelo Cards Persona. No capítulo seguinte será apresentada esta técnica. Como também
será mostrado o modelo Cards Persona – descrição, inspiração e limitações.
25
3 PERSONAS Sobre a técnica
A técnica Personas foi introduzida por Alan Cooper, no livro The Inmates are Running
the Asylum, em 1998, como um instrumento prático de design de interação. Ganhou
rapidamente popularidade por seu poder e eficácia [COOPER 2003].
Persona é um arquétipo do usuário que ajuda a orientar as decisões quanto a recursos,
navegação, interação e design visual. Ao se projetar para esse arquétipo, as metas e padrões
estando bem compreendidos, poderá ocorrer a satisfação do grupo [GOODWIN 2001].
Os arquétipos que Personas representam são compostos com base em dados recolhidos
a partir do comportamento de usuários reais em entrevistas etnográficas. Apesar de possuir
um conceito simples, deve ser aplicado com uma sofisticação, já que personas identificam
padrões significativos no comportamento do usuário [COOPER, REIMANN e CRONIN
2007]. Um exemplo de persona pode ser visualizado na Figura 6.
Personas possibilitam construir suposições e conhecimento sobre usuários, tornando
significativa a comunicação da equipe sobre o usuário, o que vem a evitar que a equipe de
desenvolvimento use o seu próprio perfil de especialista no projeto. É possível projetar para
um pequeno número de usuários específicos, porém atendendo uma grande quantidade de
usuários [PRUITT e ADLIN 2006].
Quesenbery [QUESENBERY 2004] afirma que personas poderiam ser compostas de
informações da própria equipe, como também incrementá-las com histórias verdadeiras ou
fictícias. O que vem a ser discordado por Pruitt e Adlin [PRUITT e ADLIN 2006] que
defendem informações reais dos usuários para definição das personas.
Como ferramenta de design, Personas ajudam a determinar [COOPER, REIMANN e
CRONIN 2007]:
• o que um produto deve fazer e como se comportar;
• a comunicação entre partes interessadas, programadores, designers e outros;
• a manter o design centrado no usuário nas etapas do processo;
• a eficácia do projeto e contribuem para outras ações relacionadas com o
produto, como marketing e vendas.
26
Figura 6: Fragmento de persona apresentada na forma tradicional [PRUITT; ADLIN, 2006]
Dois processos de criação de personas serão descritos a seguir. O primeiro é baseado
na identificação de padrões entre usuários, definindo tipos que possibilitam a organização e
prioridade de cada persona [COOPER, REIMANN e CRONIN 2007]. O segundo considera
esse primeiro processo, porém aplicado em um ciclo de vida [PRUITT e ADLIN 2006].
O primeiro processo é resultado da aplicação da técnica na Empresa Cooper, que
define os seguintes passos [COOPER, REIMANN e CRONIN 2007]:
• Identificação de variáveis comportamentais (atividades: o que o usuário faz e
com que frequência; atitudes: pensamento do usuário sobre o domínio do
produto e da tecnologia; aptidões: nível educacional, treinamento e capacidade
de aprendizado do usuário; motivação: porque o usuário está comprometido
com o domínio do produto e habilidades: capacidade do usuário em relação ao
domínio do produto);
27
• Mapeamento dos entrevistados com as variáveis comportamentais (mapear
cada usuário com cada variável, a fim de agrupar comportamentos
semelhantes);
• Identificação de padrões comportamentais significativos;
• Sintetizar características e objetivos relevantes (detalhar dados de cada padrão
significante, neste momento define nome, sobrenome e ilustração);
• Verificar redundância e completude (identificar falhas e remover
redundâncias);
• Expandir descrição de atributos e comportamentos (narrar em terceira pessoa
para equipe atitudes, necessidades e problemas das personas);
• Definir tipos de personas (primária: representa o alvo primário para o design
de interface; secundária: necessidades adicionais de usuários que podem ser
adicionados ao produto sem interferir na primária; suplementar: nem são
primários nem secundários e sim suplementares; cliente: necessidade de
clientes e não de usuários finais; servida: usuários afetados pelo uso do
produto; negativa: tipos específicos de usuário o qual o produto não serve).
O segundo divide o ciclo de vida da Persona em cinco fases. É um processo cíclico
com etapas sequenciais [PRUITT e ADLIN 2006].
• Planejamento familiar: - criar uma equipe que irá trabalhar na construção de
personas, - pesquisar a própria empresa para avaliar problemas e necessidade, -
pesquisa do usuário e identificação de dados que servirá para construção das
personas;
• Concepção e gestação: - quantas personas serão necessárias criar, comunicar as
informações chaves, - que qualidades e elementos descritivos serão inclusos no
documento de personas, - priorizar e validar as personas, - decidir quais
personas estão prontas para ser introduzida na equipe de produção;
• Aniversário e maturação: - organizar as atividades de aniversário, maturação e
maioridade, - introduzir as personas na equipe, - assegurar a compreensão,
respeito e uso das personas, - gerenciar pequenas mudanças sem que seja
mudado o foco da persona;
28
• Maioridade: - trabalhar a persona junto com o grupo, - usar as personas para
ajudar no planejamento, produção e avaliação do produto;
• Realização de tempo de vida e aposentadoria: - avaliar a efetividade do método
e avaliar reuso ou aposentadoria para um próximo projeto.
Personas permitem identificar grupos distintos de usuários e construir usuários
fictícios para representar cada grupo [CALABRIA 2004]. Por isso é melhor manter um
número pequeno de personas, já que um grande conjunto poderá se tornar problemático.
Vantagens no uso de personas: metas e necessidades do usuário tornam-se ponto
comum para equipe; são rápidos para desenvolver e trocar necessidades de usuários; ajudam a
criar o que o usuário irá verdadeiramente fazer uso; priorizam esforços de design; diminuem
as diferenças de opiniões; diminuem a frequência dos testes de usabilidade, já que podem
avaliar com o uso das mesmas [CALABRIA 2004].
Problemas como os descritos a seguir podem ser observados quando as personas não
são bem construídas ou não aplicadas ao projeto: não aceitação do líder da equipe, quando as
personas não possuem credibilidade ou quando a equipe não sabe utilizá-la de forma eficiente
[PRUITT e ADLIN 2006].
Persona funciona muito bem, por ser poderosa quanto à criação de modelos do público
alvo. Tendo a capacidade de prever comportamentos, poderão fazer inferências sobre como os
usuários irão reagir à escolha de design feita [KREITZBERG e LITTLE 2009].
Cards Persona
Nesta seção será apresentado o modelo Cards Persona, utilizado para inserção das
personas na metodologia XDM.
Inspiração
Personas foi o método escolhido como base para esta técnica. No entanto, a mesma
apresentava carência quanto a ter pouca quantidade de imagens e ilustrações, como também
não ter reaproveitamento dos dados. Para suprir a questão de imagens e ilustrações levou-se
em consideração abordagens propostas por Baxter (1998) e Chipchase (2009), ambos
29
descreviam hábitos e escolhas de pessoas com imagens ao invés de palavras. Com a inserção
de imagens tornou-se maior a ficha de personas, tornando mais difícil a reutilização dos
dados. A solução para isso veio através da inspiração das cartas do jogo “Magic the
Gathering”. A carta desse jogo é composta por características básicas do personagem como
nome, imagem, atributos, poderes, etc. Junto com esta carta, são inseridas na mesa de jogo
cartas de tipos variados como: itens, magias, terrenos, etc [MAGIC THE GATHERING
2007]. Exemplo na Figura 7.
Figura 7: Exemplo da carta de um planeswalker Jace Belen [OLIVEIRA 2010]
Característica deste jogo utilizada no método Cards Persona: a carta principal. O
método teria como carta principal a persona em si, contendo nome, foto e características
básicas, como mostra a Figura 8, e também códigos correspondentes a cartas auxiliares
(variáveis definidas inicialmente no processo: lugar, roupa, filme, etc), como mostra a Figura
9.
Descrição do modelo
A confecção de um conjunto de cartas de Personas segue os seguintes passos
[OLIVEIRA 2010]:
30
1. Definição das categorias (cartas) auxiliares à persona – define características
do conjunto a ser criado, a partir disso saberá a quantidade dos conjuntos de
cartas auxiliares serão necessárias. Essa fase serve como base para criação de
perguntas para fase seguinte;
2. Pesquisa com usuários – nessa fase entra-se em contato com o usuário através
de técnicas como: questionário, entrevistas, observação, etnografia visual, entre
outras;
Uma vez que já se tenha características bem definidas e as técnicas de pesquisa bem
preparadas pode começar a terceira fase.
3. Compilação e resumo dos dados sobre os usuários – aqui os dados são
compilados, numa planilha ou banco de dados, para através da análise dos
mesmos possa gerar gráficos e relatórios. Com essa compilação se obtém o
esboço de futuras personas e cabe ao analista fazer uma divisão coerente para
que não sejam geradas personas em excesso ou em quantidade escassa;
4. Elaboração das cartas – aqui o responsável faz a coleta de dados gerados nas
fases anteriores e faz uma interpretação a fim de que se possam escolher
imagens que melhor representem as características do grupo de usuários.
Cartas
Uma equipe de design gráfico do GDRLab, desenvolveu um modelo para as cartas que
serve tanto para a persona quanto para as cartas auxiliares. A carta principal, que tem a
imagem da pessoa, se diferencia das auxiliares apenas por conter uma seção destinada a
códigos (formados por uma letra e dois dígitos numéricos, que relaciona a carta principal com
as auxiliares).
Limitações
A forma atual de se construir o Cards Persona é manual, tem-se que entrevistar
pessoalmente potenciais usuários, selecionar as entrevistas com o nível de respostas mais
completas, o agrupamento dos dados é realizado sem critério formal, tem que construir tabelas
digitando cada dado a fim de obter informações e ainda construir as cartas colocando códigos,
31
nome e descrição manualmente e copiando resultados para fazer buscas por imagens. Claro,
sem deixar de comentar, que por ser um trabalho manual, é trabalhoso agrupar grandes
amostras.
Figura 8: Exemplo da carta principal
Figura 9: Exemplo de cartas auxiliares
Nome
Descrição
Código
Foto / Ilustração
32
Considerações finais
Neste capítulo foi apresentada a técnica personas, base para o modelo Cards Persona.
Esse modelo é utilizado para agrupar usuários de forma a obter um usuário-modelo que
represente um grupo. Sendo que possui limitações quanto a poder analisar pequenas amostras,
já que é inviável ao homem analisar, relacionar e interpretar muitos dados sem o auxílio de
ferramentas computacionais adequadas. No próximo capítulo será explicado o Processo de
Descoberta de Conhecimento em Base de Dados, que é um processo para identificar padrões a
partir de grandes bases de dados.
33
4 KDD E MINERAÇÃO DE DADOS
Atualmente, os progressos na área da tecnologia da informação proporcionam o
desenvolvimento de sistemas de diversas naturezas e possibilitam o armazenamento de
grandes volumes de dados. Presume-se que haja informações úteis a serem extraídas dessas
grandes bases de dados de forma a oferecer as organizações conhecimento para futuras
tomadas de decisões.
Para analisar, interpretar e relacionar os dados, o homem precisa da ajuda de
ferramentas computacionais adequadas, devido à dificuldade do mesmo em encontrar
informações úteis sem automatização. Serão apresentados nesta seção os processos de KDD e
Mineração de dados, que auxiliam o homem nessas tarefas. Apesar de alguns autores
considerarem os dois como sinônimos, este trabalho adota a definição de Fayyad [FAYYAD
1996], de que KDD é o processo global de descoberta de conhecimento útil a partir de dados,
enquanto mineração de dados é a aplicação de algoritmos específicos para a extração de
padrões de dados.
O objetivo desta seção é apresentar uma introdução às etapas do processo de KDD,
processo capaz de descobrir conhecimento útil em grandes bancos de dados, e uma introdução
à mineração de dados, etapa em que ocorre a extração de padrões dos dados. Serão
apresentadas algumas das principais tarefas de mineração de dados: classificação, regressão e
agrupamento; e algumas técnicas para a aplicação dessas tarefas como redes neurais,
algoritmos genéticos e árvores de decisão.
Descoberta de Conhecimento em Bases de Dados
O armazenamento em bases de dados de grandes quantidades de dados tornou-se uma
prática considerada comum e essencial nos dias de hoje em diversas organizações. Isso
ocasiona uma grande possibilidade de existência de informações preciosas entre esses dados.
A exploração dessas bases de dados à procura de conhecimento implícito caracteriza o termo
KDD. Fayyad [FAYYAD 1996] diz que KDD é um processo, de etapas seqüenciais,
interativo e iterativo, para identificação de padrões compreensíveis, válidos, novos e
potencialmente úteis a partir de grandes bases de dados.
34
Para o bom entendimento de tal definição torna-se necessário dar uma explicação
individual de alguns dos termos usados. O processo é interativo, pois necessita do homem
como responsável, é iterativo por possuir etapas seqüenciais e possibilitar retorno as etapas
anteriores. Por padrões válidos entenda-se conhecimento válido e verdadeiro, e por padrões
novos a agregação de novos conhecimentos aos já existentes, o conhecimento útil é o que
pode ser usado para beneficiar o contexto aplicado ao processo de KDD.
As etapas do KDD consistem na etapa de pré-processamento, mineração de dados e
pós-processamento, conforme mostrado na Figura 10.
Na etapa de pré-processamento ocorre a seleção, limpeza e tratamento dos dados. A
seleção dos dados ocasiona a escolha das instâncias e atributos relevantes para o processo. A
limpeza permite a qualidade dos dados, possibilitando o preenchimento dos dados
incompletos (ausência de valores), a correção de dados ruidosos, ou seja, dados que
contenham valores disparatados (outliers) e a verificação de dados inconsistentes, que
possuam alguma discordância entre si. Em seguida, ocorre o tratamento dos dados, que
normaliza e reduz a dimensionalidade dos dados – caso variáveis excedam capacidade dos
algoritmos de aprendizagem – para serem adequadamente utilizados pelos algoritmos.
Após o pré-processamento dos dados, segue a etapa de mineração de dados, onde
ocorre a escolha do algoritmo para o cumprimento da tarefa do problema em questão.
Na etapa de pós-processamento ocorre à visualização, análise e interpretação do
conhecimento obtido, onde os dados são organizados de forma a serem avaliados pelo
especialista. O especialista tem papel fundamental nessa etapa, pois é o mesmo que definirá se
os padrões adquiridos são interessantes, se o conhecimento é válido, novo e útil, ou se será
necessário à volta a alguma das etapas anteriores.
Mineração de dados
Mineração de dados é a etapa mais importante do processo de KDD. O objetivo dessa
etapa consiste na análise de dados e aplicação de algoritmos de descoberta que produzem uma
enumeração particular de padrões (ou modelos) a partir dos dados. Ou seja, algoritmos que
buscam explorar os dados para determinar modelos de conhecimento [FAYYAD 1996].
As técnicas de mineração de dados são aplicadas de acordo com as tarefas a serem
realizadas no processo de KDD. Serão descritas a seguir algumas dessas tarefas, sendo que
35
será dada uma abordagem geral nas tarefas de classificação e regressão e uma abordagem
mais detalhada na tarefa de agrupamento de dados, já que a mesma é a tarefa que será
utilizada na solução proposta por este trabalho.
Figura 10: Etapas do processo de KDD
Classificação
Essa tarefa tem o objetivo de descobrir uma função para mapear um conjunto de dados
de entrada em um conjunto de classes predefinidas, de forma que o processo de classificação
possa encontrar algum relacionamento entre um novo dado e essas classes, estabelecendo a
qual classe esse novo dado pertence.
Um exemplo dessa tarefa seria uma base de dados de clientes potenciais para
empréstimos. Os clientes são divididos em clientes confiáveis e clientes inadimplentes. O
processo de classificação descobrirá uma função de modo a inserir os clientes que existem no
banco de dados em uma das duas classes predefinidas. Um novo cliente pode também ser
36
associado a uma das classes a partir de sua semelhança com outros clientes previamente
classificados.
Regressão
A tarefa de regressão consiste em utilizar o relacionamento existente entre duas ou
mais variáveis contínuas de forma que uma delas tenha o seu valor estimado a partir das
demais.
Para exemplificar essa tarefa será considerada uma base de dados que possua
informações sobre o tempo de experiência e o salário atual dos funcionários de uma empresa,
exibida na Tabela 1 [GOLDSCHMIDT; PASSOS 2005]. Nessa base de dados existe uma
influência direta da variável que denota a experiência em anos na variável salário. Pode-se
então construir, através do processo de regressão, uma função para estimar o salário anual de
um funcionário a partir de sua experiência. Em um processo real de regressão, procura-se
estimar o valor de uma variável em função de várias outras variáveis.
Tabela 1: Exemplo de uma base de dados. [GOLDSCHMIDT; PASSOS 2005]. X (experiência em anos) Y (salário anual em R$ 1.000)
03 30
08 57
09 64
13 72
03 36
06 43
11 59
21 90
01 20
16 83
Utilizando o modelo de regressão linear nos dados da Tabela 1, temos:
X’ = 9,1
Y’ = 55,4
37
β = (3 - 91) (30 – 55,4) + (8 – 9,1) (57 – 55,4) + ... + (16 – 9,1) (83 – 55,4) = 3,7
(3 - 91)² + (8 – 9,1)² + ... + (16 – 9,1)²
a = 55,4 – (3,7) (9,1) = 21,7
Portanto: Y = 21,7 + 3,7*X.
Assim, pode-se estimar que uma pessoa com 20 anos de experiência teria seu salário
anual de aproximadamente R$ 95.700,00.
Agrupamento (Clustering)
A tarefa de agrupamento a partir de uma base de dados separa os dados formando
grupos, utilizando critérios de similaridade. A identificação desses grupos é feita utilizando o
princípio de obter padrões que minimizam a distância interna e maximizam a distância entre
os grupos [HAN & KAMBER 2001], obtendo dessa forma grupos compostos por dados com
alta similaridade, entretanto, distintos de dados presentes em outros grupos.
Diferente da tarefa de classificação, que tem rótulos predefinidos, o agrupamento
precisa automaticamente identificar os grupos de dados aos quais o usuário deverá atribuir
rótulos [FAYYAD 1996]. Exemplificando a tarefa de agrupamento pode-se utilizar uma rede
de supermercado que queira agrupar a partir de seu banco de dados, clientes que possuam um
mesmo perfil de compras. Uma das formas é agrupar cliente que tenham o mesmo perfil a
partir de atributos como faixa etária, nível de renda, etc., para oferecer linhas de produtos
semelhantes.
4.1.1.1 Componentes de uma tarefa de clusterização
A atividade de agrupamento normalmente envolve [JAIN AND DUBES 1988]:
• Representação dos padrões: envolve definição do número, tipo e modo de
apresentação dos atributos que descrevem cada padrão;
• Definição de uma medida de similaridade apropriada ao domínio da aplicação:
fornecida por uma função de distância definida entre pares de dados ou
padrões;
38
• Clusterização ou agrupamento: os grupos podem ser definidos como conjuntos
crisp (um padrão pertence ou não-pertence a um dado grupo) ou fuzzy (um
padrão pode apresentar graus de pertinência aos grupos). O processo de
agrupamento pode ser hierárquico, com um processo recursivo de junções ou
separações de grupos, ou não-hierárquico, com o emprego direto de técnicas de
discriminação de clusters;
• Apresentação do resultado: deve permitir que um computador possa utilizar o
resultado de forma direta ou então deve ser orientada ao usuário, permitindo a
visualização gráfica dos clusters e a compreensão de suas inter-relações,
através da proposição de protótipos ou outras descrições compactas para os
clusters.
4.1.1.2 Técnicas de clusterização de dados
A classificação dos algoritmos utilizados na clusterização pode ser dada de acordo
com a abordagem utilizada na definição dos clusters: clusterização hierárquica ou por
particionamento.
4.1.1.2.1 Clusterização hierárquica
Nesse tipo de clusterização, os clusters são reunidos em forma de árvore, onde cada nó
consiste na união de dois elementos [WANG e HODGES 2006]. Essa formação se dá através
de aglomerações ou divisões que gera uma árvore hierárquica dos elementos. Na
Clusterização Hierárquica Aglomerativa, cada objeto é atribuído a um cluster distinto, e novos
clusters vão se formando com a união dos já existentes, baseado nas informações de quão
próximos estão os elementos de clusters distintos. Em contrapartida, na Clusterização
Hierárquica por Divisão, tem-se inicialmente um único cluster que contém todos os elementos
do cluster, e a cada iteração, vão se formando clusters menores, a partir dos já existentes
[OCHI et al. 2004].
4.1.1.2.2 Clusterização por particionamento
Na clusterização por particionamento, o conjunto de elementos é dividido em k
clusters. Se a cada iteração não forem satisfeitas as condições do problema, novas
39
configurações vão sendo criadas através da migração dos elementos entre os clusters, até que
algum critério de parada seja atingido [OCHI et al. 2004].
Além de apresentar como vantagem um melhor refinamento com relação às técnicas
de clusterização hierárquica, que não revisitam os clusters já formados. Um dos algoritmos
mais utilizados na clusterização por particionamento, é o K-means, algoritmo no qual o
SimpleKMeans, utilizado neste trabalho, se baseia.
Considerações finais
Neste capítulo foi apresentado o Processo de Descoberta de Conhecimento em Base de
Dados. Foi dado um enfoque maior a tarefa de clusterização dos dados, devido a mesma ser a
tarefa escolhida para ser utilizada na fase de mineração de dados da ferramenta PersonaWeb,
solução proposta neste trabalho, que será detalhada no próximo capítulo.
40
5 PERSONAWEB
Este capítulo descreve a ferramenta PersonasWeb, as tecnologias utilizadas no seu
desenvolvimento, sua descrição e arquitetura. Apesar de conceitos sobre personas neste
trabalho, o projeto desenvolvido não os segue a risca, tendo sido feitas adaptações para ir de
acordo com a necessidade do problema a ser resolvido, sem deixar de manter o foco principal
que é obter um usuário-modelo criado a partir de dados reais, que contenha seu nome, seus
gostos, seus hábitos, suas habilidades e etc.
Recursos utilizados pela PersonaWeb
Nesta seção será detalhada a ferramenta Weka, da qual o PersonaWeb faz uso da sua
API, através da utilização do algoritmo SimpleKMeans. Apesar de existir várias outras
ferramentas, a escolha da Weka se deu pelo fato de a mesma possuir a implementação do
algoritmo SimpleKMeans, que trabalha com bases de atributos mistos, e que tem como base o
algoritmo KMeans, método popular para tarefa de clusterização. Essa tarefa é a que é
utilizada na fase de mineração de dados do PersonaWeb, já que o objetivo deste trabalho é
agrupar pessoas com características semelhantes a partir de bases de dados. Será também dada
uma explicação sobre a LastFM e IMDB, bases externas de músicas e filmes,
respectivamente, utilizadas através de web services para troca de dados com o PersonaWeb.
Weka Waikato Environment for Knowledge Analysis – Weka foi desenvolvido pela
Universidade de Waikato, para resolver tarefas de mineração de dados através de uma coleção
de algoritmos de aprendizado de máquina. É um software livre, escrito em Java, licenciado
dentro das especificações da GPU (General Public License). Possui interface gráfica para
interagir com arquivos de dados como também para visualização dos mesmos, pode ser
aplicado em vários níveis diferentes. Você pode acessar a API Weka e fazer uso em seu
próprio programa em Java. Para importação dos dados o weka aceita vários formatos como
41
csv, binary, c45, sendo que tem somente um formato padrão que consegue manipular, o arff
(Attribute-Relation File Format).
O ARFF – apresentado na Figura 12 - é um arquivo de texto. Não aceita dados
faltosos, nem espaços entre palavras. É formado por três partes:
• @relation – deve ser a primeira linha do arquivo, seguida de uma palavra-
chave que identifique a relação dos dados a ser minerados.
• @attribute – representa um conjunto de linhas onde são descritos os atributos.
Deve está no início de cada linha seguido do nome do atributo e do tipo, que
pode ser nominal ou numérico.
• @data – as informações inseridas abaixo dessa linha indicam os registros da
base de dados. Cada linha representa uma instância, e deve conter os valores
separados por vírgula.
Figura 12: Exemplo de um arquivo arff
O weka implementa vários métodos de associação, classificação como árvores de
decisão e redes neurais e clusterização, que utiliza algoritmos como o Simple-KMeans,
Cobweb, entre outros. Possui facilidade para inclusão de novos métodos, por isso é
42
considerada uma ferramenta personalizável e expansível. A visualização gráfica dos dados é
dada em forma de histogramas, os resultados mostrados em árvores de decisão e diagramas de
dispersão, além da possibilidade de gerar modelos gráficos para montagem de redes neurais
[GOLDSCHMIDT; PASSOS 2005].
SimpleKmeans
Algoritmo utilizado pelo PersonaWeb para fazer a tarefa de clusterização na fase de
mineração de dados. É uma implementação do pacote WEKA, baseado no algoritmo K-
Means [WITTEN e FRANK 2005]. O objetivo desse método é, a partir de uma massa de
dados, agrupar n objetos em k grupos com a maior diferença possível entre eles, onde k
representa a quantidade de grupos e deve ser definida antecipadamente [BUSSAB, 1990].
Algumas implementações do K-means permite apenas valores numéricos para os
atributos. Nesse caso, pode ser necessário converter os atributos categóricos em
binários. Também pode ser necessário normalizar os valores de atributos que são medidos em
diferentes escalas (por exemplo, "idade"). Sendo que o algoritmo SimpleKMeans trata
automaticamente a mistura de atributos categóricos e numéricos. Além disso, o algoritmo
automaticamente normaliza atributos numéricos ao fazer os cálculos de distância [PENTAHO
DATA MINING]. Este parágrafo descreve a motivação do uso deste algoritmo no
PersonaWeb, já que a maioria das bases possuem atributos mistos.
O critério de agrupamento dos clusters é baseado em algumas medidas de
similaridade, a mais comum e usada pelo SimpleKmeans no PersonaWEB é a distância
euclidiana definida por:
K-means
O algoritmo K-means tem como parâmetros de entrada: um conjunto de dados com n
elementos, e número de clusters, k. Como saída, o k-means tenta identificar entre os dados
clusters bem separados.
43
A execução do algoritmo consiste na escolha aleatória dos k centros iniciais para os
clusters, sendo isso de extrema importância já que as posições iniciais muito influenciam no
resultado, pois dependendo da escolha desses centróides o algoritmo pode convergir para um
ótimo local. O passo seguinte será calcular a distância euclidiana de cada objeto em relação ao
centróide de cada grupo, atribuindo o objeto a um cluster onde a distância entre o mesmo e o
centróide é mínima, ou seja, associá-lo ao centro mais próximo. Em seguida, recalcular os
novos centros dos clusters de modo a minimizar a função objetivo erro quadrático, definida
por:
Onde: é a distância escolhida entre um ponto de dados; = i-ésimo
padrão pertencente ao j-ésimo cluster; e cj = centróide do j-ésimo cluster.
Uma vez recalculados os centróides, o algoritmo atualiza os clusters atribuindo todos
os objetos aos novos centros. Esse processo se repete em diversas iterações até que sejam
encontrados os centros finais de cada cluster, ou seja, não apresentem deslocamentos
significativos, ou até que a função objetivo comece a diminuir expressivamente após certa
quantidade de iterações.
A Figura 13 mostra um fluxograma da execução do algoritmo k-means, ressaltando a
inicialização aleatória dos centros, a atribuição de cada objeto conforme a distância que se
encontram dos centros e a busca de forma iterativa pelos centros finais.
O algoritmo tem como vantagens: a simplicidade, facilidade de implementação,
eficiência para trabalhar com grandes bases de dados, e a realocação iterativa, que com
freqüência descobre um ótimo local. Como desvantagens, apresenta a dependência dos
valores iniciais de k, a sensibilidade aos ruídos, já que dados ruidosos ou com valores
extremamente altos podem influenciar na distribuição dos dados.
IMDB
Internet Movie Database (Base de dados de filmes na internet – IMDB) possui uma
grande base com dados sobre filmes, curtas e documentários da internet em vários idiomas.
Contém informações online sobre trailers, atores, título original, fotos, gênero, diretor, entre
outros, e também possui avaliação e resenha feita pelo usuário sobre determinado filme.
44
Figura 13: Fluxograma do Algoritmo K-means
LastFM
É um site de rádio gratuita via internet, que contém um grande catálogo de músicas e
que tem agregada uma comunidade virtual onde são trocadas informações, como também o
45
usuário pode construir seu perfil musical, recomendar artistas, músicas ou álbuns a outros
usuários, se esta estiver disponível no banco de dados da LastFM. Podem também ser
formados grupos de usuários com algo em comum, e ainda o recurso de recomendações, no
qual com base no gosto do usuário, a LastFM recomenda novas músicas, shows e indica
vizinhos musicais (pessoas que gostam das mesmas músicas).
A LastFM oferece um web service. A sua API é livre para qualquer pessoa usar e criar
seus próprios programas utilizando os seus dados. Sendo que para dados restritos ao usuário, é
necessária autorização para uso. Na Figura 14, serão mostrados alguns métodos disponíveis
na API.
Figura 14: Fragmento dos métodos da API da LastFM
Descrição da ferramenta
PersonaWeb é a solução implementada que supre uma necessidade da metodologia
XDM, que é a criação de personas de forma automática. De forma geral, seu funcionamento
se dá a partir de um script de banco de dados MYSQL, que além dos dados gerais deve conter
informações do usuário sobre música, filme, hobbie e lugar.
46
O usuário final do PersonaWeb com o script da base já executado no MYSQL, terá
três fases a seguir para a obtenção das personas, como mostra a Figura 16. Primeiro, uma fase
de pré-processamento, que irá organizar e tratar os dados para a geração de um arquivo arff,
formato lido pelo weka. Em seguida, ocorre a mineração de dados, onde serão obtidos
padrões, formados por clusters com características similares. E por fim, a interpretação desses
clusters e a formação das personas, com cartas de acordo com padrões identificados que
representarão o grupo. Caso seja necessário, o usuário final poderá iniciar novamente o
processo, e escolher novos atributos para melhor obtenção de resultado dos padrões.
Figura 16: Fases do PersonaWeb
47
Primeira fase – Pré-processamento
A fase de pré-processamento irá tratar os dados do script inserido pelo usuário de
forma a deixá-los preparados para leitura do weka, ferramenta utilizada na segunda fase. O
objetivo dessa fase é criar o arquivo arff em cima desses dados já pré-processados.
O funcionamento dessa fase se dá através da exclusão dos dados faltosos, dados
redundantes, seleção de atributos, conversão de campo data nascimento em idade e
categorização dos campos música, filme, hobbie e lugar. A exclusão dos dados faltosos no
conjunto de dados é realizada utilizando o método exclusão de casos, que é um método
simples que consiste em excluir tuplas que possuam células não preenchidas. A exclusão dos
dados redundantes se dá através da exclusão de tuplas com valores iguais. A seleção de
atributos é feita com a escolha de atributos (colunas) cujo conteúdo seja relevante ao processo
de criação da persona, é realizada através do método Exclusão Direta de Casos, onde são
especificados os atributos a serem eliminados. Como a idade é uma informação importante
para uma persona, caso a base não tenha esse dado no formato padrão e sim em formato de
data (data_nascimento) é feita uma conversão dessa data para idade, podendo ser vista no
arquivo arff gerado ao final desta fase. A categorização é uma componente importante dessa
fase, pois ao se ter vários dados que possam fazer parte de uma mesma categoria, a
categorização desses dados proverá um enriquecimento na obtenção de características
similares de um grupo.
Exemplos de categorização: caso um usuário goste da música de Bruno e Marrone e
outro goste de Vitor e Léo, o gosto musical dos dois se enquadra na categoria de música
sertaneja. Ou se um usuário gosta do filme A Proposta e o outro A Verdade Nua e Crua esses
se enquadrarão na categoria Comédia Romântica. A categorização é feita utilizando APIs
disponibilizadas através de Web Service. É utilizada a LastFm para músicas, e a IMDB para
filmes. A categorização de lugar e hobbie são realizadas através de bases locais
correspondentes, criadas para este fim. Ao término dessa fase será gerado um arquivo arff que
servirá de entrada para a fase de mineração, o sistema trata todas as particularidades para
criação deste arquivo. A fase de pré-processamento pode ser visualizada na Figura 17.
48
Figura 17: Fase de pré-processamento – PersonaWeb
Segunda fase – Mineração dos dados
Nesta fase acontece a busca efetiva por conhecimento a partir dos dados, através da
aplicação de algoritmos sobre os mesmos. Neste projeto a tarefa de mineração a ser utilizada
será a de clusterização, que separa os dados da base em clusters, de tal forma que dados de um
cluster compartilhem características comuns que os diferenciem dos dados dos outros
clusters. O funcionamento dessa fase se dá na abertura do arquivo arff gerado na fase anterior
e na escolha da quantidade de clusters a serem formados. Para minerar os dados é utilizado o
algoritmo SimpleKmeans, conforme visto na seção 4.2.2, como mostra a Figura 18.
49
Figura 18: Fase de mineração de dados – PersonaWeb
Terceira fase – Interpretação e construção das cartas
O arquivo texto gerado na fase anterior serve de entrada para esta fase. Ele contém o
resultado da aplicação do algoritmo Simplekmeans sobre os dados. Esse resultado contém o
atributo, o centróide de cada cluster, quantidade de instâncias de cada cluster e porcentagem.
Um exemplo é mostrado na Figura 19.
Figura 19: Arquivo de saída do SimpleKmeans
50
Nessa terceira fase ocorre a leitura desse arquivo texto, de modo a colher informações
dos atributos e centróides, que são dispostos na carta principal nos campos imagem e
descrição. O nome é gerado aleatoriamente a partir de uma base de nomes, de acordo com o
sexo encontrado durante a mineração. As cartas auxiliares são formadas de acordo com a
informação obtida sobre música, filme, hobbie e lugar. Se a categoria da música for MPB,
será feita uma busca no campo música antes da categorização na fase de pré-processamento,
pois a exclusão feita nessa fase é uma exclusão lógica já com o intuito de utilizar os dados
neste momento. É feita uma contagem na música que mais se repete nessa categoria e a
mesma será atribuída à carta. O usuário final apenas clicará em um botão, o qual leva a página
do Google Imagens já com o parâmetro de busca do nome da música encontrado, em seguida
faz o download da imagem escolhida em um loca de sua preferência. Logo após pode ser feito
o upload da imagem e essa será salva na carta correspondente. O mesmo acontece com as
outras três categorias: filme, hobbie e lugar. A Figura 20 mostra essa fase. Ao finalizar o
usuário poderá salvar as personas criadas.
Figura 20: Fase de interpretação e visualização – PersonaWeb
51
Arquitetura
De forma geral, a arquitetura do sistema proposto é composta por camadas, visando o
isolamento das funcionalidades em módulos, e alto grau de desacoplamento. Na Figura 15 são
apresentadas as camadas que o compõem, sendo a do cliente, a lógica e a de persistência. Na
camada do cliente ocorre a submissão de requisições a lógica do sistema. Nela encontra-se a
interface do usuário. A camada lógica é responsável por abranger as regras de negócio da
aplicação, como também se comunicar com a camada de persistência a fim de requisitar
serviços de armazenamento ou busca dos dados. E a camada de persistência responsável por
armazenar os dados da aplicação.
Figura 15: Arquitetura PersonaWeb Na arquitetura do PersonaWeb, a interação inicial do usuário ocorre ao enviar um
script de seu banco de dados através da interface gráfica para a camada lógica da aplicação e
segue ao mesmo ir fazendo uso das funcionalidades do sistema a fim de atingir o objetivo de
criar personas. A camada lógica é responsável por tratar, preparar e requisitar armazenamento
para esses dados, aplicar o algoritmo de clustering e criar as cartas. As tecnologias utilizadas
na camada lógica do PersonaWeb são JSF, Richfaces, Facelets, JDBC e Web Services.
• JSF, framework utilizado no desenvolvimento de aplicações web. Baseia-se em
um modelo de componentes e eventos. Benefícios: uso de eventos com
facilidade, composição, reuso e extensão de componentes e o gerenciamento
do estado da aplicação em nível de componentes [LIMA 2008]. O JSF torna
52
fácil o desenvolvimento através de componentes de interface de usuário, como
também conecta esses componentes a objetos de negócio.
• Richfaces – biblioteca de componentes para aplicações web que utiliza o
framework JSF. Os componentes desta biblioteca vêm com Ajax integrado e
com um suporte a skins que podem deixar as interfaces da aplicação com um
visual padronizado. Ela tira o máximo partido das vantagens do JSF, incluindo
ciclo de vida, validação, conversão, juntamente com a gestão de recursos
estáticos e dinâmicos [JBOSS RICHFACES];
• Facelets – framework de templates JavaServer Faces, baseado em princípios
simples, como transformar páginas (X)HTML em JSF, sem utilizar totalmente
as suas tags. Possui as vantagens do reaproveitamento dos protótipos de telas,
design da página com qualquer editor HTML [LIMA 2008];
• Web Services – tecnologia ideal para comunicação entre sistemas. No caso do
presente projeto, necessário para comunicação entre a lógica do PersonaWeb e
os serviços da LastFM e IMDB, necessários para categorização de alguns
dados da aplicação.
• JDBC – é o padrão da indústria para conectividade de banco de dados
independentes entre a linguagem de programação Java e uma ampla gama de
bancos de dados. A API JDBC fornece um nível de chamada de API para
acessar banco de dados baseado em SQL. No PersonaWeb é responsável por
todo preparo e tratamento dos dados na fase do pré-processamento.
E camada de persistência pelo armazenamento dos dados necessários durante a
execução da aplicação.
Fluxo Navegacional
Nesta seção, apresentaremos o fluxo navegacional do PersonaWeb, mostrando as telas
que serão apresentadas ao usuário no decorrer da utilização da ferramenta.
Inicialmente o usuário é apresentado à tela onde é possível fazer a conexão do seu
script com o banco de dados do servidor. Tem a opção para copiar seu script, caso esteja
iniciando a utilização e tem a opção de escolher seu banco, caso já tenha feito uso de alguma
funcionalidade do sistema, essa tela é apresentada na Figura 21.
53
Figura 21: Tela inicial PersonaWeb
Se o usuário está iniciando, a tela seguinte oferece a opção da escolha da tabela do
banco a ser trabalhada. Se já tiver feito algum uso, o sistema retorna a tabela com as
alterações feitas. E para as duas telas, são dadas as seguintes opções: Listar, Deletar tuplas
inconsistentes, Categorizar, Excluir colunas e Minerar dados, como mostra a Figura 22.
Figura 22: Tela pré-processamento do PersonaWeb
54
Ao clicar no botão “Deletar Tuplas Inconsistentes” aparece uma caixa de diálogo
perguntando se o usuário realmente deseja excluí-las.
O botão “Deletar Colunas” lista as colunas existente na tabela e o usuário as exclui
apenas com um clique no nome da coluna que se deseja remover.
55
O usuário ao clicar no botão categorizar, é mostrada uma lista com as opções das
quatro colunas lugar, filme, hobbie e música e o tipo de categorização que se deseja.
O botão “Minerar Dados” a nível do sistema gera o arquivo arff e a nível do usuário
mostra a tela que se tem a opção para escolher a quantidade de clusters e um botão “Gerar
personas”.
Neste momento ocorre a execução do algoritmo e a visualização da tela de criação das
cartas. Essa é a última tela. É onde são geradas as cartas. Inicialmente aparecem as cartas
apenas com os textos respectivos a cada uma, e um botão escolher imagem – Figura 23. Na
carta principal as imagens estão guardadas numa base local. São apresentadas através de uma
janela que se abre e quando escolhida o usuário clica e ela é salva na carta – Figura 24. Já as
imagens das cartas auxiliares utilizam a api do Google para busca e posterior escolha. Após
isso, o usuário salva a imagem no local de sua preferência, sendo em seguida feito o upload
dessa imagem para a carta. Nessa tela ainda é exibida a quantidade de dados e a porcentagem
que a persona representa. E uma paginação para que de acordo com a quantidade escolhida o
56
usuário possa acessar cada uma. Por fim, o botão salvar, para que depois de prontas, o usuário
possa guardá-las, essa tela é exibida na Figura 25.
Figura 23: Tela para preenchimento das imagens das cartas
Figura 24: Tela para escolha da imagem da carta principal.
58
6 ESTUDO DE CASO Olimpíadas de Jogos Digitais e Educação
A OJE é um consórcio formado pela Jynx, Manifesto, Meantime e CESAR, através da
parceira do Porto Digital com a UFPE. É um empreendimento do Estado de Pernambuco com
o Porto Digital, que juntou a escola e a lan house. E através dessa combinação oferece aos
educandos e educadores uma maneira divertida e inovadora, fazendo uso de jogos digitais, de
possibilidades voltadas para o aproveitamento educacional [MEIRA 2009].
O objetivo da OJE é construir um ambiente colaborativo, onde alunos e professores
aprendam a trabalharem em equipe, como também incentivar a cultura digital na forma
pedagógica, que venha a estimular a curiosidade do aluno pela busca de informações através
da resolução de conteúdos e enigmas, que são abordados no dia a dia na sala de aula.
Características da base de dados
A base de dados da OJE, utilizada nesse experimento, teve agregado a seus dados
alguns dados externos, que durante a fase de pré-processamento foi necessário para enriquecer
os dados, obtendo assim mais informações para o processo. A base, anterior a fase de pré-
processamento, é composta por 23 atributos e 10.617 instâncias. Entre os atributos estão
nome, data de nascimento, sexo, cidade, bairro, série, motivação, tempo de jogo na semana,
lugar que costuma jogar, com que costuma jogar, disponibilidade do laboratório, intenção do
uso do laboratório, estímulo que a OJE oferece, percepção dos conteúdos escolares, mudanças
no dia a dia devido a OJE, enigmas, horário de ver TV, lugar, filme, hobbie, música, perfil,
nome da escola.
A base não poderá ser mostrada por não ter sido dada autorização para isso, sendo
autorizado apenas apresentar os dados em forma de resultado.
Utilizando o PersonaWeb
Inicialmente foi introduzido no PersonaWeb o script da base de dados da OJE, criando
assim o banco, onde foi possível aplicar as opções disponíveis de pré-processamento.
59
A primeira opção foi excluir dados faltosos e remover as tuplas redundantes. A base
no início continha 10.617 instâncias, depois da aplicação dessa opção foram excluídas 2.755
tuplas, das quais 1.843 eram tuplas com valores faltosos e 912 tuplas com valores
redundantes.
Em seguida houve a escolha dos atributos (colunas) necessários ao processo, através
do método Exclusão Direta de Casos, implementada por instrução de exclusão em SQL,
havendo assim a exclusão das colunas desnecessárias. O Quadro 1 mostra os atributos
escolhidos, ou seja, relevantes para o processo e os excluídos, que não agregam valor ao que
se deseja obter.
Quadro 1: Atributos relevantes e atributos excluídos
Atributos relevantes
sexo, motivação, tempo de jogo na semana, lugar que costuma jogar, com que costuma jogar, estímulo que a OJE oferece, percepção dos conteúdos escolares com os jogos, mudanças no dia a dia devido a OJE, enigmas, lugar, filme, hobbie, música
Atributos excluídos
nome, data de nascimento, disponibilidade do laboratório, intenção do uso do laboratório, cidade, bairro, série, perfil, horário de ver TV, nome da escola
Na base trabalhada não há a coluna idade no formato padrão, o sistema assim que o
script foi inserido guarda a coluna datanascimento, para uso posterior, mesmo que a mesma
tenha sido excluída pelo usuário na opção exclusão de colunas, acontece apenas uma exclusão
lógica.
A opção categorizar é um pouco custosa, devido ao uso de web services. O
experimento foi feito em uma máquina com Sistema Operacional Windows e a velocidade da
internet é de 512 kbps. Dentre as quatro categorizações a de filme é a que leva mais tempo,
pois devido a segurança do site, foi necessário implementar um analisador HTML que acessa
a página, salva como string, pega o valor que deseja e depois volta ao dados em busca desse
valor. Para categorizar os 7.862 filmes foram 33 minutos. A categorização das músicas custou
16 minutos. Já hobbie e lugar como são bases locais, a categorização dos dados das duas
colunas custou 7 minutos e 2 segundos. Exemplos da categorização são mostrados a seguir.
61
O sistema gera o arquivo arff ao final do pré-processamento. O arquivo gerado não é
visível ao usuário, mas, será mostrado na Figura 26, para a observação da execução do
62
sistema quanto a conversão de dataNascimento em idade que ocorre durante a formação deste
arquivo.
Figura 26: Arquivo Arff da base da OJE
Depois de aplicadas todas as opções do pré-processamento, o botão minerar dados é
habilitado para o usuário clicar. Ao se clicar nele a tela de escolha da quantidade de clusters é
apresentada. Nesse experimento o responsável pela base de dados da OJE escolheu cinco
clusters, o que equivale à criação de cinco personas.
Para a base utilizada neste experimento, os resultados foram os seguintes:
Gráfico 1: Quantidade e porcentagem dos clusters obtidos
63
Nome Eduarda Qtd. Instâncias 1494 Porcentagem 19% Texto Videogames foi sua motivação para participar da OJE, gosta
de jogar em casa. A OJE a estimula a estudar mais e passou a usar mais o laboratório da escola. Ela acha os enigmas da olimpíada difíceis.
64
Nome Marcos Qtd. Instâncias 1651 Porcentagem 21% Texto O interesse em aprender foi sua motivação para participar da
OJE, gosta de jogar na escola. A OJE o estimula a conversar mais com os professores e passou a achar as aulas mais legais. Ele acha os enigmas da olimpíada um pouco difíceis.
65
Nome João Qtd. Instâncias 1022 Porcentagem 13% Texto O interesse em prêmios foi sua motivação para participar da
OJE, gosta de jogar em casa. A OJE o estimula usar mais o computador e passou a achar as aulas mais legais. Ele acha os enigmas da olimpíada difíceis.
66
Nome Leandro Qtd. Instâncias 1179 Porcentagem 15% Texto O interesse em aprender foi sua motivação para participar da
OJE, gosta de jogar na escola. A OJE o estimula a tira mais dúvidas e passou a usar mais o laboratório. Ele acha os enigmas da olimpíada difíceis.
67
Nome Wesley Qtd. Instâncias 2516 Porcentagem 32% Texto O professor foi sua motivação para participar da OJE, gosta
de jogar em casa. A OJE o estimula a ter mais concentração e passou a participar mais das aulas. Ele acha os enigmas da olimpíada um pouco difíceis.
68
7 CONSIDERAÇÕES FINAIS
É notório que faltam ferramentas de apoio aos processos de design, em particular em
jogos. De certa forma há negligência nas atividades como arte e concepção deixando-as
carentes de processos e/ou ferramentas. Como também existe pouca preocupação em pesquisa
com o usuário, mesmo sabendo o quanto é importante inserir características desses usuários
no projeto, pois assim há um direcionamento para quem realmente irá usufruí-lo. No intuito
de suprir essa carência na fase de concepção foi criada a metodologia XDM. E neste trabalho
foi criada uma ferramenta de apoio a essa metodologia, que além de poder ser integrada a
mesma, inserindo características de potenciais usuários, pode ser tida como mais uma
ferramenta que venha a dá suporte ao processo de design.
A metodologia XDM visa ajudar na concepção de jogos e artefatos digitais. Possui
abordagem de concepção centrada no usuário, onde a primeira fase da metodologia abrange
pesquisa com o usuário, no intuito de obter conhecimento dos mesmos. Inserida na mesma,
está à técnica personas, inserida na forma do modelo Cards Persona. Sendo que esse modelo
possui limitações quanto à criação das personas, pelo fato de todo o processo ser manual, o
que acarreta dificuldades tanto na geração das personas, quanto na análise e visualização dos
dados, caso se tenha uma amostra grande.
Este trabalho teve como objetivo automatizar a geração de personas. A partir deste
objetivo foi desenvolvida uma ferramenta que gerasse essas personas a partir de grandes bases
de dados. Agrega conceitos de Personas e Descoberta de Conhecimento em Bases de Dados, a
fim de suprir necessidades de metodologia de design na etapa de concepção, buscando obter
algum conhecimento sobre o usuário para usá-lo desde a etapa inicial do projeto.
O uso do banco de dados incrementa a pesquisa, pois trata de extrair perfis de dados
reais. O processo de KDD adaptado para a solução proposta oferece facilidade no tratamento
e visualização desses dados. A implantação do resultado da ferramenta PersonaWeb se deu
com uma certa facilidade na ferramenta XDMWeb. Com isso, aumentou satisfatoriamente a
utilização da XDMWeb, já que a execução da mesma ocorre com personas criada a partir de
uma base de dados própria. A solução implementada oferece a XDMWeb mais um motivo
para a mesma ser considerada referência em métodos de design aplicados ao contexto de
jogos digitais.
O experimento feito com a base de dados do Consórcio OJE demonstra a eficácia da
ferramenta. Em cima de uma amostra de mais de dez mil instâncias, extraiu-se cinco personas
69
que beneficiará a equipe através da inclusão de características do usuário no processo de
desenvolvimento dos jogos. Saber o que motiva, qual estímulo oferece e o que os alunos
acham dos enigmas dispostos no portal, dentre outras descobertas, dará referências de como
atender cada vez melhor os alunos, como também adicionar coisas novas de acordo com as
características encontradas.
Contribuição
A pesquisa realizada neste trabalho incorpora Reconhecimento de Padrões, através do
processo de Descoberta de Conhecimento em Bases de Dados ao Processo de Design, como
instrumento para construção de personas. Dessa forma, pode-se destacar como principal
contribuição o uso de Inteligência Artifical em processos de design. O potencial dessa
integração é demonstrado através da ferramenta desenvolvida que é composta de
funcionalidades baseada no processo de KDD que permite agrupar dados de uma base real, de
forma a obter informações que gere algum conhecimento sobre os potenciais usuários de um
jogo. Como também obter essas informações através da visualização em forma de cartas,
podendo já ser integradas a metodologia XDM.
Trabalhos Futuros
Essa dissertação apresentou uma ferramenta para criação de personas. Embora o
objetivo tenha sido alcançado, ainda existe pesquisa ligada a esta dissertação que pode ser
explorada:
• Generalizar a ferramenta para outras áreas do design, não apenas Game Design;
• Ampliar para interagir com redes sociais abertas a fim de obter dados que possam
ser utilizados na geração das personas.
70
8 REFERÊNCIAS [AARSETH 2003] AARSETH, E. Playing research: methodological approaches to game analysis, paper presented at MelbourneDAC, the 5th International Digital Arts and Culture Conference, 19–23 May 2003, Melbourne.
[AMAZONAS 2007] AMAZONAS, D. S. Desenvolvimento de Jogos 3D em Java com a Utilização do Motor Gráfico Irrlicht. Fortaleza, 2007.
[ADAMS e ROLLINGS 2006] ADAMS, Ernest; ROLLINGS, Andrew. Fundamentals of game design. New Jersey: Pearson, 2006.
[ASIMOV 1962] ASIMOV, Morris. 1962. Introduction to Design. Prentice-Hall, New Jersey.
[BRATHWAITE E SCHREIBER 2009] BRAITHWAITE, B.; SCHREIBER, I. Challengers for game designers. Boston: Course Technology, 2009.
[BRIGHETTI 2003] BIGHETTI, Vera S. O Jogo como texto cultural da sociedade de informação. Dissertação de Mestrado, 2003. Pontifícia Universidade Católica de São Paulo.
[BRYCE E RUTTER 2006] BRYCE, J.; RUTTER, J. An introduction to understanding digital games. In: (Ed.). Understanding Digital Games: Sage Publications Ltd., 2006.
[BUSSAB, 1990] BUSSAB, Wilton de Oliveira; MIAZAKI, Édina Shizue; ANDRADE, Dalton Francisco de. Introdução à análise de agrupamentos. São Paulo: Associação Brasileira de Estatística, 1990.
[CALABRIA 2004] CALABRIA, Tina. An introduction to personas and how to create them. 2004. Disponivel em < http://www.steptwo.com.au/papers/kmc_personas/index.html> Acesso em 4 de abril de 2010.
[COOPER 2003] COOPER, A. The Origin of personas. Cooper journal, 2003a.
[COOPER, REIMANN E CRONIN 2007] COOPER, A., REIMANN R., CRONIN D. About Face 3: The Essentials of Interaction Design. John Wiley & Sons, 2007.
71
[FAYYAD 1996] FAYYAD, U. M; PIATETSKY-SHAPIRO, G.; SMYTH, P. From Data Mining to Knowledge Discovery in Databases: An Overview. Knowledge Discovery and Data Mining, Menlo Park: AAAI Press, 1996.
[GOEBEL E GRUENWALD 1999] GOEBEL, M.; GRUENWALD, L. A survey of data mining and knowlodge discovery software tools. SIGKDD Explorations, v. 1, p. 20-33, 1999.
[GOLDSCHMIDT; PASSOS 2005] GOLDSCHMIDT R.; PASSOS E. Data Mining: um guia prático. Rio de Janeiro: Elsevier, 2005.
[GOODWIN 2001] GOODWIN, Kim. Perfecting your personas. Cooper journal, 2001.
[HAN & KAMBER 2001] HAN, J., KAMBER, M., Data Mining: Concepts and Tecniques. Morgan Kaufmann Publishers. San Francisco. EUA. 2001.
[HARRISON 1998] HARRISON, Thomas H. Intranet Data Warehouse. São Paulo: Berkeley Brasil, 1998.
[HUIZINGA 2007] HUIZINGA, J. Homo Ludens: o jogo como elemento da cultura. 5. Perspectiva, 2007.
[HUNTSMAN 2000a] HUNTSMAN, Tim. A primer for the design process, part 1: what to do. In: Gamasutra.com, 2000a.
[HUNTSMAN 2000b] HUNTSMAN, Tim. A primer for the design process, part 2: what to think about. In: Gamasutra.com, 2000b.
[HUNTSMAN 2000c] HUNTSMAN, Tim. A primer for the design process, part 3: what you need. In: Gamasutra.com, 2000c.
[KREITZBERG E LITTLE 2009] KREITZBERG, Charles G; LITTLE, Ambrose. O poder de personas. 2009. Disponível em <http://msdn.microsoft.com/pt-br/magazine/dd569755.aspx>. Acesso em 5 de abril de 2010.
[JAIN AND DUBES 1988] JAIN, A.K. & DUBES, R.C. “Algorithms for Clustering Data”, Prentice Hall, 1988.
72
[JBOSS RICHFACES] JBOSS RICHFACES. Disponível em <www.jboss.org/jbossrichfaces>. Acesso em: 02/10/2010.
[JONES 1992] JONES, John Chris. Design Methods. 2. ed. Indianapolis: Willey, 1992.
[LIMA 2008] LIMA, Aliandro; NELSON, Odilon. XHTM e Facelets. Apresentação do Power Point, Janeiro, 2008.
[LOBACH 2001] LÖBACH, Bernd. Design Industrial: Bases para configuração dos produtos industriais. Tradução Freddy Van Camp. - Rio de Janeiro: Edgard Blücher, 2001.
[LUBAN 2001] LUBAN, Pascal. The right decision at the right time: selecting the right features for a new game project. In: Gamasutra.com, 2001.
[LUBAN 2006] LUBAN, Pascal. Interview with Pascal Luban of The Game Design Studio. Disponível em: http://www.theswapmeet.com/articles/luban.html. Acesso em: 20/06/2010.
[MAGIC THE GATHERING 2007] MAGIC THE GATHERING. Manual de Regras Básico. 10ª Edição. Renton: Wizards of the Coast, 2007. Disponível em Http://www.devir.com.br/magic/pdf/MagicRulebook.pdf Acessado em 21/07/10.
[MEIRA et. al 2009] MEIRA, L., NEVES, A., RAMALHO, G. Lan House na escola: uma olimpíada de jogos digitais e educação. VIII Brazilian Symposium on Games and Digital Entertainment. Rio de Janeiro, RJ – Brazil, October, 8th-10th 2009.
[NETO 2010] NETO, E. J. C. F. XDM WEB – Uma ferramenta web 2.0 de apoio ao processo de concepção de jogos. Recife, março 2010.
[NEVES et. al 2008] NEVES, A. M. M. ; CAMPOS, F.F.C. ; BARROS, S. G. ; CAMPELLO, S. B. ; ARAGÃO, i. ; CASTILLO, L. : XDM Métodos Extensíveis de Design. In: P & D 2008, 2008, São Paulo. Anais do congresso brasileiro de pesquisa e desenvolvimento em design. São Paulo, 2008. v. 1. p. 1-1.
[NEVES 2009] NEVES, André; OLIVEIRA, Bruno S.; FALCÃO, Leo. Pesquisa com usuários no processo de game design em Pernambuco. VII Brazilian Symposium on Games and Digital Entertainment, 2009.
73
[OCHI et al. 2004] OCHI, L. S.; DIAS, C. R.; SOARES, S. F. Clusterização em Mineração de Dados. Programa de Pós-Graduação em Computação - UFF, RJ, 2004.
[OJE] Disponível no endereço: www7.educacao.pe.gov.br/oje. Acesso 14/05/2011
[OLIVEIRA 2010] OLIVEIRA, B. S. Cards Persona: Aplicação da técnica de personas na criação de jogos digitais. Recife, fevereiro 2010. [PENTAHO DATA MINING] Disponível no endereço: http://wiki.pentaho.com/ display/DATAMINING/SimpleKMeans. Acesso 12/04/2011
[PERUCIA 2005] PERUCIA, Alexandre. Desenvolvimento de Jogos Eletrônicos – Teoria e Prática, Porto Alegre, Novatec, 2005.
[PRUITT E ADLIN 2006] PRUITT, J.; ADLIN, T. The persona lifecycle: keeping people in mind throughout product design. San Francisco: Elsevier, 2006.
[QUESENBERY 2004] QUESENBERY, W. Using personas: bringing users alive, STC Usability SIG newsletter – Usability interface, 2004.
[VAN AKEN 2005] VAN AKEN, Joan Ernst. Valid knowledge for the professional design of large and complex design processes. Design Studies, Great Britain, v. 26, n. 4, p.379-404, 4 jul. 2005.
[ZIMMERMAN 2003] ZIMMERMAN, Eric. Play as Research: the iteractive design process. In: LAUREL, Brenda. (Ed.) Design Research: methods and perspectives. Cambridge: MIT Press, 2003.
[WEKA] www.cs.waikato.ac.nz/ml/weka
[WITTEN e FRANK 2005] WITTEN, Ian H.; FRANK, Eibe. Data mining: practical machine learning tools and techniques. Morgan Kaufmann, 2005.