pós-graduação em ciência da computação · ao meu marido, jaildes, pelo apoio e incentivo. ao...

76
Pós-Graduação em Ciência da Computação “PERSONAWEB: ferramenta de criação de personas para auxiliar na concepção de jogos digitais” Por Ana Luiza do Nascimento Leite Dissertação de Mestrado Universidade Federal de Pernambuco [email protected] www.cin.ufpe.br/~posgraduacao RECIFE, JULHO/2011

Upload: others

Post on 07-Aug-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Pós-Graduação em Ciência da Computação

“PERSONAWEB: ferramenta de criação de personas para auxiliar na concepção de jogos digitais”

Por

Ana Luiza do Nascimento Leite

Dissertação de Mestrado

Universidade Federal de Pernambuco [email protected]

www.cin.ufpe.br/~posgraduacao

RECIFE, JULHO/2011

  UNIVERSIDADE FEDERAL DE PERNAMBUCO 

CENTRO DE INFORMÁTICA PÓS‐GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO  

ANA LUIZA DO NASCIMENTO LEITE 

“PersonaWeb – ferramenta de criação de personas para auxiliar na 

concepção de jogos digitais” 

ESTE TRABALHO FOI APRESENTADO À PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO DO CENTRO DE INFORMÁTICA DA UNIVERSIDADE FEDERAL DE PERNAMBUCO COMO REQUISITO PARCIAL PARA OBTENÇÃO DO GRAU DE MESTRE EM CIÊNCIA DA COMPUTAÇÃO.

ORIENTADOR: SILVIO ROMERO LEMOS MEIRA, D.Sc. CO-ORIENTADOR: ANDRÉ M. MARQUES DAS NEVES, D.Sc.

RECIFE, JULHO/2011

Dedico este trabalho a meu filho, Augusto César.

AGRADECIMENTOS

Ao meu marido, Jaildes, pelo apoio e incentivo.

Ao meu filho, Augusto César, pelas horas que tive de deixá-lo para dedicar-me a

conclusão deste trabalho.

A minha mãe, Sônia, minhas irmãs, Isabel e Poliana e meu sobrinho, José Luiz, por

sempre estarem ao meu lado e servirem de incentivo nos momentos mais difíceis durante este

processo.

Ao meu pai, Luis, que faleceu sem chegar a ver esta minha conquista, mas que sempre

deixou claro seu orgulho.

A Ricardo, por confiar e incentivar a ir sempre além nos meus estudos.

A Silvio Meira e André Neves, pela orientação, que foi essencial ao desenvolvimento

deste trabalho.

Aos amigos, Francisco Oliveira, Anderson Rocha, Simone Araujo, Francisco Melo,

Milton, Márcio, Camila e João.

A André Marllus pela força enorme que deu, ajuda importante na hora certa.

A Noca e Jane, que muitas vezes cuidaram do meu filho para eu poder escrever e

implementar.

A todos, meu sincero obrigada.

RESUMO

A Indústria de Jogos Digitais é um mercado em constante ascensão. Essa perspectiva destaca

o interesse teórico e empírico de muitos pesquisadores com jogos digitais, apresentando

algumas questões, debates sobre metodologias e aspectos teóricos. Um dos maiores desafios

no desenvolvimento de jogos é a concepção, etapa essencial no ciclo de produção de um jogo,

que é muitas vezes deixada de lado. Outro problema é que há pouca preocupação com

pesquisa do usuário e experiência de uso do jogador, o que se configura num problema mais

humano do que técnico. XDM, denominada eXtensible Design Methods é uma metodologia

desenvolvida nos últimos anos no Departamento de Design da UFPE, que visa ajudar na

concepção de jogos e artefatos digitais e possui abordagem centrada no usuário através da

técnica personas. A importância de focar na experiência do usuário é que o segredo de um

bom projeto é conhecer bem as pessoas que irão usufruir do mesmo. O presente trabalho dá

enfoque a implementação de um sistema, o PersonaWeb, que cria personas de forma

automática, levando em consideração algumas particularidades que compõem seu cenário,

resultando em cartas, que são úteis na metodologia XDM.

Palavras-chave: Jogos digitais – Metodologia de design – XDM – Personas

ABSTRACT

The Digital Game Industry is a constantly ascending market. This perspective highlights the

theoretical and empirical interest of many researchers with digital games, featuring some

questions, discussions on methodologies and theoretical aspects. One of the biggest

challenges in game development is the design, essential step in the production cycle of a

game, which is often overlooked. Another problem is that there is little concern with user

research and user experience of the player, which configures a problem more human than

technical. XDM, called eXtensible Design Methods is a methodology developed in recent

years in the Departamento de Design of UFPE, which aims to help in the design of games and

digital artifacts and features user-centered design through the personas technique. The

importance of focusing on the user experience is that the secret of a good design is to know

the people who will enjoy it. This paper focuses the implementation of a system, the

PersonaWeb, which automatically creates personas, taking into account some peculiarities

that make its scenario, resulting in cards, which are useful in the methodology XDM.

Keywords: Digital Game – Design Methodology – XDM – Personas

SUMÁRIO

 

1  INTRODUÇÃO ............................................................................................ 13 1.1  Motivação ................................................................................................................. 13 1.2  Objetivo .................................................................................................................... 14 1.3  Estrutura do Trabalho ............................................................................................... 14

2  MÉTODOS GERAIS DE DESIGN ............................................................. 16 

2.1  Métodos de design .................................................................................................... 16 2.1.1  Asimov ................................................................................................................. 16 2.1.2  Lobach .................................................................................................................. 16 2.1.3  Jones ..................................................................................................................... 17 

2.2  Metodologias de Design para Jogos ......................................................................... 17 2.2.1  Tim Hutsman ........................................................................................................ 18 2.2.2  Pascal Luban ......................................................................................................... 19 2.2.3  Eric Zimmerman ................................................................................................... 20 2.2.4  Ernest Adams e Andrew Rollings ........................................................................ 20 2.2.5  Brathwaite e Ian Schreiber ................................................................................... 21 

2.3  XDM WEB – GDRLab UFPE ................................................................................. 22 2.4  Considerações finais ................................................................................................. 24

3  PERSONAS .................................................................................................. 25 

3.1  Sobre a técnica .......................................................................................................... 25 3.2  Cards Persona ........................................................................................................... 28 

3.2.1  Inspiração ............................................................................................................. 28 3.2.2  Descrição do modelo ............................................................................................ 29 3.2.3  Cartas .................................................................................................................... 30 3.2.4  Limitações ............................................................................................................ 30 

3.3  Considerações finais ................................................................................................. 32 4  KDD E MINERAÇÃO DE DADOS ........................................................... 33 

4.1  Descoberta de Conhecimento em Bases de Dados ................................................... 33 4.2  Mineração de dados .................................................................................................. 34 

4.2.1  Classificação ......................................................................................................... 35 4.2.2  Regressão .............................................................................................................. 36 4.2.3  Agrupamento (Clustering) .................................................................................... 37 

4.3  Considerações finais ................................................................................................. 39 5  PERSONAWEB ........................................................................................... 40 

5.1  Recursos utilizados pela PersonaWeb ...................................................................... 40 5.1.1  Weka ..................................................................................................................... 40 5.1.2  SimpleKmeans ...................................................................................................... 42 5.1.3  IMDB .................................................................................................................... 43 5.1.4  LastFM ................................................................................................................. 44 

5.2  Descrição da ferramenta ........................................................................................... 45 5.2.1  Primeira fase – Pré-processamento....................................................................... 47 5.2.2  Segunda fase – Mineração dos dados ................................................................... 48 

5.2.3  Terceira fase – Interpretação e construção das cartas ........................................... 49 5.3  Arquitetura ................................................................................................................ 51 5.4  Fluxo Navegacional .................................................................................................. 52

6  ESTUDO DE CASO .................................................................................... 58 

6.1  Olimpíadas de Jogos Digitais e Educação ................................................................ 58 6.2  Características da base de dados ............................................................................... 58 6.3  Utilizando o PersonaWeb ......................................................................................... 58

7  CONSIDERAÇÕES FINAIS ....................................................................... 68 

7.1  Contribuição ............................................................................................................. 69 7.2  Trabalhos Futuros ..................................................................................................... 69

8  REFERÊNCIAS ........................................................................................... 70 

 

LISTA DE FIGURAS

Figura 1: Etapas do desenvolvimento de jogos .................................................................. 17

Figura 2: Processo iterativo de design ................................................................................ 19

Figura 3: Processo de design de jogos digitais ................................................................... 20

Figura 4: Tela da ferramenta XDM WEB (Persona e seu cenário) ..................................... 22

Figura 5: Tela do XDM Web completa .............................................................................. 22

Figura 6: Fragmento de persona apresentada na forma tradicional ................................... 24

Figura 7: Exemplo da carta de um planeswalker Jace Belen .............................................. 27

Figura 8: Exemplo da carta principal ................................................................................ 29

Figura 9: Exemplo de cartas auxiliares .............................................................................. 29

Figura 10: Etapas do processo de KDD ............................................................................ 32

Figura 11: Exemplo de uma árvore de decisão .................................................................. 36

Figura 12: Exemplo de um arquivo arff ............................................................................. 37

Figura 13: Fluxograma do Algoritmo K-means ................................................................. 40

Figura 14: Fragmento dos métodos da API da LastFM ..................................................... 41

Figura 15: Arquitetura PersonaWeb .................................................................................. 42

Figura 16: Fases do PersonaWeb ........................................................................................... 44

Figura 17: Fase de pré-processamento – PersonaWeb ....................................................... 46

Figura 18: Fase de mineração de dados – PersonaWeb ...................................................... 47

Figura 19: Arquivo de saída do SimpleKmeans ................................................................ 47

Figura 20: Fase de interpretação e visualização – PersonaWeb ......................................... 48

Figura 21: Tela inicial PersonaWeb .................................................................................... 49

Figura 22: Tela pré-processamento do PersonaWeb .......................................................... 49

Figura 23: Tela para preenchimento das imagens das cartas ............................................. 52

Figura 24: Tela para escolha da imagem da carta principal ............................................... 52

Figura 25: Tela Final do PersonaWeb ................................................................................ 53

Figura 26: Arquivo Arff da base da OJE ........................................................................... 58

LISTA DE TABELAS

Tabela 1: Exemplo de uma base de dados ......................................................................... 33

LISTA DE QUADROS

Quadro 1: Atributos relevantes e atributos excluídos ............................................................ 55

LISTA DE GRÁFICOS

Gráfico 1: Quantidade e porcentagem dos clusters obtidos ............................................... 58

LISTA DE ABREVIAÇÕES

UFPE Universidade Federal de Pernambuco

GDRLab Game Design Research Lab

UPA Usability Professionals' Association

OJE Olimpíada de Jogos Digitais e Educação

KDD Knowledge discovery in databases

WEKA Waikato Environment for Knowledge Analysis

ARFF Attribute-Relation File Format

XML eXtensible Markup Language

API Application Programming Interface

ISO International Organization for Standardization

IMDB Internet Movie Database

JSF JavaServer Faces

JDBC Java Database Connectivity

13

1 INTRODUÇÃO Este capítulo relata as principais motivações para realização deste trabalho, mostra o objetivo

e, mostra como está estruturada o restante desta dissertação.

Motivação

O jogo é uma forma de prazer e divertimento mais primitivo do que a cultura

[HUIZINGA 2007]. É um processo essencial na socialização e formação da personalidade do

indivíduo [BRIGHETTI 2003].

Na década de 70, surgiram os jogos digitais. A sua propagação se deu devido ao

surgimento de consoles em espaços domésticos, que serviam de plataforma para sua

execução. Aarseth destaca um amplo interesse pelos jogos digitais [AARSETH 2003]. Essa

perspectiva destaca o interesse teórico e empírico de muito pesquisadores com jogos digitais,

cada um apresentando debates sobre metodologias, perspectivas teóricas e questões que

buscam responder sobre o mesmo [BRYCE e RUTTER 2006].

Entre os três maiores desafios no desenvolvimento de jogos, está o processo de

concepção de jogos, etapa muito importante no ciclo de produção de um jogo, que é muitas

vezes deixada de lado e que é essencial para maturidade da empresa [LUBAN 2006]. Neste

trabalho são mostradas algumas metodologias de desenvolvimento de jogos, que mostram

estudos relacionados ao desenvolvimento, onde é possível ver algumas dificuldades no

projeto do jogo, como pouca preocupação com a experiência de uso do jogador. Também será

mostrada uma metodologia, resultado de pesquisas desenvolvidas nos últimos anos no

Departamento de Design da UFPE, denominada eXtensible Design Methods - XDM.

XDM é um processo de design adequado à contemporaneidade cibernética [NEVES

2008]. Visa ajudar na concepção de jogos e artefatos digitais (foco inicial da ferramenta).

Possui abordagem de concepção centrada no usuário, onde a primeira fase da metodologia

abrange pesquisa com o usuário. Inserida na mesma, está a técnica de personas, objeto de

estudo do presente trabalho, que são arquétipos, cuja metas e padrões de comportamento,

servem como guia para orientação das decisões sobre recursos do produto, navegação,

interação e até mesmo design visual [GOODWIN 2001].

O Estado de Pernambuco possui por volta de 10 empresas de jogos, dentre elas se

destacam a Manifesto, a i2, a Playlore, a Preloud, a Meantime, a Jynx. A OJE - Olimpíadas

14

de jogos de Pernambuco [NEVES 2009] é um consórcio formado pela Jynx, Manifesto,

Meantime e CESAR, através da parceira do Porto Digital com a UFPE. É um

empreendimento do Estado de Pernambuco com o Porto Digital, voltado para alunos e

professores da rede de ensino, desenvolvido em forma de uma gincana de jogos digitais, onde

o principal interesse é estimular o aprendizado e participação dos alunos e já conta com mais

de 100.000 usuários online [OJE].

O Departamento de Design da UFPE, através do GDRLab, motiva-se a fazer pesquisas

de métodos e ferramentas que venham a melhorar a competitividade das empresas de jogos

pernambucanas [NEVES 2009]. A metodologia XDM, citada anteriormente, é o resultado de

uma dessas pesquisas. Essa metodologia utiliza a técnica de personas através do modelo

Cards Persona. Sendo que o mesmo possui limitações quanto à criação das personas, pelo fato

de todo o processo ser manual, o que acarreta dificuldades tanto na geração das personas,

quanto na análise e visualização dos dados, caso se tenha uma amostra grande. O presente

trabalho irá desenvolver uma melhoria para essa metodologia, o qual automatizará a criação

dessas personas, fazendo uso da base de dados do Consórcio da Olimpíada de Jogos Digitais e

Educação. A solução proposta possui um processo próprio de pré-processamento,

interpretação e criação das personas, essa última com base na metodologia XDM, e a fase de

mineração de dados implementada a partir da API da Weka.

Objetivo

Esta pesquisa tem como objetivo automatizar a construção de personas, no intuito de

auxiliar na concepção de jogos digitais, através do uso da solução proposta na metodologia

XDM WEB.

Estrutura do Trabalho

Este trabalho será apresentado da seguinte forma: o capítulo 2 discorre sobre o estado

da arte: metodologias de design, metodologias de design para jogos e personas. O capítulo 3

fala sobre Personas e o modelo Cards Persona. O capítulo 4 faz uma explanação sobre o

Processo de Descoberta de Conhecimento em Base de Dados e descreve a ferramenta

proposta neste trabalho, PersonaWeb, enquanto que o capítulo 5 mostra os resultados obtidos

15

na aplicação da base de dados da OJE na ferramenta PersonaWeb. E o capítulo 6 faz algumas

considerações finais.

16

2 MÉTODOS GERAIS DE DESIGN

Este capítulo irá abordar de forma geral métodos de design e metodologias de design

para jogos. Métodos de design

Os primeiros estudos sobre métodos de design começaram na década de 60, devido a

complexidade de desenvolvimento de um novo produto, que dava maior responsabilidade ao

designer sobre a sua concepção [VAN AKEN 2005]. Todo esse período teve suas gerações, a

que o processo de design era estruturado de forma linear, em seguida veio a geração em que

as fases eram cíclicas. Com as pesquisas em metodologia e o amadurecimento da atividade do

design, vêem-se agora métodos centrados no usuário, argumentativos, orientados pela

satisfação, onde contam com o usuário como parceiro.

Algumas metodologias de design existentes na literatura e seus respectivos autores

serão apresentados a seguir.

Asimov

Modelo prescritivo, composto por três fases, sendo que dentro de cada fase há os

procedimentos de análise, sintetização, avaliação, decisão, aperfeiçoamento e revisão

[ASIMOV 1962].

I. Levantamento das necessidades do projeto e definição de parâmetros de

design. Geração de alternativas analisadas pela viabilidade econômica;

II. Preliminar de design. Escolha da solução que tem o melhor conceito;

III. Linha e produção. Elaboração de detalhes menores do design e criação e

avaliação de um protótipo.

Lobach

Divide o processo de design em quatro fases referente à fase de concepção.

I. Análise do problema. Levantamento das variáveis do projeto e suas influências

para a configuração do novo produto;

17

II. Geração de alternativas. Busca das melhores idéias para solução do problema,

devem fluir livremente, fazendo uso de todo um processo criativo;

III. Avaliação das alternativas. As idéias geradas são analisadas até que ocorra a

escolha da melhor solução;

IV. Realização da solução. Construção do primeiro protótipo com documentação

contendo suas especificações técnicas.

Esse processo é iterativo, as fases interagem entre si com avanços e retrocessos

[LOBACH 2001].

Jones

Divide o processo de concepção em três fases: análise (dividir o problema em

pedaços), síntese (reagrupar os problemas de várias maneiras) e avaliação (testes da aplicação

prática de cada novo reagrupamento).

Jones [JONES 1992] denomina essas fases em:

I. Divergência. Testar a estabilidade e instabilidade de tudo que está ligado ao

produto, a fim de identificar possíveis caminhos a serem seguidos junto aos

usuários, mercado, produtores e patrocinadores do projeto;

II. Transformação. O projeto deve ser guiado de acordo com uma idéia central.

Objetivos e limites do projeto são definidos. Nessa fase ocorre a divisão do

problema em sub-problemas a fim de quebrar a complexidade;

III. Convergência. Agrupamento das informações colhidas, redução de incertezas

secundárias, a fim de escolher dentre as várias alternativas a que será realizada.

Compreender as falhas que um novo produto poderá apresentar e tentar corrigi-las, a

fim de evitar um aprendizado tardio é um dos principais benefícios de fazer uso de

metodologias de concepção [JONES 1992].

Metodologias de Design para Jogos

Esforços vêm sendo feito quanto a métodos que melhor contribuam para a concepção,

desenvolvimento e avaliação ao longo do processo de um jogo. Braimstorming, Game Design,

Document Design, Cronograma, Level Design, Beta, Teste, Versão final e Demo são as

18

etapas de desenvolvimento de um jogo [PERUCIA 2005]. Essas etapas podem ser

visualizadas na Figura 1.

Figura 1: Etapas do desenvolvimento de jogos [AMAZONAS 2007]

Serão mostradas a seguir opiniões de autores que apresentam trabalhos relacionados a

alguma das etapas do processo de desenvolvimento de jogos.

Tim Hutsman

Divide o processo de design em três seções: o que fazer para preparar um jogo, o que

pensar enquanto está fazendo o jogo, e o que necessita para definir o mesmo, ou seja, o que

fazer, em que pensar e como avaliar necessidades. Para saber o que precisa para o jogo, é

necessário ter um conhecimento do que está acontecendo ao redor. Conhecer o mercado, saber

o que a empresa quer ou o que não quer. É uma fase para perguntas, tipo: quais as tendências

atuais, o que os jogadores estão procurando (ter uma idéia sobre o que as pessoas querem) e

quais ferramentas atuais se tem acesso. Pensar é estar envolvido com o processo de

concepção. É estar atento a detalhes como: boa quantidade de conteúdo, equilíbrio entre

níveis de dificuldades. O autor destaca ainda que para se ter uma visão geral dos riscos e

minimizá-los é necessário vincular o game design com orçamento de projeto e tempo. Avaliar

19

as necessidades nada mais é do que ver o que é preciso para se chegar à definição do jogo

[HUTSMAN 2000].

Hustman dá ainda algumas dicas, como:

• não se deve complicar um jogo, quando dá para ajudar através de enredo,

regras e controles, tentar reutilizar o que de melhor já foi implementado em

outros jogos;

• deixar o controle com o jogador, evitando explicações que em nada

contribuem;

• ter conhecimento de todos os tipos de controles que o usuário terá para jogar, e

avisar antes ao usuário, caso ocorra alguma quebra ou se estabeleça novas

regras.

“Não se é um bom design apenas quando se tem um bom conjunto de idéias, e sim

quando se consegue implementá-las”

Pascal Luban

Diante das divergências de opiniões entre os envolvidos no projeto do jogo, Luban

propõe um método para promover o processo de criatividade, construindo um consenso na

equipe, tentando identificar as melhores escolhas. Procura-se deixar a etapa de concepção

mais transparente, permitir a todos os envolvidos ver o que e como se estão produzindo idéias.

O método está dividido em quatro etapas. 1ª etapa – definir objetivos e organizá-los:

aqui ocorre a preparação da equipe. 2ª etapa – identificar os parâmetros e pesquisar seus

valores: ou seja, identificar as características do jogo e valores associados. Essa é uma etapa

importante, e deve haver clareza entre os parâmetros. 3ª etapa – filtragem de idéias e definição

de preferências: na etapa anterior é feita uma pesquisa de valores para os parâmetros. Na

etapa atual é feita uma análise de combinação entre os valores de cada parâmetro, onde ocorre

a exclusão de pares de valores incompatíveis e a definição de preferências por pares de

valores que parecem promissores. 4ª etapa: análise de hipóteses de acordo com prioridades:

estabelece um conjunto de critérios a fim de definir o melhor conceito possível. Em seguida,

atribui-se pesos a cada critério. Posteriormente, ocorre a conciliação das hipóteses, já que

podem ocorrer divergências, daí cada hipótese deve ser avaliada por ângulos diferentes: tanto

os gestores quanto os jogadores. E após a melhor escolha, a hipótese conceitual do jogo

poderá ser detalhada com segurança, já que conta com o respaldo de todos da equipe

[LUBAN 2001].

20

Eric Zimmerman

Zimmerman busca desenvolver um jogo através de um ciclo iterativo, baseado na

prototipação, análise e refinamento ao longo do processo até se encontrar o estágio ideal. O

processo iterativo está representado na Figura 2. O design iterativo em jogos significa

playtesting, ou seja, jogar o jogo. Durante o processo de concepção e desenvolvimento do

jogo, ele precisa ser jogado, seja pela equipe, pelo design, por outras pessoas do escritório,

visitantes, o objetivo nesse caso é observar e questionar e em seguida ajustar e testar

novamente. Esse processo iterativo irá resultar em um produto robusto e bem sucedido. É

importante ter a experiência dos jogadores jogando. Isso possibilita a investigação e

experimentação, permitindo a descoberta de respostas para perguntas que nem se tinha idéia,

tornando uma poderosa forma de pesquisa em design [ZIMMERMAN 2003].

Figura 2: Processo iterativo de design [ZIMMERMAN 2003]

Ernest Adams e Andrew Rollings

Game design é o processo de: imaginar um jogo, definir a forma como ele funciona,

descrever os elementos que compõem o jogo e transmitir as informações para a equipe que

construirá o jogo. A concepção do jogo requer tanto criatividade quanto planejamento

cuidadoso. O game design reúne as melhores idéias de uma equipe. A metodologia proposta

Prototipar

Analisar

Refinar

21

por esses autores é a de criação de jogos centrado no jogador. A concepção de um jogador

imaginário permite que o designer tenha a tarefa de entreter e criar empatia junto ao mesmo

[ADAMS e ROLLINGS 2006].

Ao se produzir um jogo com uma abordagem centrada no usuário, deve-se evitar dois

erros: o primeiro é pensar que quem está produzindo o jogo é o próprio jogador. O que deve

ser feito são pesquisas que mostrem o público a ser atingido. O segundo erro é ter o jogador

como oponente. Hoje os jogos são vistos como ferramentas de passatempo, forma de

entretenimento, ou seja, além dos desafios, procura-se socialização e interação entre os

jogadores.

Concepção (definição do estilo, gênero, público-alvo, papel do jogador e criação do

mundo ficcional), elaboração (define a maior parte de detalhes do jogo, adiciona

características se necessário– e gera testes para todos esses conceitos) e ajuste (pequenos

ajustes - exclui ou melhora alguns conceitos). São os três estágios do processo de design

centrado no jogador proposto por Adam e Rollings, como mostra a Figura 3.

Figura 3: Processo de design de jogos digitais [ADAMS e ROLLINGS 2006]

Brathwaite e Ian Schreiber

Focalizam mais no mercado e sugerem uma pesquisa de público-alvo para o jogo,

tanto na fase inicial como na fase de desenvolvimento. Indicam questões chaves a serem

respondidas, como: foco de audiência e classificação pretendida pelo jogo, existência da pré-

Concepção Elaboração

Ajuste

22

concepção de gênero ou categoria e se existe alguma particularidade que se deseja ver no jogo

[BRATHWAITE e SCHREIBER 2009].

XDM WEB – GDRLab UFPE

O Departamento de Design da UFPE, através do GDRLab, motiva-se a fazer pesquisas

de métodos e ferramentas de design aplicados à concepção de mídia digital, com ênfase em

jogos digitais [NEVES 2009]. A metodologia XDM, é o resultado de uma dessas pesquisas.

eXtensible Design Methods –XDM é uma metodologia que auxilia o processo de

concepção de jogos e artefatos digitais. Possui uma abordagem centrada no usuário e é

inspirada nos jogos de cartas colecionáveis. O conceito de extensible dessa metodologia está

relacionado ao fato de que o design pode utilizar sub-conjuntos dos métodos que a mesma

possui, como também adicionar novos [NEVES 2008].

Esta metodologia ganhou uma versão digital, com o objetivo de criar jogos digitais de

forma mais simples e rápida, a XDM WEB. Essa ferramenta inicia-se com a escolha da

persona apropriada. Cada persona é bem detalhada, composta de outras cartas que constituem

seu cenário, como: filmes, lugares, hobbies e músicas, a Figura 4 mostra essa tela. Essas

cartas foram criadas de acordo com o modelo Cards Persona (será detalhado no próximo

capítulo). Depois da seleção da Persona, os designers escolhem referências para o produto a

ser criado, e a mesma é classificada com os mesmos conceitos antagônicos da etapa anterior,

fazendo assim uma associação às preferências da persona. A etapa seguinte às referências é a

escolha aleatória das cartas de biônica e cinética – apresentam elementos externos para

servirem de inspiração na composição do produto. Todas as cartas servirão para montar a

Caixa Morfológica, apresentada na Figura 5, também chamada de Creative Board, que tem a

persona como centro, a fim de oferecer subsídios para a criação livre de várias alternativas

[NETO 2010].

23

Figura 4: Tela da ferramenta XDM WEB (Persona e seu cenário)

Figura 5: Tela do XDM Web completa [NETO 2010]

24

Considerações finais

Neste capítulo foram apresentadas de forma geral as metodologias de design e

metodologia de design para jogos. Com o amadurecimento das atividades de design, é

possível notar a inserção de novos métodos com foco no usuário. Como também em relação a

jogos, métodos que melhor contribuam para o processo de desenvolvimento, desde a

concepção até a avaliação. Dentre as metodologias de jogos, foi apresentada a XDMWEB,

metodologia que possui abordagem centrada no usuário, utilizando a técnica personas, através

do modelo Cards Persona. No capítulo seguinte será apresentada esta técnica. Como também

será mostrado o modelo Cards Persona – descrição, inspiração e limitações.

25

3 PERSONAS Sobre a técnica

A técnica Personas foi introduzida por Alan Cooper, no livro The Inmates are Running

the Asylum, em 1998, como um instrumento prático de design de interação. Ganhou

rapidamente popularidade por seu poder e eficácia [COOPER 2003].

Persona é um arquétipo do usuário que ajuda a orientar as decisões quanto a recursos,

navegação, interação e design visual. Ao se projetar para esse arquétipo, as metas e padrões

estando bem compreendidos, poderá ocorrer a satisfação do grupo [GOODWIN 2001].

Os arquétipos que Personas representam são compostos com base em dados recolhidos

a partir do comportamento de usuários reais em entrevistas etnográficas. Apesar de possuir

um conceito simples, deve ser aplicado com uma sofisticação, já que personas identificam

padrões significativos no comportamento do usuário [COOPER, REIMANN e CRONIN

2007]. Um exemplo de persona pode ser visualizado na Figura 6.

Personas possibilitam construir suposições e conhecimento sobre usuários, tornando

significativa a comunicação da equipe sobre o usuário, o que vem a evitar que a equipe de

desenvolvimento use o seu próprio perfil de especialista no projeto. É possível projetar para

um pequeno número de usuários específicos, porém atendendo uma grande quantidade de

usuários [PRUITT e ADLIN 2006].

Quesenbery [QUESENBERY 2004] afirma que personas poderiam ser compostas de

informações da própria equipe, como também incrementá-las com histórias verdadeiras ou

fictícias. O que vem a ser discordado por Pruitt e Adlin [PRUITT e ADLIN 2006] que

defendem informações reais dos usuários para definição das personas.

Como ferramenta de design, Personas ajudam a determinar [COOPER, REIMANN e

CRONIN 2007]:

• o que um produto deve fazer e como se comportar;

• a comunicação entre partes interessadas, programadores, designers e outros;

• a manter o design centrado no usuário nas etapas do processo;

• a eficácia do projeto e contribuem para outras ações relacionadas com o

produto, como marketing e vendas.

26

Figura 6: Fragmento de persona apresentada na forma tradicional [PRUITT; ADLIN, 2006]

Dois processos de criação de personas serão descritos a seguir. O primeiro é baseado

na identificação de padrões entre usuários, definindo tipos que possibilitam a organização e

prioridade de cada persona [COOPER, REIMANN e CRONIN 2007]. O segundo considera

esse primeiro processo, porém aplicado em um ciclo de vida [PRUITT e ADLIN 2006].

O primeiro processo é resultado da aplicação da técnica na Empresa Cooper, que

define os seguintes passos [COOPER, REIMANN e CRONIN 2007]:

• Identificação de variáveis comportamentais (atividades: o que o usuário faz e

com que frequência; atitudes: pensamento do usuário sobre o domínio do

produto e da tecnologia; aptidões: nível educacional, treinamento e capacidade

de aprendizado do usuário; motivação: porque o usuário está comprometido

com o domínio do produto e habilidades: capacidade do usuário em relação ao

domínio do produto);

27

• Mapeamento dos entrevistados com as variáveis comportamentais (mapear

cada usuário com cada variável, a fim de agrupar comportamentos

semelhantes);

• Identificação de padrões comportamentais significativos;

• Sintetizar características e objetivos relevantes (detalhar dados de cada padrão

significante, neste momento define nome, sobrenome e ilustração);

• Verificar redundância e completude (identificar falhas e remover

redundâncias);

• Expandir descrição de atributos e comportamentos (narrar em terceira pessoa

para equipe atitudes, necessidades e problemas das personas);

• Definir tipos de personas (primária: representa o alvo primário para o design

de interface; secundária: necessidades adicionais de usuários que podem ser

adicionados ao produto sem interferir na primária; suplementar: nem são

primários nem secundários e sim suplementares; cliente: necessidade de

clientes e não de usuários finais; servida: usuários afetados pelo uso do

produto; negativa: tipos específicos de usuário o qual o produto não serve).

O segundo divide o ciclo de vida da Persona em cinco fases. É um processo cíclico

com etapas sequenciais [PRUITT e ADLIN 2006].

• Planejamento familiar: - criar uma equipe que irá trabalhar na construção de

personas, - pesquisar a própria empresa para avaliar problemas e necessidade, -

pesquisa do usuário e identificação de dados que servirá para construção das

personas;

• Concepção e gestação: - quantas personas serão necessárias criar, comunicar as

informações chaves, - que qualidades e elementos descritivos serão inclusos no

documento de personas, - priorizar e validar as personas, - decidir quais

personas estão prontas para ser introduzida na equipe de produção;

• Aniversário e maturação: - organizar as atividades de aniversário, maturação e

maioridade, - introduzir as personas na equipe, - assegurar a compreensão,

respeito e uso das personas, - gerenciar pequenas mudanças sem que seja

mudado o foco da persona;

28

• Maioridade: - trabalhar a persona junto com o grupo, - usar as personas para

ajudar no planejamento, produção e avaliação do produto;

• Realização de tempo de vida e aposentadoria: - avaliar a efetividade do método

e avaliar reuso ou aposentadoria para um próximo projeto.

Personas permitem identificar grupos distintos de usuários e construir usuários

fictícios para representar cada grupo [CALABRIA 2004]. Por isso é melhor manter um

número pequeno de personas, já que um grande conjunto poderá se tornar problemático.

Vantagens no uso de personas: metas e necessidades do usuário tornam-se ponto

comum para equipe; são rápidos para desenvolver e trocar necessidades de usuários; ajudam a

criar o que o usuário irá verdadeiramente fazer uso; priorizam esforços de design; diminuem

as diferenças de opiniões; diminuem a frequência dos testes de usabilidade, já que podem

avaliar com o uso das mesmas [CALABRIA 2004].

Problemas como os descritos a seguir podem ser observados quando as personas não

são bem construídas ou não aplicadas ao projeto: não aceitação do líder da equipe, quando as

personas não possuem credibilidade ou quando a equipe não sabe utilizá-la de forma eficiente

[PRUITT e ADLIN 2006].

Persona funciona muito bem, por ser poderosa quanto à criação de modelos do público

alvo. Tendo a capacidade de prever comportamentos, poderão fazer inferências sobre como os

usuários irão reagir à escolha de design feita [KREITZBERG e LITTLE 2009].

Cards Persona

Nesta seção será apresentado o modelo Cards Persona, utilizado para inserção das

personas na metodologia XDM.

Inspiração

Personas foi o método escolhido como base para esta técnica. No entanto, a mesma

apresentava carência quanto a ter pouca quantidade de imagens e ilustrações, como também

não ter reaproveitamento dos dados. Para suprir a questão de imagens e ilustrações levou-se

em consideração abordagens propostas por Baxter (1998) e Chipchase (2009), ambos

29

descreviam hábitos e escolhas de pessoas com imagens ao invés de palavras. Com a inserção

de imagens tornou-se maior a ficha de personas, tornando mais difícil a reutilização dos

dados. A solução para isso veio através da inspiração das cartas do jogo “Magic the

Gathering”. A carta desse jogo é composta por características básicas do personagem como

nome, imagem, atributos, poderes, etc. Junto com esta carta, são inseridas na mesa de jogo

cartas de tipos variados como: itens, magias, terrenos, etc [MAGIC THE GATHERING

2007]. Exemplo na Figura 7.

Figura 7: Exemplo da carta de um planeswalker Jace Belen [OLIVEIRA 2010]

Característica deste jogo utilizada no método Cards Persona: a carta principal. O

método teria como carta principal a persona em si, contendo nome, foto e características

básicas, como mostra a Figura 8, e também códigos correspondentes a cartas auxiliares

(variáveis definidas inicialmente no processo: lugar, roupa, filme, etc), como mostra a Figura

9.

Descrição do modelo

A confecção de um conjunto de cartas de Personas segue os seguintes passos

[OLIVEIRA 2010]:

30

1. Definição das categorias (cartas) auxiliares à persona – define características

do conjunto a ser criado, a partir disso saberá a quantidade dos conjuntos de

cartas auxiliares serão necessárias. Essa fase serve como base para criação de

perguntas para fase seguinte;

2. Pesquisa com usuários – nessa fase entra-se em contato com o usuário através

de técnicas como: questionário, entrevistas, observação, etnografia visual, entre

outras;

Uma vez que já se tenha características bem definidas e as técnicas de pesquisa bem

preparadas pode começar a terceira fase.

3. Compilação e resumo dos dados sobre os usuários – aqui os dados são

compilados, numa planilha ou banco de dados, para através da análise dos

mesmos possa gerar gráficos e relatórios. Com essa compilação se obtém o

esboço de futuras personas e cabe ao analista fazer uma divisão coerente para

que não sejam geradas personas em excesso ou em quantidade escassa;

4. Elaboração das cartas – aqui o responsável faz a coleta de dados gerados nas

fases anteriores e faz uma interpretação a fim de que se possam escolher

imagens que melhor representem as características do grupo de usuários.

Cartas

Uma equipe de design gráfico do GDRLab, desenvolveu um modelo para as cartas que

serve tanto para a persona quanto para as cartas auxiliares. A carta principal, que tem a

imagem da pessoa, se diferencia das auxiliares apenas por conter uma seção destinada a

códigos (formados por uma letra e dois dígitos numéricos, que relaciona a carta principal com

as auxiliares).

Limitações

A forma atual de se construir o Cards Persona é manual, tem-se que entrevistar

pessoalmente potenciais usuários, selecionar as entrevistas com o nível de respostas mais

completas, o agrupamento dos dados é realizado sem critério formal, tem que construir tabelas

digitando cada dado a fim de obter informações e ainda construir as cartas colocando códigos,

31

nome e descrição manualmente e copiando resultados para fazer buscas por imagens. Claro,

sem deixar de comentar, que por ser um trabalho manual, é trabalhoso agrupar grandes

amostras.

Figura 8: Exemplo da carta principal

Figura 9: Exemplo de cartas auxiliares

Nome

Descrição

Código

Foto / Ilustração

32

Considerações finais

Neste capítulo foi apresentada a técnica personas, base para o modelo Cards Persona.

Esse modelo é utilizado para agrupar usuários de forma a obter um usuário-modelo que

represente um grupo. Sendo que possui limitações quanto a poder analisar pequenas amostras,

já que é inviável ao homem analisar, relacionar e interpretar muitos dados sem o auxílio de

ferramentas computacionais adequadas. No próximo capítulo será explicado o Processo de

Descoberta de Conhecimento em Base de Dados, que é um processo para identificar padrões a

partir de grandes bases de dados.

33

4 KDD E MINERAÇÃO DE DADOS

Atualmente, os progressos na área da tecnologia da informação proporcionam o

desenvolvimento de sistemas de diversas naturezas e possibilitam o armazenamento de

grandes volumes de dados. Presume-se que haja informações úteis a serem extraídas dessas

grandes bases de dados de forma a oferecer as organizações conhecimento para futuras

tomadas de decisões.

Para analisar, interpretar e relacionar os dados, o homem precisa da ajuda de

ferramentas computacionais adequadas, devido à dificuldade do mesmo em encontrar

informações úteis sem automatização. Serão apresentados nesta seção os processos de KDD e

Mineração de dados, que auxiliam o homem nessas tarefas. Apesar de alguns autores

considerarem os dois como sinônimos, este trabalho adota a definição de Fayyad [FAYYAD

1996], de que KDD é o processo global de descoberta de conhecimento útil a partir de dados,

enquanto mineração de dados é a aplicação de algoritmos específicos para a extração de

padrões de dados.

O objetivo desta seção é apresentar uma introdução às etapas do processo de KDD,

processo capaz de descobrir conhecimento útil em grandes bancos de dados, e uma introdução

à mineração de dados, etapa em que ocorre a extração de padrões dos dados. Serão

apresentadas algumas das principais tarefas de mineração de dados: classificação, regressão e

agrupamento; e algumas técnicas para a aplicação dessas tarefas como redes neurais,

algoritmos genéticos e árvores de decisão.

Descoberta de Conhecimento em Bases de Dados

O armazenamento em bases de dados de grandes quantidades de dados tornou-se uma

prática considerada comum e essencial nos dias de hoje em diversas organizações. Isso

ocasiona uma grande possibilidade de existência de informações preciosas entre esses dados.

A exploração dessas bases de dados à procura de conhecimento implícito caracteriza o termo

KDD. Fayyad [FAYYAD 1996] diz que KDD é um processo, de etapas seqüenciais,

interativo e iterativo, para identificação de padrões compreensíveis, válidos, novos e

potencialmente úteis a partir de grandes bases de dados.

34

Para o bom entendimento de tal definição torna-se necessário dar uma explicação

individual de alguns dos termos usados. O processo é interativo, pois necessita do homem

como responsável, é iterativo por possuir etapas seqüenciais e possibilitar retorno as etapas

anteriores. Por padrões válidos entenda-se conhecimento válido e verdadeiro, e por padrões

novos a agregação de novos conhecimentos aos já existentes, o conhecimento útil é o que

pode ser usado para beneficiar o contexto aplicado ao processo de KDD.

As etapas do KDD consistem na etapa de pré-processamento, mineração de dados e

pós-processamento, conforme mostrado na Figura 10.

Na etapa de pré-processamento ocorre a seleção, limpeza e tratamento dos dados. A

seleção dos dados ocasiona a escolha das instâncias e atributos relevantes para o processo. A

limpeza permite a qualidade dos dados, possibilitando o preenchimento dos dados

incompletos (ausência de valores), a correção de dados ruidosos, ou seja, dados que

contenham valores disparatados (outliers) e a verificação de dados inconsistentes, que

possuam alguma discordância entre si. Em seguida, ocorre o tratamento dos dados, que

normaliza e reduz a dimensionalidade dos dados – caso variáveis excedam capacidade dos

algoritmos de aprendizagem – para serem adequadamente utilizados pelos algoritmos.

Após o pré-processamento dos dados, segue a etapa de mineração de dados, onde

ocorre a escolha do algoritmo para o cumprimento da tarefa do problema em questão.

Na etapa de pós-processamento ocorre à visualização, análise e interpretação do

conhecimento obtido, onde os dados são organizados de forma a serem avaliados pelo

especialista. O especialista tem papel fundamental nessa etapa, pois é o mesmo que definirá se

os padrões adquiridos são interessantes, se o conhecimento é válido, novo e útil, ou se será

necessário à volta a alguma das etapas anteriores.

Mineração de dados

Mineração de dados é a etapa mais importante do processo de KDD. O objetivo dessa

etapa consiste na análise de dados e aplicação de algoritmos de descoberta que produzem uma

enumeração particular de padrões (ou modelos) a partir dos dados. Ou seja, algoritmos que

buscam explorar os dados para determinar modelos de conhecimento [FAYYAD 1996].

As técnicas de mineração de dados são aplicadas de acordo com as tarefas a serem

realizadas no processo de KDD. Serão descritas a seguir algumas dessas tarefas, sendo que

35

será dada uma abordagem geral nas tarefas de classificação e regressão e uma abordagem

mais detalhada na tarefa de agrupamento de dados, já que a mesma é a tarefa que será

utilizada na solução proposta por este trabalho.

Figura 10: Etapas do processo de KDD

Classificação

Essa tarefa tem o objetivo de descobrir uma função para mapear um conjunto de dados

de entrada em um conjunto de classes predefinidas, de forma que o processo de classificação

possa encontrar algum relacionamento entre um novo dado e essas classes, estabelecendo a

qual classe esse novo dado pertence.

Um exemplo dessa tarefa seria uma base de dados de clientes potenciais para

empréstimos. Os clientes são divididos em clientes confiáveis e clientes inadimplentes. O

processo de classificação descobrirá uma função de modo a inserir os clientes que existem no

banco de dados em uma das duas classes predefinidas. Um novo cliente pode também ser

36

associado a uma das classes a partir de sua semelhança com outros clientes previamente

classificados.

Regressão

A tarefa de regressão consiste em utilizar o relacionamento existente entre duas ou

mais variáveis contínuas de forma que uma delas tenha o seu valor estimado a partir das

demais.

Para exemplificar essa tarefa será considerada uma base de dados que possua

informações sobre o tempo de experiência e o salário atual dos funcionários de uma empresa,

exibida na Tabela 1 [GOLDSCHMIDT; PASSOS 2005]. Nessa base de dados existe uma

influência direta da variável que denota a experiência em anos na variável salário. Pode-se

então construir, através do processo de regressão, uma função para estimar o salário anual de

um funcionário a partir de sua experiência. Em um processo real de regressão, procura-se

estimar o valor de uma variável em função de várias outras variáveis.

Tabela 1: Exemplo de uma base de dados. [GOLDSCHMIDT; PASSOS 2005]. X (experiência em anos) Y (salário anual em R$ 1.000)

03 30

08 57

09 64

13 72

03 36

06 43

11 59

21 90

01 20

16 83

Utilizando o modelo de regressão linear nos dados da Tabela 1, temos:

X’ = 9,1

Y’ = 55,4

37

β = (3 - 91) (30 – 55,4) + (8 – 9,1) (57 – 55,4) + ... + (16 – 9,1) (83 – 55,4) = 3,7

(3 - 91)² + (8 – 9,1)² + ... + (16 – 9,1)²

a = 55,4 – (3,7) (9,1) = 21,7

Portanto: Y = 21,7 + 3,7*X.

Assim, pode-se estimar que uma pessoa com 20 anos de experiência teria seu salário

anual de aproximadamente R$ 95.700,00.

Agrupamento (Clustering)

A tarefa de agrupamento a partir de uma base de dados separa os dados formando

grupos, utilizando critérios de similaridade. A identificação desses grupos é feita utilizando o

princípio de obter padrões que minimizam a distância interna e maximizam a distância entre

os grupos [HAN & KAMBER 2001], obtendo dessa forma grupos compostos por dados com

alta similaridade, entretanto, distintos de dados presentes em outros grupos.

Diferente da tarefa de classificação, que tem rótulos predefinidos, o agrupamento

precisa automaticamente identificar os grupos de dados aos quais o usuário deverá atribuir

rótulos [FAYYAD 1996]. Exemplificando a tarefa de agrupamento pode-se utilizar uma rede

de supermercado que queira agrupar a partir de seu banco de dados, clientes que possuam um

mesmo perfil de compras. Uma das formas é agrupar cliente que tenham o mesmo perfil a

partir de atributos como faixa etária, nível de renda, etc., para oferecer linhas de produtos

semelhantes.

4.1.1.1 Componentes de uma tarefa de clusterização

A atividade de agrupamento normalmente envolve [JAIN AND DUBES 1988]:

• Representação dos padrões: envolve definição do número, tipo e modo de

apresentação dos atributos que descrevem cada padrão;

• Definição de uma medida de similaridade apropriada ao domínio da aplicação:

fornecida por uma função de distância definida entre pares de dados ou

padrões;

38

• Clusterização ou agrupamento: os grupos podem ser definidos como conjuntos

crisp (um padrão pertence ou não-pertence a um dado grupo) ou fuzzy (um

padrão pode apresentar graus de pertinência aos grupos). O processo de

agrupamento pode ser hierárquico, com um processo recursivo de junções ou

separações de grupos, ou não-hierárquico, com o emprego direto de técnicas de

discriminação de clusters;

• Apresentação do resultado: deve permitir que um computador possa utilizar o

resultado de forma direta ou então deve ser orientada ao usuário, permitindo a

visualização gráfica dos clusters e a compreensão de suas inter-relações,

através da proposição de protótipos ou outras descrições compactas para os

clusters.

4.1.1.2 Técnicas de clusterização de dados

A classificação dos algoritmos utilizados na clusterização pode ser dada de acordo

com a abordagem utilizada na definição dos clusters: clusterização hierárquica ou por

particionamento.

4.1.1.2.1 Clusterização hierárquica

Nesse tipo de clusterização, os clusters são reunidos em forma de árvore, onde cada nó

consiste na união de dois elementos [WANG e HODGES 2006]. Essa formação se dá através

de aglomerações ou divisões que gera uma árvore hierárquica dos elementos. Na

Clusterização Hierárquica Aglomerativa, cada objeto é atribuído a um cluster distinto, e novos

clusters vão se formando com a união dos já existentes, baseado nas informações de quão

próximos estão os elementos de clusters distintos. Em contrapartida, na Clusterização

Hierárquica por Divisão, tem-se inicialmente um único cluster que contém todos os elementos

do cluster, e a cada iteração, vão se formando clusters menores, a partir dos já existentes

[OCHI et al. 2004].

4.1.1.2.2 Clusterização por particionamento

Na clusterização por particionamento, o conjunto de elementos é dividido em k

clusters. Se a cada iteração não forem satisfeitas as condições do problema, novas

39

configurações vão sendo criadas através da migração dos elementos entre os clusters, até que

algum critério de parada seja atingido [OCHI et al. 2004].

Além de apresentar como vantagem um melhor refinamento com relação às técnicas

de clusterização hierárquica, que não revisitam os clusters já formados. Um dos algoritmos

mais utilizados na clusterização por particionamento, é o K-means, algoritmo no qual o

SimpleKMeans, utilizado neste trabalho, se baseia.

Considerações finais

Neste capítulo foi apresentado o Processo de Descoberta de Conhecimento em Base de

Dados. Foi dado um enfoque maior a tarefa de clusterização dos dados, devido a mesma ser a

tarefa escolhida para ser utilizada na fase de mineração de dados da ferramenta PersonaWeb,

solução proposta neste trabalho, que será detalhada no próximo capítulo.

40

5 PERSONAWEB

Este capítulo descreve a ferramenta PersonasWeb, as tecnologias utilizadas no seu

desenvolvimento, sua descrição e arquitetura. Apesar de conceitos sobre personas neste

trabalho, o projeto desenvolvido não os segue a risca, tendo sido feitas adaptações para ir de

acordo com a necessidade do problema a ser resolvido, sem deixar de manter o foco principal

que é obter um usuário-modelo criado a partir de dados reais, que contenha seu nome, seus

gostos, seus hábitos, suas habilidades e etc.

Recursos utilizados pela PersonaWeb

Nesta seção será detalhada a ferramenta Weka, da qual o PersonaWeb faz uso da sua

API, através da utilização do algoritmo SimpleKMeans. Apesar de existir várias outras

ferramentas, a escolha da Weka se deu pelo fato de a mesma possuir a implementação do

algoritmo SimpleKMeans, que trabalha com bases de atributos mistos, e que tem como base o

algoritmo KMeans, método popular para tarefa de clusterização. Essa tarefa é a que é

utilizada na fase de mineração de dados do PersonaWeb, já que o objetivo deste trabalho é

agrupar pessoas com características semelhantes a partir de bases de dados. Será também dada

uma explicação sobre a LastFM e IMDB, bases externas de músicas e filmes,

respectivamente, utilizadas através de web services para troca de dados com o PersonaWeb.

Weka Waikato Environment for Knowledge Analysis – Weka foi desenvolvido pela

Universidade de Waikato, para resolver tarefas de mineração de dados através de uma coleção

de algoritmos de aprendizado de máquina. É um software livre, escrito em Java, licenciado

dentro das especificações da GPU (General Public License). Possui interface gráfica para

interagir com arquivos de dados como também para visualização dos mesmos, pode ser

aplicado em vários níveis diferentes. Você pode acessar a API Weka e fazer uso em seu

próprio programa em Java. Para importação dos dados o weka aceita vários formatos como

41

csv, binary, c45, sendo que tem somente um formato padrão que consegue manipular, o arff

(Attribute-Relation File Format).

O ARFF – apresentado na Figura 12 - é um arquivo de texto. Não aceita dados

faltosos, nem espaços entre palavras. É formado por três partes:

• @relation – deve ser a primeira linha do arquivo, seguida de uma palavra-

chave que identifique a relação dos dados a ser minerados.

• @attribute – representa um conjunto de linhas onde são descritos os atributos.

Deve está no início de cada linha seguido do nome do atributo e do tipo, que

pode ser nominal ou numérico.

• @data – as informações inseridas abaixo dessa linha indicam os registros da

base de dados. Cada linha representa uma instância, e deve conter os valores

separados por vírgula.

Figura 12: Exemplo de um arquivo arff

O weka implementa vários métodos de associação, classificação como árvores de

decisão e redes neurais e clusterização, que utiliza algoritmos como o Simple-KMeans,

Cobweb, entre outros. Possui facilidade para inclusão de novos métodos, por isso é

42

considerada uma ferramenta personalizável e expansível. A visualização gráfica dos dados é

dada em forma de histogramas, os resultados mostrados em árvores de decisão e diagramas de

dispersão, além da possibilidade de gerar modelos gráficos para montagem de redes neurais

[GOLDSCHMIDT; PASSOS 2005].

SimpleKmeans

Algoritmo utilizado pelo PersonaWeb para fazer a tarefa de clusterização na fase de

mineração de dados. É uma implementação do pacote WEKA, baseado no algoritmo K-

Means [WITTEN e FRANK 2005]. O objetivo desse método é, a partir de uma massa de

dados, agrupar n objetos em k grupos com a maior diferença possível entre eles, onde k

representa a quantidade de grupos e deve ser definida antecipadamente [BUSSAB, 1990].

Algumas implementações do K-means permite apenas valores numéricos para os

atributos. Nesse caso, pode ser necessário converter os atributos categóricos em

binários. Também pode ser necessário normalizar os valores de atributos que são medidos em

diferentes escalas (por exemplo, "idade"). Sendo que o algoritmo SimpleKMeans trata

automaticamente a mistura de atributos categóricos e numéricos. Além disso, o algoritmo

automaticamente normaliza atributos numéricos ao fazer os cálculos de distância [PENTAHO

DATA MINING]. Este parágrafo descreve a motivação do uso deste algoritmo no

PersonaWeb, já que a maioria das bases possuem atributos mistos.

O critério de agrupamento dos clusters é baseado em algumas medidas de

similaridade, a mais comum e usada pelo SimpleKmeans no PersonaWEB é a distância

euclidiana definida por:

K-means

O algoritmo K-means tem como parâmetros de entrada: um conjunto de dados com n

elementos, e número de clusters, k. Como saída, o k-means tenta identificar entre os dados

clusters bem separados.

43

A execução do algoritmo consiste na escolha aleatória dos k centros iniciais para os

clusters, sendo isso de extrema importância já que as posições iniciais muito influenciam no

resultado, pois dependendo da escolha desses centróides o algoritmo pode convergir para um

ótimo local. O passo seguinte será calcular a distância euclidiana de cada objeto em relação ao

centróide de cada grupo, atribuindo o objeto a um cluster onde a distância entre o mesmo e o

centróide é mínima, ou seja, associá-lo ao centro mais próximo. Em seguida, recalcular os

novos centros dos clusters de modo a minimizar a função objetivo erro quadrático, definida

por:

Onde: é a distância escolhida entre um ponto de dados; = i-ésimo

padrão pertencente ao j-ésimo cluster; e cj = centróide do j-ésimo cluster.

Uma vez recalculados os centróides, o algoritmo atualiza os clusters atribuindo todos

os objetos aos novos centros. Esse processo se repete em diversas iterações até que sejam

encontrados os centros finais de cada cluster, ou seja, não apresentem deslocamentos

significativos, ou até que a função objetivo comece a diminuir expressivamente após certa

quantidade de iterações.

A Figura 13 mostra um fluxograma da execução do algoritmo k-means, ressaltando a

inicialização aleatória dos centros, a atribuição de cada objeto conforme a distância que se

encontram dos centros e a busca de forma iterativa pelos centros finais.

O algoritmo tem como vantagens: a simplicidade, facilidade de implementação,

eficiência para trabalhar com grandes bases de dados, e a realocação iterativa, que com

freqüência descobre um ótimo local. Como desvantagens, apresenta a dependência dos

valores iniciais de k, a sensibilidade aos ruídos, já que dados ruidosos ou com valores

extremamente altos podem influenciar na distribuição dos dados.

IMDB

Internet Movie Database (Base de dados de filmes na internet – IMDB) possui uma

grande base com dados sobre filmes, curtas e documentários da internet em vários idiomas.

Contém informações online sobre trailers, atores, título original, fotos, gênero, diretor, entre

outros, e também possui avaliação e resenha feita pelo usuário sobre determinado filme.

44

Figura 13: Fluxograma do Algoritmo K-means

LastFM

É um site de rádio gratuita via internet, que contém um grande catálogo de músicas e

que tem agregada uma comunidade virtual onde são trocadas informações, como também o

45

usuário pode construir seu perfil musical, recomendar artistas, músicas ou álbuns a outros

usuários, se esta estiver disponível no banco de dados da LastFM. Podem também ser

formados grupos de usuários com algo em comum, e ainda o recurso de recomendações, no

qual com base no gosto do usuário, a LastFM recomenda novas músicas, shows e indica

vizinhos musicais (pessoas que gostam das mesmas músicas).

A LastFM oferece um web service. A sua API é livre para qualquer pessoa usar e criar

seus próprios programas utilizando os seus dados. Sendo que para dados restritos ao usuário, é

necessária autorização para uso. Na Figura 14, serão mostrados alguns métodos disponíveis

na API.

Figura 14: Fragmento dos métodos da API da LastFM

Descrição da ferramenta

PersonaWeb é a solução implementada que supre uma necessidade da metodologia

XDM, que é a criação de personas de forma automática. De forma geral, seu funcionamento

se dá a partir de um script de banco de dados MYSQL, que além dos dados gerais deve conter

informações do usuário sobre música, filme, hobbie e lugar.

46

O usuário final do PersonaWeb com o script da base já executado no MYSQL, terá

três fases a seguir para a obtenção das personas, como mostra a Figura 16. Primeiro, uma fase

de pré-processamento, que irá organizar e tratar os dados para a geração de um arquivo arff,

formato lido pelo weka. Em seguida, ocorre a mineração de dados, onde serão obtidos

padrões, formados por clusters com características similares. E por fim, a interpretação desses

clusters e a formação das personas, com cartas de acordo com padrões identificados que

representarão o grupo. Caso seja necessário, o usuário final poderá iniciar novamente o

processo, e escolher novos atributos para melhor obtenção de resultado dos padrões.

Figura 16: Fases do PersonaWeb

47

Primeira fase – Pré-processamento

A fase de pré-processamento irá tratar os dados do script inserido pelo usuário de

forma a deixá-los preparados para leitura do weka, ferramenta utilizada na segunda fase. O

objetivo dessa fase é criar o arquivo arff em cima desses dados já pré-processados.

O funcionamento dessa fase se dá através da exclusão dos dados faltosos, dados

redundantes, seleção de atributos, conversão de campo data nascimento em idade e

categorização dos campos música, filme, hobbie e lugar. A exclusão dos dados faltosos no

conjunto de dados é realizada utilizando o método exclusão de casos, que é um método

simples que consiste em excluir tuplas que possuam células não preenchidas. A exclusão dos

dados redundantes se dá através da exclusão de tuplas com valores iguais. A seleção de

atributos é feita com a escolha de atributos (colunas) cujo conteúdo seja relevante ao processo

de criação da persona, é realizada através do método Exclusão Direta de Casos, onde são

especificados os atributos a serem eliminados. Como a idade é uma informação importante

para uma persona, caso a base não tenha esse dado no formato padrão e sim em formato de

data (data_nascimento) é feita uma conversão dessa data para idade, podendo ser vista no

arquivo arff gerado ao final desta fase. A categorização é uma componente importante dessa

fase, pois ao se ter vários dados que possam fazer parte de uma mesma categoria, a

categorização desses dados proverá um enriquecimento na obtenção de características

similares de um grupo.

Exemplos de categorização: caso um usuário goste da música de Bruno e Marrone e

outro goste de Vitor e Léo, o gosto musical dos dois se enquadra na categoria de música

sertaneja. Ou se um usuário gosta do filme A Proposta e o outro A Verdade Nua e Crua esses

se enquadrarão na categoria Comédia Romântica. A categorização é feita utilizando APIs

disponibilizadas através de Web Service. É utilizada a LastFm para músicas, e a IMDB para

filmes. A categorização de lugar e hobbie são realizadas através de bases locais

correspondentes, criadas para este fim. Ao término dessa fase será gerado um arquivo arff que

servirá de entrada para a fase de mineração, o sistema trata todas as particularidades para

criação deste arquivo. A fase de pré-processamento pode ser visualizada na Figura 17.

48

Figura 17: Fase de pré-processamento – PersonaWeb

Segunda fase – Mineração dos dados

Nesta fase acontece a busca efetiva por conhecimento a partir dos dados, através da

aplicação de algoritmos sobre os mesmos. Neste projeto a tarefa de mineração a ser utilizada

será a de clusterização, que separa os dados da base em clusters, de tal forma que dados de um

cluster compartilhem características comuns que os diferenciem dos dados dos outros

clusters. O funcionamento dessa fase se dá na abertura do arquivo arff gerado na fase anterior

e na escolha da quantidade de clusters a serem formados. Para minerar os dados é utilizado o

algoritmo SimpleKmeans, conforme visto na seção 4.2.2, como mostra a Figura 18.

49

Figura 18: Fase de mineração de dados – PersonaWeb

Terceira fase – Interpretação e construção das cartas

O arquivo texto gerado na fase anterior serve de entrada para esta fase. Ele contém o

resultado da aplicação do algoritmo Simplekmeans sobre os dados. Esse resultado contém o

atributo, o centróide de cada cluster, quantidade de instâncias de cada cluster e porcentagem.

Um exemplo é mostrado na Figura 19.

Figura 19: Arquivo de saída do SimpleKmeans

50

Nessa terceira fase ocorre a leitura desse arquivo texto, de modo a colher informações

dos atributos e centróides, que são dispostos na carta principal nos campos imagem e

descrição. O nome é gerado aleatoriamente a partir de uma base de nomes, de acordo com o

sexo encontrado durante a mineração. As cartas auxiliares são formadas de acordo com a

informação obtida sobre música, filme, hobbie e lugar. Se a categoria da música for MPB,

será feita uma busca no campo música antes da categorização na fase de pré-processamento,

pois a exclusão feita nessa fase é uma exclusão lógica já com o intuito de utilizar os dados

neste momento. É feita uma contagem na música que mais se repete nessa categoria e a

mesma será atribuída à carta. O usuário final apenas clicará em um botão, o qual leva a página

do Google Imagens já com o parâmetro de busca do nome da música encontrado, em seguida

faz o download da imagem escolhida em um loca de sua preferência. Logo após pode ser feito

o upload da imagem e essa será salva na carta correspondente. O mesmo acontece com as

outras três categorias: filme, hobbie e lugar. A Figura 20 mostra essa fase. Ao finalizar o

usuário poderá salvar as personas criadas.

Figura 20: Fase de interpretação e visualização – PersonaWeb

51

Arquitetura

De forma geral, a arquitetura do sistema proposto é composta por camadas, visando o

isolamento das funcionalidades em módulos, e alto grau de desacoplamento. Na Figura 15 são

apresentadas as camadas que o compõem, sendo a do cliente, a lógica e a de persistência. Na

camada do cliente ocorre a submissão de requisições a lógica do sistema. Nela encontra-se a

interface do usuário. A camada lógica é responsável por abranger as regras de negócio da

aplicação, como também se comunicar com a camada de persistência a fim de requisitar

serviços de armazenamento ou busca dos dados. E a camada de persistência responsável por

armazenar os dados da aplicação.

Figura 15: Arquitetura PersonaWeb Na arquitetura do PersonaWeb, a interação inicial do usuário ocorre ao enviar um

script de seu banco de dados através da interface gráfica para a camada lógica da aplicação e

segue ao mesmo ir fazendo uso das funcionalidades do sistema a fim de atingir o objetivo de

criar personas. A camada lógica é responsável por tratar, preparar e requisitar armazenamento

para esses dados, aplicar o algoritmo de clustering e criar as cartas. As tecnologias utilizadas

na camada lógica do PersonaWeb são JSF, Richfaces, Facelets, JDBC e Web Services.

• JSF, framework utilizado no desenvolvimento de aplicações web. Baseia-se em

um modelo de componentes e eventos. Benefícios: uso de eventos com

facilidade, composição, reuso e extensão de componentes e o gerenciamento

do estado da aplicação em nível de componentes [LIMA 2008]. O JSF torna

52

fácil o desenvolvimento através de componentes de interface de usuário, como

também conecta esses componentes a objetos de negócio.

• Richfaces – biblioteca de componentes para aplicações web que utiliza o

framework JSF. Os componentes desta biblioteca vêm com Ajax integrado e

com um suporte a skins que podem deixar as interfaces da aplicação com um

visual padronizado. Ela tira o máximo partido das vantagens do JSF, incluindo

ciclo de vida, validação, conversão, juntamente com a gestão de recursos

estáticos e dinâmicos [JBOSS RICHFACES];

• Facelets – framework de templates JavaServer Faces, baseado em princípios

simples, como transformar páginas (X)HTML em JSF, sem utilizar totalmente

as suas tags. Possui as vantagens do reaproveitamento dos protótipos de telas,

design da página com qualquer editor HTML [LIMA 2008];

• Web Services – tecnologia ideal para comunicação entre sistemas. No caso do

presente projeto, necessário para comunicação entre a lógica do PersonaWeb e

os serviços da LastFM e IMDB, necessários para categorização de alguns

dados da aplicação.

• JDBC – é o padrão da indústria para conectividade de banco de dados

independentes entre a linguagem de programação Java e uma ampla gama de

bancos de dados. A API JDBC fornece um nível de chamada de API para

acessar banco de dados baseado em SQL. No PersonaWeb é responsável por

todo preparo e tratamento dos dados na fase do pré-processamento.

E camada de persistência pelo armazenamento dos dados necessários durante a

execução da aplicação.

Fluxo Navegacional

Nesta seção, apresentaremos o fluxo navegacional do PersonaWeb, mostrando as telas

que serão apresentadas ao usuário no decorrer da utilização da ferramenta.

Inicialmente o usuário é apresentado à tela onde é possível fazer a conexão do seu

script com o banco de dados do servidor. Tem a opção para copiar seu script, caso esteja

iniciando a utilização e tem a opção de escolher seu banco, caso já tenha feito uso de alguma

funcionalidade do sistema, essa tela é apresentada na Figura 21.

53

Figura 21: Tela inicial PersonaWeb

Se o usuário está iniciando, a tela seguinte oferece a opção da escolha da tabela do

banco a ser trabalhada. Se já tiver feito algum uso, o sistema retorna a tabela com as

alterações feitas. E para as duas telas, são dadas as seguintes opções: Listar, Deletar tuplas

inconsistentes, Categorizar, Excluir colunas e Minerar dados, como mostra a Figura 22.

Figura 22: Tela pré-processamento do PersonaWeb

54

Ao clicar no botão “Deletar Tuplas Inconsistentes” aparece uma caixa de diálogo

perguntando se o usuário realmente deseja excluí-las.

O botão “Deletar Colunas” lista as colunas existente na tabela e o usuário as exclui

apenas com um clique no nome da coluna que se deseja remover.

55

O usuário ao clicar no botão categorizar, é mostrada uma lista com as opções das

quatro colunas lugar, filme, hobbie e música e o tipo de categorização que se deseja.

O botão “Minerar Dados” a nível do sistema gera o arquivo arff e a nível do usuário

mostra a tela que se tem a opção para escolher a quantidade de clusters e um botão “Gerar

personas”.

Neste momento ocorre a execução do algoritmo e a visualização da tela de criação das

cartas. Essa é a última tela. É onde são geradas as cartas. Inicialmente aparecem as cartas

apenas com os textos respectivos a cada uma, e um botão escolher imagem – Figura 23. Na

carta principal as imagens estão guardadas numa base local. São apresentadas através de uma

janela que se abre e quando escolhida o usuário clica e ela é salva na carta – Figura 24. Já as

imagens das cartas auxiliares utilizam a api do Google para busca e posterior escolha. Após

isso, o usuário salva a imagem no local de sua preferência, sendo em seguida feito o upload

dessa imagem para a carta. Nessa tela ainda é exibida a quantidade de dados e a porcentagem

que a persona representa. E uma paginação para que de acordo com a quantidade escolhida o

56

usuário possa acessar cada uma. Por fim, o botão salvar, para que depois de prontas, o usuário

possa guardá-las, essa tela é exibida na Figura 25.

Figura 23: Tela para preenchimento das imagens das cartas

Figura 24: Tela para escolha da imagem da carta principal.

57

Figura 25: Tela Final do PersonaWeb.

58

6 ESTUDO DE CASO Olimpíadas de Jogos Digitais e Educação

A OJE é um consórcio formado pela Jynx, Manifesto, Meantime e CESAR, através da

parceira do Porto Digital com a UFPE. É um empreendimento do Estado de Pernambuco com

o Porto Digital, que juntou a escola e a lan house. E através dessa combinação oferece aos

educandos e educadores uma maneira divertida e inovadora, fazendo uso de jogos digitais, de

possibilidades voltadas para o aproveitamento educacional [MEIRA 2009].

O objetivo da OJE é construir um ambiente colaborativo, onde alunos e professores

aprendam a trabalharem em equipe, como também incentivar a cultura digital na forma

pedagógica, que venha a estimular a curiosidade do aluno pela busca de informações através

da resolução de conteúdos e enigmas, que são abordados no dia a dia na sala de aula.

Características da base de dados

A base de dados da OJE, utilizada nesse experimento, teve agregado a seus dados

alguns dados externos, que durante a fase de pré-processamento foi necessário para enriquecer

os dados, obtendo assim mais informações para o processo. A base, anterior a fase de pré-

processamento, é composta por 23 atributos e 10.617 instâncias. Entre os atributos estão

nome, data de nascimento, sexo, cidade, bairro, série, motivação, tempo de jogo na semana,

lugar que costuma jogar, com que costuma jogar, disponibilidade do laboratório, intenção do

uso do laboratório, estímulo que a OJE oferece, percepção dos conteúdos escolares, mudanças

no dia a dia devido a OJE, enigmas, horário de ver TV, lugar, filme, hobbie, música, perfil,

nome da escola.

A base não poderá ser mostrada por não ter sido dada autorização para isso, sendo

autorizado apenas apresentar os dados em forma de resultado.

Utilizando o PersonaWeb

Inicialmente foi introduzido no PersonaWeb o script da base de dados da OJE, criando

assim o banco, onde foi possível aplicar as opções disponíveis de pré-processamento.

59

A primeira opção foi excluir dados faltosos e remover as tuplas redundantes. A base

no início continha 10.617 instâncias, depois da aplicação dessa opção foram excluídas 2.755

tuplas, das quais 1.843 eram tuplas com valores faltosos e 912 tuplas com valores

redundantes.

Em seguida houve a escolha dos atributos (colunas) necessários ao processo, através

do método Exclusão Direta de Casos, implementada por instrução de exclusão em SQL,

havendo assim a exclusão das colunas desnecessárias. O Quadro 1 mostra os atributos

escolhidos, ou seja, relevantes para o processo e os excluídos, que não agregam valor ao que

se deseja obter.

Quadro 1: Atributos relevantes e atributos excluídos

Atributos relevantes

sexo, motivação, tempo de jogo na semana, lugar que costuma jogar, com que costuma jogar, estímulo que a OJE oferece, percepção dos conteúdos escolares com os jogos, mudanças no dia a dia devido a OJE, enigmas, lugar, filme, hobbie, música

Atributos excluídos

nome, data de nascimento, disponibilidade do laboratório, intenção do uso do laboratório, cidade, bairro, série, perfil, horário de ver TV, nome da escola

Na base trabalhada não há a coluna idade no formato padrão, o sistema assim que o

script foi inserido guarda a coluna datanascimento, para uso posterior, mesmo que a mesma

tenha sido excluída pelo usuário na opção exclusão de colunas, acontece apenas uma exclusão

lógica.

A opção categorizar é um pouco custosa, devido ao uso de web services. O

experimento foi feito em uma máquina com Sistema Operacional Windows e a velocidade da

internet é de 512 kbps. Dentre as quatro categorizações a de filme é a que leva mais tempo,

pois devido a segurança do site, foi necessário implementar um analisador HTML que acessa

a página, salva como string, pega o valor que deseja e depois volta ao dados em busca desse

valor. Para categorizar os 7.862 filmes foram 33 minutos. A categorização das músicas custou

16 minutos. Já hobbie e lugar como são bases locais, a categorização dos dados das duas

colunas custou 7 minutos e 2 segundos. Exemplos da categorização são mostrados a seguir.

60

61

O sistema gera o arquivo arff ao final do pré-processamento. O arquivo gerado não é

visível ao usuário, mas, será mostrado na Figura 26, para a observação da execução do

62

sistema quanto a conversão de dataNascimento em idade que ocorre durante a formação deste

arquivo.

Figura 26: Arquivo Arff da base da OJE

Depois de aplicadas todas as opções do pré-processamento, o botão minerar dados é

habilitado para o usuário clicar. Ao se clicar nele a tela de escolha da quantidade de clusters é

apresentada. Nesse experimento o responsável pela base de dados da OJE escolheu cinco

clusters, o que equivale à criação de cinco personas.

Para a base utilizada neste experimento, os resultados foram os seguintes:

Gráfico 1: Quantidade e porcentagem dos clusters obtidos

63

Nome Eduarda Qtd. Instâncias 1494 Porcentagem 19% Texto Videogames foi sua motivação para participar da OJE, gosta

de jogar em casa. A OJE a estimula a estudar mais e passou a usar mais o laboratório da escola. Ela acha os enigmas da olimpíada difíceis.

64

Nome Marcos Qtd. Instâncias 1651 Porcentagem 21% Texto O interesse em aprender foi sua motivação para participar da

OJE, gosta de jogar na escola. A OJE o estimula a conversar mais com os professores e passou a achar as aulas mais legais. Ele acha os enigmas da olimpíada um pouco difíceis.

65

Nome João Qtd. Instâncias 1022 Porcentagem 13% Texto O interesse em prêmios foi sua motivação para participar da

OJE, gosta de jogar em casa. A OJE o estimula usar mais o computador e passou a achar as aulas mais legais. Ele acha os enigmas da olimpíada difíceis.

66

Nome Leandro Qtd. Instâncias 1179 Porcentagem 15% Texto O interesse em aprender foi sua motivação para participar da

OJE, gosta de jogar na escola. A OJE o estimula a tira mais dúvidas e passou a usar mais o laboratório. Ele acha os enigmas da olimpíada difíceis.

67

Nome Wesley Qtd. Instâncias 2516 Porcentagem 32% Texto O professor foi sua motivação para participar da OJE, gosta

de jogar em casa. A OJE o estimula a ter mais concentração e passou a participar mais das aulas. Ele acha os enigmas da olimpíada um pouco difíceis.

68

7 CONSIDERAÇÕES FINAIS

É notório que faltam ferramentas de apoio aos processos de design, em particular em

jogos. De certa forma há negligência nas atividades como arte e concepção deixando-as

carentes de processos e/ou ferramentas. Como também existe pouca preocupação em pesquisa

com o usuário, mesmo sabendo o quanto é importante inserir características desses usuários

no projeto, pois assim há um direcionamento para quem realmente irá usufruí-lo. No intuito

de suprir essa carência na fase de concepção foi criada a metodologia XDM. E neste trabalho

foi criada uma ferramenta de apoio a essa metodologia, que além de poder ser integrada a

mesma, inserindo características de potenciais usuários, pode ser tida como mais uma

ferramenta que venha a dá suporte ao processo de design.

A metodologia XDM visa ajudar na concepção de jogos e artefatos digitais. Possui

abordagem de concepção centrada no usuário, onde a primeira fase da metodologia abrange

pesquisa com o usuário, no intuito de obter conhecimento dos mesmos. Inserida na mesma,

está à técnica personas, inserida na forma do modelo Cards Persona. Sendo que esse modelo

possui limitações quanto à criação das personas, pelo fato de todo o processo ser manual, o

que acarreta dificuldades tanto na geração das personas, quanto na análise e visualização dos

dados, caso se tenha uma amostra grande.

Este trabalho teve como objetivo automatizar a geração de personas. A partir deste

objetivo foi desenvolvida uma ferramenta que gerasse essas personas a partir de grandes bases

de dados. Agrega conceitos de Personas e Descoberta de Conhecimento em Bases de Dados, a

fim de suprir necessidades de metodologia de design na etapa de concepção, buscando obter

algum conhecimento sobre o usuário para usá-lo desde a etapa inicial do projeto.

O uso do banco de dados incrementa a pesquisa, pois trata de extrair perfis de dados

reais. O processo de KDD adaptado para a solução proposta oferece facilidade no tratamento

e visualização desses dados. A implantação do resultado da ferramenta PersonaWeb se deu

com uma certa facilidade na ferramenta XDMWeb. Com isso, aumentou satisfatoriamente a

utilização da XDMWeb, já que a execução da mesma ocorre com personas criada a partir de

uma base de dados própria. A solução implementada oferece a XDMWeb mais um motivo

para a mesma ser considerada referência em métodos de design aplicados ao contexto de

jogos digitais.

O experimento feito com a base de dados do Consórcio OJE demonstra a eficácia da

ferramenta. Em cima de uma amostra de mais de dez mil instâncias, extraiu-se cinco personas

69

que beneficiará a equipe através da inclusão de características do usuário no processo de

desenvolvimento dos jogos. Saber o que motiva, qual estímulo oferece e o que os alunos

acham dos enigmas dispostos no portal, dentre outras descobertas, dará referências de como

atender cada vez melhor os alunos, como também adicionar coisas novas de acordo com as

características encontradas.

Contribuição

A pesquisa realizada neste trabalho incorpora Reconhecimento de Padrões, através do

processo de Descoberta de Conhecimento em Bases de Dados ao Processo de Design, como

instrumento para construção de personas. Dessa forma, pode-se destacar como principal

contribuição o uso de Inteligência Artifical em processos de design. O potencial dessa

integração é demonstrado através da ferramenta desenvolvida que é composta de

funcionalidades baseada no processo de KDD que permite agrupar dados de uma base real, de

forma a obter informações que gere algum conhecimento sobre os potenciais usuários de um

jogo. Como também obter essas informações através da visualização em forma de cartas,

podendo já ser integradas a metodologia XDM.

Trabalhos Futuros

Essa dissertação apresentou uma ferramenta para criação de personas. Embora o

objetivo tenha sido alcançado, ainda existe pesquisa ligada a esta dissertação que pode ser

explorada:

• Generalizar a ferramenta para outras áreas do design, não apenas Game Design;

• Ampliar para interagir com redes sociais abertas a fim de obter dados que possam

ser utilizados na geração das personas.

70

8 REFERÊNCIAS [AARSETH 2003] AARSETH, E. Playing research: methodological approaches to game analysis, paper presented at MelbourneDAC, the 5th International Digital Arts and Culture Conference, 19–23 May 2003, Melbourne.

[AMAZONAS 2007] AMAZONAS, D. S. Desenvolvimento de Jogos 3D em Java com a Utilização do Motor Gráfico Irrlicht. Fortaleza, 2007.

[ADAMS e ROLLINGS 2006] ADAMS, Ernest; ROLLINGS, Andrew. Fundamentals of game design. New Jersey: Pearson, 2006.

[ASIMOV 1962] ASIMOV, Morris. 1962. Introduction to Design. Prentice-Hall, New Jersey.

[BRATHWAITE E SCHREIBER 2009] BRAITHWAITE, B.; SCHREIBER, I. Challengers for game designers. Boston: Course Technology, 2009.

[BRIGHETTI 2003] BIGHETTI, Vera S. O Jogo como texto cultural da sociedade de informação. Dissertação de Mestrado, 2003. Pontifícia Universidade Católica de São Paulo.

[BRYCE E RUTTER 2006] BRYCE, J.; RUTTER, J. An introduction to understanding digital games. In: (Ed.). Understanding Digital Games: Sage Publications Ltd., 2006.

[BUSSAB, 1990] BUSSAB, Wilton de Oliveira; MIAZAKI, Édina Shizue; ANDRADE, Dalton Francisco de. Introdução à análise de agrupamentos. São Paulo: Associação Brasileira de Estatística, 1990.

[CALABRIA 2004] CALABRIA, Tina. An introduction to personas and how to create them. 2004. Disponivel em < http://www.steptwo.com.au/papers/kmc_personas/index.html> Acesso em 4 de abril de 2010.

[COOPER 2003] COOPER, A. The Origin of personas. Cooper journal, 2003a.

[COOPER, REIMANN E CRONIN 2007] COOPER, A., REIMANN R., CRONIN D. About Face 3: The Essentials of Interaction Design. John Wiley & Sons, 2007.

71

[FAYYAD 1996] FAYYAD, U. M; PIATETSKY-SHAPIRO, G.; SMYTH, P. From Data Mining to Knowledge Discovery in Databases: An Overview. Knowledge Discovery and Data Mining, Menlo Park: AAAI Press, 1996.

[GOEBEL E GRUENWALD 1999] GOEBEL, M.; GRUENWALD, L. A survey of data mining and knowlodge discovery software tools. SIGKDD Explorations, v. 1, p. 20-33, 1999.

[GOLDSCHMIDT; PASSOS 2005] GOLDSCHMIDT R.; PASSOS E. Data Mining: um guia prático. Rio de Janeiro: Elsevier, 2005.

[GOODWIN 2001] GOODWIN, Kim. Perfecting your personas. Cooper journal, 2001.

[HAN & KAMBER 2001] HAN, J., KAMBER, M., Data Mining: Concepts and Tecniques. Morgan Kaufmann Publishers. San Francisco. EUA. 2001.

[HARRISON 1998] HARRISON, Thomas H. Intranet Data Warehouse. São Paulo: Berkeley Brasil, 1998.

[HUIZINGA 2007] HUIZINGA, J. Homo Ludens: o jogo como elemento da cultura. 5. Perspectiva, 2007.

[HUNTSMAN 2000a] HUNTSMAN, Tim. A primer for the design process, part 1: what to do. In: Gamasutra.com, 2000a.

[HUNTSMAN 2000b] HUNTSMAN, Tim. A primer for the design process, part 2: what to think about. In: Gamasutra.com, 2000b.

[HUNTSMAN 2000c] HUNTSMAN, Tim. A primer for the design process, part 3: what you need. In: Gamasutra.com, 2000c.

[KREITZBERG E LITTLE 2009] KREITZBERG, Charles G; LITTLE, Ambrose. O poder de personas. 2009. Disponível em <http://msdn.microsoft.com/pt-br/magazine/dd569755.aspx>. Acesso em 5 de abril de 2010.

[JAIN AND DUBES 1988] JAIN, A.K. & DUBES, R.C. “Algorithms for Clustering Data”, Prentice Hall, 1988.

72

[JBOSS RICHFACES] JBOSS RICHFACES. Disponível em <www.jboss.org/jbossrichfaces>. Acesso em: 02/10/2010.

[JONES 1992] JONES, John Chris. Design Methods. 2. ed. Indianapolis: Willey, 1992.

[LIMA 2008] LIMA, Aliandro; NELSON, Odilon. XHTM e Facelets. Apresentação do Power Point, Janeiro, 2008.

[LOBACH 2001] LÖBACH, Bernd. Design Industrial: Bases para configuração dos produtos industriais. Tradução Freddy Van Camp. - Rio de Janeiro: Edgard Blücher, 2001.

[LUBAN 2001] LUBAN, Pascal. The right decision at the right time: selecting the right features for a new game project. In: Gamasutra.com, 2001.

[LUBAN 2006] LUBAN, Pascal. Interview with Pascal Luban of The Game Design Studio. Disponível em: http://www.theswapmeet.com/articles/luban.html. Acesso em: 20/06/2010.

[MAGIC THE GATHERING 2007] MAGIC THE GATHERING. Manual de Regras Básico. 10ª Edição. Renton: Wizards of the Coast, 2007. Disponível em Http://www.devir.com.br/magic/pdf/MagicRulebook.pdf Acessado em 21/07/10.

[MEIRA et. al 2009] MEIRA, L., NEVES, A., RAMALHO, G. Lan House na escola: uma olimpíada de jogos digitais e educação. VIII Brazilian Symposium on Games and Digital Entertainment. Rio de Janeiro, RJ – Brazil, October, 8th-10th 2009.

[NETO 2010] NETO, E. J. C. F. XDM WEB – Uma ferramenta web 2.0 de apoio ao processo de concepção de jogos. Recife, março 2010.

[NEVES et. al 2008] NEVES, A. M. M. ; CAMPOS, F.F.C. ; BARROS, S. G. ; CAMPELLO, S. B. ; ARAGÃO, i. ; CASTILLO, L. : XDM Métodos Extensíveis de Design. In: P & D 2008, 2008, São Paulo. Anais do congresso brasileiro de pesquisa e desenvolvimento em design. São Paulo, 2008. v. 1. p. 1-1.

[NEVES 2009] NEVES, André; OLIVEIRA, Bruno S.; FALCÃO, Leo. Pesquisa com usuários no processo de game design em Pernambuco. VII Brazilian Symposium on Games and Digital Entertainment, 2009.

73

[OCHI et al. 2004] OCHI, L. S.; DIAS, C. R.; SOARES, S. F. Clusterização em Mineração de Dados. Programa de Pós-Graduação em Computação - UFF, RJ, 2004.

[OJE] Disponível no endereço: www7.educacao.pe.gov.br/oje. Acesso 14/05/2011

[OLIVEIRA 2010] OLIVEIRA, B. S. Cards Persona: Aplicação da técnica de personas na criação de jogos digitais. Recife, fevereiro 2010. [PENTAHO DATA MINING] Disponível no endereço: http://wiki.pentaho.com/ display/DATAMINING/SimpleKMeans. Acesso 12/04/2011

[PERUCIA 2005] PERUCIA, Alexandre. Desenvolvimento de Jogos Eletrônicos – Teoria e Prática, Porto Alegre, Novatec, 2005.

[PRUITT E ADLIN 2006] PRUITT, J.; ADLIN, T. The persona lifecycle: keeping people in mind throughout product design. San Francisco: Elsevier, 2006.

[QUESENBERY 2004] QUESENBERY, W. Using personas: bringing users alive, STC Usability SIG newsletter – Usability interface, 2004.

[VAN AKEN 2005] VAN AKEN, Joan Ernst. Valid knowledge for the professional design of large and complex design processes. Design Studies, Great Britain, v. 26, n. 4, p.379-404, 4 jul. 2005.

[ZIMMERMAN 2003] ZIMMERMAN, Eric. Play as Research: the iteractive design process. In: LAUREL, Brenda. (Ed.) Design Research: methods and perspectives. Cambridge: MIT Press, 2003.

[WEKA] www.cs.waikato.ac.nz/ml/weka

[WITTEN e FRANK 2005] WITTEN, Ian H.; FRANK, Eibe. Data mining: practical machine learning tools and techniques. Morgan Kaufmann, 2005.