modelo tcc decsi atual

35
Universidade Federal de Ouro Preto Instituto de Ciências Exatas e Aplicadas Colegiado de Sistemas de Informação Rede Social Baseada em Localização Thiago Moreira de Freitas TRABALHO DE CONCLUSÃO DE CURSO ORIENTAÇÃO: Alexandre Magno de Sousa Julho, 2015 João Monlevade/MG

Upload: pochavida

Post on 14-Dec-2015

53 views

Category:

Documents


20 download

DESCRIPTION

modelo tcc

TRANSCRIPT

Page 1: Modelo Tcc Decsi Atual

Universidade Federal de Ouro PretoInstituto de Ciências Exatas e AplicadasColegiado de Sistemas de Informação

Rede Social Baseada emLocalização

Thiago Moreira de Freitas

TRABALHO DECONCLUSÃO DE CURSO

ORIENTAÇÃO:Alexandre Magno de Sousa

Julho, 2015João Monlevade/MG

Page 2: Modelo Tcc Decsi Atual
Page 3: Modelo Tcc Decsi Atual

Thiago Moreira de Freitas

Rede Social Baseada em Localização

Orientador: Alexandre Magno de Sousa

Monografia apresentada ao curso de Sistemas de Infor-mação do Departamento de Computação e Sistemasda Universidade Federal de Ouro Preto como requisitoparcial para obtenção do grau de Bacharel em Sistemasde Informação

Universidade Federal de Ouro PretoJoão MonlevadeJulho de 2015

Page 4: Modelo Tcc Decsi Atual

Thiago Moreira de FreitasRede Social Baseada em Localização/ Thiago Moreira de Freitas. – João

Monlevade, 29 de julho de 2015-33 p. : il. (algumas color.) ; 30 cm.

Orientador: Alexandre Magno de Sousa

Monografia (graduação) – Universidade Federal de Ouro Preto, 29 de julho de2015.1. Palavra-chave1. 2. Palavra-chave2. I. Orientador. II. Universidade xxx. III.

Faculdade de xxx. IV. Título

CDU 02:141:005.7

Page 5: Modelo Tcc Decsi Atual

FOLHA DE APROVAÇÃO DA BANCA EXAMINADORA

Rede Social Baseada em Localização

Thiago Moreira de Freitas

Monografia apresentada ao curso de Sistemas de Informação do De-partamento de Computação e Sistemas da Universidade Federal deOuro Preto como requisito parcial para obtenção do grau de Bacharelem Sistemas de Informação aprovada pela Banca Examinadora abaixoassinada:

Alexandre Magno de SousaMestre em Ciência da Computação

OrientadorDECSI - UFOP

Nome Completo Convidado1Mestre em Ciência da Computação

ExaminadorDECSI - UFOP

Nome Completo Convidado2Mestre em Ciência da Computação

ExaminadorDEENP - UFOP

João Monlevade, 29 de julho de 2015

Page 6: Modelo Tcc Decsi Atual
Page 7: Modelo Tcc Decsi Atual

Este trabalho é dedicado às crianças adultas que,quando pequenas, sonharam em se tornar cientistas.

Page 8: Modelo Tcc Decsi Atual
Page 9: Modelo Tcc Decsi Atual

Lista de abreviaturas e siglas

ABNT Associação Brasileira de Normas Técnicas

abnTeX ABsurdas Normas para TeX

OSN Oline Social Network - Rede Social Online

LBSN Location Basead Social Network - Rede Social Baseada em Localização

GPS Global Positioning System - Sistema de Posicionamento Global

Page 10: Modelo Tcc Decsi Atual
Page 11: Modelo Tcc Decsi Atual

Sumário

1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111.2 Resultados e Contribuições . . . . . . . . . . . . . . . . . . . . . . . . 111.3 Estrutura da Monografia . . . . . . . . . . . . . . . . . . . . . . . . . 11

2 TRABALHOS RELACIONADOS . . . . . . . . . . . . . . . . . . . . 132.1 You Are Your Check-In: Understanding the Behavior of Tourists

and Residents Using Data from Foursquare . . . . . . . . . . . . . . 132.2 O Uso de uma Rede Geossocial nas Cidades Brasileiras e sua Rela-

ção com Fatores Socioeconômicos . . . . . . . . . . . . . . . . . . . . 162.3 Estudo de Hábitos Alimentares e de Bebida Usando Mídia Social . 182.4 We Know Where You Live: Privacy Characterization of Foursquare

Behavior . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192.5 Considerações Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

3 FUNDAMENTAÇÃO TEÓRICA . . . . . . . . . . . . . . . . . . . . 213.1 Redes Sociais Online . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213.2 Redes Sociais Baseadas em Localização . . . . . . . . . . . . . . . . . 223.3 Porque Pessoas Utilizam Redes Sociais Baseadas em Localização . 233.4 Principais Componentes de uma Rede Social Baseada em Localização 243.5 Privacidade em Redes Sociais Georreferenciadas . . . . . . . . . . . 253.6 Popularidade de Locais . . . . . . . . . . . . . . . . . . . . . . . . . . 263.7 Considerações Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

4 OBJETIVO DO TRABALHO E METODOLOGIA . . . . . . . . . . 274.1 Definição do Problema . . . . . . . . . . . . . . . . . . . . . . . . . . 274.2 Metodologia Aplicada . . . . . . . . . . . . . . . . . . . . . . . . . . . 274.3 Considerações Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

5 RESULTADOS E CONTRIBUIÇÕES . . . . . . . . . . . . . . . . . 29

6 CONCLUSÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

Page 12: Modelo Tcc Decsi Atual
Page 13: Modelo Tcc Decsi Atual

11

1 Introdução

1.1 ObjetivosO objetivo geral deste trabalho é avaliar o comportamento social urbano da cidade de

Belo Horizonte a partir de informações públicas disponibilizadas em redes sociais baseadasem localização. O Foursquare foi a rede social escolhida para realizar este trabalho. Parase concluir o objetivo geral, foram realizados os seguintes objetivos específicos:

• Definir os dados disponibilizados pelo usuário que serão utilizados para alcançar oobjetivo geral.

• Desenvolver um coletor de dados para obter os dados definidos.

• Analisar os dados obtidos e chegar a conclusões.

1.2 Resultados e Contribuições

1.3 Estrutura da MonografiaO restante deste trabalho está estruturado da seguinte forma. O capítulo 2 descreve

os trabalhos relacionados. Em seguida, o capítulo 3 apresenta a fundamentação teórica.No capítulo 4 é descrito o objetivo do trabalho e metodologia. Posteriormente, no capítulo5 é abordado os resultados e contribuições. Finalmente, no capítulo 6 é feita a conclusão.

Page 14: Modelo Tcc Decsi Atual
Page 15: Modelo Tcc Decsi Atual

13

2 Trabalhos Relacionados

EDITAR - EDITAR - EDITAR Neste capítulo é apresentado trabalhos relacionados,em que diz respeito a coleta e análise de dados de redes sociais baseadas em localização.Este capítulo possui a seguinte estrutura. A seção 2.1 . Em seguida, a seção 2.2. Logoapós, a seção 2.3 . Na seção 2.4 .Posteriormente, na seção ?? .Finalmente, na seção 2.5 éapresentada as considerações finais.

2.1 You Are Your Check-In: Understanding the Behavior of Tou-rists and Residents Using Data from Foursquare

Em seu trabalho (FERREIRA; SILVA; LOUREIRO, 2014) apresentaram a utiliza-ção dos sinais emitidos pelos usuários da rede social Foursquare, os chamados check-ins,para ser realizado o entendimento entre as diferenças existentes entre o comportamentode turistas e residentes. Possuindo o objetivo de ressaltar: Metodologia para a separaçãode turistas e residentes utilizando dados de redes sociais baseadas em localização; Aná-lise de aspectos espaço-temporais do comportamento de turistas e residentes em quatrocidades populares ao redor do mundo: Londres, Nova Iorque, Rio de Janeiro e Tóquio;Uso de métricas de centralidade de rede para entender melhor a interação dos turistas eresidentes com a cidade. No estudo foram utilizados check-ins do Foursquare. Os dadosforam coletados a partir do Twitter, onde os check-ins estavam disponíveis de maneirapública. A coleta foi feita a partir da API de streaming fornecida pelo Twitter para buscade tweets em tempo real. Esta coleta foi realizada em uma semana do mês de abril de2012, nas cidades de Londres (15,671 check-ins), Nova Iorque (86,867 check-ins), Rio deJaneiro (27,222 check-ins) e Tóquio (118,788 check-ins).

Foi feita uma análise nos dados obtidos que demonstrou que nos usuários “turistas”a presença de locais turísticos é maior que nos usuários “residentes”. Entretanto, a diferençada porcentagem do tipo “turista” e da porcentagem de “residente” varia em cada cidade,refletindo a quantidade que turistas e residentes frequentam os mesmos locais. A cidade doRio de Janeiro possui uma diferença de 4 porcento, indicando que existe uma concentraçãomaior de turistas em locais turísticos. Em Tóquio a diferença é de 1 porcento, coincidindocom a menor concentração de locais turísticos, comparada com as outras cidades. Osautores perceberam que é comum a transição de turistas entre locais populares segundoo número de curtidas, seguido da preferência por locais turísticos, demonstrando queos turistas movimentam-se não apenas em locais turísticos mas também em locais depreferência mista.

Page 16: Modelo Tcc Decsi Atual

14 Capítulo 2. Trabalhos Relacionados

A depender da cidade o número de certas categorias pode variar. Em Tóquio,por exemplo, existe uma quantidade bem menor de check-ins em locais do tipo Casa emdatasets de residentes, ao contrário das outras cidades, onde check-ins em locais do tipoCasa neste mesmo tipo de dataset é popular. No Brasil, por exemplo, existem muitoscheck-ins na categoria Casa, o que indica uma preocupação menor com o fator privacidade.Esses resultados podem ser explicados por diferenças culturais.

A cidade de Nova Iorque, conhecida como uma das maiores do mundo e detentorade centros financeiros, tem presença de turistas e residentes dividida nas categorias Food eProfessional & Other Places, o que reflete a semelhança de comportamento entre os doistipos de usuários. Entretanto, a diferença de comportamento pode ser notada ao observarmaior presença de turistas em locais do tipo Outdoors, Arts & Entertainment e Travel &Transport.

Existem as subcategorias que sobressaem de acordo com o costume local. Ainda nacidade de Nova Iorque, dentre os residentes existe uma maior presença de check-ins emestádios de baseball, típico de uma cidade norte-americana, onde o baseball é um esportetradicional. Na cidade do Rio de Janeiro a subcategoria relacionada a restaurantes queservem churrasco também tem destaque, exibindo um hábito de moradores da cidade.Refletindo locais turísticos populares ao ar livre, a categoria Outdoor é bastante popularno Rio de Janeiro por turistas, ao contrário de Tóquio. Entretanto, a mesma categoria épopular entre os residentes de Tóquio, o que demonstra o hábito em frequentar locais aoar livre e monumentos.

A analise da relação entre as categorias e as classes de usuários ajuda a observaruma tendência de cada uma delas para cada tipo de local. Entretanto cada local possuipeculiaridades e pode ter o comportamento alterado a depender do estado do usuário.O comportamento de turistas e residentes sofre influências de aspectos temporais, comoo horário e época do ano. Em locais onde turistas e residentes costumam frequentar amovimentação em números é dividida, entretanto o comportamento é diferente. Ao analisarlocais de frequência mista (feita por turistas e residentes) e o movimento de cada tipo deusuário foi observado diferenças no padrão.

O Cristo Redentor e o Morro do Pão de Açúcar são pontos turísticos reconhecidosmundialmente. Possuem 100 porcento e 71 porcento das transições feitas por turistas,respectivamente. As transições para o Pão de Açúcar são em sua maioria com aeroportos.Há também ligação com alguns cafés. O Estádio Olímpico João Havelange tem um númeroproporcional de check-ins de turistas e residentes, inclusive em relação aos horários defrequência, predominante a noite coincidindo com horários de jogos). Embora tenha umnúmero alto de transições tanto por turistas quanto por residentes, há uma diferençanos locais que antecedem e sucedem essas transições. No caso dos residentes, existemmuitas transições para residências, academias, bairros e ruas. Os turistas também visitam o

Page 17: Modelo Tcc Decsi Atual

2.1. You Are Your Check-In: Understanding the Behavior of Tourists and Residents Using Data fromFoursquare 15

Engenhão à noite porém há transições durante o dia, provavelmente para visitas turísticas

No grafo de residentes também é possível visualizar a ida e a volta de alguns bairrospara o Engenhão. Um local popular entre os residentes (100 porcento dos check-ins feitospor essa classe), é o Café du Lage. Este café encontra-se no parque Henrique Lage, mesmolocal da Escola de Artes Visuais e é frequentado por moradores. Em um determinadolocal, pode-se inferir se ele é turístico ou não pelo horário ou locais que antecederam ousucederam o check-in. O Sambódromo da Marques de Sapucaí, no Rio de Janeiro, tevetransições feitas predominantemente por residentes, em horários de ensaios de escola desamba (entre 20 e 22 horas). Os locais de origem ou destino são em sua maioria relacionadosa ruas e bairros, todos intermediários a estadia no local.

Outro destaque é a favela Pavão-Pavãozinho, popular no ranking de transições, quepossui check-ins feitos apenas por residentes. Embora algumas favelas do Rio já tenhamvisitas guiadas para turistas, como a Rocinha, a Pavão-Pavãozinho tem movimentaçãoapenas por parte de residentes.

A partir do degree centrality os autores perceberam que tais locais são característicosde pessoas que moram na cidade e priorizam locais relacionados a atividades cotidianas.

A partir do degrre centrality dos turistas da cidade de Nova Iorque, foi observadoum perfil diferente, concentrando locais de alimentação e visitação. Dos 10 locais listados,alguns possuem relação mais forte com a classe de turistas, por exemplo, aeroporto e locaispara visitação, como Central Park, Manhattan Bridge, Union Square Park e US PostOffice. O US Post Office, apesar de estar na categoria Post Office, aparece em listas devisitação turística devido à arquitetura das suas instalações. Além destes, outras categoriascomo Coffee Shop e Supermarket são populares durante a noite, provavelmente em funçãodo jantar. O local ShopRite, por exemplo, funciona 24 horas e é indicado como local paraalimentação rápida nas dicas deixadas pelos usuários no Foursquare. Estes locais refletemo comportamento turístico na cidade pois são atividades relacionadas ao entretenimentocombinado com necessidades básicas, como alimentação.

A ponte de Manhattan aparece tanto no ranking do grafo de turistas quanto dografo de residentes, pois atrai as duas classes de usuários. Para os turistas é um dos cartõespostais de Nova Iorque e para os residentes passagem que liga Manhattan ao Brooklyn.No ranking do grafo de residentes os vértices de maior grau tem maior aparição durante anoite, enquanto no ranking do grafo de turistas os horários são diversificados.

Através do estudo apresentado foi observado as diferenças no comportamentoentre as classes de usuários turistas e residentes, e também entender melhor a dinâmicadas cidades com as técnicas utilizadas. Existem inúmeras possibilidades para trabalhosfuturos, por exemplo, a utilização de outras métricas de redes complexas para auxiliar noentendimento do comportamento dos usuários sob outras perspectivas.

Page 18: Modelo Tcc Decsi Atual

16 Capítulo 2. Trabalhos Relacionados

2.2 O Uso de uma Rede Geossocial nas Cidades Brasileiras e suaRelação com Fatores Socioeconômicos

O trabalho de (SALES et al., 2013) dá um passo na investigação das oportunidadese desafios de diferentes contextos urbanos dentro do Brasil para o uso do Foursquare.Para tanto, foram consideradas duas perguntas para a pesquisa. Primeiro, foi exploradocomo o uso do Foursquare acontece e varia em diferentes cidades brasileiras. Segundo,teve o objetivo entender como as características socioeconômicas de diferentes cidades queadotaram o Foursquare se relacionam com o seu funcionamento no Brasil.

Foi feita uma análise exploratória e descritiva, que considera dados coletadosdo uso do Foursquare em 59 das cidades mais populosas do Brasil. Para caracterizaro uso do Foursquare, foi proposto um conjunto de quatro métricas (Atividade por 100mil pessoas, caracteriza quão ativa a cidade é no Foursquare em um período; dimensãoDensidade captura quanta informação existe por km2 na cidade; Idade média da 5a dicae Diversidade da informação em uma cidade) que captura aspectos da anotação coletivarealizada pelos usuários de uma cidade que produzem valor para seus usuários. Comofatores socioeconômicos, foram utilizados indicadores relacionados à economia, bem-estar,população e violência nos municípios. A análise da relação entre os fatores socioeconômicose as quatro dimensões do uso do Foursquare que foram definidas é feita através de regressõesmultivariadas.

A coleta de dados sobre uso do Foursquare foi realizada três períodos distintos deuma semana em 2012. Do dia 29/06 a 05/07/2012, tiveram 345.165 check-ins coletadose 171.711 lugares mencionados, no período de 03/10 a 10/10/2012, obtiveram 292.770check-ins e 109.104 lugares mencionados, do dia 01/11 a 08/11/2012, coletaram 620.906check-ins e tiveram como retorno 278.050 lugares mencionados. Em cada uma destassemanas, duas etapas foram conduzidas. A primeira etapa da coleta visou obter umpanorama da atividade no Foursquare durante uma semana em cada cidade. Como a APIpública do Foursquare não dá suporte direto à obtenção destes dados, a API do Twitterfoi utilizada para a coleta. Informações duplicadas foram ignoradas. Os dados coletadosnesta etapa representam uma amostra de todos os check-ins realizados na cidade, umavez que a integração entre o Foursquare e Twitter. Para evitar que a semana escolhidapara a análise fosse atípica em alguma das cidades (devido a um feriado municipal, festejoregional, etc.), dentre as três coletas realizadas, a amostra utilizada para cada cidadeé a que tem a mediana da quantidade de postagens observada naquela cidade nas suastrês medições. A segunda etapa da coleta de dados consiste em obter, através da APIpública do Foursquare, informações sobre tips em cada um dos lugares mencionados nosdados obtidos na amostra escolhida na primeira etapa para cada cidade. Com esta coleta,foi obtido um panorama do histórico do uso do Foursquare nos locais para os quais foi

Page 19: Modelo Tcc Decsi Atual

2.2. O Uso de uma Rede Geossocial nas Cidades Brasileiras e sua Relação com Fatores Socioeconômicos17

observado atividade na semana de coleta escolhida. Os dados correspondentes aos índicesutilizado na análise dos fatores socioeconômicos foram obtidos do IBGE, com exceção dataxa de homicídios dos municípios, obtida do Ministério da Saúde. Todos os indicadoressão referentes ao censo de 2010, com exceção do IDHM, que é referente ao ano 2000. Alémdos dados da rede geossocial e de fatores socioeconômicos, coletamos também do IBGEshape files que descrevem as fronteiras a área territorial de cada uma das 59 cidadesestudadas.

Realizando a análise dos dados no que diz respeito a atividade por 100 mil habitantes,foi observado uma distribuição concentrada em valores menores que 3500 postagens por 100mil habitantes, com a mediana sendo 2419 postagens/100mil habitantes. Inspecionando osdados, foi constatado que a maioria das cidades com valor nesta métrica acima da medianasão as capitais de seus estados. Esta constatação indica que a adoção do Foursquareestá mais avançada nos centros econômicos dos estados. As cidades com maior atividaderelativa na amostra são Belo Horizonte/MG e São Luís/MA, com aproximadamente 20mil postagens para cada 100 mil habitantes na semana observada. No extremo oposto,Belford Roxo, Mauá, Piracicaba, Osasco, Caxias do Sul e Aparecida de Goiânia têm todasmenos de 300 postagens por 100 mil habitantes.

Para a diversidade, há uma clara moda em torno de 1 usuário/local, indicandoque em uma fração significativa das cidades observadas, existem muitos locais anotadospela informação de um único usuário. Por outro lado, metade das cidades têm diversidadesuperior a 2,64 usuários/local. Ademais, as cidades com maior diversidade não são emgeral aquelas com maior atividade por 100 mil habitantes, com a exceção de Belém/PA,que aparece nos dados como cidade ativa (15 mil postagens por 100 mil habitantes) ediversa (em média 12 opiniões de usuários diferentes por local anotado).

Em relação a densidade das cidades na amostra de dados, os autores obtiveramuma média e mediana respectivamente em 77 e 60 marcações por km2. As cidades que sedestacam nesta métrica são sobretudo Niterói/RJ e Florianópolis/SC, com mais de 200marcações por km2. Uma possibilidade é que a extensão territorial utilizada pelos usuáriosdo Foursquare nestas cidades seja relativamente pequena, e que isso, combinado com ocaráter turístico das duas cidades potencialize a densidade de suas marcações. Entre ascidades com menor densidade estão Brasília, Natal e Belém. Por fim, idade da 5a dicatem uma distribuição menos concentrada e sem cidades de claro destaque. A média emediana da idade da 5a dica é de 9,6 e 10 dias, respectivamente. Entre as cidades commenor idade para a 5a dica, observamos diversas cidades relativamente pequenas e depouca atividade, sugerindo que nestes casos há uma concentração da atividade em menoslocais, ocasionando anotações mais recentes em média.

Page 20: Modelo Tcc Decsi Atual

18 Capítulo 2. Trabalhos Relacionados

2.3 Estudo de Hábitos Alimentares e de Bebida Usando Mídia So-cial

O trabalho dos autores (SILVA et al., 2014) visa utilizar a mesma metodologia parao estudo de diferenças culturais proposta em [10], no entanto foi objetivado: utilizar umanova base de dados do Foursquare e verificar se obtém os mesmos resultados apresentadospor [10]; Responder duas perguntas que não foram respondidas por [10]. Qual o resultadode separação de culturas se for desconsiderado o tempo e considerado apenas os tiposde locais presentes nas regiões analisadas? E se considerarmos o tipo de local e a suapopularidade na região?

Foi analisado um conjunto de dados do Foursquare. Os dados do Foursquare foramcoletados através do Twitter. Além de tweets de texto simples, os usuários também podemcompartilhar localizações (ou check-ins) a partir de uma integração com o Foursquare. EmAbril de 2012 (do dia 20 a 29), foram coletados mais de 3,2 milhões de tweets contendocheck-ins georreferenciados. Como o interesse do estudo foi principalmente relacionadono que as pessoas comem ou bebem, foram agrupamos manualmente as subcategoriasde locais, disponíveis no conjunto de dados do Foursquare, relacionadas com três classes:Bebida, Fast Food e Slow Food. Após o processo de classificação manual, a classe Bebidaresultou em 216.694 check-ins, disponibilizados por 135.671 usuários únicos; a classe FastFood com 301.634 check-ins, disponibilizados por 190.517 usuários únicos; e a classe SlowFood com 306.836 check-ins disponibilizados por 193.694 usuários únicos. Além disso, aclasse Bebida tem 21 subcategorias (por exemplo, sake place, karaoke bar e pub), ao passoque a classe Fast Food tem 27 subcategorias (por exemplo, bakery, burger joint e wingsjoint) e a classe Slow Food tem 53 subcategorias, incluindo Chinese restaurant, steakhousee Greek restaurant.

Para uma análise espacial foi verificado onde as pessoas de diferentes cidadesfrequentam, considerando as três classes de locais definidas. A classe Slow Food apresentaalta distinção, ou correlação menor, na maior parte das e cidades, exceto para as cidadesque pertencem ao mesmo país. As cidades dos EUA, Brasil, Japão e Indonésia, os únicospaíses que possuem pelo menos duas cidades representantes, são altamente correlacionadas.Esse resultado também foi observado por [10], assim como os resultados para as classesBebidas e Fast Food, resultados omitidos nesse artigo.

Para a análise temporal foi analisado os horários em que os usuários comem e/oubebem. Foram mostrados os resultados para três cidades brasileiras (Belo Horizonte, PortoAlegre e São Paulo). Sendo que o número de check-ins realizados na classe Slow Food aolongo das horas do dia em diferentes cidades brasileiras em dias de semana, exibem umpadrão semelhante. Foi notado que as cidades refletem um comportamento apresentadopelo país, apresentando o maior pico de atividade por volta da hora do almoço. Isso reflete

Page 21: Modelo Tcc Decsi Atual

2.4. We Know Where You Live: Privacy Characterization of Foursquare Behavior 19

uma característica já conhecida do hábito dos brasileiros: dar maior importância ao almoço.Esse resultado também está de acordo com o apresentado em [10].

Para realizar a identificação de fronteiras culturais os autores utilização a clus-terização de regiões com hábitos alimentares e de bebida similares, utilizaram tambéma mesma metodologia proposta em [10]. O resultado foi de acordo com o esperado, ascidades dos Estados Unidos, Brasil, Europa e Ásia foram clusterizadas separadamente.Esses resultados são idênticos aos encontrados por [10].

Considerando um dataset ainda não analisado anteriormente, nossos resultadospreliminares indicam que hábitos alimentares e bebida dos usuários são bastante similaresaos hábitos observados anteriormente por [10]. Isso sugere que os resultados observadosnaquele trabalho, mesmo considerando apenas uma semana de dados, podem sim explicaros hábitos culturais dos usuários das regiões analisadas. Além disso, estudamos duasnovas abordagens para clusterização de regiões, que inicialmente foram piores do que aabordagem apresentada por [10].

2.4 We Know Where You Live: Privacy Characterization of Fours-quare Behavior

O objetivo dos autores (PONTES et al., 2012) foi fazer um estudo para poderinferir facilmente a cidade de origem (estado e país) de um usuário baseado em informaçõesdisponíveis ao público, simplesmente tomando a localização da maioria do locais que ousuário é conectado e as prefeituras, Tips e Dones. O estudo foi baseado em um grandeconjunto de dados coletados a partir do Foursquare usando a API do sistema. Foram obtidosdados de perfil de usuário constituído por tipo de usuário, cidade natal, lista de amigos,prefeituras, Tips, Dones, número total de check-ins, nomes no Twitter e identificadores noFacebook. A coleta foi feita de agosto a outubro de 2011, coletando um total de 13.570.060de usuários. O conjunto de dados contém 10.618.411 Tips, 9.989.325 Dones e 15.149.981prefeituras em 15.898.484 locais diferentes.

Analisando as prefeituras, Tips e Dones de usuários foram obtidos que cerca de 1milhão que têm apenas prefeituras, 670 mil que têm apenas Tips e 367.000 que têm apenasDones, enquanto que 890.000 usuários têm todos os três atributos. Assim, explorar essesatributos para inferir uma cidade do usuário é promissor como a informação necessáriaestá disponível em uma grande fração de todos os usuários. Foi verificado que as cidadescom o maior número de prefeituras tendem também a ter um grande número de Tips eDones.

Foi realizada uma análise temporal e espacial da atividade do usuário em termosde Tips e Dones. Cerca de 36% dos usuários têm deslocamentos médios e máximos de 0

Page 22: Modelo Tcc Decsi Atual

20 Capítulo 2. Trabalhos Relacionados

km, indicando distâncias muito curtas (dentro de poucos metros). Além disso, 70% dosutilizadores têm uma média de deslocamento de no máximo 150 quilômetros, que poderiamser caracterizadas como dentro da área metropolitana de uma grande cidade, também60% dos usuários possuem um deslocamento máximo de 100 quilômetros, possivelmente, adistância entre cidades vizinhas. Cerca de 10% dos usuários possuem um deslocamentomáximo de, pelo menos, 6.000 quilômetros.

Os usuários tendem a ter prefeituras, Tip e Dones em Venues no mesmo localonde eles vivem. Num primeiro momento, pode-se pensar que as prefeituras são talvez apeça mais forte de evidências sobre a cidade de um usuário. No entanto, Tips tambémrevelam lugares onde o usuário tem ido. Finalmente, Dones pode também fornecer algumasevidências sobre a localização casa de um usuário, embora talvez não tão forte como Tips eprefeituras. Através dos resultados obtidos as prefeituras são o melhor atributo para inferirlocal de origem, embora, talvez surpreendentemente, Tips são apenas marginalmente pior.Dones, por sua vez, produzem os piores resultados entre os três atributos, quando utilizadoisoladamente. a combinação de atributos faz mal a precisão, em comparação com o modeloPrefeitura, na maioria dos casos, possivelmente devido Tips e Dones adicionar algumruído. Se pode inferir corretamente a cidade de cerca de 78% dos usuários no prazo de50 quilômetros de distância. Para o estado do usuário, atingiu uma precisão em torno de75%. Para o país precisões acima de 90%.

Através dos resultados se pode destacar o comportamento do usuário em termos demobilidade. Em nível municipal, por exemplo, alguns usuários que vivem nas proximidadesdas cidades inferidas, o que pode indicar que eles provavelmente vivem em um lugare mudam frequentemente para outro. No nível estadual, a fração mais baixa, mas nãodesprezível de erros indica que existem alguns usuários que têm mobilidade interestadual.No nível de país, que há uma alta concentração de atividades consideradas (prefeituras,Tips e Dones). Isto pode ser verificado pela maior precisão obtidas nos modelos. Noentanto, erros de inferência ainda são possíveis uma vez que alguns usuários podem tersua localização atual desatualizada, ou podem viajar muito em torno do mundo.

2.5 Considerações Finais

Page 23: Modelo Tcc Decsi Atual

21

3 Fundamentação Teórica

Está capítulo aborda a fundamentação teórica do trabalho sendo organizada destemodo. A Seção 3.1 descreve as principais características e importância de redes sociaisonline. Principais características e importância em redes sociais baseadas em localizaçãosão apresentadas na seção 3.2. Em seguida é descrito o porque de pessoas utilizaremredes sociais baseadas em localização na 3.3. Na seção 3.4 é apresentado os principaiscomponentes de uma rede social baseada em localização.Posteriormente, a seção 3.5descreve sobre a privacidade em redes sociais georreferenciadas.Logo após, a popularidadede locais é apresentado na seção 3.6.Finalmente, na seção 3.7 apresenta as consideraçõesfinais.

3.1 Redes Sociais Online

Com o advento da internet surgiram diversas aplicações para a plataforma web,email, comércio eletrônico, aplicações par-a-par, entre outros(BENEVENUTO; ALMEIDA;SILVA, 2012). O modo de comunicação das pessoas passou por uma mudança significativa,elas começaram a se socializar pela internet através de redes sociais online (OSNs)(LI;CHEN, 2010). As OSNs ganharam grande popularidade pela funcionalidade de permitir queusuários criem e compartilhem conteúdo nesses ambientes (BENEVENUTO; ALMEIDA;SILVA, 2012). Estes conteúdos podem ser fotos, vídeos, mensagens entre outros.

Redes sociais online tem o objetivo de incentivar usuários a interagirem uns com osoutros e que os mesmos realizem compartilhamento de informação. Visando este objetivoexistem vários tipos de redes sociais disponíveis na internet de acordo com o interessepresente em um grupo de pessoas. Redes destinadas a relacionamentos (Facebook, Google+, MySpace ), a mensagens curtas (Twitter),a profissionais(LinkedIn), a compartilhamentode vídeos(You-Tube), compartilhamento de fotos(Instagram),entre outras.

(BENEVENUTO; ALMEIDA; SILVA, 2012) Definiram rede social online como umserviço Web que permite a um indivíduo (1) construir perfis públicos ou semi-públicosdentro de um sistema, (2) articular uma lista de outros usuários com os quais ele(a)compartilha conexões e (3) visualizar e percorrer suas listas de conexões assim como outraslistas criadas por outros usuários do sistema.

Page 24: Modelo Tcc Decsi Atual

22 Capítulo 3. Fundamentação Teórica

3.2 Redes Sociais Baseadas em LocalizaçãoCom a popularização do uso de smartphones incorporados com GPS(Global Posi-

tioning System) e acesso a Internet, como iPhones e telefones Google Android, toraramredes sociais baseadas em localização (LBSNs) muito mais acessíveis para usuários mó-veis(LI; CHEN, 2010; LINDQVIST et al., 2011; GAMBS; HEEN; POTIN, 2011). Essatecnologia tornou possível obter o local atual em que indivíduos estão presentes e, emseguida, transformar em um endereço físico utilizando uma ferramenta de geocodificaçãoreversa(GAMBS; HEEN; POTIN, 2011). Usuários que utilizam smartphones tem pas-sado a utilizar aplicativos que possibilitam o compartilhamento de localização, podendocompartilhar suas informações com amigos em suas redes sociais(LINDQVIST et al., 2011).

Redes sociais baseadas em localização como Foursquare, Facebook Places e outras,permitem que o usuário munido de um aparelho smartphone com GPS compartilhem sualocalização atual. Essa ação é denominada check-in, que é um diferencial em relação a redessociais(OSNs) que não possuem essa função. O check-in através de um aplicativo móvelé feito com muito mais facilidade e de uma forma mais frequente, que quando o usuáriotem que fazer o check-in a partir de um aplicativo web, consequentemente aumentando aquantidade de dados gerados(GAMBS; HEEN; POTIN, 2011). Nas LBSNs é incentivado ocompartilhamento de locais frequentados pelos utilizador propagando essas informaçõespara outros usuários, sendo possível avaliar o local em que se realizou o Check-In, realizaruma descrição contendo sua opinião e existe a possibilidade de outras pessoas avaliemessas descrições.

Informações de localização podem ser utilizadas para recomendação de pontos deinteresses próximo, fornecer orientações, facilitar a coordenação social entre grupos de ami-gos, conhecer novas pessoas, monitorar usuários(GUHA; BIRNHOLTZ, 2013; LINDQVISTet al., 2011). A facilidade de realizar atividades sociais e coordenação é um dos motivos quetornam as redes sociais baseadas em localização uma atividade atraente para os usuários,sendo que tira aquele padrão de ficar atras do computador para conhecer novas pessoaspresente nas redes sociais online, nas redes sociais baseadas em localização incentiva ousuário a sair de casa e ter uma atividade social mais "física"do que a proporcionada pelasOSNs.

Abaixo são apresentadas algumas redes sociais baseadas em localização, demons-trando seus principais objetivos e características para atender as necessidades de seususuários:

• Yelp: Fundado em 2004 com o objetivo de possibilitar as pessoas encontraremserviços e estabelecimentos, tais como: dentistas, cabeleireiros e mecânicos. O Yelpteve uma média de aproximadamente 142 milhões visitantes mensais em 2015.Usuários do Yelp já escreveram mais de 77 milhões de avaliações. Além de escrever e

Page 25: Modelo Tcc Decsi Atual

3.3. Porque Pessoas Utilizam Redes Sociais Baseadas em Localização 23

pesquisar avaliações, é possível utilizar o Yelp para encontrar listas e para conversarcom outros usuários;

• Facebook Places: Funciona a partir de um smartphone com GPS integrado, elemostra uma lista de lugares próximos ao usuário. Todos os lugares possuem suaspróprias páginas no Facebook. Onde é possível fazer um check-in nestes locais, apartir disso é feito o compartilhamento para o grupo de amigos no Facebook dousuário permitindo que eles visualizam onde o usuário esteve;

• Apontador: Tem o objetivo de permitir o usuário encontrar lugares, serviços efacilidades online em determinada cidade. O Apontador permite o usuário filtrar asavaliações de acordo com o que deseja achar: Melhor Conteúdo, Menores, Recentes,Mais Antigas, Mais curtidas, Negativas e Positivas.1 a cada 5 brasileiros que usainternet passa pelo Apontador procurando um lugar ou serviço. 16 milhões de pessoasacessam o site Apontador todo mês. Mais de 7.5 milhões de locais cadastrados.

TABELA DE REDES SOCIAIS BASEADAS EM LOCALIZAÇÃO

3.3 Porque Pessoas Utilizam Redes Sociais Baseadas em Localiza-çãoRedes sociais baseadas em localização possibilitaram um novo modo de utilização

de redes sociais online. Esses tipos de rede trouxeram o compartilhamento de localizaçãoque ganhou popularidade. O que levanta perguntas:Qual o valor impulsiona uso dessessistemas das pessoas? Como é que usuários se apropriam desses sistemas, inventandonovos propósitos para que eles servem? Entender essas e outras perguntas podem oferecerinformações valiosas sobre o uso do mundo real e pode revelar oportunidades de design denovos serviços e novas aplicações.

(LINDQVIST et al., 2011) em seu trabalho examinaram o compartilhamento delocalização da rede social Foursquare, em sua pesquisa os participantes mencionaram comobenefício o contato com os amigos, descobrimento de novos lugares, manter o controledos restaurantes e bares para torná-lo mais fácil de visitá-los novamente, descontos emprodutos oferecidos para pessoas que frequentassem os lugares varias vezes. Em relaçãoa privacidade foi mencionado como uma desvantagem, aproximadamente metade dosparticipantes tinha preocupações com a privacidade, a outra metade não. Em respeito anão fazer Chek-in em determinados locais surgiu problemas de auto representação, porexemplo não fazer o check-in em restaurantes de fast food, em casa e trabalhos . Empequena quantidade foi visto decisões semelhantes a não fazer check-in para os médicos e

Page 26: Modelo Tcc Decsi Atual

24 Capítulo 3. Fundamentação Teórica

bancos. Com isso foi afirmando que há lugares onde certas pessoas teriam vergonha dedizer onde estavam. Em relação a usos diferentes do Foursquare, utilização do check-inpara avisar que chegou em casa em segurança ou para informar disponibilidade.

3.4 Principais Componentes de uma Rede Social Baseada em Lo-calizaçãoNesta seção são descritas algumas das funcionalidades presentes em uma rede social

baseada em localização. O objetivo é apresentar oque as principais redes sociais destacategoria pode fornecer em sua utilização, não apresentar uma lista exaustiva de todassuas funcionalidades.

• Perfil do usuário: É uma página disponibilizada para o usuário, que contém suasinformações. Perfis possuem conteúdos que demonstram características do individuoem questão, como os interesses, informações pessoais, foto, entre outras informaçõesque podem variar de acordo com a rede social.

• Check-in: Possibilita o usuário compartilhar sua informação geográfica na redesocial baseada em localização.

• Atualizações: Uma das formas do usuário conseguir descobrir conteúdo na redesocial. Permite que usuários consigam visualizar informações compartilhadas deseus amigos e ao mesmo tempo encoraja usuários a realizarem compartilhamento deinformações.

• Local:Página que contém informações sobre o local que pode ser realizado check-in.Nesta página contem detalhes como informações básicas do local (endereço do local,informações para contato, informações sobre características de funcionamento dolocal), categoria em que se enquadra o local, pontuação arrecadada de avaliaçõesfeitas pelos usuários e comentários de frequentadores.

• Comentários: Forma do usuário expressar características e opinião sobre o local.Uma forma de descrever o sentimento de frequentar o local, podendo atrair novosusuários da rede social para frequentar o local comentado ou até mesmo afastar deacordo com oque foi informado pelo usuário.

• Avaliação: Permite a usuários expressar sua opinião sobre um local ou sobre umcomentário feito sobre o local gostando ou não do mesmo.(EDITAR)

• Listas de locais: Permite usuário salvar locais para que possa realizar check-infuturamente, ou que gostou de frequentar para visitar posteriormente.(EDITAR)

Page 27: Modelo Tcc Decsi Atual

3.5. Privacidade em Redes Sociais Georreferenciadas 25

3.5 Privacidade em Redes Sociais Georreferenciadas

Uma persistente questão em explorar o uso de LBSNs e serviços baseados emlocalização, em geral, tem sido um dos privacidade. Muitos usuários inicialmente resistiucompartilhar informações de localização (e muito poucos ainda fazem) [3, 5], e os pes-quisadores procuraram entender os motivos das pessoas para a partilha de localização[5, 27, 32], as circunstâncias em que eles estão dispostos a compartilhar [3], e com quempartilham [3,5,6,27]. (GUHA; BIRNHOLTZ, 2013).

Usando essa abordagem rende vários novos resultados. Em primeiro lugar, asdecisões das pessoas ao redor localização partilha não depende apenas de quem pode versua localização, mas também em suas percepções de como visível o check-in é e como olocal é público. Em segundo lugar, esses fatores criam uma sensação de indefinição dasfronteiras entre espaços públicos e privados e iniciar as tensões na rede amigo LBSN,que têm, impactos temporais posteriores sobre a formação e gerenciamento de impressão.(GUHA; BIRNHOLTZ, 2013).

No estudo de (LINDQVIST et al., 2011) obtiveram através de pesquisa em relaçãoa privacidade na rede social Foursquare, foi mencionado como uma desvantagem, apro-ximadamente metade dos participantes tinha preocupações com a privacidade, a outrametade não. A metade que não tinha preocupações com a privacidade, parecia ter umbom modelo mental de como o Foursquare funciona, sabendo utilizar os controles deprivacidade para controlar o que for compartilhado com os outros. Já a outra metade quetinha preocupações com a privacidade, parecia haver desalinhamento em termos de comoas pessoas entendessem o funcionamento do Foursquare, bem como o fato das pessoassaberem utilizar os controles de privacidade. Em relação ao gerenciamento de privacidade,(74 porcento) participantes tinha fotos reconhecíveis no seu perfil público, mais de 70porcento de pessoas que partilham número de telefone, endereço de e-mail, ou links paraseu perfil no Facebook ou Twitter. a maioria dos participantes (187) também deixaramser visto nas listas de "Quem está aqui"e 193 deixaram ver que eles tinham o check-inem um local. 142 (64 porcento) dos participantes vincularam a sua conta do Foursquareno Twitter, enquanto 114 (52 porcento) vincularam com o Facebook. No entanto, ape-nas 40 participantes (18 porcento) tweetam sobre seus check-ins e ainda menos 23 (11porcento) permitem o Foursquare postarem seus check-ins no mural do Facebook. 128participantes (58 porcento) disseram que tinham amigos que não haviam sequer encontradopessoalmente.29 dos participantes (17 p do sexo masculino e 12 do sexo feminino) às vezes,fazem check-in quando eles estão deixando um lugar para fins de segurança . Um númerosignificativo de participantes 71 (32 porcento) também disseram ter usado Foursquarepara verificar se alguém chegou em segurança ao seu destino.

Page 28: Modelo Tcc Decsi Atual

26 Capítulo 3. Fundamentação Teórica

3.6 Popularidade de Locais

3.7 Considerações Finais

Page 29: Modelo Tcc Decsi Atual

27

4 Objetivo do Trabalho e Metodologia

4.1 Definição do Problema

4.2 Metodologia AplicadaO Selenium é um conjunto de ferramentas de software diferentes, cada um com

uma abordagem diferente para apoiar a automação de teste. Através dessa ferramenta setem um grande conjunto de funções de teste para realizar testes em aplicações web detodos os tipos. As operações permitidas no Selenium são flexíveis, permitindo variadasopções de localização de elementos presente em uma página web. Uma das principaiscaracterísticas do Selenium é o suporte para execução de testes para múltiplas plataformasde navegadores(??).

O Foursquare é uma rede social baseada em localização que permite usuários com-partilharem informações de locais que frequentam. O Foursquare procura saber oque seususuários gostam e indica lugares a partir do gosto particular de cada usuário. Recomenda-ções do Foursquare são baseadas em gostos, avaliações de lugares semelhantes e nos amigosem que o usuário confia. Em 2009, o Foursquare lançou o check-in e compartilhamento delocalização em tempo real com amigos. Cinco anos depois,foi criado um próprio aplicativopara os check-ins, chamado de Swarm. Em 2015 o Foursquare conta com mais de 55milhões de pessoas em todo mundo com mais de 70 milhões de dicas e fizeram check-inmais de 7 bilhões de vezes, mais de 2 milhões de empresas confirmaram suas localizaçõespara se conectar com seus clientes(??).

4.3 Considerações Finais

Page 30: Modelo Tcc Decsi Atual
Page 31: Modelo Tcc Decsi Atual

29

5 Resultados e Contribuições

Page 32: Modelo Tcc Decsi Atual
Page 33: Modelo Tcc Decsi Atual

31

6 Conclusão

Page 34: Modelo Tcc Decsi Atual
Page 35: Modelo Tcc Decsi Atual

33

Referências

ASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS. NBR 6028 : Resumo -apresentação. Rio de Janeiro, 2003. 2 p. Nenhuma citação no texto.

BENEVENUTO, F.; ALMEIDA, J.; SILVA, A. Coleta e análise de grandes bases dedados de redes sociais online. In: Jornadas de Atualização em Informática (JAI). [S.l.:s.n.], 2012. Citado na página 21.

FERREIRA, A. P. G.; SILVA, T. H.; LOUREIRO, A. A. F. You are your check-in:Understanding the behavior of tourists and residents using data from foursquare. In:Proceedings of the 20th Brazilian Symposium on Multimedia and the Web. New York, NY,USA: ACM, 2014. (WebMedia ’14), p. 103–110. ISBN 978-1-4503-3230-9. Disponível em:<http://doi.acm.org/10.1145/2664551.2664562>. Citado na página 13.

GAMBS, S.; HEEN, O.; POTIN, C. A comparative privacy analysis of geosocial networks.In: Proceedings of the 4th ACM SIGSPATIAL International Workshop on Security andPrivacy in GIS and LBS. New York, NY, USA: ACM, 2011. (SPRINGL ’11), p. 33–40.Citado na página 22.

GUHA, S.; BIRNHOLTZ, J. Can you see me now?: Location, visibility and themanagement of impressions on foursquare. In: Proceedings of the 15th InternationalConference on Human-computer Interaction with Mobile Devices and Services. New York,NY, USA: ACM, 2013. (MobileHCI ’13), p. 183–192. Citado 2 vezes nas páginas 22 e 25.

LI, N.; CHEN, G. Sharing location in online social networks. IEEE Network, 2010. Citado2 vezes nas páginas 21 e 22.

LINDQVIST, J. et al. I’m the mayor of my house: Examining why people use foursquare -a social-driven location sharing application. In: Proceedings of the SIGCHI Conference onHuman Factors in Computing Systems. New York, NY, USA: ACM, 2011. (CHI ’11), p.2409–2418. Citado 3 vezes nas páginas 22, 23 e 25.

PONTES, T. et al. We know where you live: Privacy characterization of foursquarebehavior. In: Proceedings of the 2012 ACM Conference on Ubiquitous Computing. NewYork, NY, USA: ACM, 2012. (UbiComp ’12), p. 898–905. ISBN 978-1-4503-1224-0.Disponível em: <http://doi.acm.org/10.1145/2370216.2370419>. Citado na página 19.

SALES, A. et al. O uso de uma rede geossocial nas cidades brasileiras e sua relaÇãocom fatores socioeconõmicos. In: Proceedings of the 12th Brazilian Symposiumon Human Factors in Computing Systems. Porto Alegre, Brazil, Brazil: BrazilianComputer Society, 2013. (IHC ’13), p. 142–147. ISBN 978-85-7669-278-2. Disponível em:<http://dl.acm.org/citation.cfm?id=2577101.2577130>. Citado na página 16.

SILVA, T. H. et al. Estudo de hábitos alimentares e de bebida usando mídiasocial. In: Proceedings of the 13th Brazilian Symposium on Human Factorsin Computing Systems. Porto Alegre, Brazil, Brazil: Sociedade Brasileira deComputa&#231;&#227;o, 2014. (IHC ’14), p. 337–340. ISBN 978-85-7669-291-1.Disponível em: <http://dl.acm.org/citation.cfm?id=2738055.2738110>. Citado napágina 18.