intro duçãorogerio/publications/cisaisi2009_apresentacao.pdf · intro dução agrupamento tip os...
TRANSCRIPT
De Vargas et al. PPgSC / Universidade Federal do Rio Grande do Norte � slide 1
Agrupamento de Dados Intervalares om oAlgoritmo IFCM
Rogério R. de Vargas, Benjamín R. C. Bedregal, Isaa O. FilhoCISAISI 2009
Ari a/Chile, Outubro de 2009
Introdução
De Vargas et al. PPgSC / Universidade Federal do Rio Grande do Norte � slide 2
AgrupamentoIntroduçãoAgrupamentoTipos deAgrupamentoMotivação
De Vargas et al. PPgSC / Universidade Federal do Rio Grande do Norte � slide 3
A tarefa de agrupamento reúne em um mesmo grupoobjetos de uma oleção que mantenham algum grau dea�nidade. Assim, a sua base é o on eito de similaridade,o seu objetivo prin ipal é de maximizar a similaridade deobjetos do mesmo grupo e de minimizá-la entre oselementos de grupos distintos.
Figure 1: Exemplo de agrupamento de dados em sete gru-pos, onde o rótulo sobre o elemento indi a a qual perten e
Tipos de AgrupamentoIntroduçãoAgrupamentoTipos deAgrupamentoMotivação
De Vargas et al. PPgSC / Universidade Federal do Rio Grande do Norte � slide 4■ Nos métodos de agrupamento hard ada ponto no onjunto de dados perten e a exatamente um luster ;■ Agrupamento fuzzy de uma forma bem geral, tem asua partição baseada na ideia de funções depertinên ia expressa por um grau de pertinên iareferente a um luster, isto é, os algoritmos fuzzyasso iam um dado a todos os lusters através davariação do grau de pertinên ia do dado em ada luster.
MotivaçãoIntroduçãoAgrupamentoTipos deAgrupamentoMotivação
De Vargas et al. PPgSC / Universidade Federal do Rio Grande do Norte � slide 5
Representar o onjunto de dados omo intervalos onsisteem delimitar os erros o asionados por estimativas demedições, de simpli� ações, modelagem, por falhahumana ou pelo instrumento de medição. Em diversostrabalhos na literatura, estes lidam om dadosintervalares mas om uma perspe tiva pontual no sentidoque os graus de pertinên ias e as métri as sejampontuais. Um dos objetivos deste trabalho é apresentaruma forma de agrupamento para os valores amostrais que onsideram os erros ontidos. Então a entrada dos dadossão valores intervalares. Desta forma, julga-se que a lassi� ação de ada elemento a um determinado luster(o grau de pertença) também seja um intervalo.
Matemáti a Intervalar
De Vargas et al. PPgSC / Universidade Federal do Rio Grande do Norte � slide 6
Operações Bási asMatemáti aIntervalarOperações Bási asFunçõesIntervalaresEspe iaisMétri a Intervalar
De Vargas et al. PPgSC / Universidade Federal do Rio Grande do Norte � slide 7
Table 1: Prin ipais operações sobre intervalosDes rição OperaçõesAdição X + Y =[(
x + y)
; (x + y)]Subtração X − Y =
[
(x − y) ;(
x − y)]Multipli ação X ×Y = [min{x×y, x×y, x×y, x×y}; max{x×
y, x × y, x × y, x × y}]Divisão XY
=[
min{
xy, x
y, x
y, x
y
}
; max{
xy, x
y, x
y, x
y
}] om
0 /∈[
y; y]
Funções Intervalares Espe iaisMatemáti aIntervalarOperações Bási asFunçõesIntervalaresEspe iaisMétri a Intervalar
De Vargas et al. PPgSC / Universidade Federal do Rio Grande do Norte � slide 8■ De�ne-se os expoentes de uma função intervalarsendo n ∈ N onforme
Xn =
[xn;xn] se x < 0 e n for par[0; max ([xn;xn])] se x < 0 < x e n for par[xn;xn] aso ontrário
■ De�ne-se a raiz fra ionário intervalar na equaçãon√
X =
{ [
n√
x; n√
x] se x ≥ 0
↑ aso ontrárioObserve que Xmn = ( n
√X)m.
Métri a IntervalarMatemáti aIntervalarOperações Bási asFunçõesIntervalaresEspe iaisMétri a Intervalar
De Vargas et al. PPgSC / Universidade Federal do Rio Grande do Norte � slide 9
De�nição 1 (Uma distân ia intervalar)Sejam X e Y ∈ IR. A distân ia essen ialmente intervalarentre X e Y , denotada por dMI(X,Y ), é o intervalo daequação:
dMI(X; Y ) = [min {d(x; y) : x ∈ X e y ∈ Y } ;max {d(x; y) : x ∈ X e y ∈ Y }]onde d(x; y) é a distân ia usual (|x − y|) entre doisnúmeros reais.Proposição 2Sejam X e Y ∈ IR. Então
dMI(X; Y ) =
[0;max(|X − Y |; |X − Y |)] se X ∩ Y 6= ∅ˆ
min(|X − Y |; |X − Y |); max(|X − Y |; |X − Y |)˜ se X ∩ Y = ∅
Algoritmo Proposto
De Vargas et al. PPgSC / Universidade Federal do Rio Grande do Norte � slide 10
Interval Fuzzy C-MeansAlgoritmo PropostoInterval FuzzyC-MeansIFCM - Parâmetrosde EntradaIFCM - Passo 1IFCM - Passo 2IFCM - Passo 3IFCM - Passo 4IFCM - Passo 5IFCM - Critério deConvergên ia
De Vargas et al. PPgSC / Universidade Federal do Rio Grande do Norte � slide 11■ A té ni a de lusterização pro ura identi� ar um onjunto de ategorias ou lasses para des rever osdados;
■ Na lusterização parte-se de uma situação em quenão existem lasses, somente elementos de umuniverso. A partir destes elementos, as té ni as de lusterização são responsáveis por de�nir as lasses eenquadrar os elementos;■ Baseado na estrutura do algoritmo Fuzzy C-Means éproposto um algoritmo para a lusterização de dadosintervalares, denominado Interval Fuzzy C-Means(IFCM).
IFCM - Parâmetros de EntradaAlgoritmo PropostoInterval FuzzyC-MeansIFCM - Parâmetrosde EntradaIFCM - Passo 1IFCM - Passo 2IFCM - Passo 3IFCM - Passo 4IFCM - Passo 5IFCM - Critério deConvergên ia
De Vargas et al. PPgSC / Universidade Federal do Rio Grande do Norte � slide 12
Os parâmetros de entrada do algoritmo são:■ n é o número de dados intervalares;■ c é o número de lusters onsiderados no algoritmo, oqual deve ser de idido antes da exe ução;■ m é um fator de fuzziness (um valor maior do que 1).
IFCM - Passo 1Algoritmo PropostoInterval FuzzyC-MeansIFCM - Parâmetrosde EntradaIFCM - Passo 1IFCM - Passo 2IFCM - Passo 3IFCM - Passo 4IFCM - Passo 5IFCM - Critério deConvergên ia
De Vargas et al. PPgSC / Universidade Federal do Rio Grande do Norte � slide 13
As etapas do algoritmo são:
■ Ini ialize µ om subintervalos de [0; 1] aleatóriosasso iados a ada par (dados/ lusters) tais que para ada par dados/ luster (Xi; j) e aj ∈ µi,j temos queexistem ak ∈ µi,k para todo
k ∈ {1, . . . , j − 1, j + 1, . . . , c} satisfazendoc
∑
k=1
ak = 1
IFCM - Passo 2Algoritmo PropostoInterval FuzzyC-MeansIFCM - Parâmetrosde EntradaIFCM - Passo 1IFCM - Passo 2IFCM - Passo 3IFCM - Passo 4IFCM - Passo 5IFCM - Critério deConvergên ia
De Vargas et al. PPgSC / Universidade Federal do Rio Grande do Norte � slide 14■ Cal ule o entro do luster j da seguinte maneira:
Cj =
n∑
i=1
µmij Xi
n∑
i=1
µmij
◆ Cj é o entro (intervalo) do j-ésimo luster;◆ Xi é o i-ésimo dado intervalar;
IFCM - Passo 3Algoritmo PropostoInterval FuzzyC-MeansIFCM - Parâmetrosde EntradaIFCM - Passo 1IFCM - Passo 2IFCM - Passo 3IFCM - Passo 4IFCM - Passo 5IFCM - Critério deConvergên ia
De Vargas et al. PPgSC / Universidade Federal do Rio Grande do Norte � slide 15■ Cal ule um valor ini ial (um intervalo de dado) para J
J =n
∑
i=1
c∑
j=1
µmij dMI (Xi;Cj)
2
◆ dMI (Xi;Cj) é a distân ia intervalar entre Xi eCj;
IFCM - Passo 4Algoritmo PropostoInterval FuzzyC-MeansIFCM - Parâmetrosde EntradaIFCM - Passo 1IFCM - Passo 2IFCM - Passo 3IFCM - Passo 4IFCM - Passo 5IFCM - Critério deConvergên ia
De Vargas et al. PPgSC / Universidade Federal do Rio Grande do Norte � slide 16■ Cal ule a tabela de função de pertinên ia fuzzyintervalar
µij =
(
1dMI(Xi;Cj)
)1
m−1
c∑
k=1
(
1
dMI (Xi;Ck)
)1
m−1
IFCM - Passo 5Algoritmo PropostoInterval FuzzyC-MeansIFCM - Parâmetrosde EntradaIFCM - Passo 1IFCM - Passo 2IFCM - Passo 3IFCM - Passo 4IFCM - Passo 5IFCM - Critério deConvergên ia
De Vargas et al. PPgSC / Universidade Federal do Rio Grande do Norte � slide 17■ Retornar a etapa 2 até que uma ondição de paradaseja al ançada.
IFCM - Critério de Convergên iaAlgoritmo PropostoInterval FuzzyC-MeansIFCM - Parâmetrosde EntradaIFCM - Passo 1IFCM - Passo 2IFCM - Passo 3IFCM - Passo 4IFCM - Passo 5IFCM - Critério deConvergên ia
De Vargas et al. PPgSC / Universidade Federal do Rio Grande do Norte � slide 18
Algumas ondições de parada possíveis são:
■ Um número de iterações pré-�xado foi exe utado, epode-se onsiderar que o algoritmo onseguiu agrupar(�bom o bastante") os dados;
■ O usuário informa um valor de parada ǫ > 0, e sedMI (JU ; JA) ≤ [ǫ; ǫ]então pára, onde JA é a função objetiva al ulada daiteração anterior e JU é a função objetiva da últimaiteração.
Resultados
De Vargas et al. PPgSC / Universidade Federal do Rio Grande do Norte � slide 19
Entrada de Dados IntervalaresResultadosEntrada de DadosIntervalaresResultados om oalgoritmo IFCM
De Vargas et al. PPgSC / Universidade Federal do Rio Grande do Norte � slide 20
Os parâmetros de entrada foram 50 dados, 3 lusters,m = 1, 25 e ǫ = 0, 01. A entrada de dados foi simulada,gerando dados aleatórios dividido-os em in o grupos.
Table 2: Entrada de dadosGRUPO VALORES ENTRE AMOSTRAG1 [1; 5] 7G2 [6; 15] 13G3 [16; 24] 15G4 [25; 40] 7G5 [41; 50] 8
Resultados om o algoritmo IFCMResultadosEntrada de DadosIntervalaresResultados om oalgoritmo IFCM
De Vargas et al. PPgSC / Universidade Federal do Rio Grande do Norte � slide 21
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0 5 10 15 20 25 30 35 40 45 50
grau
de
pert
inen
cia
dados
CLUSTER 1CLUSTER 2CLUSTER 3
Figure 2: Resultado do Algoritmo IFCM om todos os lus-ters
Con lusões
De Vargas et al. PPgSC / Universidade Federal do Rio Grande do Norte � slide 22
Considerações FinaisCon lusõesConsideraçõesFinaisObrigado...
De Vargas et al. PPgSC / Universidade Federal do Rio Grande do Norte � slide 23■ Apresentou-se um estudo das prin ipais operações efunções espe iais da matemáti a intervalar na análisede lusters. Estudou-se outros algoritmos de lusterização para a entrada de dados intervalares e on lui-se que a proposta neste trabalho apresentavantagens por nun a realizar uma onversão de dadosintervalares para dados pontuais e os graus depertinên ias manterem-se omo intervalos;■ Na extensão intervalar do algoritmo fuzzy -meansapli ou-se duas té ni as: a matemáti a intervalar e ateoria dos onjuntos difusos. Desta forma, é possíveltratar os dados de entrada impre isos em resultados om funções de pertinên ias intervalares.
Obrigado...Con lusõesConsideraçõesFinaisObrigado...
De Vargas et al. PPgSC / Universidade Federal do Rio Grande do Norte � slide 24
Agrupamento de DadosIntervalares omo Algoritmo IFCM
CONTATOSrogerio�ppgs .ufrn.brbedregal�dimap.ufrn.br