zadaci - matf.bg.ac.rs · koliki je odnos ci s cenja apriori algoritma za ovaj skup podataka? odnos...

2

Click here to load reader

Upload: hatuong

Post on 09-Mar-2019

212 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Zadaci - matf.bg.ac.rs · Koliki je odnos ci s cenja Apriori algoritma za ovaj skup podataka? Odnos ci s cenja Odnos ci s cenja je de nisan kao procenat skupova stavki koji nisu generisani

Istrazivanje podataka - zadaci za vezbe 4

Zadaci

1. Dat je skup podataka

• Nacrtati resetku skupova stavki koja odgovara datom skupu podataka. Oznaciti cvoroveu resetki sledecim slovima:

– N : ako se skup stavki ne smatra kandidatom po Apriori algoritmu. Tj. ako 1) skupstavki nije generisan u koraku generisanja kandidata, ili 2) je generisan u korakugenerisanja kandidata ali je kasnije uklonjen u koraku ciscenja kandidata jer nekinjegov podskup nije cest.

– F : kandidat skupa stavki je cest po Apriori algoritmu.

– I : Ako se skup stakvi smatra retkim posle odredivanja podrske.

• Koliki je procenat cestih skupova stavki?

• Koliki je odnos ciscenja Apriori algoritma za ovaj skup podataka? Odnos ciscenjaje definisan kao procenat skupova stavki koji nisu generisani za vreme generisanjakandidata ili su eliminisani u koraku ciscenja kandidata.

• Koliki je odnos laznog alarma (procenat kandidatskih skupova stavki koji su obelezenikao retki posle prebrojavanja podrske)?

Prakticni zadaci

1. Primenom pravila pridruzivanja proveriti da li postoji zavisnost medu podacima u skuputransactions. Diskutovati dobijene rezultate. (KNIME, SPSS Modeler)

2. Primenom pravila pridruzivanja proveriti da li postoji zavisnost medju upisanim izbornimpredmetima. Diskutovati dobijene rezultate. (SPSS Modeler)

Page 2: Zadaci - matf.bg.ac.rs · Koliki je odnos ci s cenja Apriori algoritma za ovaj skup podataka? Odnos ci s cenja Odnos ci s cenja je de nisan kao procenat skupova stavki koji nisu generisani

Mere

Pravila pridruzivanja su oblika: X → Y , a broj transakcija je N.

• Broj transakcija koje sadrze stavke X : σ(X)

• Podrska (Support) : sup(X → Y ) = σ(X∪Y )N

*U alatu SPSS Modeler:

– Podrska (Support): sup(X → Y ) = σ(X)N

– Podrska pravila (Rule Support): sup(X → Y ) = σ(X∪Y )N

• Pouzdanost (Confidence): conf(X → Y ) = σ(X∪Y )σ(X)

U literaturi se pojavljuju:

– confprior je pouzdanost za pravilo empty → Y

– confposterior je pouzdanost za pravilo X → Y

• Lift: Lift = conf(X→Y )sup(Y )

ili Lift = confposteriorconfprior

* Pravilo X → Y je zanimljivo ako je Lift(X → Y ) 6= 1

• Razlika u pouzdanosti (Confidence Difference): confdiff = confposterior − confprior

• Odnos pouzdanosti (Confidence Ratio): confratio = 1− min(confposterior,confprior)

min(confposterior,confprior)

• Obim rasporedivanja (Deployability): σ(X)−σ(X∪Y )N