prahovÉ pojmy
DESCRIPTION
PRAHOVÉ POJMY. doc. Ing. Kristína Machová, CSc. k ristina. m achova @tuke.sk people.tuke.sk/kristina.machova/. O SNOVA:. Charakteristika prahových pojmov Reprezentácia a použitie tabuľky kritérií Reprezentácia a použitie lineárnej prahovej jednotky - PowerPoint PPT PresentationTRANSCRIPT
OSNOVA:
• Charakteristika prahových pojmov• Reprezentácia a použitie tabuľky kritérií• Reprezentácia a použitie lineárnej
prahovej jednotky• Reprezentácia a použitie sférickej
prahovej jednotky• Operátory na pohyb v priestore pojmov• Indukcia tabuľky kritérií• Algoritmus HCT• Indukcia lineárnej prahovej jednotky• Iteratívna váhová perturbácia
PRAHOVÉ POJMY v KOCKE
Predstavujú flexibilnejšiu reprezentáciu znalostí Kľúčovým je parciálne pokrytie Stačí ak nový, zatiaľ neklasifikovaný, TP
spĺňa iba niektoré podmienky definície triedy Konkrétne, stačí ak stupeň pokrytia
prekročí preddefinovaný prah Reprezentácie: tabuľka kritérií, lineárna prahová
jednotka, sférická prahová jednotka
REPREZENTÁCIA A POUŽITIETABUĽKY KRITÉRIÍ
Reprezentácia: Najjednoduchšia forma prahového popisu Hovoríme jej aj pojem m_z_n (n je počet atribútov
a prah m je prirodzené číslo medzi 1 a n) Konjunkcia všetkých n podmienok sa nazýva
prototyp alebo etalón Pojem n_z_n prezentuje konjunkciu Pojem 1_z_n prezentuje disjunkciuPoužitie: TP je zaradený do tej triedy, z definície ktorej spĺňa aspoň m podmienok.
REPREZENTÁCIA A POUŽITIETABUĽKY KRITÉRIÍ
Numerická doména v dvojrozmernom priestore: Pojem 2_z_2 prezentuje etalón - bod Pojem 1_z_2 prezentuje disjunkciu
– body rastra na úsečkách
REPREZENTÁCIA A POUŽITIETABUĽKY KRITÉRIÍ
Numerická doména v trojrozmernom priestore: Pojem 3_z_3 je prezentovaný bodom Pojem 2_z_3 je prezentovaný úsečkami Pojem 1_z_3 je prezentovaný plochamiGeometrické útvary sú rovnobežné s osami irelevantných atribútov
REPREZENTÁCIA A POUŽITIELINEÁRNEJ PRAHOVEJ JEDNOTKY
Reprezentácia: Každý atribút má priradenú váhu,
ktorá určuje stupeň jeho relevancie IF THEN chorá bunka LTU v dvojrozmernom priestore pojmov predstavuje
priamku, ktorá separuje negatívne a pozitívne TPPoužitie: Ak TP spĺňa nerovnicu v IF časti pravidla,
potom je klasifikovaný ako pozitívny TP pojmu.
5,1_2_1_1 stenahrubábičičjedenjadrojedno
REPREZENTÁCIA A POUŽITIELINEÁRNEJ PRAHOVEJ JEDNOTKY
Reprezentácia - poznámky: Kombinácia váh v pravidle sa nazýva
LTU (Linear Treshold Unit) Tabuľka kritérií je špeciálnym prípadom LTU,
kde váhy nadobúdajú hodnoty 1 V N - dimenzionálnom priestore predstavuje LTU
hyper - rovinu v separabilnom priestore Váhy atribútov určujú orientáciu hyperroviny Prahová hodnota určuje jej posunutie pozdĺž
kolmice na hyperrovinu Pojem reprezentovateľný LTU separuje lineárne
pozitívne a negatívne príklady
REPREZENTÁCIA A POUŽITIELINEÁRNEJ PRAHOVEJ JEDNOTKY
REPREZENTÁCIA A POUŽITIESFÉRICKEJ PRAHOVEJ JEDNOTKY
Reprezentácia: Na rozdiel od LTU, pozitívne príklady
sú ohraničené zo všetkých strán V N - dimenzionálnom priestore tvorí hypersféru V dvojrozmernom priestore: kruh alebo elipsa Konštanta pri atribúte udáva polohu centra a
prahová hodnota určuje polomer hypersféry Hypersféra separuje negatívne a pozitívne TP
(uzatvára pozitívne TP vo svojom vnútri)Použitie: Ak TP spĺňa nerovnicu v IF časti pravidla,
potom je klasifikovaný ako pozitívny TP pojmu.
REPREZENTÁCIA A POUŽITIESFÉRICKEJ PRAHOVEJ JEDNOTKY
5,02,20,1 GH 5,1)5,2()6,5( 22 GH
OPERÁTORY na POHYB v PRIESTORE
Pridanie atribútu do podmienky pri konštantnom prahuprodukuje všeobecnejšie pojmy(1_z_2 je priamka, 1_z_3 je plocha) Nárast prahovej hodnoty pri zachovaní etalónu vedie Ku špecifickejšiemu pojmu (1_z_3 je plocha, 2_z_3 je priamka)
INDUKCIA TABUľKY KRITÉRIÍ
Ak r relevantných atribútov 2 kroková indukcia:určenie etalónuvýber prahu od 1 do r vrátaneTreshold Revision (Algoritmus revízie prahu)Etalón - najfrekventovanejšie hodnoty AtribútovMá dve verzie:Treshold Revision Generalštartuje od najšpecifickejšieho pojmu r_z_roperátor zmenšuje prahovú hodnotuTreshold Revision Specific
štartuje od najvšeobecnejšieho pojmu 1_z_roperátor zvyšuje prahovú hodnotu
ALGORITMUS HCT
Heuriscic Criteria Tabels – Langley, 1996Dokáže zvládnuť realistickejšie situácie,
keď je relevantných iba r z n atribútovJe neinkrementálnyPostupuje smerom od špecifického k všeobecnémuJe riadený ohodnocovacou funkciou ScorePrehľadávanie je obmedzené šírkou lúča Beam SizePoužíva operátory generalizácieVykazuje prvky kvantitatívneho usudzovaniaZvláda zašumené domény
OPERÁTORY ZOVŠEOBECNENIA1. Vymaže atribút a zároveň zníži prah o jednotkuZ hypotézy 2_z_{jedno_jadro, jeden_bičík, hrubá stena}generuje zovšeobecnenia: 1_z_{jedno_jadro, jeden_bičík}
1_z_{jedno_jadro, hrubá_stena}1_z_{jeden_bičík, hrubá_stena}
2. Drží prah konštantný a zároveň zavádza nový atribútZ hypotézy 1_z_{jedno_jadro}Generuje zovšeobecnenia: 1_z_{jedno_jadro, jeden_bičík}
1_z_{jedno_jadro, hrubá_stena}Inverzne je možné definovať operátory špecifikácie:1. Pridá atribút a zároveň zvýši prah o jednotku2. Drží prah konštantný a zároveň vymazáva atribút
ALGORITMUS HCTVstupy: PSET...množina pozitívnych trénovacích príkladov
NSET...množina negatívnych trénovacích príkladov
ATTS...množina nominálnych atribútov
Výstupy: Tabuľka kritérií na klasifikáciu nových príkladov
Parameter: Beam-Size počet popisov pojmov na novej úrovni
Procedúra: hct(PSET,NSET,ATTS)
nech etalón E je množinou najfrekventovanejších hodnôt v PSET
pre každý z atribútov v ATTS
nech inicializačná prahová hodnota T = veľkosť ATTS (počet
atribútov)
nech inicializačná množina hypotéz HSET={[T_z_E]}
htc-aux(PSET,NSET,E,{},HSET)
ALGORITMUS HCT
htc-aux(PSET,NSET,E,CLOSED-SET,HSET)
nech OPEN-SET={}
for každý pojem H v HSET
nech SPECS je najšpecifickejšie zovšeobecnenie(H,E)
nech NEWSET={}
for každý špecifikovaný pojem S v SPECS
if Score (S,PSET,NSET)>Score
(H,PSET,NSET)
then pridaj S do NEWSET
if NEW-SET={}
then pridaj H do CLOSED-SET
else for každý pojem S v NEW-SET
pridaj S do OPEN-SET
if OPEN-SET={}
then vráť člena s najvyšším skóre v CLOSED-SET
else nech BEST-SET je Beam-Size počet najvyššie
skórovaných
členov zjednotenia OPEN-SET a CLOSED-SET
nech CLOSED-SET sú členovia CLOSED-SET v BEST-
SET
nech OPEN-SET sú členovia OPEN-SET v BEST-SET
hct-aux(PSET,NSET,E,CLOSED-SET,OPEN-SET)
INDUKCIA LTU
LTU generuje deliace hranice priamka v rovinerovina v priestore, hyperrovina v multidimenzionálnom pr.Model hyperroviny (w0 je prah a wi sú váhy atribútov):
Vj=0 pre body na deliacej ploche.Body - TP, pre ktoré Vj>0 budú klasifikované ako pozitívne.Hľadáme takú množinu váh, ktorá uskutoční najväčšie množstvo korektných klasifikácií.
Pre bod na deliacej ploche platí: Ukj=-wk.
n
i ii wxw1 0
n
i jiji Vxw0
ki
kjkjiji Uxxw /)(kkjjkj wxVU /
ALGORITMUS IWPIterative Weight Perturbation-Iteratívna váhová perturbácia
Vstupy: ISET...množina trénovacích príkladov
ATTS...množina atribútov
Výstupy:LTU na klasifikáciu nových príkladov
Parameter: Max_Iterations...maximálny počet iterácií
Procedúra: iwp (ISET,ATTS).
ALGORITMUS IWP
Procedúra: iwp (ISET,ATTS).
nech H je LTU s voliteľnými váhami z intervalu (-1,1)
nech BEST=H
nech COUNT=Max_Iterations
repeat kým neplatí COUNT=0:
for každý atribút K z ATTS
for každý príklad J z ISET
vypočítaj Ukj použijúc H a J
ulož Ukj hodnoty v zostupnom uspor. (U’)
for každý susedný pár U’ hodnôt
nech wk’ je zápornou priemernou hodnotou páru
nech H’ je H, v ktorom je wk nahradené wk’
vypočítaj Score(H’,ISET)
nech H je LTU s najvyšším skóre
if Score(H,ISET)=1
then vráť hypotézu H
else if Score(H,ISET)>=Score(BEST,ISET)
then nech BEST=H
dekrementuj COUNT
vráť hypotézu BEST.
Deliace hranice generované IWP