predstavljanje nesavršenog znanja
DESCRIPTION
Predstavljanje nesavršenog znanja. Motivacija: Racionalna odluka inteligentnog agenta ovisi o relativnim odnosima važnosti ciljeva i stupnjeva vjerovanja u ostvarenje tih ciljeva. Agent ne može garantirati ostvarenje cilja. - PowerPoint PPT PresentationTRANSCRIPT
1
Predstavljanje nesavršenog znanjaPredstavljanje nesavršenog znanja
Motivacija:
Racionalna odluka inteligentnog agenta ovisi o relativnim odnosima važnosti ciljeva i stupnjeva vjerovanja u ostvarenje tih ciljeva.
Agent ne može garantirati ostvarenje cilja. Potrebno je uvesti predstavljanje stupnja
vjerovanja u postizanje cilja, t.j. stupnja vjerovanja u istinitost rasuđivanjem izvedenog zaključka.
Nesavršen zaključak ili cilj mora se izvesti iz nesavršenog poznavanja stanja svijeta (činjenica) i nesavršene baze znanja.
2
Predstavljanje nesavršenog znanja
Zadatak: Oblikovati sustav temeljen na predstavljanju i
obradbi nesavršenog znanja.
Ideja: Činjenicama i pravilima (ili logičkim izrazima)
pridijeliti težinske faktore koji preslikavaju nesavršeno znanje (stupanj vjerovanja) o tim temeljnim entitetima sustava.
Definirati postupak pridjeljivanja težinskih faktora novo izvedenom zaključku.
3
Predstavljanje nesavršenog znanja
Shematski prikaz stanja svijeta i baze znanja: u okviru formalne logike ili prirodnog zaključivanja
pravilima (Wfi – težinski faktori činjenica, Wrj – težinski faktori
pravila):Činjenice:F1, Wf1 F2, Wf2 …Fn, Wfn Pravila:( A11, A12, …, A1k ) C1 , Wr1( A21, A22, …, A2l ) C2 , Wr2 …( Am1, Am2, …, Amp ) Cm , Wrm
Problem: semantika težinskih faktora !
4
Predstavljanje nesavršenog znanjaSemantika težinskih faktora: 1. NEIZVJESNOST (nepotpuno poznavanje stvarnoga
svijeta)
Npr.: Temperatura pare je 280 C, (0.8).Ovdje 0.8 predstavlja neku mjeru nepotpunog poznavanja temperature, t.j. možda pogrešku mjernog instrumenta ±20%.
Pristupi uvođenju mjere za neizvjesnost (nepotpunog poznavanja svijeta):
Predikatna Logika + vjerojatnost u automatiziranom
dokazivanju teorema (ATP)P , W1 ; Modus ponens s vjerojatnostima
premisa P Q , W2 : da li W1 i W2 mogu biti nekozistentni ?
_________ Q , W3 ? ; Kolika je vjerojatnost zaključka ?
Faktori izvjesnosti u sustavima s pravilima ("Ad Hoc" postupak).
Različite formalne logike (npr. DST) Mrežni kauzalni modeli
5
Predstavljanje nesavršenog znanja
Teorijske osnovice za rukovanje s NEIZVJESNOSĆU
Racionalni agent odabire akciju temeljem preferencija.
1. Vjerojatnost – pogodna za obradbu izostavljenih ili nedostajućih podataka.
2. Predstavljanjem i obradbom preferencija bavi se teorija korisnosti (engl. utility theory).
3. Teorija odlučivanja = teorija vjerojatnosti + teorija korisnosti.
(O teoriji korisnosti i teoriji odlučivanja bit će riječi kasnije o mrežnim modelima predstavljanja znanja)
6
Predstavljanje nesavršenog znanja
Semantika težinskih faktora:
2. NEIZRAZITOST (nejasnost, neodređenost, nepreciznost)
Npr: Temperatura pare je visoka.
visoka – neizrazita vrijednost, ali traži pripadnu mjeru i semantiku
Pristupi uvođenju mjere neizrazitog znanja: Neizrazita logika (engl. fuzzy). Neizrazita logika + faktori izvjesnosti. Teorija mogućnosti (engl. possibility theory).
7
Predstavljanje nesavršenog znanja
Težinski faktori predstavljeni predikatnom logikom + vjerojatnost (Nilsson, 1989.g.)
U "Modus ponens" vodimo indikatore ri:P, r1 ri = stupanj verovanja u
istinitost (P Q), r2 (engl. degree of belief)Q, r3 modeliramo s vjerojatnošću
Tumačenje preko svjetova:Svaka logička formula je istinita (T) u svijetu W1, a neistinita (F) u
svijetu W2.P se nalazi u W1 s vjerojatnošću p, a u W2 s vjerojatnošću (1 – p).Za skup od L formula postoji 2L mogućih svjetova.Stvarno postoji K 2L svjetova, jer su neki nemogući.Npr. za P=T, Q=F, nemoguć je svijet u kojem (P Q) = T.
8
Predstavljanje nesavršenog znanja
Logika + vjerojatnostPromatramo "Modus ponens":Konzistentni su samo svjetovi (interpretacije) sukladni tablici
implikacije:W1 W2 W3 W4 (4 svijeta) potpun i isključiv skup
P vektor p1 p2 p3 p4 pi = vjer. da je naš svijet baš Wi ( pi = 1)
__________________________P T T F F r1 = p1 + p2 (P Q) T F T T r2 = p1 + p3 + p4 Q T F T F r3 = p1 + p3
V4 vektor R vektorL = 3 (broj formula i r-ova).K = 4 (broj svjetova), K < 2L .
Indikatori ri predstavljanju sumu vjerojatnosti onih svjetova u kojima je ta formula istinita.
9
Predstavljanje nesavršenog znanja
Logika + vjerojatnost
Definiramo formalan sustav: Vektor Vi s (vrijednostima komponenata F=0 ili T=1) prikazuje
istinitost pojedine formule u nekom svijetu Wi . Vektore V1, ... ,Vk (sa L komponenata) grupiramo u matricu (L x
K): V. Vjerojatnosti ri grupiramo u L-dimnenzijski vektor R. Vjerojatnosti pi grupiramo u K-dimenzijski vektor P. Vjerojatnosti se povezane matričnom jednadžbom:
R = V P
Ako postoje vjerojatnosti danih formula, moguće je probabilističko rasuđivanje:
a) Koja je vjerojatnost novo generirane formule ? (npr. Q u "Modus ponensu).
b) Kako promjena jedne vjerojatnosti utječe na ostale vjerojatnosti u skupu ?
10
Predstavljanje nesavršenog znanja
Logika + vjerojatnostZa "Modus ponens" matrica V je:
1 1 0 0 ; P ; 0 pi 1V =1 0 1 1 ; (P Q) ; pi = 1
1 0 1 0 ; Q ;
Opažamo: Preslikavanje R = V P je linearno. Vršne vrijednosti P se preslikavaju u vršne vrijednosti R. Vršne vrijednosti P su za pi=1 (samo jedan pi zbog pi=1). Vršni vektori P su: [1,0,0,0], [0,1,0, 0], [0,0,1,0], [0,0,0,1] –
(stupčani vektori). Zbog linearnog preslikavanja vršnim P odgovaraju vršni R vektor
koji su ustvari pojedine kolone V matrice. Odnos vršnih vrijednosti može se prikazati grafički.
11
Predstavljanje nesavršenog znanja
Logika + vjerojatnostK=4 vrha u L=3 dimenzije:(piramida s vrhom [1,1,1])
Zaključci:1. Za dani r1 = prob(P) i r2 = prob(PQ),
ne postoji jednoznačni r3 = prob(Q)(proboj kroz piramidu). Probabilističko zaključivanje nije jednoznačan proces.
2. Postoje nekonzistentne vjerojatnosti pridijeljene istinitosnim vrijednostima već i za r1 i r2 (od ishodišta do dijagonale donje ravnine).
3. Za L rečenica i K skupova mogućih svjetova, konzistentan prostor je ograničen hiperravnimon s K vrhova u L dimenzija (analitički zahtjevno).
4. Za male matrice V, i posebne degenerirane slučajeve (npr. linearna kombinacija p-ova i r-ova) postoje aproksimacijske metode.
1
1
1
r3 = prob(Q)
r1 = prob(P)r2 = prob(PQ)
12
Predstavljanje nesavršenog znanja
Faktori izvjesnosti kao težinski faktori u sustavima s pravilima ("Ad Hoc"
postupak)
Faktori izvjesnosti (CF) - (engl, certainty factor)
Ideja: Činjenicama i pravilima pridružiti težinske faktore CFi koji
opisuju značaj toga entiteta u sustavu. Pri izračunu prekrivanja parova činjenica i AKO dijelova pravila
odrediti CFAKOAKO za cijeli AKO dio pravila. Temeljem izvornog CF pravila i izračunatog CFAKO za AKO stranu
pravila odrediti novi faktor izvjesnosti CFC svakog pravila. Ako je novi faktor izvjesnosti pravila manji od unaprijed
postavljenog praga, to pravilo treba isključiti iz skupa za donošenje zaključka.
13
Predstavljanje nesavršenog znanjaOdređivanje izvornih faktora izvjesnosti
Činjenice: pridruživanje CF svakoj činjenici je sasvim heuristički (npr. točnost mjerenja neke veličine, statistički iz povijesti itd.).
Pravila: Najčešće koristimo pojednostavljene uvjetne vjerojatnosti kao faktore izvjesnosti.
AKO: E, TADA: H, P(H | E) (ovdje samo jedan član na AKO strani)gdje je P(H | E) uvjetna vjerojatnost da će se dogoditi H (hipoteza) ako se dogodio E (evidencija). Uvjetna vjerojatnost P(H | E) može semantički preuzeti ulogu faktora izvjesnosti CF pravila.
Primjer iz medicine:Liječnik zna (iz svoje statistike) da je apriorna vjerojatnost meningitisa P(M), apriorna vjerojatnost ukrućenog vrata P(V), te vjerojatnost ukrućenog vrata kod dijagnosticiranog meningitisa P(V | M).
Kolika je vjerojatnost meningitisa ako se pojavi pacijent s ukrućenim vratom ?P(M | V) je vjer. hipoteze uz evidenciju t.j. P(H | E), odnosno faktor izvjesnosti
CF.
P(M | V) = P(V | M) · P(M) / P(V) uz uporabu Bayesovog pravila
14
Predstavljanje nesavršenog znanjaOdređivanje izvornih faktora izvjesnosti
Pravilo s više dijelova na AKO strani:AKO: E1, E2, ... , Em, TADA: H, P(H | E1, E2, ..., Em)Bayesovo pravilo daje:
P(E1, E2, ..., Em | Hk) P(H)P(H | E1, E2, ..., Em) = -------------------------------------
P(E1, E2, ..., Em)m istodobnih Em (simptoma) zahtijeva 2m (svi podskupovi) apriornih vjerojatnosti. Eksponencijalna složenost nedopustiva.
Redukcija složenosti: Ei su međusobno nezavisni (vrlo jako pojednostavljenje).
P(E1, E2, ..., Em | Hk) = P(E1 | Hk) · P(E2 | Hk) · … · P(Em | Hk)P(E1, E2, ..., Em) = P(E1) · P(E2) · … · P(Em)
P(E1 | Hk) P(E2 | Hk) P(Em | Hk)P(H | E1, E2, ..., Em) = P(Hk) ------------ ------------ ... ------------
P(E1) P(E2) P(Em)
15
Predstavljanje nesavršenog znanja
Računanje s faktorima izvjesnosti (CF)
Određivanje CF za aktivirano pravilo
Činjenice: s faktorima izvjesnosti CF1 . . . CFn Pravilo: Faktor izvjesnosti pravila CFR .
Novi faktor izvjesnosti pravila nakon slaganja svih članova na AKO strani s odgovarajućim činjenicama:
CFC = CFR min[CF1 , . . . , CFn]
Odabere se minimalni CF temeljem slaganja parova činjenica s AKO dijelovima u pravilu. Dobiveni minimalni CF množi izvorni CFR pravila.Slijedi faktor izvjesnosti zaključka (TADA strane pravila) CFC .
16
Predstavljanje nesavršenog znanjaUpis nove činjenice kao rezultat zaključivanja
Npr.:
Činjenica: F1 , CFF1 =0.9
Pravilo: AKO F1, TADA (F2 uz CFF2 = 0.7) , CFR = 0.8
Pravilo se aktivira (F1 AKO F1) i nova činjenica F2 upisuje se u skup činjenica, ali sa promijenjenim faktorom izvjesnosti CFF2 :
CFF2 = 0.9 x 0.7 x 0.8 = 0.504
17
Predstavljanje nesavršenog znanjaVišestruki doprinos istoj hipotezi
Pravilo može svojim zaključkom upisati činjenicu Fn (uz faktor izvjesnosti CFFn ) , koja već postoji u skupu
činjenica kao F (uz faktor izvjesnosti (CFF ).(Vidi raniji primjer uz pretpostavku da je F1 = F2).
Obnovljena (ista) činjenica dobiva novi faktor izvjesnosti:CF = max [ CFFn , CFF ]
18
Predstavljanje nesavršenog znanjaEkspertni sustav MYCIN (Stanford Univ., 1984) i faktori
izvjesnosti
Činjenice:(sensitive organism-1 penicillin -1.0)
; org-1 nije osjetljiv na pencl. Pravila:Ako: E1, E2, ... , Ek ; niz evidencijaTada: H, CF ; izvjesnost hipoteze H CF - faktor izvjenosti (confidence factor), -1, 1+1 - potpuna potvrda hipoteze-1 - potpuna potvrda negacije hipoteze0 - početna izvjesnost hipoteze (niti je potvđena niti odbačena)
19
Predstavljanje nesavršenog znanjaEkspertni sustav MYCIN (Stanford Univ., 1984) i faktori
izvjesnosti MB(H,E) - MD(H,E) CF = --------------------------- 1 - min MB(H,E), MD(H,E)
MB [0, 1] - mjera vjerovanja (measure of belief) u H zbog EMD [0, 1] - mjera nevjerovanja (measure of disbelief) u H zbog E
Za jedan E: 1 ako P(H) = 1MB(H,E) =
max( P(HE), P(H) ) - P(H) ------------------------------------ inače 1 - P(H) 1 ako P(H) = 0MD(H,E) =
min( P(HE), P(H) ) - P(H) ------------------------------------ inače - P(H) P(H), P(HE) su apsolutne i uvjetne vjerojatnosti
20
Predstavljanje nesavršenog znanjaEkspertni sustav MYCIN (Stanford Univ., 1984) i faktori
izvjesnosti Za više E: MB(H, Ei Ek) = MB(H, Ei) + MB(H, Ek) - MB(H, Ei) MB(H, Ek)Za više hipoteza Hi :MB(H1 H2, E) = min(MB(H1, E), MB(H2, E))MB(H1 H2, E) = max(MB(H1, E), MB(H2, E))Za MD, min se zamjenjuje sa max i obrnuto. Strategija upravljanja: ulančavanje unatragKonjunkcija AKO strane: min operacijom uz empirički prag CF >
0.2.Zaključak: <CF_ako_strane> * <CF_tada_strane>Kombinacija pravila (više pravila govore o istom H) npr. za dva CF: oba CF > 0: CFnovi = CF1 + CF2 - CF1*CF2 oba CF < 0: CFnovi = CF1 + CF2 + CF1*CF2 inače: CFnovi = (CF1 + CF2) / (1 -
minCF1,CF2)
21
Predstavljanje nesavršenog znanjaEkspertni sustav MYCIN (Stanford Univ., 1984) i faktori
izvjesnosti Problemi:
1) Npr. za više MB i jedan MD:MB(H, Ei)=0.8 za i=1,...,10 (10 dokaza u korist hipoteze)MD(H, E11)=0.2 (1 dokaz protiv hipoteze)MBuk(H, Ei) 0.999CF (0.999 - 0.2)/(1-0.2), te ostaje vrlo blizu toj vrijednosti ma
koliko dokaza u korist hipoteze H (nije sukladno intuiciji)
2) P(H1) = 0.8, P(H1 | E) = 0.9 -> CF(H1 | E) = 0.5P(H2) = 0.2, P(H2 | E) = 0.8 -> CF(H2 | E) = 0.75
Veća uvj. vjer. -> niži CF: kontradikcija
3) CF(H, e) = CF(H, i) * CF(i, e) ; i = među-hipotezaP(H | e) P(H | i) * P(i | e) ; u teoriji vjer. ne vrijedi
22
Predstavljanje nesavršenog znanjaDEMPSTER - SHAFER (1970) teorija - DST
Problemi teorije vjerojatnosti:Izražavanje neznanja: postoje 2 hipoteze: A, B, i nema drugih
informacija.Po teoriji vjerojatnosti: P(A) = P(B) = 0.5, te P(H)+P(H)=1DST: nema potvrde za takvo rasuđivanje.Definiramo:Okvir rasuđivanja (spoznaje) U=Hi, hipoteze (potpun skup
međusobno isključivih događaja). Neka je U = {H1, H2, H3, H4}.
Po teoriji vjerojatnosti pridjeljuje se pojedinoj hipotezi tako da: pi = 1.
DST pridjeljuje tzv. osnovne vjerojatnosti svim podskupovima od U (u našem primjeru postoji 16 podskupova) za koje postoji neka potvrda. Npr.:
m(H1) = 0.3m(H2) = 0.2m(H3) = 0.1m(H1, H3) = 0.4 (H1 ili H3)m(Ai) = 0 za ostale podskupove jer za njih nema potvrde.m(Ai) = 1 uvjet konzistentnosti (ovdje 0.3+0.2+0.1+0.4)
23
Predstavljanje nesavršenog znanjaDEMPSTER - SHAFER (1970) teorija – DST
m(Ak) nije vjerojatnost jer za p(Ak), Ak jedan i samo jedan događaj.
Definicije:Fokalni elementi: svi podskupovi Ai za koje m(Ai) > 0.Jezgra: unija svih fokalnih elemenata; ovdje {H1, H2, H3.
Primjer izražavanja neznanja:U = {A, B). Postoji događaj A ili B i nema drugih informacija.Teorija vjerojatnosti: p(A)=0.5, p(B)=0.5DST: pridjeljujemo osnovne vjerojatnosti svim podskupovima:m(0) = 0 ; potvrđeno je da postoji barem jedan događaj m(A) = 0 ; nije potvrđeno da je Am(B) = 0 ; nije potvrđeno da je Bm(A, B) = 1 ; sigurno je ili A ili B
24
Predstavljanje nesavršenog znanjaDEMPSTER - SHAFER (1970) teorija – DST
Def. funkcija vjerovanja (Bel, belief) u događaj A (A je podskup U):Bel(A) zbraja sve osnovne vjerojatnosti svih podskupova od A:Bel(A) = m(Bj) gdje su Bj svi podskupovi od A.Bel(A)=m(A) za pojedinačne elemente, dok je Bel(A)>m(A) inače. Npr. neke vrijednosti Bel za gornji slučaj:Bel(H1) = m(H1) = 0.3 ; jednako osnovnoj vjerojatnostiBel(H1, H3) = m(H1, H3)+m(H1)+m(H3) = 0.4 + 0.3 + 0.1=0.8 >
m(H1, H3)Obilježja Bel:Bel(0) = 0, nema vjerovanja u prazan skupBel(U) = 1, u potpunom skupu je sva istina (to je ujedno m(Ai))Vjerovanje u negaciju hipoteze A, t.j. Bel(A):Neka je A=H1, a A je sve osim A, t.j. sve osim H1:Bel(A) = m(H1) = 0.3Bel(A) = Bel(H2, H3, H4) = m(H2) + m(H3) + 0 (ostali m) = 0.2 +
0.1= 0.3 Bel(A) + Bel(A) 1
25
Predstavljanje nesavršenog znanjaDEMPSTER - SHAFER (1970) teorija – DST
Def. vjerodostojnost (plauzibilnost) A:Pl(A) = 1 - Bel(A) - to je maksimalno moguće vjerovanje u
APl(A) - Bel(A) - neizvjesnost u A.Bel(A), Pl(A) - interval sigurnosti vjerovanja u APrimjeri:0, 0 hipoteza je neistinita1, 1 hipoteza je istinita0.3, 1 hipoteza je djelomično istinita0, 1 nema dokaza u korist hipoteze0, 0.8 hipoteza je djelomično neistinita (0.2 u korist
neistinosti)0.2, 0.7 ima dokaza da je hipoteza istinita (0.2) i nestinita (0.3)
Sustav znanja s pravilima i DST indikatorima:Ako: E1 ... En, Tada: H, Bel(H), Pl(H)
Problem: eksponencijalan skup apriornog znanja.Npr. 100 zavisnih događaja, teorija vjer.: 2100 , DST: 2200 .