predstavljanje nesavršenog znanja

1

Predstavljanje nesavršenog znanjaPredstavljanje nesavršenog znanja

Motivacija:

Racionalna odluka inteligentnog agenta ovisi o relativnim odnosima važnosti ciljeva i stupnjeva vjerovanja u ostvarenje tih ciljeva.

Agent ne može garantirati ostvarenje cilja. Potrebno je uvesti predstavljanje stupnja

vjerovanja u postizanje cilja, t.j. stupnja vjerovanja u istinitost rasuđivanjem izvedenog zaključka.

Nesavršen zaključak ili cilj mora se izvesti iz nesavršenog poznavanja stanja svijeta (činjenica) i nesavršene baze znanja.

2

Predstavljanje nesavršenog znanja

Zadatak: Oblikovati sustav temeljen na predstavljanju i

obradbi nesavršenog znanja.

Ideja: Činjenicama i pravilima (ili logičkim izrazima)

pridijeliti težinske faktore koji preslikavaju nesavršeno znanje (stupanj vjerovanja) o tim temeljnim entitetima sustava.

Definirati postupak pridjeljivanja težinskih faktora novo izvedenom zaključku.

3


Shematski prikaz stanja svijeta i baze znanja: u okviru formalne logike ili prirodnog zaključivanja

pravilima (Wfi – težinski faktori činjenica, Wrj – težinski faktori

pravila):Činjenice:F1, Wf1 F2, Wf2 …Fn, Wfn Pravila:( A11, A12, …, A1k ) C1 , Wr1( A21, A22, …, A2l ) C2 , Wr2 …( Am1, Am2, …, Amp ) Cm , Wrm

Problem: semantika težinskih faktora !

4

Predstavljanje nesavršenog znanjaSemantika težinskih faktora: 1. NEIZVJESNOST (nepotpuno poznavanje stvarnoga

svijeta)

Npr.: Temperatura pare je 280 C, (0.8).Ovdje 0.8 predstavlja neku mjeru nepotpunog poznavanja temperature, t.j. možda pogrešku mjernog instrumenta ±20%.

Pristupi uvođenju mjere za neizvjesnost (nepotpunog poznavanja svijeta):

Predikatna Logika + vjerojatnost u automatiziranom

dokazivanju teorema (ATP)P , W1 ; Modus ponens s vjerojatnostima

premisa P Q , W2 : da li W1 i W2 mogu biti nekozistentni ?

_________ Q , W3 ? ; Kolika je vjerojatnost zaključka ?

Faktori izvjesnosti u sustavima s pravilima ("Ad Hoc" postupak).

Različite formalne logike (npr. DST) Mrežni kauzalni modeli

5


Teorijske osnovice za rukovanje s NEIZVJESNOSĆU

Racionalni agent odabire akciju temeljem preferencija.

1. Vjerojatnost – pogodna za obradbu izostavljenih ili nedostajućih podataka.

2. Predstavljanjem i obradbom preferencija bavi se teorija korisnosti (engl. utility theory).

3. Teorija odlučivanja = teorija vjerojatnosti + teorija korisnosti.

(O teoriji korisnosti i teoriji odlučivanja bit će riječi kasnije o mrežnim modelima predstavljanja znanja)

6


Semantika težinskih faktora:

2. NEIZRAZITOST (nejasnost, neodređenost, nepreciznost)

Npr: Temperatura pare je visoka.

visoka – neizrazita vrijednost, ali traži pripadnu mjeru i semantiku

Pristupi uvođenju mjere neizrazitog znanja: Neizrazita logika (engl. fuzzy). Neizrazita logika + faktori izvjesnosti. Teorija mogućnosti (engl. possibility theory).

7


Težinski faktori predstavljeni predikatnom logikom + vjerojatnost (Nilsson, 1989.g.)

U "Modus ponens" vodimo indikatore ri:P, r1 ri = stupanj verovanja u

istinitost (P Q), r2 (engl. degree of belief)Q, r3 modeliramo s vjerojatnošću

Tumačenje preko svjetova:Svaka logička formula je istinita (T) u svijetu W1, a neistinita (F) u

svijetu W2.P se nalazi u W1 s vjerojatnošću p, a u W2 s vjerojatnošću (1 – p).Za skup od L formula postoji 2L mogućih svjetova.Stvarno postoji K 2L svjetova, jer su neki nemogući.Npr. za P=T, Q=F, nemoguć je svijet u kojem (P Q) = T.

8


Logika + vjerojatnostPromatramo "Modus ponens":Konzistentni su samo svjetovi (interpretacije) sukladni tablici

implikacije:W1 W2 W3 W4 (4 svijeta) potpun i isključiv skup

P vektor p1 p2 p3 p4 pi = vjer. da je naš svijet baš Wi ( pi = 1)

__________________________P T T F F r1 = p1 + p2 (P Q) T F T T r2 = p1 + p3 + p4 Q T F T F r3 = p1 + p3

V4 vektor R vektorL = 3 (broj formula i r-ova).K = 4 (broj svjetova), K < 2L .

Indikatori ri predstavljanju sumu vjerojatnosti onih svjetova u kojima je ta formula istinita.

9


Logika + vjerojatnost

Definiramo formalan sustav: Vektor Vi s (vrijednostima komponenata F=0 ili T=1) prikazuje

istinitost pojedine formule u nekom svijetu Wi . Vektore V1, ... ,Vk (sa L komponenata) grupiramo u matricu (L x

K): V. Vjerojatnosti ri grupiramo u L-dimnenzijski vektor R. Vjerojatnosti pi grupiramo u K-dimenzijski vektor P. Vjerojatnosti se povezane matričnom jednadžbom:

R = V P

Ako postoje vjerojatnosti danih formula, moguće je probabilističko rasuđivanje:

a) Koja je vjerojatnost novo generirane formule ? (npr. Q u "Modus ponensu).

b) Kako promjena jedne vjerojatnosti utječe na ostale vjerojatnosti u skupu ?

10


Logika + vjerojatnostZa "Modus ponens" matrica V je:

1 1 0 0 ; P ; 0 pi 1V =1 0 1 1 ; (P Q) ; pi = 1

1 0 1 0 ; Q ;

Opažamo: Preslikavanje R = V P je linearno. Vršne vrijednosti P se preslikavaju u vršne vrijednosti R. Vršne vrijednosti P su za pi=1 (samo jedan pi zbog pi=1). Vršni vektori P su: [1,0,0,0], [0,1,0, 0], [0,0,1,0], [0,0,0,1] –

(stupčani vektori). Zbog linearnog preslikavanja vršnim P odgovaraju vršni R vektor

koji su ustvari pojedine kolone V matrice. Odnos vršnih vrijednosti može se prikazati grafički.

11


Logika + vjerojatnostK=4 vrha u L=3 dimenzije:(piramida s vrhom [1,1,1])

Zaključci:1. Za dani r1 = prob(P) i r2 = prob(PQ),

ne postoji jednoznačni r3 = prob(Q)(proboj kroz piramidu). Probabilističko zaključivanje nije jednoznačan proces.

2. Postoje nekonzistentne vjerojatnosti pridijeljene istinitosnim vrijednostima već i za r1 i r2 (od ishodišta do dijagonale donje ravnine).

3. Za L rečenica i K skupova mogućih svjetova, konzistentan prostor je ograničen hiperravnimon s K vrhova u L dimenzija (analitički zahtjevno).

4. Za male matrice V, i posebne degenerirane slučajeve (npr. linearna kombinacija p-ova i r-ova) postoje aproksimacijske metode.

1

1

1

r3 = prob(Q)

r1 = prob(P)r2 = prob(PQ)

12


Faktori izvjesnosti kao težinski faktori u sustavima s pravilima ("Ad Hoc"

postupak)

Faktori izvjesnosti (CF) - (engl, certainty factor)

Ideja: Činjenicama i pravilima pridružiti težinske faktore CFi koji

opisuju značaj toga entiteta u sustavu. Pri izračunu prekrivanja parova činjenica i AKO dijelova pravila

odrediti CFAKOAKO za cijeli AKO dio pravila. Temeljem izvornog CF pravila i izračunatog CFAKO za AKO stranu

pravila odrediti novi faktor izvjesnosti CFC svakog pravila. Ako je novi faktor izvjesnosti pravila manji od unaprijed

postavljenog praga, to pravilo treba isključiti iz skupa za donošenje zaključka.

13

Predstavljanje nesavršenog znanjaOdređivanje izvornih faktora izvjesnosti

Činjenice: pridruživanje CF svakoj činjenici je sasvim heuristički (npr. točnost mjerenja neke veličine, statistički iz povijesti itd.).

Pravila: Najčešće koristimo pojednostavljene uvjetne vjerojatnosti kao faktore izvjesnosti.

AKO: E, TADA: H, P(H | E) (ovdje samo jedan član na AKO strani)gdje je P(H | E) uvjetna vjerojatnost da će se dogoditi H (hipoteza) ako se dogodio E (evidencija). Uvjetna vjerojatnost P(H | E) može semantički preuzeti ulogu faktora izvjesnosti CF pravila.

Primjer iz medicine:Liječnik zna (iz svoje statistike) da je apriorna vjerojatnost meningitisa P(M), apriorna vjerojatnost ukrućenog vrata P(V), te vjerojatnost ukrućenog vrata kod dijagnosticiranog meningitisa P(V | M).

Kolika je vjerojatnost meningitisa ako se pojavi pacijent s ukrućenim vratom ?P(M | V) je vjer. hipoteze uz evidenciju t.j. P(H | E), odnosno faktor izvjesnosti

CF.

P(M | V) = P(V | M) · P(M) / P(V) uz uporabu Bayesovog pravila

14

Predstavljanje nesavršenog znanjaOdređivanje izvornih faktora izvjesnosti

Pravilo s više dijelova na AKO strani:AKO: E1, E2, ... , Em, TADA: H, P(H | E1, E2, ..., Em)Bayesovo pravilo daje:

P(E1, E2, ..., Em | Hk) P(H)P(H | E1, E2, ..., Em) = -------------------------------------

P(E1, E2, ..., Em)m istodobnih Em (simptoma) zahtijeva 2m (svi podskupovi) apriornih vjerojatnosti. Eksponencijalna složenost nedopustiva.

Redukcija složenosti: Ei su međusobno nezavisni (vrlo jako pojednostavljenje).

P(E1, E2, ..., Em | Hk) = P(E1 | Hk) · P(E2 | Hk) · … · P(Em | Hk)P(E1, E2, ..., Em) = P(E1) · P(E2) · … · P(Em)

P(E1 | Hk) P(E2 | Hk) P(Em | Hk)P(H | E1, E2, ..., Em) = P(Hk) ------------ ------------ ... ------------

P(E1) P(E2) P(Em)

15


Računanje s faktorima izvjesnosti (CF)

Određivanje CF za aktivirano pravilo

Činjenice: s faktorima izvjesnosti CF1 . . . CFn Pravilo: Faktor izvjesnosti pravila CFR .

Novi faktor izvjesnosti pravila nakon slaganja svih članova na AKO strani s odgovarajućim činjenicama:

CFC = CFR min[CF1 , . . . , CFn]

Odabere se minimalni CF temeljem slaganja parova činjenica s AKO dijelovima u pravilu. Dobiveni minimalni CF množi izvorni CFR pravila.Slijedi faktor izvjesnosti zaključka (TADA strane pravila) CFC .

16

Predstavljanje nesavršenog znanjaUpis nove činjenice kao rezultat zaključivanja

Npr.:

Činjenica: F1 , CFF1 =0.9

Pravilo: AKO F1, TADA (F2 uz CFF2 = 0.7) , CFR = 0.8

Pravilo se aktivira (F1 AKO F1) i nova činjenica F2 upisuje se u skup činjenica, ali sa promijenjenim faktorom izvjesnosti CFF2 :

CFF2 = 0.9 x 0.7 x 0.8 = 0.504

17

Predstavljanje nesavršenog znanjaVišestruki doprinos istoj hipotezi

Pravilo može svojim zaključkom upisati činjenicu Fn (uz faktor izvjesnosti CFFn ) , koja već postoji u skupu

činjenica kao F (uz faktor izvjesnosti (CFF ).(Vidi raniji primjer uz pretpostavku da je F1 = F2).

Obnovljena (ista) činjenica dobiva novi faktor izvjesnosti:CF = max [ CFFn , CFF ]

18

Predstavljanje nesavršenog znanjaEkspertni sustav MYCIN (Stanford Univ., 1984) i faktori

izvjesnosti

Činjenice:(sensitive organism-1 penicillin -1.0)

; org-1 nije osjetljiv na pencl. Pravila:Ako: E1, E2, ... , Ek ; niz evidencijaTada: H, CF ; izvjesnost hipoteze H CF - faktor izvjenosti (confidence factor), -1, 1+1 - potpuna potvrda hipoteze-1 - potpuna potvrda negacije hipoteze0 - početna izvjesnost hipoteze (niti je potvđena niti odbačena)

19


izvjesnosti MB(H,E) - MD(H,E) CF = --------------------------- 1 - min MB(H,E), MD(H,E)

MB [0, 1] - mjera vjerovanja (measure of belief) u H zbog EMD [0, 1] - mjera nevjerovanja (measure of disbelief) u H zbog E

Za jedan E: 1 ako P(H) = 1MB(H,E) =

max( P(HE), P(H) ) - P(H) ------------------------------------ inače 1 - P(H) 1 ako P(H) = 0MD(H,E) =

min( P(HE), P(H) ) - P(H) ------------------------------------ inače - P(H) P(H), P(HE) su apsolutne i uvjetne vjerojatnosti

20


izvjesnosti Za više E: MB(H, Ei Ek) = MB(H, Ei) + MB(H, Ek) - MB(H, Ei) MB(H, Ek)Za više hipoteza Hi :MB(H1 H2, E) = min(MB(H1, E), MB(H2, E))MB(H1 H2, E) = max(MB(H1, E), MB(H2, E))Za MD, min se zamjenjuje sa max i obrnuto. Strategija upravljanja: ulančavanje unatragKonjunkcija AKO strane: min operacijom uz empirički prag CF >

0.2.Zaključak: <CF_ako_strane> * <CF_tada_strane>Kombinacija pravila (više pravila govore o istom H) npr. za dva CF: oba CF > 0: CFnovi = CF1 + CF2 - CF1*CF2 oba CF < 0: CFnovi = CF1 + CF2 + CF1*CF2 inače: CFnovi = (CF1 + CF2) / (1 -

minCF1,CF2)

21


izvjesnosti Problemi:

1) Npr. za više MB i jedan MD:MB(H, Ei)=0.8 za i=1,...,10 (10 dokaza u korist hipoteze)MD(H, E11)=0.2 (1 dokaz protiv hipoteze)MBuk(H, Ei) 0.999CF (0.999 - 0.2)/(1-0.2), te ostaje vrlo blizu toj vrijednosti ma

koliko dokaza u korist hipoteze H (nije sukladno intuiciji)

2) P(H1) = 0.8, P(H1 | E) = 0.9 -> CF(H1 | E) = 0.5P(H2) = 0.2, P(H2 | E) = 0.8 -> CF(H2 | E) = 0.75

Veća uvj. vjer. -> niži CF: kontradikcija

3) CF(H, e) = CF(H, i) * CF(i, e) ; i = među-hipotezaP(H | e) P(H | i) * P(i | e) ; u teoriji vjer. ne vrijedi

22

Predstavljanje nesavršenog znanjaDEMPSTER - SHAFER (1970) teorija - DST

Problemi teorije vjerojatnosti:Izražavanje neznanja: postoje 2 hipoteze: A, B, i nema drugih

informacija.Po teoriji vjerojatnosti: P(A) = P(B) = 0.5, te P(H)+P(H)=1DST: nema potvrde za takvo rasuđivanje.Definiramo:Okvir rasuđivanja (spoznaje) U=Hi, hipoteze (potpun skup

međusobno isključivih događaja). Neka je U = {H1, H2, H3, H4}.

Po teoriji vjerojatnosti pridjeljuje se pojedinoj hipotezi tako da: pi = 1.

DST pridjeljuje tzv. osnovne vjerojatnosti svim podskupovima od U (u našem primjeru postoji 16 podskupova) za koje postoji neka potvrda. Npr.:

m(H1) = 0.3m(H2) = 0.2m(H3) = 0.1m(H1, H3) = 0.4 (H1 ili H3)m(Ai) = 0 za ostale podskupove jer za njih nema potvrde.m(Ai) = 1 uvjet konzistentnosti (ovdje 0.3+0.2+0.1+0.4)

23

Predstavljanje nesavršenog znanjaDEMPSTER - SHAFER (1970) teorija – DST

m(Ak) nije vjerojatnost jer za p(Ak), Ak jedan i samo jedan događaj.

Definicije:Fokalni elementi: svi podskupovi Ai za koje m(Ai) > 0.Jezgra: unija svih fokalnih elemenata; ovdje {H1, H2, H3.

Primjer izražavanja neznanja:U = {A, B). Postoji događaj A ili B i nema drugih informacija.Teorija vjerojatnosti: p(A)=0.5, p(B)=0.5DST: pridjeljujemo osnovne vjerojatnosti svim podskupovima:m(0) = 0 ; potvrđeno je da postoji barem jedan događaj m(A) = 0 ; nije potvrđeno da je Am(B) = 0 ; nije potvrđeno da je Bm(A, B) = 1 ; sigurno je ili A ili B

24


Def. funkcija vjerovanja (Bel, belief) u događaj A (A je podskup U):Bel(A) zbraja sve osnovne vjerojatnosti svih podskupova od A:Bel(A) = m(Bj) gdje su Bj svi podskupovi od A.Bel(A)=m(A) za pojedinačne elemente, dok je Bel(A)>m(A) inače. Npr. neke vrijednosti Bel za gornji slučaj:Bel(H1) = m(H1) = 0.3 ; jednako osnovnoj vjerojatnostiBel(H1, H3) = m(H1, H3)+m(H1)+m(H3) = 0.4 + 0.3 + 0.1=0.8 >

m(H1, H3)Obilježja Bel:Bel(0) = 0, nema vjerovanja u prazan skupBel(U) = 1, u potpunom skupu je sva istina (to je ujedno m(Ai))Vjerovanje u negaciju hipoteze A, t.j. Bel(A):Neka je A=H1, a A je sve osim A, t.j. sve osim H1:Bel(A) = m(H1) = 0.3Bel(A) = Bel(H2, H3, H4) = m(H2) + m(H3) + 0 (ostali m) = 0.2 +

0.1= 0.3 Bel(A) + Bel(A) 1

25


Def. vjerodostojnost (plauzibilnost) A:Pl(A) = 1 - Bel(A) - to je maksimalno moguće vjerovanje u

APl(A) - Bel(A) - neizvjesnost u A.Bel(A), Pl(A) - interval sigurnosti vjerovanja u APrimjeri:0, 0 hipoteza je neistinita1, 1 hipoteza je istinita0.3, 1 hipoteza je djelomično istinita0, 1 nema dokaza u korist hipoteze0, 0.8 hipoteza je djelomično neistinita (0.2 u korist

neistinosti)0.2, 0.7 ima dokaza da je hipoteza istinita (0.2) i nestinita (0.3)

Sustav znanja s pravilima i DST indikatorima:Ako: E1 ... En, Tada: H, Bel(H), Pl(H)

Problem: eksponencijalan skup apriornog znanja.Npr. 100 zavisnih događaja, teorija vjer.: 2100 , DST: 2200 .

predstavljanje nesavršenog znanja

Documents