dezvoltarea aplicațiilor web (4/12): aspecte privind modelarea cunoştinţelor

133
Dr. Sabin Buragawww.purl.org/net/busaco aspecte privind modelarea cuno ș tin ț elor Dezvoltarea aplica ț iilor Web

Upload: sabin-buraga

Post on 13-May-2015

172 views

Category:

Technology


1 download

DESCRIPTION

Dezvoltarea aplicațiilor Web (4/12) — detalii la http://profs.info.uaic.ro/~busaco/teach/courses/wade/web-film.html

TRANSCRIPT

Page 1: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

aspecte privind modelarea cunoștințelor

Dezvoltarea aplicațiilor Web

Page 2: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

“If you haven’t got a word for a concept, you can’t think about it; if you don’t think about it,

you won’t invent a word for it.”

Sapir-Whorf Hypothesis

Page 3: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

DIKW (Data, Information, Knowledge, Wisdom)adaptare după S. Carpenter, 2008 și J. Liebowitz, 2012

Page 4: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

La ce mijloace intelectuale putem recurgepentru a explica lumea în care trăim?

Page 5: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

exemplu:

<section>

<p><a href="cv.html">CV-ul meu</a></p>

</section>

Eu, autorulacestui marcaj!

Page 6: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

întrebări

…privitoare la structură:

<a> este parte obligatorie din <p>? Ori altceva?

cv.html este (identifică) o resursă?un obiect?

o clasă de obiecte?un atribut?o relație?

orice altceva?

Page 7: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

întrebări

…referitoare la vocabular/meta-date:

<a> e similar cu <a> din HTML?autorul marcajului este cel care l-a și publicat?

dacă da, când?sub ce termeni privind copyright-ul?

ce proprietăți specifice pot fi definite?

formalizat, eventual

Page 8: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

necesități

Existența unor instrumente intelectualefacilitând înțelegerea lumii (cunoașterea umană)

via descrieri abstracte

Page 9: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

necesități

Existența unor instrumente intelectualefacilitând înțelegerea lumii (cunoașterea umană)

via descrieri abstracte

modele

(Allemang & Hendler, 2008) și (Daum & Merten, 2003)

Page 10: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Modelele utilizate facilitează comunicareaîntre (grupuri de) persoane

Page 11: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Modelele utilizate facilitează comunicareaîntre (grupuri de) persoane

un model poate descrie un context specific într-o manieră ce poate fi înțeleasă de anumite persoane

jargon – e.g., un vocabular de termeni specifici

Page 12: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Modelele utilizate facilitează comunicareaîntre (grupuri de) persoane

colaborare mediată de înțelegerea similarăa unui fenomenpartajarea cunoașterii umane

unul dintre scopurileprimare ale Web-ului

Page 13: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

factual set of examples set of traces set of statements

conceptual taxonomies & typologies component systems hybrid conceptual systems

procedural series procedures parallel procedures interactive procedures

prescriptive definitions, norms & constraints laws & theories decision trees control rules

processes & methods processes methods collaborative systems

o clasificare a modelelor de cunoștințe

(knowledge models)Gilbert Paquette, 2010

Page 14: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Modelele explică un anumit conceptși pot realiza predicții

Page 15: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Modelele explică un anumit conceptși pot realiza predicții

punând în relație un fenomen cu altele (similare)

Page 16: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Modelele explică un anumit conceptși pot realiza predicții

punând în relație un fenomen cu altele (similare)

premisa realizării de interpretări specifice

Page 17: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Modelele mediază puncte de vedere diferite

Page 18: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Modelele mediază puncte de vedere diferite

un model poate oferi mijloacele necesare explorăriidiferențelor dintre conceptualizările unor fapte

Page 19: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Modelele mediază puncte de vedere diferite

un model poate oferi mijloacele necesare explorăriidiferențelor dintre conceptualizările unor fapte

facilitează înțelegerea unui anumit web

Page 20: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Modelele pot reprezenta generalizări convenabileale universului pe care-l modelează

Page 21: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Modelele pot reprezenta generalizări convenabileale universului pe care-l modelează

exemple:modelul utilizatorului în interacțiunea om-calculator

modelul relațional al bazelor de datemodelul de comunicare în rețele de calculatoaremodelul computațional al unui sistem software

Page 22: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

modelele facilitează structurarea unor „lucruri” de interes dintr-un domeniu (web) complex

com

ple

xita

te (

pri

vin

d s

tru

ctu

ra)

gradul de generalitate a modelării cunoștințelor domeniului

ontologie

tezaur

taxonomie(clasificare)

vocabular(nomenclatură)

folksonomie

du

(Kat

rin

Wel

ler,

20

10

)

Page 23: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

modelele facilitează structurarea unor „lucruri” de interes dintr-un domeniu (web) complex

com

ple

xita

te (

pri

vin

d s

tru

ctu

ra)

gradul de generalitate a modelării cunoștințelor domeniului

ontologie

tezaur

taxonomie(clasificare)

vocabular(nomenclatură)

folksonomie

sisteme tradiționale de organizare a cunoștințelor

du

(Kat

rin

Wel

ler,

20

10

)

Web social

Web semantic

Page 24: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Semantica = atașarea un formalism– ce explică “semnificația” unui concept –

la o construcție sintactică

Page 25: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Semantica = atașarea un formalism– ce explică “semnificația” unui concept –

la o construcție sintactică

exemplu: semantica limbajelor de programaree.g., specificată via axiome logice ori algebre

Page 26: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Semantica = atașarea un formalism– ce explică “semnificația” unui concept –

la o construcție sintactică

în cazul limbajului natural, se referă la modalitatea de a înțelege o apariție a unei construcții (litere și/sau sunete)

Page 27: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Oamenii/mașinile trebuie să utilizezeîn același mod cunoștințele

partajarea aceleași conceptualizări a informațieiîn cadrul unei comunități ori a unui web

Page 28: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Necesitatea exprimarii (in)formalea semanticii – meaning

relația (relation) dintre concepte“pătrat” în relație cu “dreptunghi”

constrângerea/restricția (constraint)“dreptunghi” constrâns la “pătrat”

Page 29: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Necesitatea existențeiunui vocabular comun

elementele sintactice – cuvintele, marcatorii etc. –au același înțeles atât pentru transmițător,

cât și pentru destinatar

Page 30: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Necesitatea existențeiunui set comun de constrângeri

eventual, exprimate formal

Page 31: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Necesitatea existențeiunui cadru conceptual comun

ce poate specifica relații între (clase de) informații

înțelegerea nu va fi influențată de cunoștințele inițiale nespecificate

(unspecified background knowledge)

Page 32: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Implicitul nu poate fi citit/procesat

de către software

“moartea proces biologic”

(via Encyclopaedia Britannica)

Page 33: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Informațiile de background – deseori, implicit

cunoscute de scriitorul/cititorul uman –

nu sunt accesibile pentru mașină (Brewster, 2003)

exemple: articolele științifice, beletristica

Page 34: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Modelele utilizate pentru comunicații inter-umane

prezinta avantaje față de modelele create

spre a fi folosite de calculatoare

Page 35: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

modelele comunicative la care recurg oamenii

se bazează pe limba (maternă) și pe imagistică

Page 36: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Modelele utilizate pentru comunicații inter-umane

prezinta avantaje față de modelele create

spre a fi folosite de calculatoare

lăsând oamenii să interpreteze semnificația unui model,

putem asista la proliferarea confuziei – vezi legislația

Page 37: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Modelele comune folosite de oameni

au – în general – un caracter informal

Page 38: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Modelele comune folosite de oameni

au – în general – un caracter informal

semnificația termenilor utilizați nu poate fi unic definită

Page 39: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Modelele comune folosite de oameni

au – în general – un caracter informal

semnificația termenilor utilizați nu poate fi unic definită

exemplu: “explicarea” unor resurse recurgând exclusiv

la termeni de conținut (tag-uri) stabiliți de utilizator

Page 40: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Page 41: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Abordări diferite în modelarea resurselor Web

www.readwriteweb.com/archives/semantic-web/

Page 42: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Cum pot fi adnotate manual resursele Web?

Page 43: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Tag-urile definite de utilizator reprezintăclasificări ad-hoc realizate de oameni,

partajate în cadrul unei comunități

context: social bookmarking

Page 44: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging – definiții

Bookmark

referință creată manual

ce vizează o resursă de interes

e.g., imagine, film, documentație,…

Page 45: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging – definiții

Tag

(meta)dată simplă – termen arbitrar ales –

asociată extern unui obiect (unei resurse)

cu scopul de a identifica, sorta, agrega etc. acea resursă

Page 46: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging – definiții

Aplicație de bookmarking

aplicație Web facilitând descoperirea de

conținuturi & persoane de interes

pe baza tag-urilor partajate + bookmark-urilor existente

S. Braun, Social Semantic Bookmarking (2008)www.slideshare.net/vzach/social-semantic-bookmarking-pakm-presentation

Page 47: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Folksonomy = folk + taxonomy

“…is the result of personal free tagging of pagesand objects for one’s own retrieval”

Thomas Vander Wal, 2007

Page 48: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Uzual, tagging-ul are loc într-un mediu social

legat de procesele cognitive

Page 49: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Obiectde

interes

Asocierimentalemultiple

(concepte)

tt

tt

tagging

tagging-ul reprezintă o modalitate particulară de adnotarea resurselor electronice – digital content annotation

Page 50: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model mental

reprezentare(în limba maternă)

reprezentaresimbolică (grafică)

reprezentare(în altă limbă)

reprezentare reprezentare

reprezentare

interpretare

interpretare

interpretare

“Apple”

„măr” (?)

adaptare după (Gilbert Paquette, 2010)

Page 51: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Tagging-ul are un caracter subiectiv

bazat pe limitele tag-urilor lingvistice

Page 52: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Feedback-ul propriu + feedback-ul social

Rashmi Sinha, 2006

Page 53: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Tag-urile personale sunt mai memorabiledecât cele (strict) semantice

Page 54: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Fiecare persoana este expertăîn propriul vocabular (set de termeni de conținut)

Page 55: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Page 56: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

RT @ontoligent Folksonomy is metadata.

Page 57: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Page 58: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Tagging-ul poate depinde și de context(comunitatea de utilizatori)

design = “visual design”versus

design = “software design”

Page 59: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Problema lipsei preciziei – după (Happel et al., 2008)

jargon

plural – “inițiativă” versus “initiative”

abrevieri – “SAX” versus “saxofon”

cuvinte compuse – “opensource” versus “open-source”

erori de redactare – “elephant” versus “elefant”

Page 60: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Problema lipsei preciziei – după (Happel et al., 2008)

polisemie

semnificații multiple ale aceluiași tag

exemplu: “pasta” – as dish, “pasta” – as ingredient

Page 61: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Problema lipsei preciziei – după (Happel et al., 2008)

omonimie

tag-uri care au înțelesuri multiple neînrudite

exemplu: “toc”

Page 62: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Problema lipsei preciziei – după (Happel et al., 2008)

multilingvism

tag-uri cu semnificații diferite, în funcție de limbă

exemplu: “paste” (în română) versus “paste” (în engleză)

Page 63: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Problema lipsei preciziei – după (Happel et al., 2008)

sinonimie

același concept este referit prin termeni diferiți

exemplu: “design” versus “proiectare”

Page 64: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Problema lipsei preciziei – după (Happel et al., 2008)

nepotriviri la nivel abstract

lipsa relațiilor (semantice) dintre tag-urila diverse niveluri de abstractizare

datorată intențiilor sau expertizei utilizatorilor

exemplu: “băutură” versus “vin” versus “Merlot”

Page 65: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Setul de tag-uri asociate resurselor Web de interesare caracter dinamic

modelul de clasificare bazat pe tagging nu este static

Page 66: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Sistemele bazate pe tagging oferă suport pentruorganizarea informală a unui volum semnificativ

de informații eterogene existente pe Web

Page 67: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Sistemele bazate pe tagging oferă suport pentruorganizarea informală a unui volum semnificativ

de informații eterogene existente pe Web

organizarea este informală,deoarece interpretarea tag-urilor necesită

aportul utilizatorilor într-un context dat

Page 68: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Problema asigurării interoperabilității

“interoperability with tagging systems”

(Peter Mika, 2006)

consistență

identificare viabilă

partajarea încrederii

Page 69: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Problema privind tag spam-ul

rezolvări actuale:

manuale (bazate pe factorul uman), algoritmice, mixte

Page 70: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Problema privind tag spam-ul

detection-based methods

prevention-based methods

demotion-based methods

http://heymann.stanford.edu/tagspam.html

Page 71: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Scalabilitatea tagging-ului (Vander Wal, 2007)

Page 72: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Interacțiuni într-un sistem de social tagging:salvare & tagging

re-detectare (refinding)

clicking, pivoting, exploring

căutare – a propriilor tag-uri ori a altora

(în cadrul grupului de interes sau în general)

interacțiune în cadrul grupului social

Page 73: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Determinarea importanței

cine determină „tăria” semnificației tag-urilor:aplicația, proprietarul sitului sau utilizatorul?

Page 74: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Determinarea “zgomotului”

detecția & eliminarea “zgomotului”:dezambiguizare, facilități de căutare, spelling etc.

Page 75: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

#iphonesia

#photooftheday

#jj #iphoneography

#instagood #instagram

#instagramhub

#iphoneonly #igers

#instamood #gang_family

#sky #bestoftheday

#webstagram #ig

#iphone #iphone4 #gmy

#jj_forum #all_shots

cele mai populare tag-uri folositede utilizatorii aplicației Instagram

(20 octombrie 2013)

Page 76: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

a se vizita hashtags.org și tagdef.com

tagging în contextul microblog-urilorhashtag analytics

Page 77: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Problema vizualizării tag-urilor

adoptarea diverselor tehnici de vizualizare

e.g., tag clouds, clustering, semantic zoom

Page 78: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Problema vizualizării tag-urilor

O. Kaser, D. Lemire, “Tag-Cloud Drawing: Algorithms for Cloud Visualization”, WWW2007 Workshop on Tagging and Metadata

for Social Information Organization, 2007 – http://slidesha.re/cpkPLi

Page 79: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

vizualizarea tag-urilor – o implementare JavaScriptwww.jasondavies.com/wordcloud/

Page 80: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Problema monitorizării dinamicii &analizei evoluției tag-urilor

o serie de detalii în articolulJ. Lehmann et al., “Dynamical Classes of Collective Attention

in Twitter”, WWW2012 Conference, ACM Press, 2012www2012.wwwconference.org/proceedings/proceedings/p251.pdf

Page 81: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Problema clasificării resurselor (Sinha, 2006)

exemplificare:clasificarea religiilor

Flickr (folksonomie)vs.

Dewey (sistem de clasificare realizat de experți)

Page 82: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Problema clasificării resurselor (Sinha, 2006)

exemplificare:clasificarea religiilor

FlickrHinduism: 6512 imagini + Christianity: 5207 imagini

Page 83: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Problema clasificării resurselor (Sinha, 2006)

Dewey – http://dewey.info/class/200/

200 Religion

201 Religious mythology & social theology

202 Doctrines

203 Public worship & other practices

204 Religious experience, life & practice

205 Religious ethics

206 Leaders & organization

...

Page 84: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Sistemele de tagging reprezintă oamenii care participă în cadrul acestora

puncte de vedere & perspective posibil limitate

Page 85: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Pot apărea conflicte:

tag-urile folosite de experți diferă de cele ale novicilor

Page 86: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Pot apărea conflicte:

grupurile de interes sunt mai focalizateîn ceea ce privește clasificarea mai bună a resurselor

Page 87: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Pot apărea conflicte:

dificultăți în detectarea unui punct de vedere minoritar

Page 88: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging – exemple de utilizare

social bookmarking: Diigo, Evernote, Instapaper, Skloog

multimedia: 500px, Flickr, Last.fm, Scribd, Viddler

știri: Digg, Reddit

e-business: Amazon, Lulu

știință: CiteULike, Connotea, myExperiment

sisteme de operare (fișiere): Mac OS X, Windows 7/8

Page 89: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Remarci:

“In essence tag systems mirror the pagerank structure of Google’s system, but make the internal structures

browsable and viewable directly.”

Lee Iverson

FolkRank (A. Hotho et al., 2006)

Page 90: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Necesitatea existenței adnotărilor semantice(semantic annotation) a resurselor Web

Page 91: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Necesitatea existenței adnotărilor semantice(semantic annotation) a resurselor Web

utilizarea unui termen descrispe baza unui model de specificare a cunoștințelor

e.g., relația sa cu alți termeni, indiferent de limba utilizată

Page 92: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: tagging

Remarci:

“Large number of individual tagging actionsresult in the emergence of the semantics of tags.”

lightweight, dynamic ontologies (Peter Mika, 2005)

vezi inițiativa TagCommons

Page 93: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

studiu de caz: mash-up-uri Web de agregare a datelorpe baza tagging-ului de resurse

X. Liu et al., “Composing Data-Driven Service Mashups with Tag-based Semantic Annotations”, ICWS 2011, IEEE Press, 2011

Page 94: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Putem recurge la modele formale?

Page 95: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: formalizare

Explicarea & prezicerea unui fenomen necesitămodele având un grad mai mare de formalism

decât comunicarea umană

Page 96: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: formalizare

Explicarea & prezicerea unui fenomen necesitămodele având un grad mai mare de formalism

decât comunicarea umană

explicarea unui fenomen îl pune în legăturăcu anumite “principii de bază” (first principles)

Page 97: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: formalizare

Explicarea & prezicerea unui fenomen necesitămodele având un grad mai mare de formalism

decât comunicarea umană

aceste principii (axiome, reguli) nu depind de o anumităinterpretare particulară umanăobiectivitate

Page 98: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: formalizare

Formalismele – uzual, exprimate matematic –oferă suport pentru realizarea predicțiilor

Page 99: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: formalizare

Formalismele – uzual, exprimate matematic –oferă suport pentru realizarea predicțiilor

utile în diverse contexteprecum e-business-ul

Page 100: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: formalizare

Formalismele – uzual, exprimate matematic –oferă suport pentru realizarea predicțiilor

exemplu (în cazul unui joc electronic): explicarea – și prezicerea – traiectoriei unui obiect

via un model formal implicând concepteca forță, gravitație, viteză, masă descrise matematic

Page 101: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: formalizare

Formalismul ne ajută să evaluăm

când un anumit model e aplicabil

formalismul (matematic) permite ca evaluarea

să fie independentă de factorii umani

Page 102: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: formalizare

Formalismul ne ajută să evaluăm

când un anumit model e aplicabil

putem explica anumite aspecte ale Web-ului,

recurgând la diferite modele formale

Page 103: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: exemple

Modelul diagramelor entitate-relațieEntity-Relation Model – ERM (Chen, 1976)

Semantic Object Modeling – SOM (Kroenke, 1995)Unified Modeling Language – UML (OMG, 1997)

Higher Order Entity Relationship Model (Thalheim, 2000)Asset-Oriented Model – AOM (Daum & Merten, 2003)

utilizare tipică: specificarea schemelor de baze de date

Page 104: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model de acces la date: yql

Yahoo! Query Language

abstractizează accesul la surse de date eterogenece pot fi obținute via servicii Web

http://developer.yahoo.com/yql/

Page 105: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model de acces la date: yql

Permite – pe baza unui limbaj similar SQL –interogarea, filtrarea, combinarea datelor la nivel de Web

(suport pentru realizarea de mash-up-uri)

facilitează atașarea la aplicația Web dezvoltatăa surselor de date de interes:

fluxuri de știri, informații cartografice, resurse multimedia etc.

Page 106: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model de acces la date: yql

Adoptă o sintaxă SQLshow, desc, select, use, insert, update, delete

răspunsul la o interogare = rânduri (rows) de date

Page 107: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model de acces la date: yql

Sursele – modelate ca tabele – de date disponibilesunt precizate de http://datatables.org/

built-in tables – oferite de Yahoo!+

community tables – e.g., Amazon, Apple, arXiv, BBC,Deviant Art, Diigo, Facebook, GitHub, Klout, Mendeley,

Mozilla Labs, PayPal, Slideshare, Spotify, Vimeo,…

Page 108: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model de acces la date: yql

cele mai recente fotografii stocate de Flickrselect * from flickr.photos.recent limit 7;

informații meteo despre localitatea Iașiselect * from weather.bylocation where location='Iasi';

cele mai recente evenimente ce vor avea loc în Europaselect start_date, description from upcoming.events

where woeid in (select woeid from geo.places

where text="Europe") | sort (field="start_date")

Page 109: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

creații muzicale oferite de iTunesselect * from apple.itunes where

term='Brain Damage' and media='music';

URL-ul serviciului Web REST aferent

Page 110: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model de accesla date

Servicii Webmodel de calcul

Ofertantde servicii de

telefonie mobilă

mash-up-uri la nivelde dispozitiv mobil

model de implementaremodel de interacțiune

model de acces la date – studiu de caz

YQL

adaptare după twitter.com/sh1mmer

model de comunicare

Page 111: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: puncte de vedere

Web-ul având un caracter multidisciplinar,modelele utilizate pot fi diferite

reprezentarea unei varietăți de opinii(posibil, contradictorii)

care nu pot fi reconciliate la nivel global

Page 112: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Necesitate:

o infrastructură oferind suport atât pentru

AAA (Anyone can say Anything about Any topic),

cât și pentru a media puncte de vedere diferite

Page 113: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model

Necesitate:

o infrastructură oferind suport atât pentru

AAA (Anyone can say Anything about Any topic),

cât și pentru a media puncte de vedere diferite

partajarea + concilierea modelelor (in)formale utilizate

Page 114: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: expresivitate

Fiecare model oferă un anumit nivel de expresivitate

exemplu: expresivități diferite ale modelelorde specificare a unei molecule de apă

Page 115: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: expresivitate

Modele cu niveluri de expresivitate și sintaxe diferite

rețeasemantică

adaptare după Sean Bechhofer

Page 116: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: expresivitate

Modele cu niveluri de expresivitate și sintaxe diferite

asocieri de subiecte

(topic map)

adaptare după Sean Bechhofer

Page 117: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: expresivitate

Modele cu niveluri de expresivitate și sintaxe diferite

diagrameUML

adaptare după Sean Bechhofer

Page 118: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: expresivitate

Modele cu niveluri de expresivitate și sintaxe diferite

grafuriconceptuale

adaptare după Sean Bechhofer

Page 119: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: expresivitate

Modele cu niveluri de expresivitate și sintaxe diferite

adaptare după Sean Bechhofer

grafuriRDF

Page 120: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: expresivitate

Modele cu niveluri de expresivitate și sintaxe diferite

adaptare după Sean Bechhofer

logica de ordin I

Every programmer likes the Sun.(Ax) programmer (x) => likes (x, Sun)

You can fool some of the people all of the time.(Ex) (At) (person (x) ^ time (t)) => canFool (x, t)

Tux is not human.~human (Tux)

Page 121: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

model: expresivitate

Limbajele de modelare conceptuală a resurselorîn contextul Web-ului semantic

au grade diferite de expresivitate

RDFRDFS (RDF Schema)SKOSOWL

detalii în cursurile viitoare

Page 122: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

“noul” Web

În contextul Web-ului, scopul principal estemodelarea unei arii (domeniu) de cunoaștere

concepte primare – entități, “lucruri” ale domeniului

relații între concepte

atribute/proprietăți (nume & valori) ale conceptelor

reguli de asociere privind concepte, relații, atribute

Page 123: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

“noul” Web – componente de bază

Page 124: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

“noul” Web

Faze privind evoluția:

1. infrastructura de bază (HTTP, RDF, OWL)

finalizată

www.w3.org/2001/sw/

Page 125: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

“noul” Web

Faze privind evoluția:

2. formularea necesităților de promovare &de implementare

identificarea grupurilor de lucru relevanteatragerea comunităților de interes

(științe ale vieții, GIS – Geographical Information Systems, ofertanți de bunuri digitale, guverne etc.)

+ intersecția Web-ului semantic cu alte tehnologii

Page 126: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

viziunea stratificată privitoare la Semantic Web(Tim Berners-Lee)

Page 127: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

“noul” Web

Semantic Web (Web of Data)

actualele “cărămizi” ale Web-ului semantic oferă

modalități de modelare conceptuală a resurselor

pentru a permite efectuarea de raționamente automate

Page 128: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

“noul” Web

Constituirea unei științe a Web-ului(Science of the Web) – Berners-Lee et al., 2006

Web science = combinație între științe analitice(e.g., biologia) și cele sintetice (computer science)

caracter inerent inter-disciplinar

webscience.org

Page 129: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

“noul” Web

“Web science is about more than modeling the current Web. It is about engineering

new infrastructure protocols and understanding the society that uses them, and it is about the creation of beneficial new systems.”

Tim Berners-Lee et al., Science, 313, august 2006

Page 130: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

“concluzii”

It’s not the wires – it’s the computers

It’s not the computers – it’s the documents

It’s not the documents – it’s the things

Page 131: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

“concluzii”

“The last level of abstraction isthe Web of real things,

built on top of the Web of documents, which is in turn built on the network of computers.”

Tim Berners-Lee

Page 132: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

rezumat

modelarea cunoștințelor: de la tagging la Web science

Page 133: Dezvoltarea aplicațiilor Web (4/12): Aspecte privind modelarea cunoştinţelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

episodul viitor: modelul de date RDF

Firebug Firefoxextinde

Mozilla

produsDeproduce

Deschis

areStatut

areStatut

Hadoop

Organizație

este Apacheproduce

este

Sabinutilizează

Persoană

este

Lucene