a szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [msz 7788/1] a...

104
BME VIK TMIT MeR 1 A Szemantikus háló A szemantikus háló a Web funkcionalitására épülő új réteg, adatai alkalmasak gépi feldolgozásra, automatizálásra is.

Upload: others

Post on 19-Feb-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 1

A Szemantikus háló

A szemantikus háló a Web

funkcionalitására épülő új réteg,

adatai alkalmasak gépi feldolgozásra,

automatizálásra is.

Page 2: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 2

Mi kell hozzá?

A hálózati tartalom egyértelmű címkézése.

Gépi intelligencia számára is használható adatmodell(ek),

amit ember által olvashatóan kell tárolni.

Szabványos szótárak (a leírt adatok megértéséhez).

Következtetés-logika.

Bizonyítási szint: a többi rendszerkomponens felé

megjeleníti az eredményt.

Bizalmi szint: a hálón sok adat rossz, hiteltelen,

bizonytalan.

Page 3: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 3

szabványosítás: W3C

• Technology and Society Domain – Semantic Web activities

• RDF Core WG, Web Ontology WG, RDF Interest Group, Semantic Web Coordination Group, stb.

• RDF Model and Syntax Specification

• RDF Concepts and Abstract Data Model

• RDF Model Theory (and graph syntax) Az RDF szemantika formális definíciója

• RDF/XML syntax Az XML ábrázolás definíciója

• RDF Schema (and data types) A Vocabulary Definition Language

Page 4: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 4

A szemantikus háló

rétegei

Page 5: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 5

URI

Uniform Resource Identifier

Az RDF-ben:

minősített URI használatos.

(URI és egy opcionális részletazonosító:

#szöveg)

A részletazonosító az URI-val megadott

adat jellemzésére szolgál.

Page 6: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 6

Metaadatok

Metaadat : adat az adatról

(minden adat, ami más adatról szól, pl.

katalógusadat)

• A metaadatok természetesen önmaguk is

adatok, így róluk is lehetnek további

metaadatok.

• Alapvető kategorizálás : leíró és

szemantikus metaadatok.

Page 7: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 7

Alapvető kategorizálás

Leíró metaadatok (descriptive metadata):

olyan metaadatok, amelyek jelentése nem

közvetlenül kapcsolódik a dokumentum

jelentéséhez, hanem a dokumentum

keletkezésének és/vagy módosításának a

körülményeit írják le.

Például: a dokumentum szerzője, a dokumentum

hossza, az utolsó módosítás dátuma stb.

Page 8: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 8

Alapvető kategorizálás

Szemantikus metaadat: olyan metaadat, amely a dokumentum jelentéséről hordoz információt.

Például: a dokumentum jellegzetes kulcsszavai, témaköre. A szemantikus metaadatok főleg strukturálatlan és félstrukturált adatok esetében hasznosak, ahol az adatok információtartalma csak külön feldolgozás árán nyerhető ki az adatok reprezentációjából.

Page 9: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 9

Metaadat típusok

• Adminsztratív metaadat:

információs erőforrás adminsztrációjához,

menedzseléséhez (pl. jogok, hozzáférés, digitalizáláshoz szelektálási

kritérium)

• Leíró metaadat:

információs erőforrás azonosításához és

jellemzéséhez (pl. katalógus, keresési segítség, index, hyperlink

erőforrások között)

Page 10: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 10

Metaadat típusok (2)

• Megőrzési metaadat: információ megőrzési tevékenységhez (pl. az erőforrás fizikai állapotának leírása, adatfrissítési előírás)

• Műszaki metaadat: rendszerműködési jellemzők (pl. hw, sw, digitalizálási adat, formátum, kódkulcs, jelszó)

• Felhasználási metaadat: erőforrás felhasználásának szintje, típusa (pl. kiállítási adat, felhasználó regisztrátum, újrahasznosítás)

Page 11: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 11

Példa: EBU/SMPTE metaadatok

A korszerű médiainformációs rendszerek

felépítésének egyik pillére.

• Az Európai Műsorszóró Egyesület (EBU) az

audiovizuális tartalmat (content) a következő

összetevőkre bontja:

• Video Essence - videóesszencia

• Audio Essence - audióesszencia

• Data Essence - adatesszencia

• Metadata - metaadat

Page 12: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 12

content = essence + metadata A tartalmat csomagokba rendezik. A csomagokra

így külön-külön sokféle funkció és jellemzés

alkalmazható. (Pl. Access Control, Identifiers &

Labels, Version Control, IPR Management, Data

Access, Essence Tracking,

Contribution/Distribution Information, Data Base

Management, Play-list-Essence Matching)

Page 13: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 13

Példa: MPEG-7

• multimédia tartalmak szabványos

leírására, szolgáló szabványos

- deszkriptorokat, leíró sémákat,

deszkriptor-leíró nyelvet tartalmazó –

keretrendszer

Page 14: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 14

• Data (a leírni kívánt audiovizuális információ)

• Feature (a Data valamilyen megkülönböztető sajátossága)

• Descriptor (egy Feature reprezentációja, szemantikai és szintaktikai szabályok révén)

• Descriptor Value (egy Descriptor konkrét értéke, előfordulása)

• Description Scheme - DS (DSs) (meghatározza a Descriptor-ok és a Description Scheme-k viszonyrendszerének, szerkezetének szemantikáját és szintaktikáját)

• Description - D (Ds) (egy DS-ből, azaz struktúrából és Description Value-k egy adott készletéből áll)

• Coded Description ("külső" követelményeknek - pl. tömörség, véletlen elérés - megfelelő Description)

• Description Definition Language - DDL (Descriptor-ok és DS-ek létrehozására, módosítására alkalmas nyelv)

Page 15: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 15

Példa: Dublin Core

• az internetes forrásfeltárási munka megkönnyítése, a források bibliográfiai leírásának egységesítése, a hozzáférés és az egységes értelmezés szabványosítása.

• 15 leíró egység:

• title - cím, creator - alkotó, subject - tárgyszavas leírás, description - leírás, publisher - kiadó, contributor - hozzájáruló, date - dátum, type - típus, format - formátum, identifier - egyedi azonosító, source - forrás, language – nyelv, relation – forráshivatkozás, coverage - téridő-helyzet, rights - jogok

• A Dublin Core szabvány specifikációja: Internet RFC 2413 (The Dublin Core Metadata for Simple Resource Discovery).

Page 16: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 16

Metaadat és Web

Több kezdeményezés: metaadatokkal ellátni

a Webet.

Felhasználási területek:

Katalogizálás (pl. BibTeX)

Tartalmi rangsorolás

Szellemi tulajdon védelme

Személyességi szintek (hozzáférés)

e-kereskedelem

Page 17: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 17

MDC Open Information Model

Metaadat Koalíció (Meta Data Coalition -

MDC).

Célja: a metaadatok egységes kezelése.

Nyílt információs modell (Open Information

Model - OIM), komponens-alapú,

újrahasznosítható alkalmazásfejlesztés

támogatása. UML modellező nyelv

alkalmazása.

Page 18: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 18

Alkotó elemei

• Analysis and Design Model (UML Extensions, Common Data Types, Generic Elements)

• Object and Component Model (Component Description Model)

• Database and Warehousing Model (Database Schema, OLAP Schema, Data Transformations, Record Oriented Legacy Databases, Report Definitions)

• Business Engineering Model (Business Goal Model, Organizational Model, Business Rule Model, Business Process Model)

• Knowledge Management Model (Knowledge Description Format, Semantic Definitions)

Page 19: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 19

Implementációs eszközei

• Unified Modeling Language (UML) - az

OIM formális specifikációs nyelve

• eXtensible Markup Language (XML) - az

OIM szabványos csere formátum nyelve

• a Structured Query Language (SQL) - az

OIM lekérdező nyelve.

Page 20: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 20

UML

Model Repository

Formal

Specification

XML

Transfer

Documentation

Test, etc.

Query View

Object Model

Interface Def.

XML Document

Type Definition

SQL Schema

Definition

Page 21: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 21

Az információkereső-nyelvi

szótár fogalma • Információkereső-nyelvi szótáron, illetve

szókészleten természetes és mesterséges

nyelven alapuló szótárakat, illetve

szókészletet értünk:

– osztályozási rendszert,

– tárgyszójegyzéket,

– tezauruszt és

– ún. szabad tárgyszavakat

Page 22: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 22

Tezauruszok

• A metaadat akkor (a leg)hasznos(abb), ha

jelentése jól definiált.

Megállapodások, szabványok szükségesek:

az egyértelműség (értelmezésbeli különbségek

elkerülésére: pl. szerző, utolsó módosítás

dátuma),

és a (mező)formátumok egységesítésére (pl.

mindig az ISO szerinti dátumformátumot

használjuk)

Page 23: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 23

Tezauruszok

• Szemantikus metaadat esetében ez bonyolultabb (a mezők tartalmának a jelentése sem feltétlen világos - pl. kulcsszavak esetén).

• Tipikus megoldás: a felhasználható kulcsszavak körét egy ún. kontrollált szótárral (controlled vocabulary) adjuk meg (az adott témakör összes lehetséges kifejezését, azok magyarázatát és a köztük levő kapcsolatot tartalmazza).

• Ezzel a kulcsszavak jelentése a rendszeren belül egyértelműen rögzíthető.

Page 24: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 24

• Ennek egyik megvalósítási módja a tezaurusz:

adott szakterület kulcsszavait és azok közti

(nyelvtani) kapcsolatokat tartalmazza.

• Tipikusak egy tezauruszon belül a szinonima

(synonim), az általánosabb kifejezés (broader

term, BT), a specifikusabb kifejezés (narrower

term, NT), és az általános „kapcsolatos fogalom”

(related term, RT) relációk.

Tezaurusz

Page 25: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 25

Tezaurusz szabványok

Nemzetközi :

• ISO 2788:1986 Documentation --

Guidelines for the establishment and

development of monolingual thesauri

• ISO 5964:1985 Documentation --

Guidelines for the establishment and

development of multilingual thesauri

Magyar szabvány: MSZ 3418-87

Page 26: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 26

A tezaurusz és más osztályozási rendszerek

A tezauruszban ún. lexikai egységek és a köztük

levő relációk vannak.

Többféle reláció lehet két lexikai egység között -

> ezáltal egy tezaurusz több irányú barangolást

tesz lehetővé (mint egy klasszikus osztályozási

rendszer, pl. könyvtári osztályozó rendszer).

Ez nagyobb kifejező erőt ad, de

karbantarthatósága, kezelhetősége nehezebb.

Page 27: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 27

a reláció rövid jele

szakmai megnevezése laikusok számára történő

megnevezése

F generikus fölérendelt (nem-

fogalom)

általánosabb kifejezése

T

partitív fölérendelt (egész) átfogóbb kifejezése, egésze

R

eredménye, következménye rendeltetése/oka

A

generikus alárendelt (faj-fogalom) fajtája

P

partitív alárendelt (rész) része

E

eredete, kiindulása eszköze/okozata

X

egyéb rokonsága, átfedése rokon kifejezés

L

deszkriptor lásd

LV

vagylagos deszkriptorok lásd vagy

H

nemdeszkriptor helyettesített

HV

vagylagos nemdeszkriptorok vagylagosan helyettesített

Page 28: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 28

ADATBÁZIS

M: Adatok elektronikus hordozó rögzített, keresésre alkalmas

és forgalmazott, szervezett, összessége

F Műszaki dokumentum

X Cd-rom

ADATHORDOZÓ

M: Olyan tároló közeg, amelyen vagy amelyben egy

meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1]

A Filmanyag

Hanglemez

Hangszalag

Képlemez

Képszalag

Mágneses adathordozó

Optikai adathordozó

Papírlap

T Dokumentum

Page 29: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 29

DIPLOMA

M: Szakképzettséget vagy (cím)adományozást igazoló

(díszes) oklevél

F Bizonyítvány

Diplomamunka

L Szakdolgozat

DISSZERTÁCIÓ

M: Felsőoktatási vagy egyéb keretben tudományos

fokozat ill. cím elnyeréséért készített értekezés [MSZ

3424/6]

H Doktori értekezés

F Tanulmány

X Szakdolgozat

Tézis

Page 30: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 30

Ének M: Emberi hanggal megszólaltatott zene L Vokális zene ÉNEKESKÖNYV M: Énekszövegeket és hangjegyírással lejegyzett énekeket tartalmazó gyűjtemény [VILIRLEX] F Gyűjteményes könyv Hangjegyes tartalmú dokumentum A Daloskönyv Egyházi énekeskönyv Táncdalgyűjtemény X Énektankönyv Népdalgyűjtemény ÉNEKTANKÖNYV H Oktatási énekeskönyv F Zenei tankönyv A Szolfézskönyv X Énekeskönyv

Page 31: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 31

Ismert tezauruszok

• The Art and Architecture Thesaurus, Getty Institute

http://www.getty.edu/research/conducting_research/vocabular

ies/aat/

• Union List of Artist's Names, Getty Institute

http://www.getty.edu/research/conducting_research/vocabular

ies/ulan/

• British Museum Object Names Thesaurus

http://www.mda.org.uk/bmobj/Objintro.htm

• NASA Thesaurus

http://www.sti.nasa.gov/thesfrm1.htm

• USA kongresszusi könyvtár

http://www.loc.gov/lexico/servlet/lexico/

Page 32: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 32

Az információtípusok jellemzése

• Jelölő (markup) nyelvek (SGML, HTM,

XML)

• Szöveg. Szövegformátum, természetes

nyelv, hasonlósági modellezés.

• Multimédia. Formátumok, leíró adatok,

tartalom-jellemzés.

Page 33: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 33

Ontológiák

(Tudásreprezentáció)

Page 34: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 34

Ontolológia a filozófiában

• „a létről szóló tan”

• ontosz (lenni, létezni) + logosz (tudomány)

• Arisztotelész, Aquinói Szent Tamás (istenérvek)

• XX. Század: Husserl, Hartmann, Heidegger,

• Érzékfeletti irracionális intuíció útján felfogott lét legáltalánosabb fogalmainak rendszere (Filozófiai kislexikon)

• Az ontológia a legfontosabb fogalmak és viszonyaik leírása.

Page 35: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 35

Fogalmak viszonya

• Taxonómia

• A fogalmak felosztása, hierarchiába szervezése

valamilyen megkülönböztetési szabály alapján.

– Amit felosztunk: nemek (genus)

– Az alárendelt fogalmak: fajok (species)

– A fajok között kölcsönös kizárás van

– Természetesen mindkettő relatív

– Tartalmazási reláció

– Fogalmak, melyeknek vannak példányai

– Fa struktúra (létezik a legfelsőbb nem)

Állatok

Emlősök Halak

Stb.

Page 36: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 36

Kategóriák • Általában a világ egy kis részének leírásához is

kevés egy fa. (pl. a kecskebéka és a gyűlölet

nehezen illeszthető össze – nincs közös ősük)

• A fa helyett tehát erdő alkalmazható.

• A különböző kategóriák független taxonómiát

alkotnak, de közöttük kapcsolatok lehetnek. – Nem párosítható minden fogalom mindennel.

– Az egyik fa egy fogalmához a másik fa mely nemének

leszármazottjai kapcsolódhatnak (alma-gömb).

– Egy fogalom mely másik fogalmak használatát zárja ki

(alma-kék).

– Példa: Arisztotelészi kategóriák

Page 37: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 37

Az ontológia

egyezményes terminológiát állít fel egy

közös érdeklődésű közösség tagjai között.

• A tagok lehetnek emberek vagy gépi

ügynökök.

Page 38: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 38

Az ontológia = egy konceptualizáció specifikációja.

A konceptualizáció (C) a tudás készítőjének fejében kialakuló

fogalmi séma vagy sémák. Megjelenítéséhez nyelvre (L) van

szükségünk. (tárgynyelv) A fogalmi séma és reprezentációja

között ontológiai elkötelezettség (ontological commitment) (K)

teremt kapcsolatot.

O

N

T

O

L

Ó

G

I

A

C

ontológiai

elkötelezettség

L nyelv

modelljei

K

Page 39: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 39

Ontológia vs. tezaurusz

• FONTOS! Fogalmakról van szó, nem

kifejezésekről, mint a tezauruszban. Az

ontológiákban a nyelvi megjelenés csak egy

címke.

Dolog

absztakció

Fogalom

felidézés

Kifejezés

ontológia tezaurusz

Page 40: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 40

Ontológia az informatikában

• Gruber: „egy adott felhasználói csoport által egy adott témakörben közösen használt világkép formális leírása”

• Tehát már nem akarja senki a teljes tudást leírni, részterületeket kell megcélozni (dokumentum típusok, algebra).

Elemei: • Fogalmak (concepts) • Kapcsolatok (relation) • Axiómák (axioms)

Page 41: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 41

“Jaguár“

Fogalom

Dolog Szimbólum

felidéz vonatkozik

Page 42: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 42

Miért

címkézünk, építünk tezauruszt, ontológiát … ?

Mert a tipikus felhasználó nem képes jól leképezni

igényét az információs rendszer által

megkövetelt módra. (Különösen ma, az Internet

korában: sok ember keres, intézi ügyeit –

speciális előképzettség nélkül, a modellek, a

struktúrák, a konvenciók ismerete nélkül,

hétköznapi logikával.)

Page 43: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 43

A megoldandó probléma

• Információ kereső képesség javítása

• Recall (több jó találatunk legyen)

• Precision (kevesebb rossz találatunk legyen)

• Lehetőleg közelítsünk a természetes nyelvhez,

az emberi gondolkodáshoz!

• (Kérdés: milyen kapcsolatban van ez a kettő ?)

Page 44: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 44

A keresés nyelvi nehézségei 1.

Azonos (hasonló) jelentésű kifejezések - Példa:

• „Egy felest szeretnék!”

• „Ide gyorsan egy kupicával!”

• „5 cl pálinkát kérek!”

Egy indexelő kereső nem tekinti egyformának!

• Szinonimák: feles, 5 cl, kupica

• Szórend: (Ide-kérek), (5cl, kupica)

Page 45: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 45

A keresés nyelvi nehézségei 2.

Azonosnak látszó kifejezések - Példa:

• A mag, amelyik a földbe került, kicsírázott.

• A Föld magjának anyaga vas és nikkel

keveréke.

Egy indexelő kereső azonosnak tekinti!

• hominimák: Föld, föld

• kontextus tévesztés: mag, mag

Page 46: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 46

Nyelvi kompetencia

Honnan tudja az ember a jó megoldást? • Szinonimák ismerete, szórend értelmezése

• Önmagában még nem magyaráz meg mindent – Ha rosszul beszélünk egy nyelvet, akkor is boldogulunk

– Egy-egy szó is óriási információtöbbletet tud adni („heuréka élmény”)

– Felülemelkedünk a nyelv szintaktikáján „A kék alma felszáll a bánya mélyébe” Nyelvileg (szintaktikailag) tökéletes, értelme nincs.

Nem elég önmagában a nyelv logikája ! (bár az is nagyon sokat segíthet, és – különösen

magyarul – még nagyon sok megoldatlan probléma van)

Page 47: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 47

Háttértudás

Ha a számítógépek is rendelkeznének az

ember háttértudásával, sokkal

ügyesebben dolgoznának.

Probléma:

• Hogyan tehetjük a számítógép számára is

érthetővé?

• Hogyan használjuk fel a háttértudást?

Page 48: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 48

Mire jó, ha ontológiát készítünk?

• Az információ szerkezete definiálható emberek és szoftver ügynökök számára

• A szakterület tudásanyagát újrafelhasználhatóvá teszi

• A kiinduló feltételeket kiemeli (axiómák, hipotézisek, posztulátumok, fikciók)

• A mindennapi fogalomrendszert megkülönbözteti a logikaitól

• Elemezhető általa a tudás teljessége

Page 49: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 49

Szabványos szintakszis

Ma: XML alapú leíró nyelvek (hogy

egyszerűbb legyen parsert készíteni).

Példák:

SHOE, XOL (Ontology Exchange Language), OML

(Ontology Markup Language), RDFS, OIL

(Ontology Intechange Language), DAML+OIL

Ontológia és metaadat szerkesztő

szoftverek (Protégé, Webonto, OilEd, stb.)

Page 50: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 50

• Az RDF általános és absztrakt modell amely bármilyen típusú metaadat leírására alkalmas, bármilyen olyan dologról, avagy erőforrásról (resource), amely egyedi, webes azonosítóval (URI) rendelkezik.

• Az RDF az alapja a Szemantikus Világhálónak, az összes felhasználható adat ebben az adatmodellben jelenik meg.

• Az RDF W3C ajánlás.

Az RDF

Page 51: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 51

Miért nem elég az XML?

miért nem elég XML-ben leírni az adatokat, hiszen az XML általános,

rendszerfüggetlen nyelv, amelyben

minden leírható? Az XML csak egy adatcsere formátum, és

a különböző XML séma nyelvek is csak az

adatok struktúráját, megjelenését

korlátozzák, de az adatok szemantikáját

nem definiálják.

Page 52: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 52

• Az N3 (Notation3) oktatási nyelvet

alkalmazom az alábbiakban.

• primer - getting into the semantic web and rdf using

n3.htm

Page 53: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 53

RDF

Az RDF-ben az információ állítások együttese,

mindegyik alannyal, állítmánnyal és tárggyal

- és semmi mással.

Példa: <#pat> <#knows> <#jo> .

Az angol nyelvű RDF irodalomban használatos kategóriák:

Alany - Subject

Állítmány - Verb / Predicate / Property

Tárgy - Object

Page 54: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 54

Alany állítmány és tárgy

Egy mondat: <#pat> <#knows> <#jo> .

• Minden egyes elemet (alany, állítmány, tárgy) egy URI azonosít. A tárgy lehet egy érték(string) is.

<#pat> <#age> „34" .

• Az állítmány („RDF-ül”: tulajdonság) a másik két elem kapcsolatát fejezi ki.

<#pat> <#child> <#al> .

<#pat> has <#child> <#al> .

<#al> is <#child> of <#pat> .

Page 55: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 55

rövidítéskonvenció

ha egy állítmányhoz több állítást

kapcsolunk:

a pontosvessző (;) másik állítmányt

kapcsol ugyanahhoz az alanyhoz,

a vessző (,) ugyazon alany-állítmány

párhoz másik tárgyat kapcsol. <#pat> <#child> <#al>, <#chaz>, <#mo>;

<#age> „34" ;

<#eyecolor> "blue" .

Page 56: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 56

Másképp

<#pat> <#age> „34"; <#eyecolor> "blue" .

<#al> <#age> "3"; <#eyecolor> "green" .

<#jo> <#age> "5"; <#eyecolor> "green" .

age eyecolor

pat 34 blue

al 3 green

jo 5 green

Page 57: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 57

<#pat><#child>[<#age> "4"],[<#age> "3"].

Itt a tárgyat nem azonosítottuk. A [ ] -ben

található elemek egy létező objektumra

utalnak, de nem szándékozunk - se itt, se

más dokumentumban – hivatkozni rá. Pontosabban: a [ ] deklarálja, hogy valami létezik az adott

tulajdonsággal, de nem ad módot arra, hogy hivatkozzunk rá. Ha

meg akarom nevezni, akkor:

[ <#name> "Pat"; <#age> "24"; <#eyecolor> "blue" ].

[ <#name> "Al" ; <#age> "3"; <#eyecolor> "green" ].

[ <#name> "Jo" ; <#age> "5"; <#eyecolor> "green" ].

Page 58: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 58

A „pat”, „child” és „age” karakterek URI-k, a

gép számára semmi jelentést nem

hordoznak ezen kívül !

- amíg azt nem állítjuk: <#pat> <#name> "Pat".

Page 59: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 59

Közös fogalom

A szemantikus web valójában nem képes megadni valamiről,

hogy mit jelent. A „cím” (pl. könyvtári katalógusban,

weboldalon) egy fogalom, s ha több forrás, dokumentum

szeretné ezt használni:

– ugyanazt kell érteni rajta

– ugyanazt a „szótári elemet” kell használni az

azonosítására.

<> <#title> "Az N3 egyszerű példája".

(Az üres <> a kurrens dokumentumot jelenti. A példában

a #title olyan fogalomra vonatkozik, amit maga a

dokumentum definiál.)

Page 60: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 60

Közös fogalom

A Dublin Core (DC)-ban is van elképzelés a

cím fogalomról. Ezt használva jobban

definiált állítást tehetünk (e tananyag

címéről):

<> http://purl.org/dc/elements/1.1/title „szematikus

háló".

Ez túl hosszú, ezért az N3 megengedi az

egyszerűsítést: @prefix dc: <http://purl.org/dc/elements/1.1/> .

<> dc:title „szemantikus háló".

Page 61: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 61

Prefix használata esetén

: jel a # helyett (a dc és a cím között), nem

használ <>-t. A megadott prefix a

dokumentum további részében használható.

Az RDF honlapról sok fogalom

meghivatkozható, és bárki megadhat újakat,

készíthet névteret. @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-

ns#>.

@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#>.

@prefix ont: <http://www.daml.org/2001/03/daml-ont#>.

Page 62: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 62

Legyen @prefix : <#> .

Ezzel :pat :child [ :age "4" ] , [ :age "3" ].

Page 63: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 63

Szótárkészítés

dc:title = tulajdonság Új szótár vagy ontológia: új osztályok és

tulajdonságok megadása. Osztálybasorolás: milyen tipusú az a valami rdf:type

amit N3-ban így rövidítünk: a

Adjuk meg így személyek egy osztályát:: :Person a rdfs:Class.

A dokumentumban aztán: :Pat a :Person.

Page 64: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 64

Egy objektum több osztályban lehet. Közöttük nem

kell hierarchikus viszonynak lenni. – Az alany osztálya: domain (Minek lehet ilyen típusú

értéke)

– A tárgy osztálya: range (Milyen típusu értékeket vehet

fel)

Konvenció (nem szabvány, nem kötelező): – Osztály azonosítót nagy kezdőbetűvel

– Tulajdonságot kis kezdőbetűvel

Page 65: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 65

Megfelelőség :Woman = foo:FemaleAdult . :Title a rdf:Property; = dc:title .

– Célszerű, ahol lehet már létező szótárakra hivatkozni – Megőrzi a rugalmasságot

• Névtér – Az RDF szótár „azonosítója” – Azonosító

• Ami egyedi • Ami a „kezünkben van” • Ami változatlan, perzisztens

– Message-ID

– Egy helyi path

– URI (pl. purl.org)

Page 66: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 66

Formulák

Egy RDF dokumentum, illetve séma állítások

(statements, mondatok) halmaza.

• Formula= egy állítás, ami

– állítások halmaza • Egymástó független állítások (bármelyik kiemelhető)

• Tetszőleges sorrendben

• Egymást nem fedik át (teljesen)

– igaz a saját környezetében (context)

Tehát egy Dokumentum: formulák halmaza <x.rdf> :says { :pat a :Person . } .

Itt az alany nem pat, hanem x.rdf

Page 67: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 67

Szabályok Szabály =

– Egy olyan állítás, ami szerint valami egy előfeltétel következménye

– Ezt az állítást aztán valamely mechanizmus feldolgozhatja

Logikai szabályok definíciója:

@prefix log: <http://www.w3.org/2000/10/swap/log#> .

Példa: { sensor:thermostat math:greaterThan "30" . } log:implies { control:furnace control:setTo "1" . } .

this log:forAll :x, :y. {:x :parent :y} log:implies {:y :child :x}. :parent ont:inverse :child .

this log:forAll :p, :q .

{ :p ont:inverse :q . } log:implies {

this log:forAll :x, :y. { :x :p :y. } log:implies { :y :q :x. } } .

Page 68: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 68

Szabályok

@prefix : <#uncle>.

:Fred is :father of :Joe.

:Bob is :brother of :Fred.

@prefix log:

<http://www.w3.org/2000/10/swap/log#> .

this log:forAll :who1, :who2.

{ :who1 :father [ :brother :who2 ] } log:implies {

:who1 :uncle :who2 }.

Page 69: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 69

Alany, állítmány és tárgy

• Resource (=forrás) – Bármi, amit egy URI azonosíthat

• PropertyType – Egy olyan forrás, ami egy másik forrás jellemzésére

használható – egy kapcsolat típus

• Property – Egy forrás vagy egy érték

• Statement – A három kombinációja

• Az RDF állítások leírhatók XML formátumban

Page 70: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 70

Elem-hármas és gráf

http://tmit.bme.hu/index.html mailto::[email protected]

http://vhol.org/DC/Creator

http://tmit.bme.hu/index.html mailto::[email protected]

http://vhol.org/DC/Creator

mailto::[email protected] http://tmit.bme.hu/photo.html

http://vhol.org/sema/tartalmaz http://vhol.org/sema/egyuttdolgozik

http://vhol.org/DC/Creator

Page 71: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 71

Szemantikus gráf

Gráfstruktúra: amelyben

a csomópontok az egyes fogalmakat,

az élek a csomópontok közti (bináris)

kapcsolatokat jelzik.

Mind a csomópontok, mind az élek

címkézettek.

Page 72: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 72

Az RDF gráfban

két típusú csomópont van: - erőforrás (resource) - szövegfüzér (literal).

Az erőforrás csomópontok az erőforrás URI-jával címkézettek, a szövegfüzér csomópontok a szövegfüzér tartamával. A csomópontokat összekötő éleket tulajdonságoknak (property) nevezik.

A gráf irányított (a tulajdonság irányítása lényeges).

Page 73: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 73

A gráfstruktúra egyszerű logikai állításokat kódol.

Ha A csomóponttól egy másik B csomóponthoz

vezet egy P tulajdonság él:

„az A csomópont P tulajdonsága B”.

Az állítást egy (P,A,B) hármasként

reprezentálhatjuk.

ahol P a tulajdonságot, az állítás állítmányát jelöli,

A az alany és B az állítás tárgya.

Az állítmány két erőforrás között létesít

kapcsolatot.

Page 74: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 74

Elem-hármas és gráf

http://tmit.bme.hu/index.html mailto::[email protected]

http://vhol.org/DC/Creator

http://tmit.bme.hu/index.html mailto::[email protected]

http://vhol.org/DC/Creator

mailto::[email protected] http://tmit.bme.hu/photo.html

http://vhol.org/sema/tartalmaz http://vhol.org/sema/egyuttdolgozik

http://vhol.org/DC/Creator

TÁRGY ÁLLÍTMÁNY ALANY

Page 75: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 75

Elem-hármas és gráf

http://tmit.bme.hu/index.html mailto::[email protected]

http://vhol.org/DC/Creator

„Az index.html létrehozója netuddki.”

TÁRGY ÁLLÍTMÁNY ALANY OBJECT PREDICATE SUBJECT

Page 76: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 76

Elem-hármas és gráf

http://tmit.bme.hu/index.html mailto::[email protected]

http://vhol.org/DC/Creator

mailto::[email protected] http://tmit.bme.hu/photo.html

http://vhol.org/sema/tartalmaz http://vhol.org/sema/egyuttdolgozik

http://vhol.org/DC/Creator

„Az index.html létrehozója netuddki és nekem

(akik együtt dolgoznak). Az index.html tartal-

mazza photo.html-t.”

Page 77: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 77

További lehetőségek RDF-ben

Az egyszerű gráf modellen kívül: kollekciók (bag, sequence) megadása, állításokról való állítás („Kati azt mondta, hogy ...”), stb.

Ezeket speciális szemantikával rendelkező tulajdonságok segítségével valósították meg, az adatmodell lényegét nem érintik.

Az RDF alapú ontológiákban lehet újabb, rögzített szemantikájú tulajdonságokat és csomópontokat definiálni, így tetszőleges bonyolultságú adatokat RDF-ben megjeleníteni.

Page 78: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 78

Miért nem egyszerűen XML?

• Az RDF: – Független (bárki implementálhat szótárakat, típusokat, stb – és

ha ezt közzéteszi akárki hivatkozhat is rá – nem egy „felülről definiált” szótáron alapszik)

– Egyszerűen cserélhető, platform, nyelv, stb… független (XML szerializáció)

– Skálázható – világszerte tetszőleges számú XML kifejezés láncolható össze.

• Miért nem egyszerűen XML (önmagában)? – XML elemek esetében számít a sorrend, míg az RDF

egyszerűen állítások halmaza

– Az XML elemek megengednek kevert típusokat, ahol egy elemnek mind szöveges, mind struktúrált információt tartalmaz

• Az RDF egy XML alkalmazás, XML Schema-val leírható.

Page 79: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 79

RDF Séma

Az RDF szabványhoz szorosan kapcsolódik

az RDF Schema (RDFS) nyelv, amellyel

egyszerű ontológiákat (csomópontok és

tulajdonságok előre definiált halmazát)

definiálhatunk.

Page 80: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 80

RDF Séma

A szabvány csak a legegyszerűbb konstrukciókat

tartalmazza, lehetőséget adva

osztályhierarchiák megalkotására (subclass –

alosztály és subproperty – altulajdonság

reláció),

az adott osztályba tartozás kifejezésére (type –

típus reláció),

egy adott tulajdonság értelmezési

tartományának (domain) és értékkészletének

(range) a megadására.

Page 81: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 81

Az RDFS ontológia maga is egy RDF

dokumentum.

W3C filozófia: (lásd XML és XML Schema)

a sémák létrehozására és szerkesztésére

legyenek használhatók ugyanazok az

eszközök, amelyeket az alap adatmodell

kezelésére hoztak létre.

Page 82: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 82

DAML+OIL

Az RDFS-re épülő ontológia leíró nyelvek

egyik példája a DAML+OIL ontológia leíró

nyelv.

Két korábbi projekt, a DARPA Agent Markup

Language (DAML) és az Ontology

Inference Layer (OIL) eredményeit egyesíti. Felhasználja az RDFS

konstrukcióit, és további elemekkel bővíti

azt. Ilyen bővítések például:

Page 83: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 83

• A szövegfüzérek felé és erőforrások felé mutató tulajdonságok explicit megkülönböztetése, a tisztább fogalmi modellezés érdekében.

• Halmazműveletek definiálása osztályhoz: pl. osztályok uniója, metszete

• Annak megadása, hogy egy osztály „ugyanaz” mint egy másik, ill. egy osztály példányai biztosan különböznek egy másikétól.

• Inverz tulajdonságok, tranzitív tulajdonságok specifikálása.

• A tulajdonságok értékkészlet és értéktartomány definíciójának adott osztályra való megszorítása.

• XML Schema adattípusok használata az egyszerű literálok helyett.

Page 84: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 84

DAML+OIL

A DAML+OIL nyelv teljes értékű ontológia

specifikációs nyelv, kifejezőereje elegendő

a gyakorlatban is alkalmazható ontológiák

specifikálásához.

Page 85: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 85

• Communications (communicator, recipient) – Speech

– Software (SoftwareDocumentation, SoftwareVersion)

– Document (Title, Subject, Author, Publisher) • Lecture

• Publication – Book

– Thesis

– Article

– Periodical

• Homepage

• Abstract

– PhoneCall

• DocumentRepresentation – ElectronicDocument

– PaperDocument

Példa: DAML dokumentum ontológia

Tulajdonságok

Osztályok

Kategóriák

Page 86: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 86

• <rdf:RDF xmlns="http://www.daml.org/2001/03/daml+oil#"> <Ontology about=""> <versionInfo>document-ont, v.1.0</versionInfo> <comment>An ontology that models documents, particularly publications</comment> <imports resource="http://www.cs.umd.edu/projects/plus/DAML/onts/base1.0.daml"/> </Ontology> <Class ID="Communication"> <subClassOf resource="http://www.cs.umd.edu/projects/plus/DAML/onts/general1.0.daml#Event"/> </Class>

• <Property ID="communicator"> <label>is communicated by</label> <domain resource="#Communication"/> <range resource="http://www.cs.umd.edu/projects/plus/DAML/onts/general1.0.daml#Agent"/> </Property>

• ……………….. Névterek használata

Ontológia definíciója

Példa osztály

Példa tulajdonság

Példa: Dokumentum RDF séma 1.

Page 87: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 87

Példa: Dokumentum RDF séma 2.

• …………………………….

<Class ID="Communication">

<subClassOf

resource="http://www.cs.umd.edu/projects/plus/DAML/onts/general1.0.daml#Event"/

>

</Class>

• <Class ID="DocumentRepresentation">

<subClassOf

resource="http://www.cs.umd.edu/projects/plus/DAML/onts/general1.0.daml#Artifact"

/>

</Class>

• <Class ID="PaperDocument"><subClassOf resource="#DocumentRepresentation"/></Class>

<Class ID="ElectronicDocument"><subClassOf

resource="#DocumentRepresentation"/></Class>

• ……………….. Osztályok (kategóriák)

Alosztályok

Page 88: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 88

Példa: Dokumentum RDF séma 3.

• …………………………….

<Class ID="Document"><subClassOf resource="#Communication"/></Class> • <Property ID="subject">

<label>has subject</label>

<domain resource="#Document"/>

<range resource="http://www.cs.umd.edu/projects/plus/DAML/onts/base1.0.daml#SHOEEntity"/>

</Property>

<Property ID="author">

<label>is written by</label>

<domain resource="#Document"/>

<range resource="http://www.cs.umd.edu/projects/plus/DAML/onts/general1.0.daml#Person"/>

</Property>

<Property ID="title">

<label>is titled</label>

<domain resource="#Document"/>

</Property> ……………….. Tulajdonságok

Címke (label)

Osztály, amiben értelmezve van (domain)

Kitöltési korlátozások (range)

Page 89: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 89

Példa: Dokumentum RDF séma 4.

• …………………………….

• <Class ID="Software"><subClassOf resource="#Communication"/></Class>

• <Property ID="softwareVersion">

<label>is version</label>

<domain resource="#Software"/>

</Property>

<Property ID="softwareDocumentation">

<label>is documented in</label>

<domain resource="#Software"/>

<range resource="#Publication"/>

</Property>

………………..

Rekurzió

(a szoftver dokumentáció

Publikáció típusú lehet)

Page 90: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 90

Szemantikus háló

összefoglalás

Page 91: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 91

Információk a hálózaton:

természetes nyelveken írt szöveges

állományok

adatállományok (szemantikus jelentőségű

szerkezetben)

multimédia állományok

vegyes állományok

Emberek számára mindez értelmes lehet,

de gép számára általában nem.

Page 92: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 92

Emberi és gépi felhasználhatóság

önleíró (adat)források

metaadatok használata

a metaadatot gép által is olvasható formában (pl. XML)

reprezentáljuk

a metaadathoz definiálni kell a használt szókészletet is

gépi (pl. ágensek) következtetési képesség

A szemantikus háló kiterjeszti a web jelenlegi

lehetőségeit

(„globálisan összefüggő adatbázis”)

Page 93: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 93

Alapszabályok

Minden elemet (erőforrást) URI-val azonosíthatunk

Erőforrásoknak és linkeknek lehet típusa

Részleges információ is elfogadható a szemantikus web határtalan, bárki bármit állíthat bárkiről

Nem cél a „teljes bizalom”; bizalmi láncok

Bővíthető

A szabványosítás körének minimalizálása

Page 94: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 94

A szemantikus háló

rétegei

Page 95: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 95

URI, Unicode réteg

• URI és Unicode réteg: lehetővé teszik, hogy

(nemzetközi karakterkészlettel) egyedi

azonosítókat rendelhessünk az

objektumainkhoz

A forrásokat egyértelműen azonosítjuk

ez nélkülözhetetlen a konzisztens állításokhoz

Az URI-k lehetnek

Protokoll függőek (http://, mailto:)

Protokoll/hely függetlenek (URN-s, PURL)

Page 96: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 96

XML réteg

lehetővé teszi hogy a felhasználó

tetszőleges struktúrába szervezze a

dokumentumait,

de nem mond semmit arról, hogy mi mit

jelent

Page 97: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 97

RDF réteg

a „jelentés-réteg”:

hármasok csoportja,

minden hármas: alany, ige és tárgy az

állításokban

Page 98: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 98

RDF Sémák

Az RDF még nem elég, mert

az RDF-ben nincs kapcsolat a (szokásos)

adattípusokkal

meg kell egyeznünk egy adott

szókészletben

RDF Sémák használata :

milyen kapcsolatok használhatók?

mely forrásokra érvényesek a kapcsolatok?

Page 99: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 99

Ontológia réteg

A szemantikus hálónak szüksége van ontológiák

felépítésére és használatára

Az RDF sémák csak az alapmechanizmust adják (nem

lehet következtetéseket levonni a szókészlet elemeiről)

„ha ez az állítás igaz, akkor az az állítás is igaz”

„ha ez az állítás igaz, akkor az az állítás nem igaz”

Nincs megfeleltetés a különböző szókészletek között

Nincsenek többszörös szülőosztályok, komplex

megszorítások, feltételek ...

Page 100: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 100

Ontológia réteg

Az ontológia kifejezéseket és összefüggéseket határoz

meg egy adott tudásterület leírásához

A cél: Webontológia nyelv („Web Ontologies Language”),

amely a következőkön alapszik:

RDF és RDF Sémák

korábbi munkák:

DAML (DARPA projekt), OIL (EU projekt)

DAML+OIL (DAMN és OIL egyesítése)

a logika, tudásreprezentáció, stb., gyakorlati

eredményeinek felhasználása

Page 101: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 101

Logikai réteg

Általános célú szabály nyelvek, amelyek

képesek lekérdezni és szűrni

A lekérdezések hasonlóak az SQL-hez

Van, aki külön rétegnek tekinti (az ontológia és a

logika között).

Page 102: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 102

Logikai réteg

• Következtetés-gép (inference engine) : a

szematikus hálón található tudás gépi

gyarapítására.

• A már specifikált tudásból új tudást vezet

le.

• Két megközelítés:

– általános logikai következtetés-gép

– specializált problémamegoldó algoritmus

Page 103: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 103

Bizonyosság réteg

Általános célú értelmező a szemantikus hálóhoz.

A műveletek (kérdés, ellenőrzés, átalakítás, szűrés, stb.)

értelmének feldolgozására.

Proof language ?

A HTTP „GET” tartalmazhat-e bizonyítékot arra, hogy a

felhasználónak joga van megkapni a dokumentumot ? A

hitelesítési technológián (pl. digitális aláírás) kívül kell e

más, kontextusfüggő információ a bizonyossághoz?

Pl. Closed World Machine (CWM): Perl implementáció N3

szabályok bizonyítására.

Page 104: A Szemantikus háló · meghatározott fizikai változó adatokat ábrázolhat [MSZ 7788/1] A Filmanyag Hanglemez Hangszalag Képlemez Képszalag Mágneses adathordozó Optikai adathordozó

BME VIK TMIT MeR 104

Bizalmi réteg

Az állítások valamilyen kontextusban

fordulnak elő a weben.

Az alkalmazásoknak szüksége van a

kontextusra, hogy megállapítsák egy

állítás megbízhatóságát.

A szematikus háló szerkezete nem

garantálja hogy minden állítás igaz a

weben.