relační datový model základní ideje

Relační datový modelZákladní ideje

RMD důsledně odděluje data, která jsou chápána jako relace, od jejich implementace.

Pro manipulaci s daty jsou k dispozici dva silné prostředky - relační kalkul a relační algebra.

Pro omezení redundance dat v relační databázi jsou navrženy pojmy umožňující normalizovat relace.

Definice RMD

Mějme množiny D1, D2, D3,....... Dn.

Z každé vybereme 1 prvek → vytvoříme uspořádanou n-tici.

Množina všech n-tic tvoří kartézský součin.

Relace je každá podmnožina kartézského součinu.

Z hlediska databázových systémů jsou množiny D1, D2, D3,....... Dn množiny hodnot atributů a

označují se jako domény.

RMD má jediný konstrukt -

databázovou relaci.

Celá složitá realita je transformována do relací. Toto je jedno z velkých omezení

relační databázové technologie.

Otázka: Je to možné, je to únosné? Jak dál…

V čem se databázová relace liší od matematické?

• Databázová relace je vybavena pomocnou strukturou, které se říká schéma relace. Schéma relace se skládá ze jména relace, jmen atributů a domén.

• Prvky domén, ze kterých se berou jednotlivé komponenty prvků relace, jsou atomické hodnoty. Tomuto omezení se říká 1.normální forma relací (1NF).

Zápis schématu relace

Schéma relace lze zapsat:

R(A1:D1,....An:Dn)

Prvkům relace se říká n-tice (také instance)

n určuje řád relace

Počet n-tic udává kardinalita relace

Zápis schématu relační databáze

Schéma relační databáze je dvojice (R,I),

kde R je množina schémat relací,

I je množina integritních omezení.

Integritní omezení

Doménové

Entitní

Referenční

Doménové IO

Doménové IO přiřazuje pro každý atribut relace předem definovanou doménu jeho

hodnot.

Doménové IO je definováno:• datovým typem atributu

• podmínkami platnosti (logickými formulemi)

Entitní IO

Entitní IO zabezpečuje Primární klíč (PK) relace.• Primární klíč je množina atributů K A, kde

A je množina všech atributů relace R, jejichž hodnoty jednoznačně určují n-tice (instance) relace R.

• K je minimální v tom smyslu, že nelze z K odebrat žádný atribut, aniž by to narušilo identifikační vlastnost.

• Z podstaty RMD vyplývá, že každá relace má primární klíč. Protože relace jsou množiny, nesmí relace obsahovat duplicitní n-tice (instance).

Referenční IO

Referenční integrita je omezení, které omezuje vztahy mezi daty ve dvou

relacích. Atribut, kterého se referenční integrita týká se nazývá cizí klíč (foreign

key - FK).Jestliže relace obsahuje cizí klíč, její n-tice jsou závislé na existenci n-tic v nadřazené relaci.Hodnota FK se musí vyskytovat jako

hodnota PK v nadřazené relaci.

Podmínky pro relační tabulky

• Všechny hodnoty v tabulce musí být elementární (podmínka 1.NF).

• Sloupce mohou být v libovolném pořadí.• Řádky mohou být v libovolném pořadí.• Sloupce musí být homogenní = ve sloupci musí být

údaje stejného typu (doménové integritní omezení).• Každému sloupci musí být přiřazeno jednoznačné

jméno (tzv. atribut).• V relační tabulce nesmí být dva zcela stejné řádky.

tzn., že každý řádek je jednoznačně rozlišitelný (entitní integritní omezení).

Funkční závislosti atributů

Nechť R(A:D) je relační schéma,

X A, Y A

jsou jednoduché nebo složené atributy.

Y je funkčně závislý na atributu X, značíme

( X Y ), platí-li pro každou instanci relace R,

že pro každou hodnotu atributu X existuje nejvýše jedna hodnota atributu Y.


Atribut Y je úplně funkčně závislý na

složeném atributu X, je-li na X funkčně

závislý a zároveň není funkčně závislý na

žádné z jeho složek.


Nechť X, Y, Z jsou atributy (jednoduché

nebo složené) daného relačního schématu

a nechť mezi dvojicemi atributů platí:

X Y Y Z (Y X).

Pak je atribut Z tranzitivně závislý na

atributu X.

Normální formy relací

Relace R je v 1 NF, jestliže jsou všechny její

atributy atomické, tj. dále nedělitelné. Toto

omezení je příliš silné a stává se hlavní

nevýhodou relačních databází.


Relace R je v 2 NF, je-li v první normální

formě (1 NF) a jestliže pro každý neklíčový

atribut platí, že je úplně funkčně závislý

na primárním klíči.


Relace R je v 3 NF, je-li ve 2 NF a platí-li, že

žádný neklíčový atribut není tranzitivně

závislý na žádném klíči relace R.


Relace R je v Boyce-Coddově NF ( BCNF),

je-li v 1 NF a platí-li pro každou funkční

závislost X A , která není triviální, že X

je klíčem v R a A je neklíčový atribut.

Příklady normálních forem (1NF)

Stát Město Název auta

Počet

ČR Mladá Boleslav

Škoda Fabia

100

ČR Mladá Boleslav

Škoda Fabia

150

Německo Kolín n/R Opel Vectra

20


80


25

Francie Paříž Renault 24


Název Stát Město Název auta

Počet

D1 ČR Mladá Boleslav

Škoda Fabia

100

D1 ČR Mladá Boleslav

Škoda Fabia

150

D3 Německo Kolín n/R Opel Vectra

20


80


25

D6 Francie Paříž Renault 24


Číslo Typ Druh Výška

1 Smrk Jehličnatý 5

2 Jedle Jehličnatý 3

3 Smrk Jehličnatý 12

4 Dub Listnatý 8

5 Dub Listnatý 5


Funkční závislosti atributů:• Číslo Typ• Číslo Druh• Číslo Výška• Typ DruhČíslo Typ & Typ Druh ↔ Číslo DruhRelace není v 3NF – tranzitivní závislostAby byla relace v 3NF:• Dekompozicí relace v 2NF dostaneme

relace v 3NF.


Číslo Typ Výška

1 Smrk 5

2 Jedle 3

3 Smrk 12

4 Dub 8

5 Dub 5


Typ Druh

Smrk Jehličnatý

Jedle Jehličnatý

Dub Listnatý

Příklady normálních forem (BCNF)

Odstraňuje závislosti kandidátů primárního klíče.Zaměstnanec (Číslo_zam, RČ, Jméno, Příjmení, Funkce)Kandidáti PK: Číslo_zam a RČ

Funkční závislosti:Kromě všech závislostí neklíčových atributů na kandidátech PK,

ex. i závislost kandidátů PK navzájem.

Relace není v CBNF.Dekompozice:Zaměstnanec (Číslo_zam, Jméno, Příjmení, Funkce)aRČ_zaměstnanců (Číslo_zam, RČ)Obě relace jsou v BCNF

Dedukce funkčních závislostíNechť R je relační schéma a A, B, C je podmnožina jeho atributů.

Dále předpokládejme funkční závislosti: A B a B C. Z těchto závislostí lze předpokládat A C (tranzitivita).

Označme F jako množinu funkčních závislostí pro R (A B a B C) a X Y jako libovolnou funkční závislost. Řekneme-li, že F logicky implikuje X Y, pak každý prvek relačního

schématu R, který splňuje závislosti v F, splňuje i závislost X Y a zapisujemeF = X Y

V našem případě relačního schématu R pak tuto skutečnost zapíšeme: A B, B C= A C

Uzávěr množiny funkčních závislostí

F+ je uzávěrem F tehdy, platí-li, že všechny

závislosti v F+ jsou logickými důsledky

v F.

A zapisujeme:

F+ = X Y F = X Y

Kandidáti primárního klíče a funkční závislosti

Mějme schéma R(A1,A2,....,An) a funkční závislosti F. Nechť X je podmnožina

{A1,A2,....,An}. Pak o X lze říci, že je kandidátem primárního klíče v R, jestliže:

1. X A1A2....,An je v F+

Závislost všech atributů A1,A2,....,Anna atributu X je daná nebo logicky vyplývá.

2. Neexistuje Y X, pro které by platilo

Y A1A2....,An v F+.

Armstrongovy axiomy

1. ReflexivitaJestliže Y X U, pak závislost X Y je logicky

implikována. Na složeném atributu A1A2,....An je funkčně závislý každý atribut Ai, který je jeho složkou.

2. AugmentaceJestliže platí X Y ve schématu R a Z je podmnožinou

atributů U, pak taky platí: XZ YZ (XZ je zkrácené označení X Z).3. TranzitivitaJestliže platí X Y a zároveň Y Z, pak taky platí X Z

Armstrongovy axiomy

Příklad:Mějme schéma R(A,B,C,D) s funkčními závislostmi A C,

B D. Zvolme primárním klíčem složený atribut AB jako jediný. Dokažte, že AB je jediným kandidátem

primárního klíče.1. A C daná závislost2. AB ABC augmentace atributy AB3. B D daná závislost4. ABC ABCD augmentace atributy ABC5. AB ABCD tranzitivitaVšechny atributy relačního schématu R jsou závislé na klíči

AB a přitom nejsou závislé na jeho složkách A, B.

Dodatečná deduktivní pravidla

1. Pravidlo spojení X Y, X Z = X YZ

2. Pravidlo pseudotranzitivity X Y, WY Z = WX Z

3. Dekompoziční pravidloJestliže X Y & Z Y, pak X Z

Dodatečná deduktivní pravidla - důkaz

Pravidlo 1X Y daná závislostX XY augmentace XX Z daná závislostXY YZ augmentace YX XY & X Y YZ implikuje X YZPravidlo 2X Y daná závislostWX WY augmentace WWY Z daná závislostWX Z tranzitivitaPravidlo 3Y Z vyplývá z reflexivityX Y daná závislostX Z tranzitivita

Dodatečná deduktivní pravidla

Příklad:Mějme schéma R(A,B,C) a F = A B, B C. Určete F+.Řešení:1. Za X dosaďte postupně všechny atributy, obsahující A.ABC AB dekompoziční pravidloA C tranzitivita, vyplývající z FAB BC augmentace BABC BC tranzitivita

2. Za X dosaďte postupně všechny atributy, které obsahují B, ale neobsahují A.BC B dekompoziční pravidloB C předpokladB 0 reflexivita

3. Za X dosaďte všechny atributy, které obsahují C, ale neobsahují ani A, ani B.C C reflexivitaC 0 reflexivita0 0 reflexivita

relační datový model základní ideje

Documents