Download - Une introduction - Université de Sherbrooke
ChristinaKHNAISSER etLucLAVOIEDépartementd’informatiqueFacultédessciences
[email protected]@usherbrooke.cahttp://info.usherbrooke.ca/llavoie
Uneintroduction
2016-10-15
BASES DE DONNÉESENTREPÔTS DE DONNÉES
BD300v100b
Départem
entd’informatique,Facultédessciences,U
niversitédeSherbrooke,Québec
2016-10-15
2
BD301:E
ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie
PLAN
¢Problématique
¢Leconceptd’entrepôtdedonnées
¢Lesarchitectures
¢Lesmodèlesdeschéma
¢Lesvisions
¢Laquestiondutemps
¢Laquestiondesorigines
¢Unevisionévolutiveetlarenormalisation
¢Quelquesquestionsouvertes
Départem
entd’informatique,Facultédessciences,U
niversitédeSherbrooke,Québec
2016-10-15BD301:E
ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie
3
PROBLÉMATIQUE
¢UneBDc’estbien,deuxc’estmieux, troisc’esttrop?� del’ordinateurcentral
� enpassantparl’architectureclient-serveur,
� ledépôtdépartementalet
� lesBDpersonnelles
� onarriveauchaos!
¢Nécessitéd’avoiruneimagecomplètecohérente� Commentgérerlamultiplicité?
� Commentunifierl’hétérogénéité?
Départem
entd’informatique,Facultédessciences,U
niversitédeSherbrooke,Québec
2016-10-15
4
BD301:E
ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie
PROBLÉMATIQUEEXPLOITATION ET ANALYSE,DES BESOINS DIFFÉRENTS ?
Départem
entd’informatique,Facultédessciences,U
niversitédeSherbrooke,Québec
2016-10-15
5
BD301:E
ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie
PROBLÉMATIQUECOMMENT RETROUVER CECI
SGBD
Schémalogique
IPMlogique
IPMconceptuelle
SE
Schéma physique n
BD n
Analyste informatique
Analyste métier
Administrateur de BD
Utilisateurs
Schéma Conceptuel
BD 1
Schéma physique 1
Départem
entd’informatique,Facultédessciences,U
niversitédeSherbrooke,Québec
2016-10-15BD301:E
ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie
6
ENTREPÔT DE DONNÉES
¢Comment« fédérer »les« visions »?� Agrégationdes« faits »
¢ parlesprocessus« producteurs »dedonnées,
¢ doncselonl’axedutemps.
� Documentationdes« dimensions »¢ parlesentitésliées.
� Découpagedessourcesparproducteur.
� Liaisondessourcesparentité.
Départem
entd’informatique,Facultédessciences,U
niversitédeSherbrooke,Québec
2016-10-15BD301:E
ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie
7
ENTREPÔT DE DONNÉESARCHITECTURES
¢DataMart (DM)� lapratiqueoriginale« adhoc »
¢ InformationFactory (IF)� lapropositionoriginaledeInmon
¢DataWarehouse (DW)� lapropositionsubséquentedeKimball
Départem
entd’informatique,Facultédessciences,U
niversitédeSherbrooke,Québec
2016-10-15BD301:E
ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie
8
ENTREPÔTS DE DONNÉESMODÈLES DE SCHÉMA CLASSIQUES
¢Cube� décompositionparentitésindépendantes
� structurationorthogonale
¢Étoile� décompositionparentitésindépendantes
� structurationparprocessusproducteur
¢Flocon� décompositionparentitésindépendantes
� hiérarchisationdesentités
� structurationparprocessusproducteur
Départem
entd’informatique,Facultédessciences,U
niversitédeSherbrooke,Québec
2016-10-15BD301:E
ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie
9
ENTREPÔTS DE DONNÉESVISIONS¢Visionclassique
� temporellementestampillée� incrémentalepure� optimisationparladénormalisation
¢ quellenormalisation?¢ quelleoptimisation?
¢Visioncontemporaine� résolumentbitemporelle� nepeutêtreseulementincrémentale� optimisationparlanormalisation
¢ quelleméthoded’accès?¢ quellegestionmémoire?
Départem
entd’informatique,Facultédessciences,U
niversitédeSherbrooke,Québec
2016-10-15
10
BD301:E
ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie
PROBLÉMATIQUECOMMENT RETROUVER CECI
SGBD
Schémalogique
IPMlogique
IPMconceptuelle
SE
Schéma physique n
BD n
Analyste informatique
Analyste métier
Administrateur de BD
Utilisateurs
Schéma Conceptuel
BD 1
Schéma physique 1
Départem
entd’informatique,Facultédessciences,U
niversitédeSherbrooke,Québec
2016-10-15
11
BD301:E
ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie
LA QUESTION DU TEMPS
Départem
entd’informatique,Facultédessciences,U
niversitédeSherbrooke,Québec
2016-10-15BD301:E
ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie
12
LA MESURE DU TEMPS
¢VoirManthey
Départem
entd’informatique,Facultédessciences,U
niversitédeSherbrooke,Québec
2016-10-15BD301:E
ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie
13
TEMPS ET CALENDRIER
¢VoirManthey
Départem
entd’informatique,Facultédessciences,U
niversitédeSherbrooke,Québec
2016-10-15BD301:E
ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie
14
RELATIVITÉ DU TEMPS
¢VoirManthey
Départem
entd’informatique,Facultédessciences,U
niversitédeSherbrooke,Québec
2016-10-15BD301:E
ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie
15
UN MODÈLE
Modèle'discret'du'temps
Perception'du'temps'(continue)
Instant PériodeAlfa Oméga
;'∞ +'∞
Durée
Modèlesimplediscret(chronon)fini(alpha,omega)intervallesopérateursdeAllen
Départem
entd’informatique,Facultédessciences,U
niversitédeSherbrooke,Québec
2016-10-15
16
BD301:E
ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie
OPÉRATEURS DE ALLEN
Opération gauche droite résultat Description Définition[b:e] Allenintervalle(b,e) point point intervalle {x∊ T|b≤x≤e} [p-:p+)
début intervalle point p.b p-
fin intervalle point p.e p+
prédécesseur point point p.b-1 ?
successeur point point p.e+1 ?
dénombrement intervalle entier nombred'éléments ?
alpha Typepoint point LapluspetitevaleurdutypeT first
oméga Typepoint point LaplusgrandevaleurdutypeT last
appartenance point intervalle booléen x∊ p x∊ p
appartenance-1 intervalle point booléen p∍ x ?
antérioritéstricte intervalle intervalle booléenp : |---|ooooooq : oooooo|---| p.e+1<q.b before
adjacenceantérieure intervalle intervalle booléenp : o|---|oooooq : oooooo|---| p.e+1=q.b meets
chevauchementantérieurstrict intervalle intervalle booléenp : oo|---|ooooq : ooooo|---|o p.b<q.b∧ p.e≥q.b∧ p.e<q.e overlaps
commencementstrict intervalle intervalle booléenp : ooo|--|ooooq : ooo|---|ooo q.b=p.b∧ p.e<q.e starts
inclusionbi-stricte intervalle intervalle booléenp : oooo|-|ooooq : ooo|---|ooo q.b<p.b∧ p.e<q.e during
achèvementstrict intervalle intervalle booléenp : oooo|--|oooq : ooo|---|ooo q.b<p.b∧ p.e=q.e finishes
égalité intervalle intervalle booléenp : ooo|---|oooq : ooo|---|ooo q.b=p.b∧ p.e=q.e equals
Départem
entd’informatique,Facultédessciences,U
niversitédeSherbrooke,Québec
2016-10-15BD301:E
ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie
17
LA COORDINATION ET LA QUESTION DES ORIGINES
¢VoirManthey
Départem
entd’informatique,Facultédessciences,U
niversitédeSherbrooke,Québec
2016-10-15BD301:E
ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie
18
QUELQUES QUESTIONS OUVERTES
¢Traitementdel’incertitudedesmesures� margesd’erreur
¢Traitementdel’incertitudedesfaits� mondeouvertvsmondefermé
¢L’alimentation:ETLouELT� origine:ELT
� règledepratique:ETL
� retouràlaraison:ELT
Départem
entd’informatique,Facultédessciences,U
niversitédeSherbrooke,Québec
2016-10-15BD301:E
ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie
19
VISION ÉVOLUTIVE
¢ Incontournableévolutivité
¢ Inadéquationdelavisionincrémentalepure� temporalisation
� correction
� harmonisation
¢L’entrepôtdedonnées,unebasededonnéescommelesautres?
Départem
entd’informatique,Facultédessciences,U
niversitédeSherbrooke,Québec
2016-10-15
20
BD301:E
ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie
PRINCIPALES RÉFÉRENCES
¢ ADAMSON,C. 2010.Thecomplete reference starschema.McGraw-Hill,NewYork,NY,USA.
¢ ADAMSON,C. 2008-2015.http://blog.oaktonsoftware.com
¢ INMON,W.H. 2005.Buildingthedatawarehouse.JohnWiley,Indianapolis,IN,USA.
¢ JIANG,B.2015.Constructing DataWharehouses with Metadriven Generic Operators,andmore.2nded.,Createspace.
¢ KIMBALL,R. 2013.Thedatawarehouse toolkit:thedefinitive guidetodimensional modeling.JohnWiley,Indianapolis,IN,USA.
¢ MANTHEY,R.2015.http://www.iai.uni-bonn.de/III/lehre/vorlesungen/TemporalIS/SS15/