quality-oriented and metadata-driven integration in information grids
DESCRIPTION
Quality-oriented and Metadata-driven Integration in Information Grids. Christoph Quix Présenté par Tarek TURKI [email protected]. Plan. Présentation du contexte Introduction Objectifs La méthodologie d’intégration Conclusion et perspectives Bibliographie. - PowerPoint PPT PresentationTRANSCRIPT
02/02/2005 Tarek TURKIMRI - RTS
1
Quality-oriented and Metadata-driven Integration in
Information Grids
Christoph Quix
Présenté par Tarek TURKI
02/02/2005 Tarek TURKIMRI - RTS
2
Plan
• Présentation du contexte• Introduction• Objectifs• La méthodologie d’intégration• Conclusion et perspectives• Bibliographie
02/02/2005 Tarek TURKIMRI - RTS
3
Présentation du contexte
• Christoph Quix est un professeur assistant au groupe SI (Informatik V) de RWTH Aachen, Allemagne
• Il a reçu son Ph.D. en informatique en 2003• Il travaille sur la gestion de la méta-donnée
dans les entrepôts de donnée• Il a réalisé une trentaine de publications
dans les journaux scientifiques et les conférences internationales
• Publié en décembre 2004
02/02/2005 Tarek TURKIMRI - RTS
4
Introduction
• Grille d’information– Abstraction des ressources– Interface unique pour faire des requêtes– Sources de données hétérogènes, indépendantes et
dynamiques
• But : délivrer un « bon » résultat pour une requête donnée
• Besoin de la qualité des résultats + méta-donnée (hétérogénéité)!
02/02/2005 Tarek TURKIMRI - RTS
5
Objectifs
• Un Framework de méta-données étendu pour stocker les différents types de méta-données
• L’intégration de la qualité sous plusieurs aspects (complétude, exactitude, …) dans le Framework
• Une méthodologie qui se base sur la méta-donnée et la qualité pour l’intégration de l’information
02/02/2005 Tarek TURKIMRI - RTS
6
Modèle de la méta-donnée
• On classe la méta-donnée d’une source selon 3 perspectives :– Perspective conceptuelle : ontologies et modèles
sémantiques de la grille– Perspective logique : modélise la structure de la
donnée, c’est une vue du schéma conceptuel– Perspective physique : décrit les emplacements de la
donnée et la façon d’y accéder
02/02/2005 Tarek TURKIMRI - RTS
7
Modèle de la méta-donnée
02/02/2005 Tarek TURKIMRI - RTS
8
Qualité des données
• Contexte d’utilisation pris en compte• L’approche GQM (Goal-Question-Metric)
propose un modèle intéressant de la qualité– Séparation de la qualité requise par les utilisateurs et
le calcul des facteurs de qualité– Utilise les questions pour évaluer les facteurs de
qualité
Ex: « Améliorer la disponibilité du système A »
« Quel est le temps de réponse des requêtes? »
02/02/2005 Tarek TURKIMRI - RTS
9
Qualité des données
02/02/2005 Tarek TURKIMRI - RTS
10
Méthodologie d’intégration
02/02/2005 Tarek TURKIMRI - RTS
11
Méthodologie de l’intégration
1. Ontologie de la grille
2. Associations Ontologies/Schémas logiques
3. Metadata Repository & les informations sur la Qualité
4. Requête utilisateur & Qualité requise
5. Réécriture de la requête
02/02/2005 Tarek TURKIMRI - RTS
12
Ontologie de la grille
• Définie les sémantiques des informations dans la grille• Définie les classes et les relations qui les lient à l’aide
d’un langage tel que OWL
02/02/2005 Tarek TURKIMRI - RTS
13
Association schémas/ontologies (1)
• Chaque source fournie un schéma de la structure des données stockées
• Un schéma logique est une vue sur l’ontologie• Cette approche, est dite LAV (local-as-view)• Schéma logique : structure de la donnée• Ontologies : description abstraite des objets• Comment relier ces schémas logiques avec les
objets conceptuels ?
02/02/2005 Tarek TURKIMRI - RTS
14
Association schémas/ontologies (2)
• Solution : Utilisation des requêtes d’annotation !
• Ex : (b,i,t,a,d,n) sont les objets conceptuels et (isbn,name…) sont des données relationnelles
02/02/2005 Tarek TURKIMRI - RTS
15
Metadata Repository & les informations sur la Qualité• Gère toute la méta-donnée nécessaire à
l’intégration de l’information• Contient une carte des associations
ontologies/schémas logiques• Contient les informations sur la qualité des
sources de données• Compare la qualité requise par l’utilisateur avec
celles des sources meilleure réécriture des requêtes
02/02/2005 Tarek TURKIMRI - RTS
16
Requête utilisateur & Qualité requise
• La définition d’une requête est similaire à celle d’un schéma logique
• Ex : retrouver tous les auteurs qui vivent à Munich
• Les besoins en qualité sont exprimés à l’aide d’un poids entre [0,1]
• Le poids peut être affecté à chaque prédicat et/ou à chaque aspect de la qualité (disponibilité, …)
02/02/2005 Tarek TURKIMRI - RTS
17
Réécriture de la requête
• La requête utilisateur est réécrite en plusieurs requêtes pour les sources de données
• Principe :– Identifier les sources qui peuvent contribuer dans le
résultat de la requête.– Trouver toutes les combinaisons « correctes » des
sources identifiées
• Utilisation de l’algorithme MiniCon pour la deuxième étape de la réécriture
02/02/2005 Tarek TURKIMRI - RTS
18
MiniCon
1. Construction du MiniCon-Description (MCD) : c’est une liste des associations entre les prédicats des requêtes et ceux des sources
2. Combiner les MCD pour couvrir la totalité des prédicats de la requête
3. Prendre en compte les requêtes d’annotation par la création d’une fonction « match » spécifique
02/02/2005 Tarek TURKIMRI - RTS
19
Conclusion et perspectives
Un nouveau modèle pour les méta-données La méthodologie d’intégration proposée est bien définie Pas d’implémentation pas d’expérimentation pas
d’évaluation
Perspectives : Intégration d’une vue orientée service Implémentation d’un prototype au sein du Framework
OGSA-DAI
02/02/2005 Tarek TURKIMRI - RTS
20
Bibliographie
M. Jarke, M. A. Jeusfeld, C. Quix, P. Vassiliadis.
« Architecture and Quality in Data Warehouses: An
Extended Repository Approach ». Information
Systems, 24(3):229–253, 1999.
02/02/2005 Tarek TURKIMRI - RTS
21
Any
Questions ?