quality-oriented and metadata-driven integration in information grids

21
02/02/2005 Tarek TURKI MRI - RTS 1 Quality-oriented and Metadata-driven Integration in Information Grids Christoph Quix Présenté par Tarek TURKI tartur2000@ yahoo.fr

Upload: luisa

Post on 08-Jan-2016

38 views

Category:

Documents


1 download

DESCRIPTION

Quality-oriented and Metadata-driven Integration in Information Grids. Christoph Quix Présenté par Tarek TURKI [email protected]. Plan. Présentation du contexte Introduction Objectifs La méthodologie d’intégration Conclusion et perspectives Bibliographie. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Quality-oriented and Metadata-driven Integration in Information Grids

02/02/2005 Tarek TURKIMRI - RTS

1

Quality-oriented and Metadata-driven Integration in

Information Grids

Christoph Quix

Présenté par Tarek TURKI

[email protected]

Page 2: Quality-oriented and Metadata-driven Integration in Information Grids

02/02/2005 Tarek TURKIMRI - RTS

2

Plan

• Présentation du contexte• Introduction• Objectifs• La méthodologie d’intégration• Conclusion et perspectives• Bibliographie

Page 3: Quality-oriented and Metadata-driven Integration in Information Grids

02/02/2005 Tarek TURKIMRI - RTS

3

Présentation du contexte

• Christoph Quix est un professeur assistant au groupe SI (Informatik V) de RWTH Aachen, Allemagne

• Il a reçu son Ph.D. en informatique en 2003• Il travaille sur la gestion de la méta-donnée

dans les entrepôts de donnée• Il a réalisé une trentaine de publications

dans les journaux scientifiques et les conférences internationales

• Publié en décembre 2004

Page 4: Quality-oriented and Metadata-driven Integration in Information Grids

02/02/2005 Tarek TURKIMRI - RTS

4

Introduction

• Grille d’information– Abstraction des ressources– Interface unique pour faire des requêtes– Sources de données hétérogènes, indépendantes et

dynamiques

• But : délivrer un « bon » résultat pour une requête donnée

• Besoin de la qualité des résultats + méta-donnée (hétérogénéité)!

Page 5: Quality-oriented and Metadata-driven Integration in Information Grids

02/02/2005 Tarek TURKIMRI - RTS

5

Objectifs

• Un Framework de méta-données étendu pour stocker les différents types de méta-données

• L’intégration de la qualité sous plusieurs aspects (complétude, exactitude, …) dans le Framework

• Une méthodologie qui se base sur la méta-donnée et la qualité pour l’intégration de l’information

Page 6: Quality-oriented and Metadata-driven Integration in Information Grids

02/02/2005 Tarek TURKIMRI - RTS

6

Modèle de la méta-donnée

• On classe la méta-donnée d’une source selon 3 perspectives :– Perspective conceptuelle : ontologies et modèles

sémantiques de la grille– Perspective logique : modélise la structure de la

donnée, c’est une vue du schéma conceptuel– Perspective physique : décrit les emplacements de la

donnée et la façon d’y accéder

Page 7: Quality-oriented and Metadata-driven Integration in Information Grids

02/02/2005 Tarek TURKIMRI - RTS

7

Modèle de la méta-donnée

Page 8: Quality-oriented and Metadata-driven Integration in Information Grids

02/02/2005 Tarek TURKIMRI - RTS

8

Qualité des données

• Contexte d’utilisation pris en compte• L’approche GQM (Goal-Question-Metric)

propose un modèle intéressant de la qualité– Séparation de la qualité requise par les utilisateurs et

le calcul des facteurs de qualité– Utilise les questions pour évaluer les facteurs de

qualité

Ex: « Améliorer la disponibilité du système A »

« Quel est le temps de réponse des requêtes? »

Page 9: Quality-oriented and Metadata-driven Integration in Information Grids

02/02/2005 Tarek TURKIMRI - RTS

9

Qualité des données

Page 10: Quality-oriented and Metadata-driven Integration in Information Grids

02/02/2005 Tarek TURKIMRI - RTS

10

Méthodologie d’intégration

Page 11: Quality-oriented and Metadata-driven Integration in Information Grids

02/02/2005 Tarek TURKIMRI - RTS

11

Méthodologie de l’intégration

1. Ontologie de la grille

2. Associations Ontologies/Schémas logiques

3. Metadata Repository & les informations sur la Qualité

4. Requête utilisateur & Qualité requise

5. Réécriture de la requête

Page 12: Quality-oriented and Metadata-driven Integration in Information Grids

02/02/2005 Tarek TURKIMRI - RTS

12

Ontologie de la grille

• Définie les sémantiques des informations dans la grille• Définie les classes et les relations qui les lient à l’aide

d’un langage tel que OWL

Page 13: Quality-oriented and Metadata-driven Integration in Information Grids

02/02/2005 Tarek TURKIMRI - RTS

13

Association schémas/ontologies (1)

• Chaque source fournie un schéma de la structure des données stockées

• Un schéma logique est une vue sur l’ontologie• Cette approche, est dite LAV (local-as-view)• Schéma logique : structure de la donnée• Ontologies : description abstraite des objets• Comment relier ces schémas logiques avec les

objets conceptuels ?

Page 14: Quality-oriented and Metadata-driven Integration in Information Grids

02/02/2005 Tarek TURKIMRI - RTS

14

Association schémas/ontologies (2)

• Solution : Utilisation des requêtes d’annotation !

• Ex : (b,i,t,a,d,n) sont les objets conceptuels et (isbn,name…) sont des données relationnelles

Page 15: Quality-oriented and Metadata-driven Integration in Information Grids

02/02/2005 Tarek TURKIMRI - RTS

15

Metadata Repository & les informations sur la Qualité• Gère toute la méta-donnée nécessaire à

l’intégration de l’information• Contient une carte des associations

ontologies/schémas logiques• Contient les informations sur la qualité des

sources de données• Compare la qualité requise par l’utilisateur avec

celles des sources meilleure réécriture des requêtes

Page 16: Quality-oriented and Metadata-driven Integration in Information Grids

02/02/2005 Tarek TURKIMRI - RTS

16

Requête utilisateur & Qualité requise

• La définition d’une requête est similaire à celle d’un schéma logique

• Ex : retrouver tous les auteurs qui vivent à Munich

• Les besoins en qualité sont exprimés à l’aide d’un poids entre [0,1]

• Le poids peut être affecté à chaque prédicat et/ou à chaque aspect de la qualité (disponibilité, …)

Page 17: Quality-oriented and Metadata-driven Integration in Information Grids

02/02/2005 Tarek TURKIMRI - RTS

17

Réécriture de la requête

• La requête utilisateur est réécrite en plusieurs requêtes pour les sources de données

• Principe :– Identifier les sources qui peuvent contribuer dans le

résultat de la requête.– Trouver toutes les combinaisons « correctes » des

sources identifiées

• Utilisation de l’algorithme MiniCon pour la deuxième étape de la réécriture

Page 18: Quality-oriented and Metadata-driven Integration in Information Grids

02/02/2005 Tarek TURKIMRI - RTS

18

MiniCon

1. Construction du MiniCon-Description (MCD) : c’est une liste des associations entre les prédicats des requêtes et ceux des sources

2. Combiner les MCD pour couvrir la totalité des prédicats de la requête

3. Prendre en compte les requêtes d’annotation par la création d’une fonction « match » spécifique

Page 19: Quality-oriented and Metadata-driven Integration in Information Grids

02/02/2005 Tarek TURKIMRI - RTS

19

Conclusion et perspectives

Un nouveau modèle pour les méta-données La méthodologie d’intégration proposée est bien définie Pas d’implémentation pas d’expérimentation pas

d’évaluation

Perspectives : Intégration d’une vue orientée service Implémentation d’un prototype au sein du Framework

OGSA-DAI

Page 20: Quality-oriented and Metadata-driven Integration in Information Grids

02/02/2005 Tarek TURKIMRI - RTS

20

Bibliographie

M. Jarke, M. A. Jeusfeld, C. Quix, P. Vassiliadis.

« Architecture and Quality in Data Warehouses: An

Extended Repository Approach ». Information

Systems, 24(3):229–253, 1999.

Page 21: Quality-oriented and Metadata-driven Integration in Information Grids

02/02/2005 Tarek TURKIMRI - RTS

21

Any

Questions ?