qualité des données géographiques collaboratives

26
Qualité des données géographiques collaboratives Thèse : un modèle d'opérations réconciliables pour l'acquisition distribuée de données géographiques Carmen Brando Directrice : Bénédicte Bucher Journée des doctorants ED MSTIC 2010 Université Paris-Est Marne-la-Vallée 10 Juin Institut Géographique National (IGN), France Laboratoire COGIT 1 © IGN - 2010

Upload: carmen-brando

Post on 19-Jun-2015

1.238 views

Category:

Education


0 download

DESCRIPTION

Voici ma présentation pour la journée des doctorants de l'école doctorale ED MSTIC à l'Université Paris-Est Marne-la-Vallée. Elle présente le sujet de la qualité de données géographiques collaboratives (plus connu comme Volunteered Geographic Information). Je présente quelques extrait de mon état de l'art dans le cadre de ma première année de thèse à l'Institut Géographique National (IGN-France).

TRANSCRIPT

Page 1: Qualité des données géographiques collaboratives

Qualité des données géographiques collaboratives

Thèse : un modèle d'opérations réconciliables pour l'acquisition distribuée de données géographiques

Carmen BrandoDirectrice : Bénédicte Bucher

Journée des doctorants ED MSTIC 2010Université Paris-Est Marne-la-Vallée

10 Juin

Institut Géographique National (IGN), FranceLaboratoire COGIT

1© IGN - 2010

Page 2: Qualité des données géographiques collaboratives

© IGN - 2010(O’Reilly, 2007)Contenu généré par les utilisateurs

Page 3: Qualité des données géographiques collaboratives

© IGN - 2010

Page 4: Qualité des données géographiques collaboratives

Volunteered Geographic Information (VGI) : (Michael Goodchild, 2007)© IGN - 2010

Page 5: Qualité des données géographiques collaboratives

Création de contenu spatial

Flickr

Wikipédia

Géolocalisation

5© IGN - 2010

Edition d’instances géographiques

Page 6: Qualité des données géographiques collaboratives

Problématique

6© IGN - 2010 Généré par : http://www.wordle.net

Page 7: Qualité des données géographiques collaboratives

Plan

• Qualité• du contenu généré par les utilisateurs (CGU)• du contenu spatial (CS)• des données géographiques collaboratives (DGC)

• Approche proposée• Conclusion et perspectives

7© IGN - 2010

Page 8: Qualité des données géographiques collaboratives

Qualité du contenu généré par les utilisateurs (CGU) : Définition

• est associée à• si le contenu est utile ou pas aux besoins des utilisateurs :

fitness for use• confiance des utilisateurs au contenu : autorité du

fournisseur• Wikipédia : le meilleur exemple, mais…

• question de qualité : les utilisateurs sont anonymes• Wikis: l’édition de contenu est facile et rapide• Des éditeurs collaboratifs plus avancés assurent la cohérence

du contenu par la réconciliation des opérations concurrents• Ex : Google Wave

8© IGN - 2010

Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives

Page 9: Qualité des données géographiques collaboratives

• Pendant l’édition : cohérence interne et citation des sources externes

Qualité du contenu généré par les utilisateurs (CGU) : comment l’améliorer ?

9© IGN - 2010

Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives

Page 10: Qualité des données géographiques collaboratives

Qualité du contenu généré par les utilisateurs (CGU) : comment l’améliorer ?

Résolution manuelle des conflits

10© IGN - 2010

Après l’édition : Détection de conflits / Réconciliation

Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives

Page 11: Qualité des données géographiques collaboratives

Qualité du contenu spatial (CS) : Définition

11

Monde réel

Représentation idéale (terrain nominal)

Spécifications*

© IGN - 2010

* La superficie des bâtiments est plus grande que 20m2

Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives

Page 12: Qualité des données géographiques collaboratives

Qualité du contenu spatial (CS) : Définition

BD TOPO ® - IGN

La connaissance associée à comment le monde est observé et comment il est modélisé dans la base de données

12

Spécifications des fournisseurs de données géographiques

© IGN - 2010

Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives

Page 13: Qualité des données géographiques collaboratives

Qualité du contenu spatial (CS) : Définition

13

Monde réel

Représentationidéale (terrain nominal)

Données produites +Métadonnées (Spécifications + Critères d’erreur)

Qualitéinterne

Spécifications*

Processus de production : erreurs**

Qualitéexterne

Données requise par les utilisateurs

* La superficie des bâtiments est plus grande que 20m2** Il y a eu des erreurs de saisie ou la réalité a évoluée

© IGN - 2010

Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives

Page 14: Qualité des données géographiques collaboratives

Qualité des données géographiques collaboratives (DGC)

• DGC pour actualiser les bases de données (BD) des fournisseurs de DG au travers d’alertes

• OpenStreet Map, influence importante sur comment le contenu spatial est produit et actualisé

• Puis après, DGC pour complémenter les BD des fournisseurs de DG en permettant l’édition de contenu (en plus des alertes)

(Budhathoki, 2008) (Elwood, 2008) (Antoniou, 2009)14

© IGN - 2010

Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives

Page 15: Qualité des données géographiques collaboratives

Approche proposée : Spécifications pour les DGC ?

• Celles sont appropriées pour les fournisseurs de DG comme l’IGN

• et les néogéographes seront peu enthousiastes à travailler avec des spécifications…

15© IGN - 2010

© Scott Adams

Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives

Page 16: Qualité des données géographiques collaboratives

Approche proposée : Spécifications pour les DGC ?

• Groupes d’intérêts spéciaux (Coote, 2008) ont• des besoins plus forts sur la qualité des données• des limitations de budget pour collecter, rédiger et

actualiser les spécifications• Un manque d’expertise sur des techniques de

modélisation pour assurer la cohérence de ces données• un intérêt d’accepter quelques règles pendant la

contribution

16

Yes We Can

© IGN - 2010

Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives

Page 17: Qualité des données géographiques collaboratives

Approche proposée : Spécifications pour les DGC ?

Charte de directives

Tags ReferenceUsage standard des étiquettes

17© IGN - 2010

Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives

Page 18: Qualité des données géographiques collaboratives

Approche proposée : Spécifications pour les DGC ?

• Ceci est fait par Keep Right!

http://keepright.ipax.at• Des contraintes d’intégrité prédéfinies sont vérifiées sur des données OSM

18© IGN - 2010

Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives

Page 19: Qualité des données géographiques collaboratives

Approche proposée : Spécifications pour les DGC

• Assister les utilisateurs à la saisie des spécifications

• Ensuite, pour vérifier la cohérence des données utilisateurs, on utilise des mécanismes automatisés :• Pour évaluer des contraintes d’intégrité• Pour réconcilier des éditions simultanées

19© IGN - 2010

Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives

Page 20: Qualité des données géographiques collaboratives

Approche proposée : Saisie des spécifications

Taxonomie Géographique et schéma de

donnéesIGN

Catégories et infobox

Wikipédia

Saisie du schéma

Cecilia© Jorge Cham

Recherche dans un thesaurus (ex : WordNet Français)

Ex : eau, cours d’eau, fleuve, branche, ruisselet

Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives

liaison

Autorité

Enrichissementsémantique

Ex : création de la classe ruisseau 

Page 21: Qualité des données géographiques collaboratives

Approche proposée : Spécifications pour les DGC

• Assister les utilisateurs à la saisie des spécifications

• Ensuite, pour vérifier la cohérence des données utilisateurs, on utilise des mécanismes automatisés :• Pour évaluer des contraintes d’intégrité• Pour réconcilier des éditions simultanées

21© IGN - 2010

Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives

Page 22: Qualité des données géographiques collaboratives

Approche proposée :Contraintes d’intégrités

• Manque de cohérence géométrique entre le réseau hydrographique et les limites administratives

• Une contrainte d’intégrité indiquant la relation entre les deux les deux types pour assurer le partage de la géométrie

• Possible réparation: placer la limite administrative au milieu du fleuve

Données OpenStreetMap autour de Grenoble(Decembre 2009)

22© IGN - 2010

Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives

Page 23: Qualité des données géographiques collaboratives

Approche proposée : Spécifications pour les DGC

• Assister les utilisateurs à la saisie des spécifications

• Ensuite, pour vérifier la cohérence des données utilisateurs, on utilise des mécanismes automatisés :• Pour évaluer des contraintes d’intégrité• Pour réconcilier des éditions simultanées

23© IGN - 2010

Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives

Page 24: Qualité des données géographiques collaboratives

Approche proposée :Mécanisme de réconciliation

24

Tajel© Jorge Cham

© IGN - 2010

Cecilia© Jorge Cham

Changer le nom à ‘Avenue Bollée’

Ajouter un tronçon de route à ‘Rue de Paris’

Rue de Paris

??Spécification DGC :

« l’attribut nom d’une route est Independent de la géométrie »

Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives

Avenue Bollée

Page 25: Qualité des données géographiques collaboratives

Conclusion & Perspectives

• Les données géographique collaboratives font référence à un nouveau paradigme pour produire du contenu spatial

• Une approche qui réconcilie la richesse de données géographiques collaboratives avec les exigences de qualité d’un fournisseur de données

• Tester cet approche dans la plateforme GeOxygene : http://oxygene-project.sourceforge.net

25© IGN - 2010

Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives

Page 26: Qualité des données géographiques collaboratives

26© IGN - 2010

Merci de votre attention