hda-lab… suite. quelques réflexions sur wiki/db-pédia et le tagging sémantique
DESCRIPTION
Hda-Lab ( hdalab.iri-research.org/) est un prototype dédié au tagging sémantique. Il utilise Wikipédia (via DBpedia) comme référentiel sémantique.TRANSCRIPT
![Page 1: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique](https://reader038.vdocuments.site/reader038/viewer/2022100507/55867e94d8b42a44098b473a/html5/thumbnails/1.jpg)
HDA-Lab… suiteQuelques réflexions sur Wiki/DB-pédia et le tagging sémantique
Sémanticpédia, des données culturelles accessibles à tousINHA, 19/11/2012
Bertrand SajusMinistère de la Culture et de la Communication
Département des programmes numériques
![Page 2: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique](https://reader038.vdocuments.site/reader038/viewer/2022100507/55867e94d8b42a44098b473a/html5/thumbnails/2.jpg)
Retour d'expérience
![Page 3: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique](https://reader038.vdocuments.site/reader038/viewer/2022100507/55867e94d8b42a44098b473a/html5/thumbnails/3.jpg)
HDA : un corpus qui se prête à un test de tagging sémantique
Couvre un champ conceptuel très vaste :
Toutes les périodes
Toutes les civilisations
Tous les domaines artistiques
Anthologie de ressources pour l'histoire des arts
![Page 4: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique](https://reader038.vdocuments.site/reader038/viewer/2022100507/55867e94d8b42a44098b473a/html5/thumbnails/4.jpg)
1er constat : Wikipédia répond aux besoins du tagging "culturel"
Analyse provisoire portant sur les 6 premiers mois de l’année 2012 :
77,2 % des tags ont pu être liés à Wikipédia en français
83 % des tags utilisés plus d’une fois par les visiteurs du site Histoiredesarts.culture.fr
100 % des 100 mots-clés les plus fréquemment utilisés par les visiteurs du site Histoiredesarts sont liés à Wikipédia
Mois d’octobre 2012 :
![Page 5: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique](https://reader038.vdocuments.site/reader038/viewer/2022100507/55867e94d8b42a44098b473a/html5/thumbnails/5.jpg)
2ème constat : le tagging par liste de complétion est faisable
Implémentation de la liste de complétion de Wikipédia
Pas de difficulté technique
Appropriation aisée par l’équipe chargée du tagging
Performance technique et expérience utilisateur, un retour positif :
![Page 6: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique](https://reader038.vdocuments.site/reader038/viewer/2022100507/55867e94d8b42a44098b473a/html5/thumbnails/6.jpg)
Cette démarche concerne (entre autres) les données documentaires
Méthode applicable a posteriori à des données structurées
La sémantisation du seul thésaurus enrichit la totalité du corpus
8 semaines pour sémantiser 16000 mots-clés
![Page 7: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique](https://reader038.vdocuments.site/reader038/viewer/2022100507/55867e94d8b42a44098b473a/html5/thumbnails/7.jpg)
Enrichissement /Augmentation
![Page 8: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique](https://reader038.vdocuments.site/reader038/viewer/2022100507/55867e94d8b42a44098b473a/html5/thumbnails/8.jpg)
Le tag augmenté
Désambiguïsation
Gestion de la synonymie
De multiples formes d'enrichissement :
Définitions
Illustrations
Coordonnées géographiques
...
![Page 9: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique](https://reader038.vdocuments.site/reader038/viewer/2022100507/55867e94d8b42a44098b473a/html5/thumbnails/9.jpg)
Accès multilingue
Équivalents linguistiques des mots-clés
Adapté aux données non textuelles
Liens entre les différentes versions linguistiques de Wikipédia
Recherche multilingue
![Page 10: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique](https://reader038.vdocuments.site/reader038/viewer/2022100507/55867e94d8b42a44098b473a/html5/thumbnails/10.jpg)
Interopérabilité
![Page 11: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique](https://reader038.vdocuments.site/reader038/viewer/2022100507/55867e94d8b42a44098b473a/html5/thumbnails/11.jpg)
Interopérabilité sémantique
Approche interdisciplinaire
Désenclavement linguistique et culturel des données
Wikipédia : pivot du tagging et de l'indexation documentaire
![Page 12: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique](https://reader038.vdocuments.site/reader038/viewer/2022100507/55867e94d8b42a44098b473a/html5/thumbnails/12.jpg)
Interdisciplinarité : diversité des vues "métier"
![Page 13: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique](https://reader038.vdocuments.site/reader038/viewer/2022100507/55867e94d8b42a44098b473a/html5/thumbnails/13.jpg)
Désenclavement linguistique et culturel des données
Ex. : Recherche par liste de complétion en français et en japonais Gothique > Gothique international
Accès aux donnéesDéfinition contextuelle
Accès à l'article de Wikipédia en japonais
Français
Japonais
![Page 14: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique](https://reader038.vdocuments.site/reader038/viewer/2022100507/55867e94d8b42a44098b473a/html5/thumbnails/14.jpg)
Contribuer
![Page 15: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique](https://reader038.vdocuments.site/reader038/viewer/2022100507/55867e94d8b42a44098b473a/html5/thumbnails/15.jpg)
Les enjeux de la contribution à Wikipédia
Le Web des données impose un changement de paradigme
Quid de la "pertinence" ?
Le projet Wikipédia : démarche encyclopédique ouverte
Comment donner du sens au déluge des données
![Page 16: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique](https://reader038.vdocuments.site/reader038/viewer/2022100507/55867e94d8b42a44098b473a/html5/thumbnails/16.jpg)
Créer un boucle vertueuse : réutilisation <-> contribution
Deux entrées :
Quels sujets voulons-nous faire connaître à notre public ?
Rationaliser les efforts de contribution à Wikipédia
Quels sont nos sujets les plus recherchés par notre public ?
![Page 17: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique](https://reader038.vdocuments.site/reader038/viewer/2022100507/55867e94d8b42a44098b473a/html5/thumbnails/17.jpg)
Conclusion
![Page 18: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique](https://reader038.vdocuments.site/reader038/viewer/2022100507/55867e94d8b42a44098b473a/html5/thumbnails/18.jpg)
"L’Encyclopédie a rendu pensable une rupture"
Dans un sens oui, puisqu’elle repose sur les contributions multiples d’une sorte de société de gens de lettres invisibles. Mais Diderot n’aurait sûrement pas accepté la simple juxtaposition des articles, sans arbre des connaissances ni ordre raisonné, qui caractérise Wikipédia.
[Question à Roger Chartier]L’encyclopédie en ligne Wikipédia n’est-elle pas l’aboutissement du projet de Diderot et d’Alembert ?
"L'Encyclopédie a rendu pensable une rupture", Le Monde des livres, 14 janvier 2010.