drtd2015 valorisation des dr ds les thèses
TRANSCRIPT
LES DONNÉES DE LA RECHERCHE DANS LES THÈSESEN SHS DE L’UNIVERSITÉ DE LILLE 3
Cécile Malleret
Hélène Prost
Lille, 2 février 2015
• Les données de la recherche
• Pratiques des chercheurs ?
• Besoins ?
• Enquête à venir, en collaboration avec l’Université Humboldt de Berlin
• Valorisation des thèses
• Diffusion des thèses en libre accès
• Valorisation des résultats publiés avec les thèses
• Les humanités numériques
• Opportunité de faire du text & data mining ?
L’étudeLe contexte
• Exploration : quelles sont les données publiées avec les thèses ?
• Quelles sources ?
• Quels types de données ?
• Dans quels domaines ?
• Volumétrie ?
• Formats ?
• Quel potentiel ?
• Quels problèmes ?
• Quelles limites ?
L’étudeLes objectifs
• Thèses soutenues à Lille 3
• Toutes les thèses numériques
• D’autres thèses plus anciennes pour obtenir un échantillon plus conséquent (autour de 300)
• Focus on quatre domaines (histoire, psychologie, archéologie/égyptologie, linguistique)
• Intérêt : illustration, richesse du matériel, mais pas de représentativité
• Eventuellement : d’autres domaines à analyser par la suite
L’étudeL’échantillon
• « L’ensemble des fichiers composant la thèse doit être déposé » (extrait de la charte de dépôt de Lille 3)
• Possibilité de déposer des fichiers de type audio ou vidéo : rarement exploitée
• Exemple : « Des TIC comme vecteur matériel et symbolique de rationalisation et modélisation de la vie domestique : le cas de l'intelligence ambiante » d’Iwan Barth (2010)
Des documents à explorerQue peut-on y trouver ?
ANNEXE 4 : Sommaire du CD-ROM de vidéos et sons
Des documents à explorerQu’y trouve-t-on ?
• Les archives ouvertes
• Dépôt d’image, vidéo, son et carte prévus dans HAL v3
• Possibilité de les lier à un autre document (en illustration d’un document principal par exemple)
• Utilisé ? 1 fichier vidéo existant aujourd’hui.
• Pas de fichier vidéo mais, par exemple : « Bande originale de film, bande originale de vie : pour une sémiologie tripartite de l'emblème musical : le cas de l'univers Disney » de Raphaël Roth (2013 – Université d’Avignon) https://tel.archives-ouvertes.fr/tel-00987167+ vidéos sur un blog privé
Des documents à explorerOù peut-on les trouver ?
• Exemple : « L'iconographie de sainte Anne en Espagne à la fin du Moyen Age » de Alfonso de Salas (2010)
1 vol d’illustrations
de 1581 images
1 vol d’annexes
dont 1 catalogue
de 179 notices
………………
………………
………………
……………
1 vol principal
de texte suivi
d’1 plan de classement
Des documents à explorerStructure et présentation (1)
• Exemple : « Stratégie de coping chez le sportif » de Annie Carton-Caron (2004)
1 vol d’annexes
qui suit le plan
du texte
………………
………………
………………
……………
1 vol
principal
de texte
Tableaux
Figures
Des documents à explorerStructure et présentation (2)
28%
22%8%
8%
8%
7%
6%
5%3% 3% 2%
Histoire
Psychologie
Philosophie
Langues et littératures étrangères
Sciences de l'information et de la
communicationHistoire de l'art
Sciences du langage
Archéologie et égyptologie
Autres
Langue et littérature françaises
Sciences de l'éducation10
Le corpusRépartition des thèses par disciplines
283 thèses
195 thèses imprimées
88 thèses électroniques
36%
20%
12%
9%
7%
7%
4% 2%
1%
1%
1%
Histoire
Histoire de l'art
Archéologie et égyptologie
Sciences de l'information et de
la communication
Sciences de l'éducation
Psychologie
Sciences du langage
Langues et littératures
étrangères
Autres
Philosophie
Langue et littérature françaises
25 085 pages réparties entre 188 thèses
11
Le corpusRépartition des annexes par disciplines
Le corpusDistribution des disciplines
Les annexes
31%
39%
30%
Thèses imprimées
aucune
intégrées
séparées
39%
52%
9%
Thèses électroniques
aucune
intégrées
séparées
13
Lien avec le texte de la thèse
Les annexesRépartition des sources par disciplines
Les annexesTypes de document par disciplines
Typologie des annexes
131
81
58
44 44 44 4132
167 7
Nombre de thèses concernées
Répartition des documents
Exemple de graphiques (1)Typologie des annexes
Source : Laure Tabary Bolka (2007)
Eléments pour une analyse sémio-pragmatique du transfert multisupport de l'image
télévisuelle : le cas des images de la télé-réalité sur Internet et dans la presse magazine
Typologie des annexesExemple de graphiques (2)
Source : Mylène Mihout Natar (2003)
L' intervention des capitaux français dans la Pologne de la Seconde République (1918-1939)
contribution a l'histoire de l'impérialisme économique français en Europe Centrale
• Linguistique
– Analyse lexicale
• Histoire
– Prosopographie
• Archéologie
– Inventaire
– http://steles-halma-ipel.univ-lille3.fr
Valorisation des donnéesQuelques exemples
Contenu des annexes
• Mettre au maximum les données en annexes
• Décrire précisément les données, leur contenu et les conditions de recueil
• Déposer les données dans le format obtenu
Structuration des annexes
• Suivre si possible la structure du texte
• Numéroter et paginer les annexes
• Insérer des tables spécifiques par types de données
Veiller à la pérennité des accès
En conclusionQuelques recommandations