biblissima, un observatoire de la transmission des textes anciens

61
Biblissima, un observatoire de la transmission des textes anciens biblissima.fr / @biblissima Anne-Marie Turcan-Verkerk Ecole Pratique des Hautes Etudes - PSL Institut de recherche et d’histoire des textes (CNRS) Campus Condorcet

Upload: equipex-biblissima

Post on 23-Jan-2018

116 views

Category:

Technology


4 download

TRANSCRIPT

Biblissima, unobservatoiredelatransmission

destextesanciens

biblissima.fr / @biblissima

Anne-Marie Turcan-Verkerk Ecole Pratique des Hautes Etudes - PSL

Institut de recherche et d’histoire des textes (CNRS) Campus Condorcet

Bibliotheca bibliothecarum novissima

équipement de données sur la transmission des textes anciens

(français, grec, hébreu, latin…)

Comment fédérer et structurer ?

Biblissimabénéficied’uneaidedel’Etatgéréeparl’ANRau;treduprogramme« Inves;ssementsd’avenir »,portantlaréférenceANR-11-EQPX-0007.

–  Campus Condorcet (coordinateur) –  Bibliothèque nationale de France –  CESR, Tours (UMR 7323) –  CIHAM, Lyon-Avignon (UMR 5648) –  CRAHAM, Caen (UMR 6273) –  Ecole nationale des chartes, CJM (EA 3624) –  Ecole Pratique des Hautes Etudes, SAPRAT (EA 4116) –  Institut de recherche et d’histoire des textes (UPR 841) –  Pôle document numérique de la MRSH de Caen (USR 3486) –  … et bientôt les Archives nationales

Les partenaires

–  7.1 millions d’€ pour 7 ans (2012-2019) –  environ 100 chercheurs, ingénieurs,

conservateurs permanents –  L’équipe portail : 4 personnes en 2017 –  Le bureau exécutif :

Régis Robineau (Biblissima / EPHE) Johann Holland (Campus Condorcet) Matthieu Bonicel (BnF) Pierre-Yves Buard (MRSH Caen) Cyril Masset (IRHT)

Equipex 0007

50 projets scientifiques et techniques (70% de l’aide)

Engranger,créer,exposerdesdonnéesàunegrandeéchelleetàdifférentsniveaux,

selondesthéma9quesetdesprioritésdéfiniesparleprojet.

Une infrastructure numérique (25% de l’aide)

créerunsystèmedeges9onetd’analysedesdonnéeshistoriques

pourdonnerunaccèssimpleàdesdonnéescomplexesethétérogènes

–  Des centaines de milliers de données ajoutées aux bases de données en ligne

–  579 258 feuillets numérisés –  Des centaines de documents découverts dans

les archives et les bibliothèques

Biblissima, c’est :

–  Des centaines de milliers de données ajoutées aux bases de données en ligne

–  579 258 feuillets numérisés –  Des centaines de documents découverts dans les

archives et les bibliothèques –  Plus d’1.4 millions de visiteurs chaque année

sur les sites des partenaires et le site du projet –  Plus de 200 étudiants formés chaque année –  Une communauté nationale et internationale

en expansion

Biblissima, c’est :

–  Des centaines de milliers de données ajoutées aux bases de données en ligne

–  579 258 feuillets numérisés –  Des centaines de documents découverts dans les

archives et les bibliothèques –  Plus d’1.4 millions de visiteurs chaque année sur les

sites des partenaires et le site du projet –  Plus de 200 étudiants formés chaque année –  Une communauté nationale et internationale en

expansion –  L’équipe portail Biblissima et environ 45 CDD/

an –  en plus de la centaine de permanents

impliqués dans le projet

Biblissima, c’est :

Quatre missions : –  Fédérer les bibliothèques numériques –  Structurer les corpus et les

communautés : politique scientifique –  Former les chercheurs –  Faciliter l’accès aux éditions et aux

bases de données scientifiques

bvmm.irht.cnrs.fr

gallica.bnf.fr

www.bvh.univ-tours.fr

Quatre missions : –  Fédérer les bibliothèques numériques –  Structurer les corpus et les

communautés : politique scientifique –  Former les chercheurs –  Faciliter l’accès aux éditions et aux

bases de données scientifiques

Les projets fondateurs Environ 50 projets dont les résultats sont fédérés par une douzaine de ressources électroniques : construire un socle documentaire et combler les lacunes scientifiques les plus criantes. — Des bases de données — Des catalogues en ligne — Des éditions électroniques — Des projets de recherche De nouveaux venus : Europeana Regia, Sourcencyme, RegeCart, Collecta, Università degli Studi di Padova… Les ressources Biblissima : http://www.biblissima-condorcet.fr/fr/ressources/ressources-biblissima

Les projets partenariaux Biblissima

–  1 appel chaque année –  Recherche, numérisation, documentation –  200 000 € / an –  Environ 6 projets financés chaque année –  50 partenaires : bibliothèques, archives,

universités (France, RU, Canada, USA) –  Des écoles d’été

Projets Biblissima 2013-2017: http://www.biblissima-condorcet.fr/en/calls-projects/selected-projects

LabibliothèquedeMazarinenligne(2013-2017)

Quatre missions : –  Fédérer les bibliothèques numériques –  Structurer les corpus et les

communautés : politique scientifique –  Former les chercheurs –  Faciliter l’accès aux éditions et aux

bases de données scientifiques

Les écoles d’été Biblissima 1 ou 2 écoles par an : –  Pour créer un vivier de jeunes chercheurs –  En combinant érudition classique et technologies

numériques Formations : http://www.biblissima-condorcet.fr/en/resources/courses-and-training

Trombinoscope des participants: http://www.biblissima-condorcet.fr/en/community/training-participants

La dernière : Le Mans (juillet 2017) Bibliotheca Digitalis. Reconstitution de réseaux culturels au début des Temps modernes. Des sources primaires aux données (Ville du Mans, Humanities at Scale, CESR, Biblissima)

Yves Ouvrard Philippe Verkerk

Collatinus 11

l  Programme libre et ouvert (GNU GPL) - écrit en C++ (Qt 5) - les ressources sont des fichiers éditables

l  Applications résidentes (Mac OS X, Windows, bientôt Linux) http://outils.biblissima.fr/fr/collatinus/

l  Version en ligne (Collatinus 10.2) http://outils.biblissima.fr/fr/collatinus-web/

Fonctions principales

l  Lemmatisation Analyse Aide à la lecture

l  Dictionnaires - Gaffiot 2016 - Gaffiot 1934 - Lewis & Short - Jeanneau - Georges - Calonghi - Valbuena - Du Cange - Quicherat - à venir : Dvoreckij (Russe) Žepić (Croate)

l  Scansion l  Flexion Ārmă (Ārmā) vĭrūmquĕ cānō (cănō̆), Trōjāe quī prīmŭs ăb ōrīs (ōrĭs)

--̆ u-u -̆-̆ -- - -u u --̆ Ītălĭām, fātō prŏfŭgūs, Lāvīnĭăquĕ (Lāvīnĭāquĕ) vēnĭt (vĕnĭt) -uu- -- uu- --u-̆u -̆u lītŏră, mūlt[um] īll[e] ēt tērrīs jāctātŭs (jāctātūs) ĕt āltō -uu -` -` - -- ---̆ u -- vī sŭpĕrūm sāevāe mĕmŏrēm Jūnōnĭs ŏb īrăm; - uu- -- uu- --u u -u mūltă (mūltā) quōqu[e] (quŏqu[e]) ēt bēllō pāssūs, dūm cōndĕrĕt ūrbĕm, --̆ -̆` - -- -- - -uu -u īnfērrētquĕ dĕōs Lătĭō, gĕnūs (gĕnŭs) ūndĕ Lătīnŭm, ---u u- uu- u-̆ -u u-u Ālbānīquĕ pātrēs (pā̆trēs), ātqu[e] āltāe mōenĭă Rōmāe. ---u -̆- -` -- -uu --

Lemmatisation et analyse

Une bulle d'aide s'ouvre avec la lemmatisation du mot sous le curseur

Un clic sur un mot dans la fenêtre de texte le lemmatise

Les solutions sont rangées.

]

TextiColor

l  Les étudiants sont supposés connaître une liste de mots.

l  Le texte est colorisé : - Mot connu - Mot inconnu - Forme médiévale

Consulter les dictionnaires

ici, Gaffiot 2016 et Lewis & Short

Utilisé pour produire le premier corpus d’inventaires anciens en TEI:

THECAE: Thesaurus Catalogorum Electronicus

Publication fin 2017 (Presses universitaires de Caen)

Quatre missions : –  Fédérer les bibliothèques numériques –  Structurer les corpus et les

communautés : politique scientifique –  Former les chercheurs –  Faciliter l’accès aux éditions et aux

bases de données scientifiques

Des ressources et des données hétérogènes :

•  Manuscrits –  Parties de manuscrits –  Groupements de manuscrits

•  Editions et incunables •  Livres enluminés •  Données de provenance •  Reliures •  Textes

Les ressources Biblissima : http://www.biblissima-condorcet.fr/fr/ressources/ressources-biblissima

•  Listes de livres •  Catalogues de vente

•  Collections historiques •  Lieux •  Dates •  Personnes •  Collectivités

–  Institutions patrimoniales

Missions accomplies : http://beta.biblissima.fr/

https://www.youtube.com/watch?v=bAIDngKRp1g

Dans cette nouvelle version du portail (novembre) :

•  Enrichissement et mises à jour des données :

6 bases intégrées et mises en relation : ✓  Bibale (+ marques de provenance)

✓  CRII (1200 notices mises à jour)

✓  Europeana Regia ✓  Esprit des livres ✓  + Manuscripta Medica (EPHE-SAPRAT)

✓  + RegeCart (IRHT)

12 009 manuscrits 18 661 imprimés

anciens 6659 éditions 6223 oeuvres 5161 collections 11 407 personnes 1971 collectivités 1093 lieux

•  Améliorations de l’affichage des données :

–  champs supplémentaires –  données contradictoires ou non-consensuelles

–  mentions de sources des données

–  ajustements divers : interface web, moteur de recherche, visualisations

Un meilleur affichage des données non consensuelles

Données non consensuelles, avec mention de la source

En 2018 :

•  Données en cours de préparation : –  Pinakes (IRHT) => littérature grecque –  Bibliothèques françoises (CESR) => bio-bibliographie

–  Reliures.bnf.fr (BnF) => collections de la Renaissance

–  Mandragore (BnF) => manuscrits enluminés

•  Nouvelles fonctionnalités : –  Facette Date

–  Exports de données

Publication des référentiels Biblissima :

•  Cotes •  Etablissements de conservation •  Personnes / collectivités •  Oeuvres •  Lieux

Merci !

http://www.biblissima-condorcet.fr/

http://beta.biblissima.fr/

[email protected] [email protected]

[email protected] [email protected]

[email protected]

anciens membres de l’équipe Biblissima : Stefanie Gehrke, Anita Mazur, Elizabeth MacDonald, Marie Muffat