nicolas mazziotta, base de français médiéval, nouveau corpus d’amsterdam, syntactic reference...
DESCRIPTION
Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval FrenchTRANSCRIPT
![Page 1: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/1.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Base de Français MédiévalNouveau Corpus d’Amsterdam
Syntactic Reference Corpus of Medieval French
Nicolas Mazziotta
Université de Liège/Universität Stuttgart, ILR
COST Workshop, Cracovie, 25-26 avril 2013
![Page 2: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/2.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Plan
IntroductionPlanSpécificités de l’ancien français
Base de Français Médiéval
Nouveau Corpus d’Amsterdam
Syntactic Reference Corpus of Medieval French
![Page 3: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/3.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Spécificités de l’ancien français
Exemple
DesDès
lorslors
teà toi
toliprit
li anemisle Diable (sujet)
la veuela vue (objet)
« Dès cet instant, le Diable t’a dépouillé de ta vue » (Queste 190a, 1)
Principales caractéristiques
I Ancêtre du français (en simplifiant)I Ordre des mots exprime informations énonciatives plutôt que
syntaxiquesI Moins synthétique que le latin (vue classique)I Morphologie nominale pauvre et peu fiable
![Page 4: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/4.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Spécificités de l’ancien français
Exemple
DesDès
lorslors
teà toi
toliprit
li anemisle Diable (sujet)
la veuela vue (objet)
« Dès cet instant, le Diable t’a dépouillé de ta vue » (Queste 190a, 1)
Principales caractéristiques
I Ancêtre du français (en simplifiant)I Ordre des mots exprime informations énonciatives plutôt que
syntaxiquesI Moins synthétique que le latin (vue classique)I Morphologie nominale pauvre et peu fiable
![Page 5: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/5.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
IntroductionPlanSpécificités de l’ancien français
Base de Français MédiévalPrésentation généraleFormat
MétadonnéesTextes
Présentation de l’interface web
Nouveau Corpus d’AmsterdamPrésentation généraleFormat
MétadonnéesTextes
Présentation de l’interface web
Syntactic Reference Corpus of Medieval FrenchPrésentation généraleModèle syntaxique dépendancielConnexions
![Page 6: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/6.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Présentation générale
École Normale Supérieure Lyon – Laboratoire ICARUMR5191 ENS LSH / CNRS
I Base créée par Christiane Marchello-Nizia (dir. actuelle : CélineGuillot)
I Serge Heiden, Alexei Lavrentiev, Sophie Prévost
ÉtendueI 3.3 mill. occurrences-motsI de 842 à 1467I Domain d’oïl, genres variés, prose/vers
AnnotationsI Métadonnées fourniesI CATTEXI Discours cité (en cours)
![Page 7: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/7.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Présentation générale
École Normale Supérieure Lyon – Laboratoire ICARUMR5191 ENS LSH / CNRS
I Base créée par Christiane Marchello-Nizia (dir. actuelle : CélineGuillot)
I Serge Heiden, Alexei Lavrentiev, Sophie Prévost
ÉtendueI 3.3 mill. occurrences-motsI de 842 à 1467I Domain d’oïl, genres variés, prose/vers
AnnotationsI Métadonnées fourniesI CATTEXI Discours cité (en cours)
![Page 8: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/8.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Présentation générale
École Normale Supérieure Lyon – Laboratoire ICARUMR5191 ENS LSH / CNRS
I Base créée par Christiane Marchello-Nizia (dir. actuelle : CélineGuillot)
I Serge Heiden, Alexei Lavrentiev, Sophie Prévost
ÉtendueI 3.3 mill. occurrences-motsI de 842 à 1467I Domain d’oïl, genres variés, prose/vers
AnnotationsI Métadonnées fourniesI CATTEXI Discours cité (en cours)
![Page 9: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/9.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Format : Métadonnées
<profileDesc><creation><name type="author">anonyme</name><title>Queste del saint Graal</title><date type="compo" when="1220-01-01" n="13">vers 1220</date><date type="compo_periode">ancien</date><date type="compo_sous_siecle" n="13_1">début</date><region type="dialecte_auteur">non_defini</region>
</creation><langUsage><language ident="fr" usage="100">. . .</language>
</langUsage><textDesc n="roman"><channel mode="w">manuscript</channel><constitution type="single"/><derivation type="original"/><domain type="litteraire"/>. . .<purpose type="narrative"/>
</textDesc>
![Page 10: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/10.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Format : Textes
<p n="1"><lb n="1"/><s n="1" xml:id="s_fro_1">
<supplied resp="cmn" source="#ms_Z" reason="arraché"><w type="PRE" xml:id="w_fro_000001">A</w><w type="DETdef" xml:id="w_fro_000002">la</w><w type="NOMcom" xml:id="w_fro_000003">veille</w><w type="PRE" xml:id="w_fro_000004">de</w><w type="DETdef" xml:id="w_fro_000005">la</w><w type="NOMpro" xml:id="w_fro_000006">Pentecoste</w><lb n="2"/><w type="CONsub" xml:id="w_fro_000007">quant</w><w type="DETdef" xml:id="w_fro_000008">li</w><w type="NOMcom" xml:id="w_fro_000009">compaignon</w><w type="PRE" xml:id="w_fro_000010">de</w><w type="DETdef" xml:id="w_fro_000011">la</w><w type="NOMcom" xml:id="w_fro_000012">table</w><w type="ADJqua" xml:id="w_fro_000013">reonde</w>
![Page 11: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/11.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Présentation de l’interface web
FonctionnalitésI Concordances (mots, parties du discours)I Recherche syntaxique (données SRCMF)I GUI en ligne TXM (ANR Textométrie)
![Page 12: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/12.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Accueil
![Page 13: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/13.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Menu contextuel (sélection du corpus et des actions)
![Page 14: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/14.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Concordance
![Page 15: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/15.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Recherche syntaxique
![Page 16: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/16.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Plusieurs couches d’annotation
![Page 17: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/17.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
IntroductionPlanSpécificités de l’ancien français
Base de Français MédiévalPrésentation généraleFormat
MétadonnéesTextes
Présentation de l’interface web
Nouveau Corpus d’AmsterdamPrésentation généraleFormat
MétadonnéesTextes
Présentation de l’interface web
Syntactic Reference Corpus of Medieval FrenchPrésentation généraleModèle syntaxique dépendancielConnexions
![Page 18: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/18.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Présentation générale
Universität Stuttgart
I Créateur : Antonijn Dees et Piet Van ReenenI Enrichi par Achim Stein (dir. actuel), Pierre Kuntsmann and
Martin-Dietrich Gleßgen
ÉtendueI ca 3 millions de motsI 11th-14th C.I Domaine d’oïlI Principalement littéraireI Quelques manuscrits
AnnotationsI POS DeesI POS TreeTagger
![Page 19: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/19.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Présentation générale
Universität Stuttgart
I Créateur : Antonijn Dees et Piet Van ReenenI Enrichi par Achim Stein (dir. actuel), Pierre Kuntsmann and
Martin-Dietrich Gleßgen
ÉtendueI ca 3 millions de motsI 11th-14th C.I Domaine d’oïlI Principalement littéraireI Quelques manuscrits
AnnotationsI POS DeesI POS TreeTagger
![Page 20: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/20.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Présentation générale
Universität Stuttgart
I Créateur : Antonijn Dees et Piet Van ReenenI Enrichi par Achim Stein (dir. actuel), Pierre Kuntsmann and
Martin-Dietrich Gleßgen
ÉtendueI ca 3 millions de motsI 11th-14th C.I Domaine d’oïlI Principalement littéraireI Quelques manuscrits
AnnotationsI POS DeesI POS TreeTagger
![Page 21: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/21.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Format : Métadonnées
<subcorpusid="abe"deaf="JMeunAbC*". . .manuscritDees="Paris, Bibl. Nat., fr. 920"regionDees="Région parisienne"coefficientRegionDees="84 (Région parisienne)"dateMoyenneDees="1325*". . .vers="non"ponctuation="non"mots="18183"passage="intégral"commentairePhilologique="ms. Paris, BN fr. 920"qualite="ms3"sourceQualite="XG (éd.)"commentaireForme="243 ff."auteur="Jean de Meun"dateComposition="1280ca"dateManuscrit="1395ca" . . .>
![Page 22: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/22.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Format : Textes
(simplifié)
<s line="178"><word pos="PREDET:a:obj:masc:sg" taggerpos="PREDET:a" lemma="a+le|le" >al</word><word pos="NOM:obj:masc:sg" taggerpos="NOM" lemma="jor">jor</word><word pos="PRE" taggerpos="PRE" lemma="de" >de</word><word pos="NOM:obj:femi:sg" taggerpos="NOM" lemma="pentecoste" >pentecouste</word><word pos="PROCON" taggerpos="PROCON" lemma="ni" >ne</word>
</s><s line="179"><word pos="PREDET:a:obj:femi:pl" taggerpos="PREDET:a" lemma="a+le|le" >as</word><word pos="NOM:obj:femi:pl" taggerpos="NOM" lemma="fait2|feste|festre" >festes</word><word pos="ADV" taggerpos="ADV" lemma="plus" >plus</word><word pos="ADJ:obj:femi:pl" taggerpos="ADJ" lemma="haut" >hautes</word>
</s>
![Page 23: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/23.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Présentation de l’interface web
FonctionnalitésI Concordances (mots, parties du discours)I GUI en ligne TWICI TigerSearch
![Page 24: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/24.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Accueil
![Page 25: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/25.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Requête
![Page 26: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/26.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Référence
![Page 27: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/27.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Concordance
![Page 28: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/28.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
IntroductionPlanSpécificités de l’ancien français
Base de Français MédiévalPrésentation généraleFormat
MétadonnéesTextes
Présentation de l’interface web
Nouveau Corpus d’AmsterdamPrésentation généraleFormat
MétadonnéesTextes
Présentation de l’interface web
Syntactic Reference Corpus of Medieval FrenchPrésentation généraleModèle syntaxique dépendancielConnexions
![Page 29: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/29.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Présentation générale
Corpus de baseEnrichissement de la BFM et du NCA
Enrichissements antérieursI Ressources similaires mais pas identiques
I Descripteurs bibliographiques (titre, auteur, éditeur, etc).I Métadonnées spécifiques aux textes médiévaux (date de composition, du
manuscrit, lieu de rédaction, etc.)I annotations morphosyntaxiques (POS) des occurrences-mots.
I Ressources spécifiquesI NCA : lemmatisation automatique (TreeTagger)I BFM : discours direct en cours
Annotation communeI annotation syntaxique s’ajoute aux informations présentesI démarche unifiée (6= idiosyncrasie)I Note : impossible projeter automatiquement annotations syntaxiques
d’un corpus à l’autre
![Page 30: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/30.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Présentation générale
Corpus de baseEnrichissement de la BFM et du NCA
Enrichissements antérieurs
I Ressources similaires mais pas identiquesI Descripteurs bibliographiques (titre, auteur, éditeur, etc).I Métadonnées spécifiques aux textes médiévaux (date de composition, du
manuscrit, lieu de rédaction, etc.)I annotations morphosyntaxiques (POS) des occurrences-mots.
I Ressources spécifiquesI NCA : lemmatisation automatique (TreeTagger)I BFM : discours direct en cours
Annotation communeI annotation syntaxique s’ajoute aux informations présentesI démarche unifiée (6= idiosyncrasie)I Note : impossible projeter automatiquement annotations syntaxiques
d’un corpus à l’autre
![Page 31: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/31.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Présentation générale
Corpus de baseEnrichissement de la BFM et du NCA
Enrichissements antérieursI Ressources similaires mais pas identiques
I Descripteurs bibliographiques (titre, auteur, éditeur, etc).I Métadonnées spécifiques aux textes médiévaux (date de composition, du
manuscrit, lieu de rédaction, etc.)I annotations morphosyntaxiques (POS) des occurrences-mots.
I Ressources spécifiquesI NCA : lemmatisation automatique (TreeTagger)I BFM : discours direct en cours
Annotation communeI annotation syntaxique s’ajoute aux informations présentesI démarche unifiée (6= idiosyncrasie)I Note : impossible projeter automatiquement annotations syntaxiques
d’un corpus à l’autre
![Page 32: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/32.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Présentation générale
Corpus de baseEnrichissement de la BFM et du NCA
Enrichissements antérieursI Ressources similaires mais pas identiques
I Descripteurs bibliographiques (titre, auteur, éditeur, etc).I Métadonnées spécifiques aux textes médiévaux (date de composition, du
manuscrit, lieu de rédaction, etc.)I annotations morphosyntaxiques (POS) des occurrences-mots.
I Ressources spécifiquesI NCA : lemmatisation automatique (TreeTagger)I BFM : discours direct en cours
Annotation communeI annotation syntaxique s’ajoute aux informations présentesI démarche unifiée (6= idiosyncrasie)I Note : impossible projeter automatiquement annotations syntaxiques
d’un corpus à l’autre
![Page 33: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/33.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Présentation générale
Corpus de baseEnrichissement de la BFM et du NCA
Enrichissements antérieursI Ressources similaires mais pas identiques
I Descripteurs bibliographiques (titre, auteur, éditeur, etc).I Métadonnées spécifiques aux textes médiévaux (date de composition, du
manuscrit, lieu de rédaction, etc.)I annotations morphosyntaxiques (POS) des occurrences-mots.
I Ressources spécifiquesI NCA : lemmatisation automatique (TreeTagger)I BFM : discours direct en cours
Annotation commune
I annotation syntaxique s’ajoute aux informations présentesI démarche unifiée (6= idiosyncrasie)I Note : impossible projeter automatiquement annotations syntaxiques
d’un corpus à l’autre
![Page 34: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/34.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Présentation générale
Corpus de baseEnrichissement de la BFM et du NCA
Enrichissements antérieursI Ressources similaires mais pas identiques
I Descripteurs bibliographiques (titre, auteur, éditeur, etc).I Métadonnées spécifiques aux textes médiévaux (date de composition, du
manuscrit, lieu de rédaction, etc.)I annotations morphosyntaxiques (POS) des occurrences-mots.
I Ressources spécifiquesI NCA : lemmatisation automatique (TreeTagger)I BFM : discours direct en cours
Annotation communeI annotation syntaxique s’ajoute aux informations présentes
I démarche unifiée (6= idiosyncrasie)I Note : impossible projeter automatiquement annotations syntaxiques
d’un corpus à l’autre
![Page 35: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/35.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Présentation générale
Corpus de baseEnrichissement de la BFM et du NCA
Enrichissements antérieursI Ressources similaires mais pas identiques
I Descripteurs bibliographiques (titre, auteur, éditeur, etc).I Métadonnées spécifiques aux textes médiévaux (date de composition, du
manuscrit, lieu de rédaction, etc.)I annotations morphosyntaxiques (POS) des occurrences-mots.
I Ressources spécifiquesI NCA : lemmatisation automatique (TreeTagger)I BFM : discours direct en cours
Annotation communeI annotation syntaxique s’ajoute aux informations présentesI démarche unifiée (6= idiosyncrasie)
I Note : impossible projeter automatiquement annotations syntaxiquesd’un corpus à l’autre
![Page 36: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/36.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Présentation générale
Corpus de baseEnrichissement de la BFM et du NCA
Enrichissements antérieursI Ressources similaires mais pas identiques
I Descripteurs bibliographiques (titre, auteur, éditeur, etc).I Métadonnées spécifiques aux textes médiévaux (date de composition, du
manuscrit, lieu de rédaction, etc.)I annotations morphosyntaxiques (POS) des occurrences-mots.
I Ressources spécifiquesI NCA : lemmatisation automatique (TreeTagger)I BFM : discours direct en cours
Annotation communeI annotation syntaxique s’ajoute aux informations présentesI démarche unifiée (6= idiosyncrasie)I Note : impossible projeter automatiquement annotations syntaxiques
d’un corpus à l’autre
![Page 37: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/37.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Modèle syntaxique dépendanciel
toli
des
lors te
li
anemis
la
veue
CIRC
CM
PL SUJ
OBJ
MO
D
MO
D
MO
D
Classes de dépendants pour l’afr.Relation étiquetée du nom de la fonction représentée
I Principaux dépendants du verbe :I sujet (abrégé Suj)I objet (Obj)I complément régi autre que l’objet (Cmpl)I attribut du sujet (AtSj)I circonstant (Circ)
I Autres niveaux : modifieur (Mod).
![Page 38: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/38.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Modèle syntaxique dépendanciel
toli
des
lors te
li
anemis
la
veue
CIRC
CM
PL SUJ
OBJ
MO
D
MO
D
MO
D
Classes de dépendants pour l’afr.Relation étiquetée du nom de la fonction représentée
I Principaux dépendants du verbe :I sujet (abrégé Suj)I objet (Obj)I complément régi autre que l’objet (Cmpl)I attribut du sujet (AtSj)I circonstant (Circ)
I Autres niveaux : modifieur (Mod).
![Page 39: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/39.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Modèle syntaxique dépendanciel
toli
des
lors te
li
anemis
la
veue
CIRC
CM
PL SUJ
OBJ
MO
D
MO
D
MO
D
Classes de dépendants pour l’afr.Relation étiquetée du nom de la fonction représentée
I Principaux dépendants du verbe :I sujet (abrégé Suj)I objet (Obj)I complément régi autre que l’objet (Cmpl)I attribut du sujet (AtSj)I circonstant (Circ)
I Autres niveaux : modifieur (Mod).
![Page 40: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/40.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Modèle syntaxique dépendanciel
toli
des
lors te
li
anemis
la
veue
CIRC
CM
PL SUJ
OBJ
MO
D
MO
D
MO
D
Classes de dépendants pour l’afr.Relation étiquetée du nom de la fonction représentée
I Principaux dépendants du verbe :I sujet (abrégé Suj)I objet (Obj)I complément régi autre que l’objet (Cmpl)I attribut du sujet (AtSj)I circonstant (Circ)
I Autres niveaux : modifieur (Mod).
![Page 41: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/41.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
![Page 42: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/42.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Textes centraux encodés en XML (NCA et BFM). Avec les annotations et laterminologie SRCMF = ressource primaire produite
![Page 43: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/43.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Annotation sans tenir compte des annotations déjà présentes, mais en recou-rant aux éditions qui fondent les bases
![Page 44: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/44.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
SRCMF fusionné à NCA et BFM pour exploitation
![Page 45: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French](https://reader034.vdocuments.site/reader034/viewer/2022042702/55cf9e44550346d033b07a49/html5/thumbnails/45.jpg)
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French
Merci !www.srcmf.org