analyse syntaxique automatique en tamazight (kabyle)

14
Analyse Syntaxique Automatique en Tamazight (Kabyle) Yamouni Farida 1 1 Université Mouloud Mammeri Tizi Ouzou Algérie [email protected] Résumé . Dans cet article nous présentons la description des grammaires syntaxiques pour la phrase simple en Tamazight (kabyle) en vue de l’analyse syntaxique automatique de phrases. Nous retenons la phrase simple déclarative, avec la phrase simple nominale et la phrase simple verbale. Nos travaux entrent dans le cadre du module Tamazight (kabyle). Nous élaborons les ressources linguistiques utilisées pour l’analyse syntaxique et nous décrivons les mots grammaticaux recensés et utilisés, autres que le nom et le verbe. Nous présentons ensuite les grammaires syntaxiques construites ainsi que des exemples d’analyse syntaxique de phrases en Kabyle. L’analyse linguistique qui est tout d’abord effectuée avant l’analyse syntaxique utilise les dictionnaires électroniques existants (Aoughlis et al, 2013), (Aoughlis, 2014) afin de fournir les catégories syntaxiques utilisées lors de l’analyse syntaxique. Les grammaires syntaxiques permettant l’analyse sont construites sur la base des travaux de Nait-Zerrad K. à l’aide du système NooJ 1 en vue du traitement automatique de la langue Tamazight (kabyle). NooJ est une plate-forme de développement permettant la description des langues naturelles ou techniques. 1. Introduction Une implémentation des règles de grammaire est réalisée dans NooJ en vue de l’analyse syntaxique automatique de phrases. Nous nous intéressons à la phrase simple déclarative. Nous décrivons la phrase simple avec ses constituants. Elle est composée d’un énoncé minimal : EVM (énoncé verbal minimum) ou bien ENM (énoncé nominal minimum), suivi d’un ou plusieurs compléments (GN : groupe nominal). La 1 http://www.nooj4nlp.net/

Upload: others

Post on 08-Feb-2022

27 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: Analyse Syntaxique Automatique en Tamazight (Kabyle)

Analyse Syntaxique Automatique en Tamazight (Kabyle)

Yamouni Farida1

1Université Mouloud Mammeri Tizi Ouzou Algérie

[email protected]

Résumé .

Dans cet article nous présentons la description des grammaires syntaxiques pour la phrase simple en Tamazight (kabyle) en vue de l’analyse syntaxique automatique de phrases. Nous retenons la phrase simple déclarative, avec la phrase simple nominale et la phrase simple verbale. Nos travaux entrent dans le cadre du module Tamazight (kabyle). Nous élaborons les ressources linguistiques utilisées pour l’analyse syntaxique et nous décrivons les mots grammaticaux recensés et utilisés, autres que le nom et le verbe. Nous présentons ensuite les grammaires syntaxiques construites ainsi que des exemples d’analyse syntaxique de phrases en Kabyle. L’analyse linguistique qui est tout d’abord effectuée avant l’analyse syntaxique utilise les dictionnaires électroniques existants (Aoughlis et al, 2013), (Aoughlis, 2014) afin de fournir les catégories syntaxiques utilisées lors de l’analyse syntaxique. Les grammaires syntaxiques permettant l’analyse sont construites sur la base des travaux de Nait-Zerrad K. à l’aide du système NooJ

1 en vue du

traitement automatique de la langue Tamazight (kabyle). NooJ est une plate-forme de développement permettant la description des langues naturelles ou techniques.

1. Introduction

Une implémentation des règles de grammaire est réalisée dans NooJ en vue de l’analyse syntaxique automatique de phrases.

Nous nous intéressons à la phrase simple déclarative. Nous décrivons la phrase simple avec ses constituants. Elle est composée d’un énoncé minimal : EVM (énoncé verbal minimum) ou bien ENM (énoncé nominal minimum), suivi d’un ou plusieurs compléments (GN : groupe nominal). La

1 http://www.nooj4nlp.net/

Page 2: Analyse Syntaxique Automatique en Tamazight (Kabyle)

YAMOUNI FARIDA

phrase verbale complète est l’EVM. La phrase nominale complète est l’ENM. Une étude de la grammaire de Tamazight (Kabyle) est faite. Les grammaires syntaxiques sont construites pour les deux types de phrases simples. Des tests sont réalisés dans NooJ pour analyser automatiquement dans NooJ des phrases de la langue retenue. Les résultats sont présentés pour quelques phrases.

2. La phrase simple

La phrase met en relation deux éléments : un sujet (ce dont on parle) et un prédicat (ce que l’on dit du sujet), suivis éventuellement de compléments. Toute phrase est constituée d’un prédicat complété par au moins un groupe nominal qui lui est lié. Le prédicat peut être verbal ou nominal.

Elle phrase simple est constituée d’un EVM ou ENM suivi d’un ou plusieurs compléments. Selon (Chaker, 1998), « en berbère, langue à opposition verbo-nominale, c’est le verbe qui constitue généralement le noyau prédicatif, dans certains contextes, notamment en proposition relative, le verbe peut perdre cette fonction et devenir un déterminant lexical équivalent à un adjectif ».

Le nom peut occuper la fonction de prédicat. Les fonctions du nom sont (Chaker, 1998 ; Nait-Zerrad, 2001):

- Le CR, complément référentiel ou explicatif : il est marqué par l’état d’annexion, postposé à l’élément qu’il détermine, souvent le prédicat ;

- Le COD, complément d’objet direct : c’est le nominal directement placé soit après le verbe, soit après le CR, il est à l’état libre. Il peut être remplacé par un pronom affixe complément direct ;

- Le COIND, complément d’objet indirect, est obligatoirement relié au verbe par la préposition "i", à. Le noyau nominal est à l’état d’annexion ;

- L’IT, indicateur de thème : le syntagme nominal à l’état libre se trouve en position initiale, c’est une mise en relief pour annoncer l’indice de personne ou le pronom personnel ;

- Le CC, complément circonstanciel : il est introduit le plus souvent par une préposition. On peut avoir plusieurs CC se rapportant à un même verbe ou équivalent nominal. On trouve le complément direct

Page 3: Analyse Syntaxique Automatique en Tamazight (Kabyle)

ANALYSE SYNTAXIQUE AUTOMATIQUE EN TAMAZIGHT (KABYLE) 3

et les compléments prépositionnels (CC de lieu, cause, but, manière, moyen, accompagnement, comparaison) ;

- CD, Complément de nom (nom déterminant un autre nom) ou complément déterminatif, dans ce cas là le nom a une relation indirecte avec le verbe. Il peut suivre directement le nom déterminé ou être précédé de la préposition "n", de. Il est toujours à l’état d’annexion ;

- Adjectif ;

- Participe : le participe est un verbe pour lequel les oppositions de personnes sont neutralisées, il s’agit donc de constructions de type relatif dans lesquelles le verbe a perdu sa fonction de prédicat.

2.1. La phrase simple verbale

Elle est constituée d’un EVM (énoncé verbal minimum) suivi d’un ou de plusieurs compléments : GN, ayant la fonction de COD, COIND, CR, CC, etc. (Nait-Zerrad, 2001 ; 1995b).

L’EVM est composé d’un verbe + indice de personne.

La structure de la phrase simple verbale est :

EVM/CR(EA)/COD(EL)/COIND/[CC]* ou bien :

EVM (+pCOIND+pCOD+Po)/CR/CR1(COD repris)(EA)/COIND/[CC]

Avec :

COIND= PREP "i" + (N+EA) ;

Po= particule d’orientation ;

pCOD= pronom personnel COD ;

pCOIND= pronom personnel COIND ;

CR1= 2ème

CR correspondant au COD, car il reprend un pronom COD.

2.2. La phrase simple non verbale

Elle est constituée d’un EVM (énoncé verbal minimum) suivi d’un ou de plusieurs compléments : GN ayant la fonction de COD, COIND, CR, CC, etc. (Nait-Zerrad, 2001 ; 1995b).

Elle est aussi appelée phrase nominale. C’est une phrase sans verbe, constituée d’un ENM, suivi d’un ou plusieurs compléments ou GN : CR, IT, CC, adjectif, etc.

Page 4: Analyse Syntaxique Automatique en Tamazight (Kabyle)

YAMOUNI FARIDA

Phr-Simpl-Nom = ENM + GN*

L’ENM contient un nom ou équivalent (jouant le rôle du verbe dans l’EVM), accompagné d’un élément prédicatif. L’élément prédicatif peut être :

- La particule "d" dite prédicative, placée devant le nom à l’état libre ;

- Une préposition ;

- Un présentatif.

2.2.1. L’ENM avec la particule prédicative "d" :

L’ENM est composé entre autres de :

- d + nom : d aqcic ;

- d + adjectif : d ameqqran ;

- d + pronom : d nutni ;

2.2.2. L’ENM avec la préposition "n"

Elle indique l’appartenance, nous avons entre autres :

- n + pronom ;

- n + nom : n mmi-s, userwal-agi (CR); Aserwal-agi (IT), n mmi-s ;

- n + démonstratif : aɣrum, n ta ;

2.2.3. La phrase simple nominale

Nous avons les exemples suivants :

- Pronom + ENM : Netta d aqcic. / Lui, c’est un garçon ;

- Nom + ENM : Axxam d ameqqran / La maison (elle) est grande.

Page 5: Analyse Syntaxique Automatique en Tamazight (Kabyle)

ANALYSE SYNTAXIQUE AUTOMATIQUE EN TAMAZIGHT (KABYLE) 5

3. Les ressources linguistiques pour l’analyse syntaxique

Dans le système NooJ (Silberztein, 2003), les grammaires syntaxiques sont représentées par des ensembles structurés de graphes ou de règles qui décrivent des paradigmes syntaxiques stockés dans des fichiers ".nog ".

Pour l’analyse syntaxique automatique, nous avons construit des grammaires syntaxiques pour l’analyse de la phrase simple verbale et de la phrase simple nominale.

Une analyse linguistique est d’abord faite pour récupérer les catégories syntaxiques obtenues grâce à la consultation des dictionnaires élaborés dans NooJ pour le nom et le verbe. Ces catégories sont utilisées pour l’analyse syntaxique. Nous avons aussi recensé les mots grammaticaux et complété le dictionnaire existant.

3.1. Les dictionnaires utilisés

Plusieurs dictionnaires sont utilisés pour l’analyse linguistique, ils permettent de récupérer les catégories syntaxiques utilisées pour l’analyse syntaxique. Le dictionnaire des noms et celui des verbes sont décrits dans (Aoughlis et al, 2013). Le dictionnaire des verbes simples contient 3900 entrées, celui des noms 500 entrées. Les noms et adjectifs qui ont été dérivés des verbes (Aoughlis, 2014) sont dans le dictionnaire des noms et adjectifs dérivés.

3.2. Le dictionnaire des mots grammaticaux

Nous avons recensé et codé les catégories syntaxiques (Nait-Zerrad, 1995a)

autres que le nom et le verbe, dans le dictionnaire des mots grammaticaux

qui contient 116 entrées.

Page 6: Analyse Syntaxique Automatique en Tamazight (Kabyle)

YAMOUNI FARIDA

Nous trouvons ci-dessous, un extrait :

Figure1. Extrait de la grammaire des mots grammaticaux

3.3. Les grammaires syntaxiques

Deux grammaires principales sont construites : une pour la phrase simple verbale et une autre pour la phrase simple nominale.

Les grammaires sont utilisées pour l’analyse syntaxique dans NooJ.

3.3.1. Grammaire syntaxique de la phrase simple nominale

Elle contient 9 graphes.

Page 7: Analyse Syntaxique Automatique en Tamazight (Kabyle)

ANALYSE SYNTAXIQUE AUTOMATIQUE EN TAMAZIGHT (KABYLE) 7

Nous trouvons ci-dessous la grammaire principale PHR-SIMPL-NOM.nog :

Figure2. Extrait de la grammaire PHR-SIMPL-NOM

PHR-SIMPL-NOM est composée d’un ENM suivi d’un GN ou bien d’un GN suivi d’un ENM.

Nous avons deux sous-graphes ENM et GN. Nous trouvons ci-dessous, le sous-graphe ENM, avec les règles de grammaires. Quatre sous-graphes sont utilisés : REL pour la relative, ENMn pour l’ENM avec "n", PRESTAHA et PRESTAQL.

Page 8: Analyse Syntaxique Automatique en Tamazight (Kabyle)

YAMOUNI FARIDA

Figure3. Le sous-graphe ENM

3.3.2. Grammaire syntaxique de la phrase simple verbale

Nous trouvons ci-dessous la grammaire principale PHR-SIMPL-VERB, avec par exemple, les sous-graphes EVM, GNL (sous-graphe décrit dans la figure5 suivante) ou GN état libre, GNA ou GN état d’annexion.

Page 9: Analyse Syntaxique Automatique en Tamazight (Kabyle)

ANALYSE SYNTAXIQUE AUTOMATIQUE EN TAMAZIGHT (KABYLE) 9

Figure4. Extrait de la grammaire PHR-SIMPL-VERB

Figure4. Extrait de la grammaire PHR-SIMPL-VERB

Figure5. Le sous-graphe GNL

Page 10: Analyse Syntaxique Automatique en Tamazight (Kabyle)

YAMOUNI FARIDA

4. Analyse syntaxique de phrases

4.1. Analyse syntaxique d’une phrase simple nominale

- Soit la phrase à analyser :

Axxam d ameqqran. / La maison (elle) est grande

- La grammaire utilisée est PHR-SIMPL-NOM.nog

- Résultats de l’analyse :

Figure6.Arbre d’analyse de la phrase "axxam d ameqqran"

Page 11: Analyse Syntaxique Automatique en Tamazight (Kabyle)

ANALYSE SYNTAXIQUE AUTOMATIQUE EN TAMAZIGHT (KABYLE) 11

Figure7. Arbre syntaxique de la phrase"axxam d ameqqran"

Soit une autre phrase à analyser : amcic-agi n yemma, les résultats sont :

Figure8. Arbre d’analyse de la phrase "amcic-agi n yemma"

Page 12: Analyse Syntaxique Automatique en Tamazight (Kabyle)

YAMOUNI FARIDA

Figure9. Arbre syntaxique de la phrase"amcic-agi n yemma"

4.2. Analyse syntaxique d’une phrase simple verbale

Soit la phrase à analyser : yekcem wergaz yeččan aɣrum ; la grammaire est PHR-SIMPL-VERB, les résultats des analyses sont :

Figure10. Arbre d’analyse de la phrase "yekcem wergaz yeččan aɣrum"

Page 13: Analyse Syntaxique Automatique en Tamazight (Kabyle)

ANALYSE SYNTAXIQUE AUTOMATIQUE EN TAMAZIGHT (KABYLE) 13

Figure11. Arbre syntaxique de la phrase "yekcem wergaz yeččan aɣrum"

5. Conclusion et perspectives

Dans ce travail nous avons étudié les règles de grammaire du Kabyle, nous avons construit les ressources linguistiques pour l’analyse syntaxique automatique. Les travaux réalisés permettent d’analyser les phrases simple et nominale. Les résultats souhaités sont obtenus et les arbres d’analyse et syntaxiques sont affichés. Les grammaires développées utilisent les catégories syntaxiques définies pour les mots grammaticaux de la langue, ainsi que le nom et le verbe.

Il est envisagé une étude détaillée de la proposition relative avec la mise en place des grammaires syntaxiques. Une étude de la phrase négative est prévue.

Page 14: Analyse Syntaxique Automatique en Tamazight (Kabyle)

YAMOUNI FARIDA

Les résultats obtenus peuvent être utilisés pour concevoir et développer un outil pédagogique pour enseigner la grammaire du Kabyle.

Références

Aoughlis F., Nait-Zerrad K., Annouz H., Aït-Kaci F. and Habet MS. (2013). A new Tamazight Module for NooJ, In Formalising Natural Languages with NooJ 2013. Selected Papers from the NooJ 2013 International Conference. Svetla Koeva, Slim Mesfar, Max Silberztein Eds. Cambridge Scholars Publishing: Newcastle upon Tyne.

Aoughlis ,F. (2014). Noms et adjectifs dérivés en Tamazight, 6ème Edition de la Conférence Internationale sur Les Technologies d’Information et de Communication pour l'Amazighe,TICAM’14, IRCAM, Rabat, 24 et 25 novembre 2014. (Actes à paraître aux éditions de l’IRCAM).

Chaker S. (1998). Fonctions, in Filage-Gastel, Encyclopédie Berbère 19 : 2880-2886. Edisud, Aix-en-Provence.

Nait-Zerrad, K. (1995a). Grammaire du berbère contemporain (kabyle), I-Morphologie , Enag Ed. : Alger

Nait-Zerrad, K. (1995b). Grammaire du berbère contemporain (kabyle), II- Syntaxe, Enag Ed., Alger.

Nait-Zerrad, K. (2001). Grammaire moderne du kabyle, tajerrumt tatrart n teqbaylit, Karthala, Paris.

Silberztein, M. (2003). Manuel NOOJ. http://www.nooj4nlp.net