fdi

14
Gestion linguistique dans Wikip´ edia Julien Fayolle Wikim´ edia France [email protected] http://www.wikimedia.fr

Upload: wikimedia-france

Post on 22-Jun-2015

1.238 views

Category:

Education


0 download

DESCRIPTION

Conférence au Forum des droits sur l'Internet le 25 juin 2009.Sujet : gestion linguistique dans Wikipédia.

TRANSCRIPT

Page 1: Fdi

Gestion linguistique dans Wikipedia

Julien Fayolle

Wikimedia [email protected]

http://www.wikimedia.fr

Page 2: Fdi

Wikipedia

à Encyclopedie ;

à Ouverte a tous, ecrite collaborativement (Web 2.0) ;

à Neutralite de point de vue ;

à Licence libre.

ê Participation de tout le monde a la creation d’un corpus ency-clopedique (quasiment tout le monde sait quelque chose).ê Tout le monde est le relecteur de l’autre.ê Processus continu de correction, de remise en cause, d’ajustementet de presentation du savoir.

mars 2009 : 14 M de visiteurs uniques, 9e site en France(mediametrie).

Page 3: Fdi

Acteurs

Wikimedia Foundation, Inc.(WMF)

Þ heberge les sites, pasediteur.

Wikipedia et sescontributeurs benevoles ;

Þ moderation aposteriori ;

Þ auto-gestion.

Wikimedia France.Þ promotion des projets,

connaissance libre.

Page 4: Fdi

Multilinguisme

ß Disponible en 266 langues.ß Degres divers de maturite (nombre de locuteurs, date decreation).

en : 2 889 962 ;

de : 907 851 ;

fr : 807 347, ;

ja : 588 518 ;

es : 475 384 ;

zh : 254 123 ;

ar : 99 662 ;

lg (ganda, luganda) : 33.

Page 5: Fdi

Versions linguistiques

Page 6: Fdi

Acces aux versions linguistiques

á soit www.wikipedia.org, sans langue predefinie

á soit les versions linguistiques xx.wikipedia.org

á xx est le code ISO-639 de la langue.

á Sur chaque article : liens interwiki : permettent de passer al’article « equivalent » sur une autre version linguistique.

Pas de determination automatique de la langue.Flexibilite, mais il faut connaıtre le code langue (portee mondiale,pas uniquement langues dominantes).

Langue du contenu et de l’interface a priori differentes. La languede l’interface (logiciel) est specifiee par l’utilisateur.

Page 7: Fdi

Creation de version linguistique

1 pt et pt-br (bresilien) ;

2 siberien (ru-sib) ;

3 klingon (tlh) ;

4 lobjan (jbo), esperanto (eo), volapuk (vo), interlingua (ia, ie) ;

5 latin (la) ;

6 Conditions : avoir une communaute potentielle suffisante(3-5 personnes) ;

7 Coordination et decision de creation d’une Wikipedia surmeta, (plateforme d’organisation meta-linguistique, passeulement les questions linguistiques) ;

8 L’ouverture technique d’une version (la creation d’une url,base MySQL, MediaWiki) est faite par un technicien de laWMF.

Page 8: Fdi

Version linguistiques

Debats politiques et linguistiques sur moldave/roumain,serbe (sr)/croate (hr)/serbo-croate (sh)/macedonien (mk).Arabe litteral (ar), masri (arz), shami (levantin), khalidji,furati (Iraq), darija (Maghreb) ;

Variantes d’alphabet :Þ sr : ћирилица et latinica ;Þ ku : latını et erebı ;Þ zh-sg, zh-hk, zh-cn, zh-tw, zh-hans, zh-hant ;Þ az : articles en alphabet latin, interface en latin + arabe ;

Simple English (simple). Texto ? Francais facile ?

Risque de morcellement : utilite de l’alsacien (als), du breton(br), du walon (wa), du haut-normand (nrm), arpitan(francoprovencal, frp), flamand occidental (vls).

Page 9: Fdi

Creation de contenu

Les versions linguistiques sont independantes les unes des autres.Il n’y a pas de traduction automatique des que des ajouts sonteffectues sur une version. Les articles sont crees dans des versions ades dates et avec des contenus a priori differents, selon l’interet descontributeurs de la version linguistique.

Les benevoles ont defini plusieurs strategies lors de la creation d’unarticle : traduction d’un article preexistant dans une autre versionlinguistique, creation ex nihilo, melange des deux : difficile defaire une traduction exacte quand on connaıt le sujet, plus facile dese servir du plan d’un article deja ecrit.

Hierarchie de wikipedias (pour la traduction) : anglais, languesmondiales (langues de diffusion), langues regionales (pas languematernelle ou de diffusion), versions symboliques.

Page 10: Fdi

Traduction

ü Centralisation des bonnes pratiques, demande d’aide, derelecture de traduction (sur chaque grosse versionlinguistique).http://fr.wikipedia.org/wiki/Projet:Traduction

ü Organisation : comment signaler une demande de traduction,une traduction en cours, une demande de relecture, evaluationde la qualite de la relecture, comment crediter une traduction(droit d’auteur).

ü Contributeurs interesses par organiser la thematique, d’autrespar suivre le processus, d’autres font leurs traductions sanspasser par ces etapes.

ü Les contributeurs identifient les langues qu’ils peuventtraduire ou vers lesquelles ils peuvent traduire.

Traduction automatique : Google Translator Toolkit. Outil tresinteressant. Est-ce que ca sera utilise par la communaute ?

Page 11: Fdi

Travail collaboratif

ï Traduire en « plusieurs couches » :ß traduction grossiere (mot a mot, pas de recul ou de

connaissance specifique du traducteur, meconnaissance des termestechniques ou du domaine),

ß raffinements successifs.

ß La source originale n’est qu’a un clic via les liens interwikis.

ï Coordination centralisee ou non (i.e., entre individus :communaute d’utilisateurs).

ï Parfois plus facile d’ameliorer une traduction incrementalement,parfois il faut recommencer tout le paragraphe.

Page 12: Fdi

Place du francais

http://fr.wikipedia.org

ë Rencontre des francophones (France, Belgique, Suisse,Quebec, Afrique, expatries) ;

ë Chicon/endive (polemique de nommage) ;

ë Pas de demande de secession, pas de grosse tension ;

ë 3e encyclopedie par le nombre d’article.

Page 13: Fdi

Commons

î Problematique historique : redondance des medias (photos,cartes, schemas, videos, sons tous sous licence libre) ;

î commons.wikimedia.org centralise ces medias (heberge parWMF) ;

î Plus de 4 millions de documents (2009).

î Un seul site, une seule URL, mais utilisateurs de languesdifferentes.

î L’utilisateur specifie sa langue (parametre). Par defaut,anglais.

Page 14: Fdi

Translatewiki

Le logiciel derriere Wikipedia s’appelle MediaWiki (CMS souslicence libre).

Il est possible d’avoir l’interface en polonais sur la wikipedia enfrancais. Mais seulement l’interface, le contenu reste en francais.

L’ouverture d’une version linguistique est liee a l’adaptation desmessages du logiciel par les utilisateurs et par consequent ainternationaliser MediaWiki.

Le site translatewiki.net centralise l’internationalisation dulogiciel.

Developpement de MediaWiki ”en anglais”, commentaire enanglais. Communaute sur mediawiki.org.