la reconnaissance d'écriture -...

32
1 La reconnaissance d La reconnaissance d ’é ’é criture criture finition finition : La reconnaissance de l' : La reconnaissance de l'é criture criture manuscrite est un traitement informatique qui manuscrite est un traitement informatique qui a pour but de traduire un texte a pour but de traduire un texte é crit en un crit en un texte cod texte codé num numé riquement. riquement. Il faut distinguer deux reconnaissances Il faut distinguer deux reconnaissances distinctes, avec des probl distinctes, avec des problé matiques et des matiques et des solutions diff solutions diffé rentes rentes : § la reconnaissance la reconnaissance en en- ligne ligne ; ; § la reconnaissance hors la reconnaissance hors- ligne. ligne.

Upload: dangnga

Post on 13-Sep-2018

235 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

11

La reconnaissance dLa reconnaissance d’é’écriturecriture

DDééfinitionfinition : La reconnaissance de l': La reconnaissance de l'éécriture criture manuscrite est un traitement informatique qui manuscrite est un traitement informatique qui a pour but de traduire un texte a pour but de traduire un texte éécrit en un crit en un texte codtexte codéé numnuméériquement.riquement.

Il faut distinguer deux reconnaissances Il faut distinguer deux reconnaissances distinctes, avec des probldistinctes, avec des probléématiques et des matiques et des solutions diffsolutions difféérentesrentes ::

§§ la reconnaissance la reconnaissance enen--ligneligne ; ; §§ la reconnaissance horsla reconnaissance hors--ligne.ligne.

Page 2: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

22

SchSchééma de la reconnaissance en ligne et ma de la reconnaissance en ligne et hors ligne :hors ligne :

Page 3: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

33

La reconnaissance de l'La reconnaissance de l'éécriture criture manuscrite fait appel manuscrite fait appel àà la la reconnaissance de forme, mais reconnaissance de forme, mais éégalement au traitement automatique galement au traitement automatique du langage naturel.du langage naturel.

Page 4: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

44

Reconnaissance horsReconnaissance hors--ligneligne

La reconnaissance horsLa reconnaissance hors--ligne travaille sur un instantanligne travaille sur un instantanééd'encre numd'encre numéérique (sur une image). C'est le cas rique (sur une image). C'est le cas notamment de la Reconnaissance Optique de l'notamment de la Reconnaissance Optique de l'ÉÉcriture. criture.

Dans ce contexte il est impossible de savoir comment ont Dans ce contexte il est impossible de savoir comment ont ééttéé tractracéés les diffs les difféérents motifsrents motifs ; il est seulement possible ; il est seulement possible d'extraire des formes d'extraire des formes àà partir de l'image, en s'appuyant sur partir de l'image, en s'appuyant sur les technologies de reconnaissance de forme.les technologies de reconnaissance de forme.

C'est C'est éévidemment le type de reconnaissance privilvidemment le type de reconnaissance priviléégigiéépour les traitements asynchrones tels que la lecture de pour les traitements asynchrones tels que la lecture de chchèèque bancaire ou le tri postal.que bancaire ou le tri postal.

Page 5: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

55

Reconnaissance Reconnaissance enen--ligneligne

Dans le cadre de la reconnaissance Dans le cadre de la reconnaissance enen--ligneligne, , ll‘é‘échantillon d'encre est constituchantillon d'encre est constituéé d'un ensemble d'un ensemble de coordonnde coordonnéées ordonnes ordonnéées dans le temps. es dans le temps.

Il est ainsi possible de suivre le tracIl est ainsi possible de suivre le tracéé, de conna, de connaîître tre les posles poséés et levs et levéés de stylo et s de stylo et ééventuellement ventuellement ll‘‘inclinaison et la vitesse. inclinaison et la vitesse.

Il faut Il faut éévidemment un matvidemment un matéériel spriel spéécifique pour cifique pour saisir un tel saisir un tel ééchantillon, c'est le cas notamment chantillon, c'est le cas notamment des stylos numdes stylos numéériques ou des stylets sur agendas riques ou des stylets sur agendas éélectroniques ou sur les lectroniques ou sur les TabletsTablets PC.PC.

Page 6: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

66

La reconnaissance La reconnaissance enen--ligneligne est gest géénnééralement ralement beaucoup plus efficace que la reconnaissance beaucoup plus efficace que la reconnaissance horshors--ligne car les ligne car les ééchantillons sont beaucoup plus chantillons sont beaucoup plus informatifs. informatifs.

En revanche, elle nEn revanche, elle néécessite un matcessite un matéériel beaucoup riel beaucoup plus coplus coûûteux et impose de fortes contraintes au teux et impose de fortes contraintes au scripteur puisque la capture de l'encre doit se faire scripteur puisque la capture de l'encre doit se faire au moment de la saisie (capture synchrone) et non au moment de la saisie (capture synchrone) et non a posterioria posteriori (capture asynchrone).(capture asynchrone).

Page 7: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

77

Les techniques usitLes techniques usitéées peuvent avoir un champ es peuvent avoir un champ applicatif plus vaste permettant la reconnaissance applicatif plus vaste permettant la reconnaissance de toute forme abstraite simple (cf. de toute forme abstraite simple (cf. Reconnaissance de formes, Intelligence artificielle Reconnaissance de formes, Intelligence artificielle faible). faible).

Les systLes systèèmes actuels procmes actuels procèèdent majoritairement dent majoritairement par une comparaison de l'par une comparaison de l'ééchantillon chantillon àà reconnareconnaîître tre avec ceux contenus dans une base de donnavec ceux contenus dans une base de donnéées es servant de comparatifs. servant de comparatifs.

Page 8: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

88

Il est donc nIl est donc néécessaire au systcessaire au systèème deme de ::

qq soit posssoit possééder prder prééalablement une base de alablement une base de donndonnéées des formes reconnaissableses des formes reconnaissables ; ;

qq soit passer par une phase de calibrage, csoit passer par une phase de calibrage, c’’estest--àà--dire, "d'apprentissage" des formes abstraites dire, "d'apprentissage" des formes abstraites ààreconnareconnaîître pour constituer cette base de donntre pour constituer cette base de donnéées. es.

Page 9: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

99

Les techniques de comparaison reposent gLes techniques de comparaison reposent géénnééralement sur ralement sur des mdes mééthodes statistiques simples pour gagner en vitesse thodes statistiques simples pour gagner en vitesse de traitement. de traitement.

Ce qui induit queCe qui induit que ::

plus le nombre de formes que le systplus le nombre de formes que le systèème peut me peut reconnareconnaîître est grand, tre est grand,

plus la prplus la préécision statistique des comparaisons doit cision statistique des comparaisons doit l'être et, par consl'être et, par consééquent, quent,

moins la qualitmoins la qualitéé de la reconnaissance le sera. de la reconnaissance le sera.

Page 10: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

1010

Ceci car la qualitCeci car la qualitéé des systdes systèèmes de mes de reconnaissances repose sur leur capacitreconnaissances repose sur leur capacitéé a faire a faire des choix fiables basdes choix fiables baséés sur des approximations.s sur des approximations.

Or, en matiOr, en matièère d're d'éécriture manuscrite, criture manuscrite, l'approximation est, de par le facteur humain, l'approximation est, de par le facteur humain, ininééluctableluctable : il est quasiment impossible qu'un : il est quasiment impossible qu'un utilisateur de ces systutilisateur de ces systèèmes reproduise une forme mes reproduise une forme exactement telle qu'elle aura exactement telle qu'elle aura ééttéé prprééalablement alablement mméémorismoriséée dans la base de donne dans la base de donnéées comparativees comparative ! !

Page 11: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

1111

En revanche, ces systEn revanche, ces systèèmes permettent de mes permettent de comparer et reconnacomparer et reconnaîître facilement quelques tre facilement quelques formes simples, sans se soucier ni de la taille, ni formes simples, sans se soucier ni de la taille, ni de lde l‘‘orientation, ni de l'exactitude "orientation, ni de l'exactitude "spacialespaciale" de " de l'originale contenu dans la base de donnl'originale contenu dans la base de donnéées es comparativecomparative ! !

Cependant, les limitations intrinsCependant, les limitations intrinsèèques ques restreignent les domaines applicatifs restreignent les domaines applicatifs àà des des opopéérations de reconnaissance simples et rapides. rations de reconnaissance simples et rapides.

Page 12: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

1212

Citons pour exemple la technique qui semblerait demeurer Citons pour exemple la technique qui semblerait demeurer la plus simple, la plus facile et la plus rapide la plus simple, la plus facile et la plus rapide àà implimpléémenter menter en programmation informatique.en programmation informatique.

Il s'agit d'une comparaison de la moyenne de la somme Il s'agit d'une comparaison de la moyenne de la somme des segments reliant chaque points de la figure des segments reliant chaque points de la figure àà son son premier point. Ce mode de reconnaissance d'premier point. Ce mode de reconnaissance d'éécriture induit criture induit que l'que l'éédition des figures soit vectorielle, donc, constitudition des figures soit vectorielle, donc, constituéée de e de segments juxtapossegments juxtaposéés euxs eux--mêmes constitumêmes constituéés/limits/limitéés par des s par des points. points.

Autrement dit, une figure n'est qu'un ensemble de points Autrement dit, une figure n'est qu'un ensemble de points relireliéés entre eux et ayant leurs coordonns entre eux et ayant leurs coordonnéées sur un plan en es sur un plan en deux dimensions. deux dimensions.

Page 13: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

1313

Avant dAvant d’’aborder des exemples et comparaisons de aborder des exemples et comparaisons de logiciels, il convient de rappeler que du 23 au 26 logiciels, il convient de rappeler que du 23 au 26 octobre 2006, La Baule accueillait quelque 150 octobre 2006, La Baule accueillait quelque 150 chercheurs pour faire le point sur les dernichercheurs pour faire le point sur les dernièères res avancavancéées en maties en matièère de lecture automatique par re de lecture automatique par ordinateur. ordinateur.

La reconnaissance de l'La reconnaissance de l'éécriture manuscrite a connu criture manuscrite a connu ces dix dernices dix dernièères annres annéées des progres des progrèès s remarquables qui ont remarquables qui ont ééttéé éévoquvoquéés par le s par le professeur Lambert professeur Lambert SchomakerSchomaker, de l'universit, de l'universitéé de de Groningen, aux PaysGroningen, aux Pays--Bas.Bas.

Page 14: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

1414

Tout a commencTout a commencéé dans les anndans les annéées 1960, es 1960, avec les tentatives de davec les tentatives de déévelopper des velopper des algorithmes de reconnaissance optique de algorithmes de reconnaissance optique de caractcaractèères pour les majuscules et les chiffres res pour les majuscules et les chiffres du programme source du langage Fortran. du programme source du langage Fortran. LL’’ididéée, pour le programmeur e, pour le programmeur éétait dtait d’é’écrire crire son algorithme sur papier puis de le son algorithme sur papier puis de le scanner. Ensuite, lscanner. Ensuite, l’’ordinateur ferait la ordinateur ferait la traduction vers la machine.traduction vers la machine.

Page 15: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

1515

En fait, tout le monde a pensEn fait, tout le monde a penséé que la que la reconnaissance de lreconnaissance de l’é’écriture serait plus facile criture serait plus facile que celle de la parole. Pour les chiffres, en que celle de la parole. Pour les chiffres, en particulier, cparticulier, c’é’était faisable. On doit traiter tait faisable. On doit traiter seulement 10 classes de 0 seulement 10 classes de 0 àà 9. On avait 9. On avait ll’’avantage supplavantage suppléémentaire de possmentaire de possééder der beaucoup de donnbeaucoup de donnéées pour les pour l’’entraentraîînement, nement, grâce aux systgrâce aux systèèmes de tri postal et tri mes de tri postal et tri bancaire.bancaire.

Page 16: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

1616

Dans les annDans les annéées 1960, tout le monde a vu es 1960, tout le monde a vu ll’’ordinateur de Monsieur ordinateur de Monsieur SpockSpock dans Star Trek, dans Star Trek, avec son crayon informatique avec son crayon informatique TabletTablet PC. Dans les PC. Dans les annannéées 1980, on a commences 1980, on a commencéé àà envisager envisager dd’é’équiper les ordinateurs personnels de systquiper les ordinateurs personnels de systèèmes mes de reconnaissance dde reconnaissance d’é’écriture. criture.

Apple a commencApple a commencéé avec son Newton, et un avec son Newton, et un systsystèème de reconnaissance d'me de reconnaissance d'éécriture libre, criture libre, cursive. cursive.

A lA l’é’époque, poque, éétant donntant donnéée la varie la variééttéé de styles et de de styles et de scripteurs,scripteurs, chacun, dans son domaine, savait que chacun, dans son domaine, savait que ce nce n’é’était pas jouabletait pas jouable…… Apple, pourtant a lancApple, pourtant a lancééson produit. Cela nson produit. Cela n’’a pas a pas ééttéé un succun succèès.s.

Page 17: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

1717

Beaucoup de gens alors ont pensBeaucoup de gens alors ont penséé que la que la reconnaissance dreconnaissance d’é’écriture, criture, çça ne marchait a ne marchait tout simplement pas. Mais dans les tout simplement pas. Mais dans les universituniversitéés, on a continus, on a continuéé àà explorer ce explorer ce domaine de recherche. Aujourddomaine de recherche. Aujourd’’hui, cela hui, cela commence commence àà donner des rdonner des réésultats, mais la sultats, mais la qualitqualitéé nn’’est pas encore suffisante. est pas encore suffisante.

Page 18: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

1818

On peut distinguer quatre secteurs. Tout On peut distinguer quatre secteurs. Tout dd’’abord, le monde du abord, le monde du TabletPCTabletPC, avec le , avec le frameworkframework Microsoft. On peut y mettre un Microsoft. On peut y mettre un systsystèème intme intéégrgréé interactif, par lequel, interactif, par lequel, ààcertains moments, lcertains moments, l’’utilisateur met en action utilisateur met en action le logiciel de reconnaissance de lle logiciel de reconnaissance de l’é’écriture, criture, avec une tablette et un crayon.avec une tablette et un crayon.

Page 19: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

1919

Le deuxiLe deuxièème secteur, cme secteur, c’’est la reconnaissance de est la reconnaissance de chchèèques et d'adresses. Car le papier nques et d'adresses. Car le papier n’’a pas a pas disparu, contrairement aux prdisparu, contrairement aux préévisions des visions des futurologues. Il existe beaucoup de pays dans futurologues. Il existe beaucoup de pays dans lesquels le chlesquels le chèèque demeure encore un moyen de que demeure encore un moyen de paiement important. paiement important.

La France ou les USA par exemple. On a tendance La France ou les USA par exemple. On a tendance àà ll’’oublier, mais dans ce type doublier, mais dans ce type d’’application, la application, la reconnaissance dreconnaissance d’é’écriture rencontre beaucoup de criture rencontre beaucoup de succsuccèès. Elle fait s. Elle fait ééconomiser beaucoup dconomiser beaucoup d’’argent.argent.

Page 20: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

2020

Le troisiLe troisièème secteur concerne la sme secteur concerne la séécuritcuritéé et et la biomla bioméétrie. Dans les dernitrie. Dans les dernièères annres annéées, on es, on a connu une grande ama connu une grande améélioration en matilioration en matièère re de vde véérification de signatures et rification de signatures et dd’’identification didentification d’’auteurs. Les problauteurs. Les problèèmes limes liéés s au terrorisme ont renforcau terrorisme ont renforcéé la demande pour la demande pour de tels systde tels systèèmes. mes.

Page 21: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

2121

La reconnaissance dLa reconnaissance d’é’écriture informatiscriture informatiséée peut e peut ss’’avavéérer efficace. rer efficace.

Si on a une base dSi on a une base d’’identitidentitéés de 20 000 personnes, s de 20 000 personnes, on ne peut pas les comparer manuellement. Cela on ne peut pas les comparer manuellement. Cela prend trop de temps.prend trop de temps.

En revanche, En revanche, àà la fala faççon don d’’un un GoogleGoogle, un moteur de , un moteur de recherche en reconnaissance drecherche en reconnaissance d’é’écriture peut criture peut parvenir parvenir àà un run réésultat qui ne reprsultat qui ne repréésente pas une sente pas une performance parfaite, mais qui reste quand même performance parfaite, mais qui reste quand même trtrèès satisfaisant. s satisfaisant.

Page 22: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

2222

Si par exemple, le moteur nous propose Si par exemple, le moteur nous propose parmi les 20 000 identitparmi les 20 000 identitéés une liste des 10 s une liste des 10 identitidentitéés les plus approchantes, on a s les plus approchantes, on a effectueffectuéé éénormnorméément de chemin. ment de chemin.

On peut alors affiner et terminer la On peut alors affiner et terminer la vvéérification manuellement.rification manuellement.

Dans ce cas de figure, il nDans ce cas de figure, il n’’est pas nest pas néécessaire cessaire de disposer dde disposer d’’un systun systèème parfait pour me parfait pour travailler trtravailler trèès efficacement.s efficacement.

Page 23: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

2323

Le quatriLe quatrièème secteur concerne les documents me secteur concerne les documents historiques. Cela reste trhistoriques. Cela reste trèès ardu, donc on ss ardu, donc on s’’amuse amuse beaucoup. Imaginez : chaque pbeaucoup. Imaginez : chaque péériode a sa propre riode a sa propre forme dforme d’é’écriture. On doit exploiter des masses criture. On doit exploiter des masses dd’’archives pour lesquelles nous narchives pour lesquelles nous n’’avons que des avons que des donndonnéées sans es sans éétiquettes. tiquettes.

Ce qui complique beaucoup lCe qui complique beaucoup l’’apprentissage. Il apprentissage. Il nous faut 5 000 exemples pour un seul caractnous faut 5 000 exemples pour un seul caractèère. re.

Or, pour tout ce qui est historique, nous nOr, pour tout ce qui est historique, nous n’’avons avons que les images des documents.que les images des documents.

Page 24: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

2424

A ce niveau, lA ce niveau, l’’Internet va peut être beaucoup nous Internet va peut être beaucoup nous aider. Un large public saider. Un large public s’’intintééresse resse àà la gla géénnééalogie. alogie.

On peut mettre en place un systOn peut mettre en place un systèème de travail me de travail collaboratif, invitant chacun collaboratif, invitant chacun àà propose sa version propose sa version pour un nom de famille sur un document. On peut pour un nom de famille sur un document. On peut imaginer recueillir plusieurs suggestions imaginer recueillir plusieurs suggestions diffdifféérentes, donc plusieurs options drentes, donc plusieurs options d’é’étiquettes, tiquettes, pour un même nom. pour un même nom.

On pourra alors mettre en place un systOn pourra alors mettre en place un systèème me dd’é’élection de llection de l’’option la plus probable.option la plus probable.

Page 25: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

2525

Cela dit, il existe beaucoup de types dCela dit, il existe beaucoup de types d’é’écriture et criture et nous restons confrontnous restons confrontéés s àà beaucoup dbeaucoup d’’erreurs erreurs machine trmachine trèès improductives. s improductives.

Ce qui signifie quCe qui signifie qu’’il y a quelque chose que nous ne il y a quelque chose que nous ne faisons pas correctement. Mais cfaisons pas correctement. Mais c’’est justement le est justement le fait que ce soit si difficile qui rend ces recherches fait que ce soit si difficile qui rend ces recherches si intsi intééressantes.ressantes.

Page 26: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

2626

TechnicitTechnicitééss

On peut sOn peut s’’attendre attendre àà des progrdes progrèès avec ls avec l’’arrivarrivéée du e du papier papier éélectriquelectrique : de nouveaux : de nouveaux éécrans fins, en crans fins, en plastique, de taille A4. Pour lplastique, de taille A4. Pour l’’instant, sur le PDA, instant, sur le PDA, les les éécrans sont trop petits. crans sont trop petits.

Si, au lieu de ma souris, je peux dSi, au lieu de ma souris, je peux déérouler mon rouler mon morceau de papier et utiliser mon index comme morceau de papier et utiliser mon index comme une souris, je dispose alors de quelque chose de une souris, je dispose alors de quelque chose de complcomplèètement fonctionnel. tement fonctionnel.

Page 27: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

2727

FORMAT UNIPENFORMAT UNIPEN

UnipenUnipen éétait le fruit dtait le fruit d’’un compromis entre 40 un compromis entre 40 entreprises rentreprises rééunies au sein dunies au sein d’’un consortium. Ce un consortium. Ce nn’’est pas un format idest pas un format idééal. Par ailleurs, lal. Par ailleurs, l’’industrie industrie peut lpeut léégitimement faire le reproche aux gitimement faire le reproche aux universitaires de travailler sur de trop petites universitaires de travailler sur de trop petites bases. La tâche bases. La tâche éétait compliqutait compliquéée par le nombre de e par le nombre de scripteurs, les styles de tablette etc. Pour certaines scripteurs, les styles de tablette etc. Pour certaines donndonnéées, un taux de reconnaissance de 80% sur es, un taux de reconnaissance de 80% sur une base de 200 mots, cune base de 200 mots, c’’est dest dééjjàà assez bien. assez bien. Cependant, le simple fait dCependant, le simple fait d’’avoir un format avoir un format standard nous permet de comparer nos rstandard nous permet de comparer nos réésultats, sultats, ce qui est la face qui est la faççon normale de procon normale de procééder chez der chez toutes les communauttoutes les communautéés scientifiques. s scientifiques.

Page 28: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

2828

Les scientifiques ont commencLes scientifiques ont commencéé àà travailler travailler sur sur InkMLInkML dans les anndans les annéées 2000, avec IBM, es 2000, avec IBM, Motorola et dMotorola et d’’autres. Cautres. C’’est un langage basest un langage baséésur XML. Il prsur XML. Il préésente beaucoup dsente beaucoup d’’avantages. avantages. Mais, il faut bien comprendre que lMais, il faut bien comprendre que l’’industrie industrie et les scientifiques ne partagent pas les et les scientifiques ne partagent pas les mêmes intmêmes intéérêts. Pour leurs petits appareils rêts. Pour leurs petits appareils mobiles, les constructeurs veulent des mobiles, les constructeurs veulent des formats trformats trèès compresss compresséés, toujours plus s, toujours plus lléégers. Or, les scientifiques, ont besoin de gers. Or, les scientifiques, ont besoin de formats plus avancformats plus avancéés qui comportent s qui comportent beaucoup plus de dbeaucoup plus de déétails. tails.

Page 29: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

2929

Les scientifiques ont donc migrLes scientifiques ont donc migréé de de UnipenUnipenvers UPXvers UPX……

UPX est un langage basUPX est un langage baséé sur sur InkMLInkML. Il . Il couvre les couvre les besoins de chercheurs, en ce qui concerne besoins de chercheurs, en ce qui concerne ll’’apprentissage et lapprentissage et l’é’évaluation. valuation. Ils nIls n’’utilisent utilisent ququ’’une partie de une partie de InkMLInkML et ils net ils n’’ont guont guèère lre l’’usage usage de certaines fonctions spde certaines fonctions spééciales de ciales de InkMLInkML comme comme la compression par exemple. la compression par exemple.

Les fonctions de rendu graphique pourrait prendre Les fonctions de rendu graphique pourrait prendre de lde l’’importance dans limportance dans l’’avenir. Davenir. D’’un autre côtun autre côtéé, , beaucoup dbeaucoup d’’appareils du marchappareils du marchéé tireront tout de tireront tout de suite avantage des nouvelles fonctions avancsuite avantage des nouvelles fonctions avancéées es offertes par offertes par InkMLInkML..

Page 30: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

3030

Tant pour Tant pour InkMLInkML que pour UPX, la prque pour UPX, la préésence dsence d’’applications ou de applications ou de programmes de dprogrammes de déémonstration est un facteur clmonstration est un facteur cléé. .

UPX en est actuellement UPX en est actuellement àà sa version 0.9.5. sa version 0.9.5.

La prochaine La prochaine éétape devrait concerner la portabilittape devrait concerner la portabilitéé vers Windows. vers Windows.

LL’’acceptation de acceptation de InkMLInkML par Microsoft est une par Microsoft est une éétape critique. Ce qui tape critique. Ce qui serait vraiment bien, cserait vraiment bien, c’’est que les applications de est que les applications de TablecTablec--PCPC soient soient dotdotéées de capacites de capacitéés ds d’’export de fichiers en format export de fichiers en format InkMLInkML. .

Le consortium W3C Le consortium W3C éétudie actuellement le format pour sa tudie actuellement le format pour sa consolidation. Ensuite, les choses pourraient aller vite. Plus iconsolidation. Ensuite, les choses pourraient aller vite. Plus il y aura de l y aura de donndonnéées es InkMLInkML disponibles, plus ce sera facile ddisponibles, plus ce sera facile d’’intintéégrer des grer des DataSetsDataSetsdans les bases de donndans les bases de donnéées UPX destines UPX destinéées es àà la communautla communautéé travaillant travaillant sur la reconnaissance de modsur la reconnaissance de modèèles. les.

Page 31: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

3131

InkMLInkML signifie signifie InkInk MarkMark--upup LanguageLanguage(langage de balises pour l(langage de balises pour l’’encre). Il sencre). Il s’’agit agit dd’’un format de donnun format de donnéées en XML permettant es en XML permettant de reprde repréésenter, dans un cadre multimodal, senter, dans un cadre multimodal, ll’é’écriture manuscrite sous forme criture manuscrite sous forme informatique quand elle est produite par un informatique quand elle est produite par un stylo stylo éélectronique, un stylo lectronique, un stylo àà tablettetablette……

Page 32: La reconnaissance d'écriture - rdorat.free.frrdorat.free.fr/Enseignement/ELN/Seance7/La_reconnaissance_d... · La reconnaissance d’écriture Définition : La reconnaissance de

3232

InkMLInkML est un format qui nest un format qui n’’est pas limitest pas limitéé par le type par le type de plateforme. Il a pour fonction de promouvoir de plateforme. Il a pour fonction de promouvoir ll’é’échange de fichiers dchange de fichiers d’é’écriture entre les criture entre les applications.applications.

Il assure une reprIl assure une repréésentation complsentation complèète et prte et préécise cise de lde l’’encre digital. Il stocke les informations encre digital. Il stocke les informations relatives aux caractrelatives aux caractééristiques de la machines ristiques de la machines effectuant leffectuant l’’enregistrement. Il genregistrement. Il gèère les donnre les donnéées es cartographiant les dcartographiant les dééplacements de crayon, ce qui placements de crayon, ce qui permet son utilisation par les applications permet son utilisation par les applications orientorientéées reconnaissance des reconnaissance d’é’écriture et criture et authentification.authentification.