quantification histograme

18
ETAT DE L’ART : Les systèmes de reconnaissance facial I - les systèmes développer a base des approches locales 1ere application : Reconnaissance facial utilisant la différence d’intensité des pixels adjacents {quantification d’histogramme} : APIDQ : Adjacent Pixel Intensity Difference Quantization, histogram method Pour assurée la reconnaissance facial en temps réel, cette méthode donne une haute performance de taux de reconnaissance, le problème est que la quantification n’est pas optimisé, en va d’abord se concentré sur la quantification de l’APIDQ basé sur le principe de l’entropie maximal MEP et déterminer les meilleurs paramètres pour APDIQ En outre l’algorithme de APIDQ utilise le dénombré d’histogramme du visage humain comme vecteur de caractéristique pour identifier les personnes et les informations d’emplacement du visage sont inutilisés il peut être considéré comme une approche de base statistique simplifié, bien que la méthode APIDQ histogramme atteint au taux de haute reconnaissance à l’aide de 400 images de 40 personnes, de la base de données AT& t publiquement disponible de laboratoire Cambridge mais la

Upload: gata-hipogata

Post on 22-Nov-2014

467 views

Category:

Documents


1 download

DESCRIPTION

 

TRANSCRIPT

Page 1: Quantification histograme

ETAT DE L’ART : Les systèmes de reconnaissance facial

I - les systèmes développer a base des approches locales

1ere application :

Reconnaissance facial utilisant la différence d’intensité des pixels adjacents

{quantification d’histogramme} :

APIDQ : Adjacent Pixel Intensity Difference Quantization, histogram method

Pour assurée la reconnaissance facial en temps réel, cette méthode donne une haute

performance de taux de reconnaissance, le problème est que la quantification n’est pas

optimisé, en va d’abord se concentré sur la quantification de l’APIDQ basé sur le principe de

l’entropie maximal MEP et déterminer les meilleurs paramètres pour APDIQ

En outre l’algorithme de APIDQ utilise le dénombré d’histogramme du visage humain

comme vecteur de caractéristique pour identifier les personnes et les informations

d’emplacement du visage sont inutilisés il peut être considéré comme une approche de base

statistique simplifié, bien que la méthode APIDQ histogramme atteint au taux de haute

reconnaissance à l’aide de 400 images de 40 personnes, de la base de données AT& t

publiquement disponible de laboratoire Cambridge mais la capacité de classification est

diminue dans le cas d’une grande base de données de visage due a la manque d’informations

structurels du visage humain.

Afin d’améliorer la capacité de classification de l’APDIQ nous essayons d’ajouter des

informations structurel facial supplémentaire, en utilisant les informations de localisation

approximative de la partie du visage, le visage est divisée en 5 partie individuels [front, yeux,

nez ,bouche, mâchoire,] puis l’APDIQ s’applique sur chaque partie du visage le résultat de la

reconnaissance sont tout d’abord obtenue de différentes parties séparément puis combiner en

faisant la moyenne pondérée par l’intégration de l’information statistique et structurels, dans

ce qui suit nous allons présenté les différences d’intensité des pixels adjacents et nous

décrivons ensuite la méthode d’optimisation de la quantification selon le principe de lentropie

maximal

Page 2: Quantification histograme

L’APDIQ amélioré est une méthode basé sur l’histogramme et en proposera des informations

de localisation approximative des parties du visage, les résultats expérimentaux seront

abordées enfin les conclusions sont données

2- examen de l’intensité des pixels adjacent :

Quantification de la différence

La figure 1 : montre le traitement des pixels adjacent de différente intensité quantification

histogramme APDIQ un filtre passe bas est appliqué en utilisant une simple moyenne

variante 2D ce filtre est essentiel pour réduire la fréquence du bruit et l’extraction de la

plupart des composants de faibles fréquence pour la reconnaissance dans l’APDIQ pour

chaque pixel de chaque image d’entrée de différente intensité pour les pixels horizontalement

adjacent {dlx}, et la différence d’intensité pour les pixels verticalement adjacent {dly}, sont

premièrement calculé à l’aide de simple opérations de soustraction montrée :

Dlx(i,j) = I(i+1,j) – I(i,j)

Dly(i,j) = I(I, j+1) – I (i,j)

En change le system de coordonnées orthogonales aux coordonnées polaires l’angle «  θ » et

la distance « r » représentent la direction et le montant de la variation de l’intensité

Page 3: Quantification histograme

respectivement après avoir traiter tous les pixels de l’image d’entrée, les points représentes les

vecteurs sont distribué dans le plans (dlx, dly) tel qu’illustre la figure2

-La répartition des points [densité et forme] représentent la caractéristique de l’image d’entrée

-chaque vecteur de variation d’intensité est ensuite quantifié dans le plans r θ la table de la

quantification est montré dans la figure 3

Le numéro italique dans le tableau représente le numéro de chaque région de quantification

Les niveaux de quantification sont fixés à 8 en θ-axe et 8 en r-axe [totalement 50] depuis dlx

dly

Page 4: Quantification histograme

- les vecteurs sont concentrées dans petit-r (petit-dlx,-dly) regions

les étapes de quantification non uniforme sont appliqué dans r-axes, le nombre de

vecteur quantifié dans chaque région est compté et l’histogramme est généré cet

histogramme devient le vecteur de caractéristique du visage humain

- dans la phase d’inscription cet histogramme est sauvegarder dans une base de donnée

comme une information d’identification personnels, dans la phase de reconnaissance

l’histogramme est construit a partir d’une photo facial inconnue, et comparé

individuellement avec chaque histogramme enregistré et la meilleur correspondance

est sortie comme résultat de reconnaissance

la distance de Manhattan [MD] est utilisée comme une mesure correspondante entre

les histogrammes.les résultats expérimentaux montrent des taux de reconnaissance de

95 ,7% pour les 400 images de 40 personnes de la base AT& t contenant des variations

d’éclairage, de pose et d’expressions

3- optimisation de la quantification de la PDIQ :

L'essence de la méthode d'histogramme APDIQ peut être a estimé que l'opération détecte et quantifie la direction et la quantité de variation de l'intensité de la bloc de l'image. Si la quantification dans le plans rθ est très importante parce qu'elle conduit directement aux histogrammes différents.Mais comment déterminer le niveau de quantification n'est pas discuté. Bien que les résultats expérimentaux ont montré Méthode histogramme APDIQ avait acquis une reconnaissance forte performance. Il est encore difficile de dire une telle table de quantification est la plus appropriée parce que la quantification n'est pas optimisé et dans d'autres cas, les résultats doivent être examinées.Dans cette section, la maximisation de la théorie des informations entropie est utilisée comme un critère de conception.Lorsque la probabilité qu'un vecteur appartient à un certains bin(b1,b2 ,……….,bv) est notée à P(B1=b1, B2=b2,…..,Bv=bv) ou plus simple à partir P(b1,b2,……..,bv)

L’entropie de l'histogramme E peut être définie comme :

Si P(b1,b2,………….,bv) vient d'être égale probabilité direction b1,b2,…….bv l'entropie de l'histogramme E Obtient la valeur maximale selon le maximum principe de l'entropie.

Page 5: Quantification histograme

La performance de reconnaissance devrait être mieux parce que le contenu de l'information moyen sera maximale à ce stade. En outre, si nous supposons que les bacs de vecteur sont indépendantes entre elles, nous pouvez obtenir la formule suivante :

P(b1,b2,…… ;bv)= P(B1=b1)P(B2=b2)………..P(Bv=bv)

Afin de voir l'information moyenne contenue de la Histogramme sera maximisée lorsque P(Bj=bj) est constante {probabilité égal} vers tous bj ici (j=1,2,……., v)Notre stratégie de la détermination des niveaux de la quantification est que d'abord nous sous-échantillons les vecteurs, puis décider de la limite des bacs afin de faire la même choseQuantité de vecteurs appartenant à différents emplacements.

4- Méthode de division de la région Méthode histogramme APDIQ utilise uniquement le nombre d’histogramme comme des informations fonctionnelles pour identifier les personnes et les informations d'emplacement du visage n'ont jamais servi. En ne peut pas alors savoir quelle région de la partie du visage lui correspondant ce vecteur point. Si nous pouvions combiner des caractéristiques de l’histogramme et renseignements sur l'emplacement du visage , les fonctionnalités intégrées du visage serons plus robustes et efficace.

Basé sur cette idée, nous avons développé notre algorithme à une méthode histogramme d'APDIQ-division de la région (RD). Selon les coordonnées de deux yeux, qui sont obtenu par une autre méthode de localisation oculaire, inclination révision et taille de processus d'échelle, se font À normaliser le visage.

Puis la zone du surface totale est divisé en 5 partie ichnologies parties du visage (front, yeux, nez, bouche, mâchoire) avec respect des tailles, Et l’histogramme de chaque région du visage Sont généré par APDIQ opération respectivement. L’histogramme crée De chaque région faciale est par rapport a histogrammes De La même région faciale dans la BDD par le calcul de distances(d) entre eux (comme illustre la formule (5)). Puis les distances intégrés (D) sont comme indiqué dans la formule (4), obtenu en faisant la moyenne pondérée.

front, yeux , bouche, mâchoire, nez (4)

(5)

Ou le wi est e coefficient de la région faciale

sont les fréquences de dlx, dly

Page 6: Quantification histograme

Vecteurs appartenant à une région du visage d'une image d'entrée et qui appartiennent à la même région du visage d'images enregistré dans la base de données, respectivement. La meilleure correspondance est en recherchant le minimum distance de sortie comme le résultat de reconnaissance intégré.

Figure4 : échantillons de la base de données AT & T Laboratoires Cambridge. 4O personnes avec 10 images faciales pour chacun, (pour un total de 400 images), avec variations dans les angles du visage, expressions faciales et conditions d'éclairage sont incluses dans la base de données. Chaque image a une résolution de 92 x 112.

5. Expériences et discussions5.1 Expériences pour l'optimisation de la quantification5.1.1 Les ensembles de données

La base de données accessible à la publique face d'AT & T Cambridge Laboratoires [13] est utilisée pour l'analyse et expériences de reconnaissance. Quarante personnes avec 10 du visage images chacun, (pour un total de 400 images), avec des variations dans le visage angles, les expressions faciales et les conditions d'éclairage sont inclus dans la base de données. Chaque image a une résolution de 92 x 112. Échantillons d'image typique de la Figure 4 montre la base de données AT & T Laboratoires Cambridge. Des 10 images pour chaque personne, cinq ont été choisis comme sonde images et les cinq autres ont été enregistrés comme album images. Expériences de reconnaissance ont été effectuées pour 252 (10C5) combinaisons de sonde-album à l'aide de la méthode de rotation

5.1.2 Étude de la structure de la quantification

Réf. [12] utilisé une table de quantification qui contient 50 emplacements dans leurs expériences de reconnaissance. Nous enquêterons sur les structures de toute quantification des vecteurs de variation d'intensité pour optimiser la quantification. Tout d'abord, le niveau de la quantification est fixé à seulement 1 de 0 à une valeur maximale 30 tant que le nombre de niveaux de quantification dans Θ-axe est fixé à 8

(Totalement 241), et ensuite le nombre de vecteurs quantifié en chaque région de quantification est comptabilisée et un histogramme d'une image du visage est générée.

Page 7: Quantification histograme

Fig. 5 histogramme à une moyenne de 400 images. Niveaux de quantification sont fixés à 8

Dans Θ-axe et 1 au r-axe (totalement 241).

La figure 5 montre un histogramme moyen de tous les 400 images dans la base de données. Cet histogramme montre dIx-dly vecteurs sont concentrées dans les petites-r (petit-dIx, -dly) régions et la diminution dans les régions de la grande-r. Pour donnée une quantification de 8 niveau en r-axe, nous changeons la limite de bacs dynamiquement afin de faire la somme des vecteurs dans chaque bin à valeur égale, alors nous pouvons déterminer simplement la limite adaptative. Dans ce cas, nous obtenons les étapes de quantification de r = 1, 2, 3, 5, 7, 10, 30, tandis que les étapes originales sont1, 2, 4, 7, 12, 20, 30.

Fig. 6 Comparaison des résultats. Taux moyen de reconnaissance est montré ici.

La figure 6 montres la comparaison entre les résultats de la reconnaissance à l'aide de celui d'origine dans [12] et la nouvelle table de quantification qui contiennent le même nombre emplacements : 50.

Page 8: Quantification histograme

Taux de réussite de reconnaissance sont indiquées en fonction de la taille du filtre. Augmente au maximum le taux moyen de reconnaissance de 95,7 % à 96.29 %. On peut dire que la méthode d'optimisation est efficace.

Figure 7 comparaisons des résultats en différents nombre total d'emplacements. Le nombre de niveaux de quantification dans Θ-axe est fixé à 8.

Fig. 8 Comparaison des résultats à différents niveaux de l'axe de l'angle. Le nombre de niveaux de quantification dans r-axe est fixé à 8.

5.1.3 La variation du nombre de bacsDans la section 5.1.2, nous avons ne discuté que le cas que ou nous Supposons que plusieurs meilleurs emplacements est 50. Il est nécessaire de Choisissez un nombre convenable de bacs. Comme le nombre de bacs augmente la résolution de l'histogramme, peut-être le devenir si

Page 9: Quantification histograme

Sensibles que vecteurs corrompu de bruit peuvent significativement déformer l'histogramme. Au contraire, si le nombre de bacs est trop petit, l'histogramme ne peut pas suffisamment distinguer les visages différents. Dans cette section, nous discuterons uniquement les cas ou le nombre de niveaux de quantification dans Θ-axe est fixé à 8.Nous changeons le nombre de niveaux de quantification dans r- axe pour 5, 6, 7, 8, 9 et 30 où nombre de bacs sont 26, 34, 42, 50, 58 et 234, respectivement. La valeur maximale principe de l'entropie est également appliqué à la quantification de générer des histogrammes, et ensuite les performances de la reconnaissance est évalué.La figure 7 montres la comparaison entre les résultats de la reconnaissance à l'aide de tables de quantification différentes niveau de quantification dans Θ-axe est fixé à 8. Le plus haut taux moyen de reconnaissance obtenus dans chaque numéro de bacs sont indiqués ici. La meilleure performance est obtenue au nombre des 58 (ici r = 9). Maximum de la moyennetaux de reconnaissance 96.46 % est atteint.

5.1.4 La variation des niveaux de l'axe de l'angleLa discussion dans la dernière section suppose que le nombre de niveaux de quantification dans Θ-axe de 8 est le meilleur choix. Nous envisagent aussi l'effet de la quantification dans Θ- axe. A cette époque, le nombre de niveaux de quantification dans r-axes est fixe à 8. Le nombre de Niveaux de quantification dans Θ- axe est modifié pour 2, 4, 8, 12, 16 et reconnaissance résultats sont présentés à la Figure 8. Les meilleures performances sontObtient le nombre de niveaux dans angle axe de 12.Le taux de reconnaissance moyen 96.71 % au maximum est atteint dans ce cas.

Fig. 9 comparaison du taux moyen de reconnaissance entre le nombre total de bacs 86 et 50.

5.1.5 Optimisation dans les deux Θ et r-axesSelon la méthode décrite ci-dessus, nous changeons le nombre de niveaux de quantification dans Θ-axe et dans l'axe de r.

Page 10: Quantification histograme

Nous trouvons la meilleure combinaison apparaissent dans les numéros de niveaux de quantification de 12 à Θ-axe et 9 r-axe (totalement 86). Figure 9 montres la comparaison entre les résultats de la reconnaissance à l'aide de celui d'origine dans [12] et le nouveau table de quantification qui contient le nombre de bacs de 86. Taux de réussite de reconnaissance sont indiquées en fonction du filtre taille. Augmente au maximum le taux moyen de reconnaissance de 95,7 à 97,2 %. On peut dire que l'optimisation méthode est très efficace.

Fig. 11 exemple d'histogrammes. Les histogrammes des personnes différentes sont clairement différents. Toutefois, les histogrammes de la même personne sont ressemblait, bien qu'il y a une petite différence dans le détail

5.2 Expériences pour la division de la région

Tel que discuté ci-dessus, basé sur l'entropie maximale principe (MEP), nous optimisons la quantification de l'APDIQ. Taux de réussite de la reconnaissance maximale moyenne de 97,2% est Lorsque le nombre de niveaux de quantification est définies sur12 po Θ-axe et 9 r-axe (totalement 86), qui est plus élevé que la méthode d'origine à l'aide de la table de quantification de 50.Nous utiliserons le tableau de la quantification de 86 dans ces dernières expériences.

5.2.1 Les ensembles de donnéesNous utilisons une base de données FERET accessible au public [14] pour expériences de reconnaissance, qui est l'un des plus connus bases de données et consiste en des images en niveaux de gris 8 bits 14051 avec taille 256 x 384 de têtes humaines avec des vues allant de frontal à profils droits et gauche. Le FERET base de données a été construit pour mettre au point visage automatique capacités de reconnaissance pouvant servir à aider les membres de l'ordre, sécurité et renseignement. Nous utiliser la tâche FB dans nos expériences. FB (déléguée) détient 1195 images, qui principalement d'évaluer l'effet sur le visage expression. Tous les tests utilisés une galerie unique contenant 1196 images. La figure 10 montre les échantillons image typique de la base de données FERET. Afin d'éviter l'influence de le œil

Page 11: Quantification histograme

précision de détection, nous utilisons les coordonnées des yeux fourni par base de données FERET pour mettre en œuvre de la région division (RD) opération dans notre expériences.Le total visage zone est divisé dans 5 régions de soin du visage pièces (front, yeux, nez, bouche, mâchoire) avec tailles de 146 x 65, 146 x 40, 146 x 30, 146 x 35, 146 x 30, respectivement.

Fig. 12 résultats de reconnaissance de méthode histogramme RD (à l'aide de FB tâche). Taux de reconnaissance Top1 86,8 % est obtenu par original APDIQ méthode histogramme appliqué à l'ensemble du visage. À l'aide de RD-APDIQ méthode histogramme avec le coefficient de pondération de 5 régions 1, 1, 0, 1, 1, le taux de reconnaissance top1 augmente à 97,6 %.

5.2.2 Résultats La figure 11 illustre des exemples typiques des histogrammes de régions du visage. Histogrammes de différentes personnes sont clairement différents. Toutefois, les histogrammes de la même personne sont ressemblait, bien qu'il y a une petite différence dans le détail. Il peut dire que l'histogramme est le personnel très efficace fonction discriminante personnes.La figure 12 illustre les résultats de la reconnaissance de FB a obtenu en utilisant la combinaison de méthode histogramme APDIQ et procédé de division de la région (RD) pour ajouter l'emplacement brut information. Nous obtenons le taux de reconnaissance top1 de 86,8 % en méthode d'histogramme APDIQ originale appliquée à l'ensemble zone du visage avec la taille de 146 x 200. À l'aide de RD-APDIQ

méthode histogramme avec le coefficient de pondération de 5 les régions 1, 1, 0, 1, 1, le taux de reconnaissance top1 augmente à 97,6 %, qui est un peu supérieur à un autre similaires approche en Réf. [17]. Fig. 12 montre également les résultats de à l'aide seule région faciale uniquement et ceux de l'utilisation de certains combinaisons. Il a été constaté par le courant des expériences qui Parmi les régions des parties du visage, les caractéristiques des yeux semble la partie la plus importante pour la reconnaissance des visages. Comparés aux résultats des autres groupes de recherche qui Utilise la même tâche de la base de données FERET, la

Page 12: Quantification histograme

top1 taux de reconnaissance de 97,6 % atteint est le top des résultats des groupes entiers de recherche tel qu'illustré à la Figure 13. Il ne peut dire que la méthode d'histogramme RD-APDIQ est un très algorithme de reconnaissance de visage fiable.

Fig. 12 résultats de reconnaissance de méthode histogramme RD (à l'aide de FB tâche). Taux de reconnaissance Top1 86,8 % est obtenu par original APDIQ méthode histogramme appliqué à l'ensemble du visage. À l'aide de RD-APDIQ méthode histogramme avec le coefficient de pondération de 5 régions 1, 1, 0, 1, 1, le taux de reconnaissance top1 augmente à 97,6 %.

Notez que le filtre passe-bas est effectuée avant la région- opération de division à l'aide d'une moyenne mobile simple de 2-D filtre. Taux de réussite de reconnaissance varient en fonction du filtre taille. Est le plus haut taux de reconnaissance top1 de 97,6 % Obtient la taille de filtre de 13 x 13. Filtre passe-bas est efficace pour éliminer la composante de bruit et l'extraction composante de fréquence importante de reconnaissance. Par application du filtre passe-bas, détaillé les traits du visage tels que les rides et coiffure local, qui sont facilement variant en fonction de subtiles expressions du visage, l'image en prenant les conditions et les laps de temps et nuire aux performances de la reconnaissance, sont exclus. Seulement le visage personnel important de fonctionnalités telles comme le piteux état des parties du visage peut être extraites. Algorithme de reconnaissance a été programmé en C ANSI et a été exécuté sur un PC classique @ 3.2 GHz (1 G mémoire). Temps de traitement d'image unique dans FERET base de données est d'environ 95 msec, qui se compose de 50 msec pour le prétraitement, y compris l'inclinaison-révision et sizes caling et filtrage processus, 20 msec pour bloc Division, et soustraction de l'intensité minimale, APDIQ processing and 25 MS pour la base de données correspondant à l'aide d'un gallery containing 1196 images.

6. ConclusionsNous avons développé un visage très simple mais très fiable méthode de reconnaissance appelée APDIQ histogramme application de traitement de l'APDIQ. Basé sur la valeur maximale principe de l'entropie (MEP), nous optimisons la quantification dansAPDIQ en changeant alors dynamiquement la limite des emplacements quant à faire la somme des vecteurs dans chaque bac d'égalité valeur et puis nous pouvons simplement déterminer l'adaptation limite. Taux de réussite de la reconnaissance maximale moyenne de97,2 % est atteint lorsque les niveaux de quantification sont fixés à 12 enΘ-axe et 9 r-axe (totalement 86), qui est plus élevé que le méthode originale à l'aide de la table de la quantification des 50 Combinés par des informations de localisation approximative de l'éjaculation faciale pièces et APDIQ histogramme méthode, excellent performances de la reconnaissance de visage ont été vérifiée à l'aide Base de données de Féret. Les résultats expérimentaux montrent top1 taux de reconnaissance de 97,6 % en tâche FB. Cette division de la région Méthode histogramme APDIQ avérée très efficace et robuste

Page 13: Quantification histograme

pour extraire les caractéristiques locales du visage.