laboratoire 4 développement d’un système intelligent

17
Laboratoire 4 Développement d’un système intelligent DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI GTI770 - SYSTÈMES INTELLIGENTS ET APPRENTISSAGE MACHINE ÉTÉ 2014 Enseignant : Patrice Boucher Chargés de laboratoire : Faten M’hiri

Upload: manchu

Post on 27-Jan-2016

64 views

Category:

Documents


0 download

DESCRIPTION

DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI GTI770 - SYSTÈMES INTELLIGENTS ET APPRENTISSAGE MACHINE ÉTÉ 2014. Laboratoire 4 Développement d’un système intelligent. Enseignant : Patrice Boucher Chargés de laboratoire : Faten M’ hiri. Objectif. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Laboratoire  4 Développement d’un système intelligent

Laboratoire 4 Développement d’un système intelligent

DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI GTI770 - SYSTÈMES INTELLIGENTS ET APPRENTISSAGE MACHINE

ÉTÉ 2014

Enseignant :

Patrice Boucher

Chargés de laboratoire :

Faten M’hiri

Page 2: Laboratoire  4 Développement d’un système intelligent

Objectif

Développement d’un système intelligent pour:

• Reconnaissance faciale

OU• Filtrage de pourriels

Page 3: Laboratoire  4 Développement d’un système intelligent

Projet 1 : La reconnaissance faciale

• Objectif: Reconnaitre une personne parmi K individus à partir de sa photo.

• Problème de classification à K classes

Source : http://www.doc.ic.ac.uk/~sl203/?id=9

Page 4: Laboratoire  4 Développement d’un système intelligent

Projet 1 : La reconnaissance faciale

• Algorithmes suggérés:• Eigenfaces,• Fisherfaces,• Les machines à vecteurs de support (SVM),• Les réseaux de neurones.

Page 5: Laboratoire  4 Développement d’un système intelligent

Eigenfaces

Source: http://vision.stanford.edu/teaching/cs231a/lecture/lecture2_face_recognition_cs231a.pdf

Images d’apprentissage Eigenfaces

Page 6: Laboratoire  4 Développement d’un système intelligent

Support Vector MachineSVM

Source : http://www.cs.columbia.edu/~kathy/cs4701/documents/jason_svm_tutorial.pdf

Page 7: Laboratoire  4 Développement d’un système intelligent

Réseaux de neuronesNN

Source: Artificial Neural Network-Based Face Recognition, Boukelif & Adjoudj, 2004

Page 8: Laboratoire  4 Développement d’un système intelligent

Projet 1 : La reconnaissance faciale

• Données:• Faces-dataset.zip :

• Dossier train:• 40 dossier (donc nombre de classes = 40):

• 1 dossier pour chaque individu : 9 images

• Dossier test:• 40 images de chaque individu

• Format des images : PNG

Page 9: Laboratoire  4 Développement d’un système intelligent

Projet 2 : Le filtrage de pourriels

• Objectif: Identifier les courriels non sollicités (spam) à partir d’un ensemble de courriel.

• Problème de classification binaire: spam et non-spam.

Source: http://ploum.net/post/89-the-ploum-s-ultimate-anti-spam-solution

Page 10: Laboratoire  4 Développement d’un système intelligent

Projet 2 : Le filtrage de pourriels

• Algorithmes suggérés:• Classifieur naïf de Bayes,• Latent semantic indexing (LSI),• Les arbres de décisions,• Les machines à vecteurs de support (SVM),• Les réseaux de neurones.

Page 11: Laboratoire  4 Développement d’un système intelligent

Latent Semantic Indexing

• Faites une recherche google pour : ~tutorial

Google a désactivée cette option depuis un an (http://searchenginewatch.com/article/2277383/Google-Kills-Tilde-Search-Operator)

Page 12: Laboratoire  4 Développement d’un système intelligent

Arbre de décision

Source : http://aqualonne.free.fr/Teaching/csc/DM.pdf

Page 13: Laboratoire  4 Développement d’un système intelligent

Projet 2 : Le filtrage de pourriels

• Données: Prétraitées avec seulement les mots les plus pertinents dans les documents.• Spam-dataset.zip:

• Train.txt : • 1 ligne représente 1 document:

0,0,0,0,0.32,0.32,0,0,0,0,0,0.32,0,0,0,0,0,0,1.3,0,0.98,0,0,0,0,0,0,0,0.32,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0.65,0,0,0,0,0,0.257,0,0,0,0,1.3,7,104,0

• Test.txt: même format que train

Voir les fichier README.txt et name.txt pour plus de détails

La fréquence calculée freq(w) des 48 mots significatifs

La fréquence calculée freq(c) des 6 caractères significatifs

La longueur moyenne des séquences ininterrompues de lettres majuscules La longueur de la plus longue séquence

ininterrompue de lettres majusculesLe nombre total de lettres majuscules

1 valeur binaire indiquant si le courriel est un pourriel (1) ou non (0)

Page 14: Laboratoire  4 Développement d’un système intelligent

Travail à réaliser

1. Conception de la méthode: comprenant• Une courte revue de la littérature,• Analyse de données : types d’attributs, distributions des

exemples,etc.• Sélection d’un algorithme,• Définition du modèle et ses paramètres,• Définition de l’approche de validation.

• Remettre le rapport de conception (3-4 pages maximum) décrivant la conception et la justification de vos choix : à remettre dimanche le 13 juillet 2014 à 18h.

Page 15: Laboratoire  4 Développement d’un système intelligent

Travail à réaliser (2)

2. Implémentation de la méthode:• Le langage de votre choix,• Possibilité d’utiliser le logiciel/la librairie de votre

choix (ex: weka).• NOTE: Il est interdit d’utiliser tout logiciel

implémentant la totalité de votre projet.• Pas de correction interactive pour ce laboratoire :

votre code source doit contenir un fichier README.txt décrivant les étapes à suivre pour exécuter votre travail.

Page 16: Laboratoire  4 Développement d’un système intelligent

Travail à réaliser (3)

3. Validation de la méthode: • Les données d’entrainement : pour la sélection et

l’apprentissage des paramètres,• Les données de tests serviront à évaluer le travail

de chacun,• Décrire les résultats obtenus.

Remettre le rapport final du laboratoire 4 : concentré uniquement sur les parties

implémentation et résultats (vous n'avez pas à fournir la partie conception de nouveau)

Page 17: Laboratoire  4 Développement d’un système intelligent

Remise

• À remettre:– Code source – Rapport (voir l’énoncé et le gabarit)

• Date de remise:– Le 8 Août 2014 à 8h am

• Note: – Voir l’énoncé pour les consignes de la remise