optimisation par colonies de fourmis pour le e-learning : optimisation de parcours pédagogiques...

Post on 03-Apr-2015

113 Views

Category:

Documents

2 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Optimisation par Colonies de Fourmis pour le E-Learning : optimisation de parcours pédagogiques

Yann SEMETProjet Fractales, INRIA Rocquencourt

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 2

Itinéraire Le site Paraschool Problème et solution Détails algorithmiques Procédures de sélection Simulations et tests réels Perspectives

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 3

Le site Paraschool

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 4

Le site Paraschool

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 5

Le site Paraschool

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 6

Le site Paraschool

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 7

Le site Paraschool

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 8

Optimisation par Colonies de Fourmis (A CO) Paradigme inspiré des colonies

d’insectes sociaux Agents multiples et simples Balance information stigmergique

et heuristique locale Solution « émergente » Efficace, souple, facile à écrire

(métaphore des agents)

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 9

Un exemple

1

2

3

4Nid Source

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 10

Fourmis et voyageurs de commerce (ACO&TSP)

Application classique Excellents résultats obtenus par

méthodes hybrides

kJlilil

ijijkij

d

dp

i

l1

j

ln

lk

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 11

Modèle : graphe pédagogique

1

2

3

5

4 6

7

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 12

W : structure pédagogique

1

2

3

« Produit d’un vecteur par un réel »

« Vecteurs colinéaires »

« Alignement, parallélisme et vecteurs »

W=5

W=1

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 13

W : structure pédagogique

1

2

3

5

4 6

7

1

5

0.1

10

11

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 14

Un problème d’optimisation Maximiser : succès pédagogique Trouver la bonne valuation Contraintes :

Pédagogiques Facteurs individuels Facteurs collectifs

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 15

Fourmis & Phéromones

Communication stigmergique 2 types de phéromone : S et F

Dépôt : mémoire Rétro-propagation : portée

pédagogique Évaporation : dynamisme

Pour une valuation plus pertinente

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 16

Rétro-propagation : Succès

1

2

3

5

4 6

7

31

41

21 1

WS+=1

F

WS+=1/2F

WS+=1/3F

WS+=1/4F

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 17

Rétro-propagation : Échec

1

2

3

5

4 6

7

32

42

22 2

WSF+=2

WSF +=2/2

WSF +=2/2

WSF +=2/2

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 18

S/F : évaporation

: taux d’évaporation ; x=t Portée pédagogique temporelle Exploration dynamique Adaptabilité

1 tx

t SS

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 19

Mémoire individuelle : H Un 1er facteur individuel Modèle de la mémoire volatile Une valeur par nœud et par étudiant Application de NxI dans R Nœud non visité : H=1 Nœud réussi : H=0.5 Nœud raté : H=0.75

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 20

H : anti-évaporation

=constante de temps ; x=t H revient naturellement vers 1

x

x

t

ttt e

e

H

HHH

1

111

1

11

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 21

Une mesure de fitness

Mesure unifiée d’excellence locale Mesure la « désirabilité » des arcs

FSWinHiaf FSWHnn ),(),( 221

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 22

Désirabilité des arcs Balance heuristique

locale/information stigmergique. Cf TSP

Un arc est désirable lorsqu’il est : renforcé les professeurs (W élevé) témoin de succès (S élevé) non témoin d’échecs (F bas) nouveau ou oublié (H proche de 1)

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 23

Sélection d’arcs Sélection d’un arc à proposer

parmi les arcs sortants Deux forces :

Fitness (exploitation) Hasard (exploration)

Balance réglable : s

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 24

Procédures implémentées

Roulette Sélection par le rang : seuils

automatiques et manuels Tournoi Tournoi stochastique

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 25

Tests : Simulations

Une population d’étudiants : G(0.5,1/3)

A chaque étudiant i son niveau A chaque nœud sa difficulté :

0.0<d<1.0 Si niveau(i)>d succès, sinon échec

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 26

Un test élémentaire

1

2

3

5

W=1

W=5

Taux de succès :

90% si n-1=2

10% si n-1=3

Objectif : rétablir la situation, encourager 2

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 27

Comportements

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 28

Courbes de calibrage

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 29

Application réelle En cours ! Mode silencieux Observations préliminaires

encourageantes : Faisabilité technique Structuration autonome du graphe Émergence de nœuds singuliers

Travail à venir

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 30

Résumé, Perspectives

L’E-Learning comme un problème d’optimisation

Un nouveau champ d’applications pour l’intelligence en essaim

Une nouvelle façon de faire du design évolutionnaire interactif

MERCI !

« Ant Colony Optimisation for E-Learning : Observing the Emergence of Pedagogic Suggestions »

Y.Semet, Y. Jamont, R. Biojout, E. Lutton, P. Collet-

Projet Fractales, INRIA RocquencourtUniversité de Technologie de Compiègne

-

Yann.Semet@tremplin-utc.net

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 32

Annexes

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 33

H : calibrage de

Oublier un exercice : H va de 0.5 à 0.9

Oublier prend 1 semaine (x=604800s)

=3.6E-6

)1

1ln(1

x

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 34

La roulette

E=nœuds accessibles depuis ni

Probabilité proportionnelle au fitness Automatique mais pas réglable Sensible, parfois trop

Ennn

nn

nn

k

ki

ji

ji af

afap

)(

)()(

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 35

Sélection par le rang I

Probabilité de sélection inversement proportionnelle au rang

Réduction automatique des écarts Non réglable Peut être insuffisamment subtil

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 36

Sélection par le rang II

Probabilités attribuées manuellement pour chaque rang

Complètement paramétrable Lourd

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 37

Sélection par tournoi

S1 arcs sortants tirés au hasard Le meilleur est choisi 1 paramètre de contrôle

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 38

Tournoi stochastique On choisit d’abord le pire arc S1 « challengers » sont essayés

l’un après l’autre Si plus fort, le « challenger »

remplace son prédécesseur avec une probabilité s2

2 paramètres de contrôle

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 39

Prolongements Nouveaux facteurs individuels

(agenda, excellence, etc.) Nouveaux facteurs collectifs (e.g.

coupe de re-médiation) Observation avant tout

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 40

Facteurs clés

Écoute de l’équipe pédagogique Écoute des élèves Davantage que l’optimisation

computationelle

"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 41

Résumé Un problème d’optimisation : chercher

la bonne valuation des arcs d’un graphe de navigation pédagogique

Solution proposée : agents, communication stigmergique, sélection semi-aléatoire

Éléments de calibrage Premières observations

encourageantes

top related