introduction à lintelligence artificielle 2007 – khaled hadj hamou, samuel bassetto
TRANSCRIPT
![Page 1: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/1.jpg)
Introduction à l’Intelligence Artificielle
2007 – Khaled Hadj Hamou, Samuel Bassetto
![Page 2: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/2.jpg)
L’I.A. ça n’est pas…
• Ingénieur Adjoint
• MATRIX
• I.A.
• Les temps modernes
![Page 3: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/3.jpg)
L’I.A c’est plutôt…
• Démarche cognitive assistée par ordinateur
• Donner à une machine des moyens habituellement réservées à des êtres vivants: perception, raisonnement, décision, apprentissage, action
http://www.symbio.jst.go.jp/PINO/OpenPINO/open_pino.html
![Page 4: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/4.jpg)
historique
• Antiquitié à 1954, une émergence des machines « intelligentes »
• 1954: congrès à Darmouth, USA, Mc Carthy, Minsky, Shannon, Newell, Simon => programmes doués d’intelligence
• Quelques noms célèbres:– Babbage (machine à calculer, 1842)– Turing (machine universelle, 1936)... (apple)– Wiener ( cybernétique, 1943)– McCulloch & Pitt, Sutton, Barto, Haton,…
![Page 5: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/5.jpg)
Des applications de l’I.A.
• Démonstration de théorèmes• Traitement Automatique du Langage Naturel• Traitement Automatique de la Parole• Interprétation d’images & vision• Robotique• Jeux• Systèmes d’aide à la décision (SE, SbC,
classification, discrimination)
![Page 6: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/6.jpg)
Plan
• Introduction• Le raisonnement• L’apprentissage
• Quelques outils– SE– RN– DL– SMA– SàBdCas– SàBdContraintes
![Page 7: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/7.jpg)
Introduction
• 4 processus de définition d’un système intelligent:– Search : résolution de problèmes – recherche
d’une solution dans un espace de solutions– Pattern Matching : reconnaissance de formes– Inferencing or reasoning : raisonnement– Knowledge representation : représentation des
connaissances
![Page 8: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/8.jpg)
Introduction
Processus de traitement symbolique
Reconnaissance de formes
inférence Représentation
des connaissances
Résolution
de pbs
IHMExplications
Reconnaissance vocale
ApprentissageAcquisition des
données
Reconnaissance visuelle
![Page 9: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/9.jpg)
Introduction
• Deux approches aux développements– Réaliser un esprit
• I.A. symbolique, systèmes à bases de connaissances
– Modéliser le vivant• I.A. connexionniste• Mc Culloch & Pitt• Rosenblatt
![Page 10: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/10.jpg)
Plan
• Introduction• Le raisonnement• L’apprentissage
• Quelques outils– SE– RN– DL– SMA– SàBdCas– SàBdContraintes
![Page 11: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/11.jpg)
Le raisonnement
• La résolution de problèmesP = {Initial, Opérateurs, Buts}
– Méthodes d’exploration des arbres
En p
rofo
ndeurEn largeur
![Page 12: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/12.jpg)
Le raisonnement
• Pb : l’arbre peut être un peu grand – 1KAn pour la résolution d’un problème d’échec– Nécessiter d’adopter des Stratégies de parcours de
l’arbre
• Pb: nécessité de formaliser COMPLETEMENT le pb (temps non négligeable)
Classe de problèmes formalisables et difficiles pour l’homme (ex: les lois, le diagnostique médical, automobile…)
![Page 13: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/13.jpg)
Le raisonnement
• Ex trivial:
A
B
CB
C
A
ButI{O}
?
![Page 14: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/14.jpg)
Le raisonnement
B
C
A
B
CA
B
C
A
B
C
A
BC
A
B
C
A
B
C
A
11 21
1222
2313 14
• 1 voie: 4 pas• 2 voie: 3 pas• + long si on passe passe
en revue toutes les combinaisons d’empilage et dépilage
![Page 15: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/15.jpg)
Le raisonnement
• Raisonnement itératif:– À partir de I– Branche (i)– Appliquer les opérations x fois => B est
atteint ? Sinon, on remonte à I et on passe à la branche (i+1)
…
• Utilisation de connaissances « d’experts » sur l’arborescence méthodes heuristiques
![Page 16: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/16.jpg)
Le raisonnement
• Représentation des connaissances:
• Connaissance est qualifiée (superficielle, profonde, spécifique, incertaine, précise, complète, incomplète…)
• Heuristique: confiance accordée à une connaissance
CONFIANCE? K ?
![Page 17: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/17.jpg)
Le raisonnement
• Les formules logiques– Logique des propositions: une proposition
syntaxiquement vraie ou fausseEx: VIN(Bordeaux) = VRAI ; VIN(Clio)=FAUX
Vin() Prédicat ; Bordeaux, Clio Argument
Assertion Assertion
![Page 18: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/18.jpg)
Le raisonnement
• Les formules logiques– Les prédicats peuvent avoirs plusieurs arguments
Modèle(Couleur, Voiture)– Liens entre les prédicats
• Négation ¬• Et ^• Ou v
– Implication =>– Equivalence – Une formule bien formée permet de
représenter un fragment de connaissance
![Page 19: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/19.jpg)
Le raisonnement
• Insuffisance des formules des propositions– Représenter que toutes les voitures ont un moyen de
propulsion… (on ne va pas énumérer chaque voiture)
• Logique des prédicats du 1er ordre (quantification des variables)– Même opérateurs que la logique des
propositions– Ajout d’une quantification des variables par les
opérateurs :∀ (quelque soit) et ∃ (il existe)Ex: ∀y Q(y) signifie Quelque soit y du domaine,
Q(y) est Vrai.
![Page 20: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/20.jpg)
Le raisonnement
• « Modus Ponens »P et P=>Q, permet de dériver Q
• « Modus Tollens »¬Q et P=>Q, permet de dériver ¬P
• Formule de Skolem: toute formule bien posée peut être transformée en un ensemble de clauses (écriture de la formule par des disjonctions)
Ex: (∀x) (ENSGI(x) => Classepreparatoires(x) v CPP(x)) (∀x) (¬ ENSGI(x) v Classepreparatoire(x) v CPP(x))
• P• ¬P NIL
![Page 21: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/21.jpg)
Le raisonnement
• Les limitations des raisonnements logiques du 1er ordre:– Nécessité de formaliser complètement le pb.– Pas d’appréciations nuancées
• Existances d’autres logiques:– Multivaluées (Valeur de vérité > 2)– Modales (modalités d’implication (possible,
peut être…))– Floue– Non monotones (une assertion vraie à un
instant, ne le sera plus à l’instant suivant)– De description (description de concepts)
![Page 22: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/22.jpg)
Le raisonnement
• Les réseaux sémantiques– Permet de décrire des concepts, faire
des liens (relations entre les concepts et les individus)
– Raisonner sur des réseaux sémantiques Modéliser le pb par un réseau
• Pb: trouver le mécanisme de mise en correspondance structurelle
![Page 23: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/23.jpg)
Le raisonnement
• Les réseaux sémantiques
![Page 24: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/24.jpg)
Le raisonnement
• Une règle de production:“parcelle de connaissance”
SI prémisses ALORS conclusion (coefficient)
Si les prémisses sont vrais alors, la règle s’applique et la conclusion est vrai
Base des systèmes experts
![Page 25: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/25.jpg)
Le raisonnement
• Les systèmes à base de règle
Base de faits
Base de règles
Moteur d’Inférence
![Page 26: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/26.jpg)
Le raisonnement
• Le raisonnement : chaînage avant– Guidé par les données, il envisage les règles
dans le sens conditions =>conclusions– Détection des règles don’t la partie “prémisses”
est vérifiée par la base de faits– Sélection d’une règle parmi les candidats
(résolution de conflits choix d’une branche de l’arbre)
– Application de la règle, les prémisses disparaîssent de la base de faits et les conclusions viennent l’enrichir
![Page 27: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/27.jpg)
Le raisonnement
• Le raisonnement : chaînage arrière– Raisonnement guidé par un but, il utilise les règles
dans le sens conclusions->conditions : réduction du problème
1. Détection des règles qui concluent sur le but recherché
2. Sélection de la règle à envisager3. Application de cette règle et à considérer les
prémisses comme de nouveaux sous buts à atteindres. S’ils sont déjà présent dans la BF, le travail est fait, sinon, ils sont empilés dans la pile des buts
![Page 28: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/28.jpg)
Plan
• Introduction• Le raisonnement• L’apprentissage
• Quelques outils– SE– RN– DL– SMA– SàBdCas– SàBdContraintes
![Page 29: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/29.jpg)
Apprentissage
• L’apprentissage et la mémoire• La mémoire: processus de stokage et
d’exploitation d’une connaissance antérieurement acquise
• Processus de mémorisation en 4 étapes:– Information– Acquisition– Stockage– Exploitation
![Page 30: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/30.jpg)
Apprentissage
• Les différents types de mémoires
mémoire
Mémoire déclarative
Mémoire non
déclarative
Faits (sémantique
)Evènements (épisodique)
Aptitudes procédurale
sConditionnement
Apprentissage non associatif
Apprentissage perceptif
Savoir Quoi
Savoir
Comment
![Page 31: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/31.jpg)
Apprentissage
• Les différents types de mémoires:– A chaque mémoire, son mode
d’apprentissage– Ex:…– Apport des neurosciences => Classification
et caractérisation des mémoires• Chez l’homme, l’empan mnésique est de 10E5
signes ! (=> la mémoire visuelle n’existe pas !)• Etat actuel de la science, rien ne dit qu’il n’y a pas
d’autres types de mémoires
![Page 32: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/32.jpg)
Apprentissage
• L’accès aux mémoires:– Par adresse/ contenu– Accès séquentiel/parallèle– Représentation statique/dynamique– Représentation localisée/distribuée
![Page 33: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/33.jpg)
Apprentissage
• L’apprentissage statistique:– Classification– Discrimination– Catégorisation– Régression
• Différents types d’apprentissage:– Supervisé– Non supervisé– Par renforcement (semi-supervisé)
![Page 34: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/34.jpg)
Apprentissage
• La notion d’agent: un agent est une entité qui perçoit son environnement à travers des capteurs et qui agit sur son environnement par des effecteurs. (capteurs et effecteurs peuvent être logiciels…)
• Les perceptions servent à agir mais également à apprendre
• L’agent apprend une correspondance entre les perceptions et les actions en évaluant et maximisant ses performances (renforcement) fournie par l’environnement
• Il peut y avoir un décalage entre l’action et le signal de l’environnement
![Page 35: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/35.jpg)
Apprentissage
• Passer de D à F en suivant les actions {Droite, Gauche, Haut, Bas}, en utilisant les perceptions {x,y,recomp} où recomp=0 si (x,y)=(xf,yf),sinon recomp=-1, si (x,y) = mur => recomp = -10
D
F
![Page 36: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/36.jpg)
Apprentissage
• L’apprentissage par renforcement, un modèle d’agent
is
Environnement
actionEtat
récompenseAgent
1ia
1ir
![Page 37: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/37.jpg)
Apprentissage
L’apprentissage par renforcement : • S: ensemble des états• A: ensemble des actions
...... 1210
1
1
0
0
t
a
t
aa
ssssst
rtrr
![Page 38: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/38.jpg)
Apprentissage
L’apprentissage par renforcement : • Hypothèse de markov : la probabilité de passer
de l’état s à l’état s’ par l’action a dépend seulement de s et de a, pas des états précédents.
),'(),...,,,,'( 100111 aasssspasasaassssp tttttttt
![Page 39: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/39.jpg)
Apprentissage
L’apprentissage par renforcement : • Fonction objectif à maximiser, γ ds [0,1],
fonction de rabais, pour tenir compte des récompenses passées et orienter le cheminement.
014
33
221 ...
kkt
kttttt rrrrrR
![Page 40: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/40.jpg)
Apprentissage
L’apprentissage par renforcement : - cas stationnaire
![Page 41: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/41.jpg)
Apprentissage
L’apprentissage par renforcement : • Fonction de valeur d’un état s sous une
politique π, l’objectif est de trouver π qui maximise cette fonction
![Page 42: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/42.jpg)
Apprentissage
L’apprentissage par renforcement : • Fonction de valeur d’une action a, d’un état s
sous une politique π, l’objectif est de trouver π qui maximise cette fonction
![Page 43: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/43.jpg)
Apprentissage
• L’apprentissage par renforcement
– Conflit principal: exploration vs exploitation d’un résultat (différent de l’apprentissage supervisé où la récompense est immédiate)
– Notations:S: ensemble fini d’étatsA: ensemble fini d’actionsΠ est la politique qui associé à
un état, une action à réaliser, elle est probabiliste
SV
sAS
ssaassrEr
ssatactionssT
ttttass
ttass
:
)(/:
',,/
,)(/'
11'
1'
Action a effectuer quand l’agent est à
s
Espérance des récompenses
cumulées
Notations:
![Page 44: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/44.jpg)
Apprentissage
L’apprentissage par renforcement : • Equation de Bellman pour l’apprentissage
![Page 45: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/45.jpg)
Apprentissage
• Problème: quelle action a mener à un instant t ?
)(* aQValeur estimée de Q*(a) à l’instant t)(aQt
Moyenne réelle de la récompense consécutive à a
![Page 46: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/46.jpg)
Apprentissage
• Problème: quelle action a mener à un instant t ?– Greedy response => action choisie /
– Méthode excluant l’exploration des actions possibles, or la somme des optimums n’est pas forcément l’optimum des actions
Aatt aQa
))(max(arg*
![Page 47: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/47.jpg)
Apprentissage
• Problème: quelle action a mener à un instant t ?– ε-Greedy response => action choisie /
– ε->0 : méthode greedy, ε->1 : exploration pure
paRandom
paQaAa
tt
),(
)1(,))(max(arg*
![Page 48: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/48.jpg)
Apprentissage
• Problème: quelle action a mener à un instant t ?– Greedy response => action choisie /
– ε-Greedy response
)(* aQValeur estimée de Q*(a) à l’instant t)(aQt
Moyenne réelle de la récompense consécutive à a
Aatt aQa
))(max(arg*
![Page 49: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/49.jpg)
Apprentissage
• Classification : mise en évidence des relations entre des objets et entre des objets et leurs paramètres.
• Discrimination : processus de classement, recherche de séparations entre des classes existantes.
• Notion de distances, de similarités.• Objectif : produire une partition homogène de
l’ensemble des objets
![Page 50: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/50.jpg)
Plan
• Introduction• Le raisonnement• L’apprentissage
• Quelques outils– SE– RN– DL– SMA– SàBdCas– SàBdContraintes
![Page 51: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/51.jpg)
Les outils techniques
• Les réseaux de neurones
Du neurone biologique au neurone formel
![Page 52: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/52.jpg)
Les outils techniques
• Les réseaux de neurones
Du neurone biologique au neurone formeldendrite
axone
+
Seuillage
Sommation
![Page 53: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/53.jpg)
Les outils techniques
• Les réseaux de neurones
Du neurone biologique au neurone formele1
Ei
en
Si
0
,,1)(
ValeurEsiEfS
ewE
iii
jjiji
![Page 54: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/54.jpg)
Les outils techniques
• Les réseaux de neurones– Les connexions entre les neurones sont de tous
types– La plus utilisée, la structure en couches.
1 2 3 4 5 6 7 8 90
![Page 55: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/55.jpg)
Les outils techniques
• Les réseaux de neurones– Pour réaliser cette analyse, il faut discriminer les
populations ‘0’, de ‘1’, de ‘2’,…de ‘9’
1 2 3 4 5 6 7 8 90
![Page 56: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/56.jpg)
Les outils techniques
• Les réseaux de neurones– Structuration des réseaux– Pondération des réseaux– Apprentissage:
• Supervisé• Non supervisé• Orienté
![Page 57: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/57.jpg)
Les outils techniques
• Les réseaux de neurones– Apprentissage: règle de Hebb:
Wij(t+1)=Wij(t)+kSiSj
La modification du poids est proportionnelle aux activités pré et post synaptiques
Si et Sj = activation des neurones i et jWij = poids de la connexion entre les neurones i & j
![Page 58: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/58.jpg)
Les outils techniques
• Les réseaux de neurones– Le perceptron : réseau à 1 couche
N1
N2
N3
N4
S1,D1
S2,D2
S3,D3
S4,D4
Apprentissage supervisé, on réinjecte l’erreur:Wij(t+1)=Wij(t)+k(Di-Si)ej
ΔWij=k(Di-Si)ej = erreur
On ne prend en compte que l’erreur post synaptique
e1
e7
![Page 59: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/59.jpg)
Les outils techniques
• Les réseaux de neurones– Limite du perceptron : il ne sait faire que de la
discrimination de pb linéairement séparables.
N SS=1 si x1w1+x2w2-N>0S=0 si x1w1+x2w2-N<0
x1
x2
w1
w2
S=1
S=0x1
x2
Trouver w1 et w2 trouver l’équation de l’hyperplan séparant le problème !
![Page 60: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/60.jpg)
Les outils techniques
• Les réseaux de neurones– L’idée est de décomposer la non linéarité en un
succession de pb linéaires et de rajouter 1 couche !
D1: x1w1+x2w2-N=0D2: x1w’1+x2w’2-N=0
x1
x2Oui
H2
H1
N
x2
w1
w2
Nw’2
w’11,5
1
1Non
![Page 61: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/61.jpg)
Les outils techniques
• Les réseaux de neurones– Pb dans un réseau multicouches, déterminer le
poids des couches intermédiaires de sorte à minimiser l’erreur de sortie, cependant, on ne connaît pas l’erreur !
– Solution : rétropropager l’erreur à chaque niveau– Algorithme de descente du gradient
![Page 62: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/62.jpg)
Les outils techniques
• Les réseaux de neuronesObjectif : atteindre à la sortie
On diminue de manière incrémentale cette fonction:
On retrouve la loi d’apprentissage du perceptron
2)( ii ydMin
2)( ii ydC
jiiij
jij
kkl
ij
i
ij
i
ij
iiiiij
eydwDonc
ew
ew
w
y
w
d
w
ydyd
w
Cw
)(2,
)()(,0
)(
)()(2
![Page 63: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/63.jpg)
Les outils techniques
• Les réseaux de neurones
Objectif : propager l’erreur pour modifier les poids sur la couche cachée i
On fait passer l’erreur post-synaptique en erreur présynaptique
Il faut ensuite répartir cette erreur présynaptiques aux différentes branches
![Page 64: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/64.jpg)
Les outils techniques
• Les réseaux de neurones
Fonction de transfert = filtre
sortie
Entrée
![Page 65: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/65.jpg)
Les outils techniques
• Les réseaux de neurones
On positionne les neurones dans les plages d’entrées tels qu’ils réagissent à leur position
Réseaux s’auto-organisants: Les neurones s’ajoutent là où il y a le moins
d’activation
![Page 66: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/66.jpg)
D’autres outils techniques
• Les systèmes à base de cas
• Les systèmes à base de contraintes
• Les systèmes multi agents
• Les systèmes logiques de description
• Les systèmes experts
![Page 67: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/67.jpg)
Des applications (1/5)
• Oui, il y en a! ;-) ex, sur l’optimisation des opérations de ctrls vs opérations de production.
Op de fabrication
Op de fabrication
Op de fabrication
Op de ctrl
Op de ctrl
Op de fabrication
Op de ctrl
![Page 68: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/68.jpg)
Une application (2/5)
• Influences possibles sur une machine de production
C C C C C C
Dérive de la machine de production
Influence des opérations précédentesConception des gammes opératoires
Architecture produit
Dérive de la machine de métrologieConception de la gamme de contrôle
Lot produit
![Page 69: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/69.jpg)
Une application (3/5)
• Source d’information pour l’analyse en temps réel et prise de décision
C C C C C C
Lot produit
FDC
GMAO
Qualité prod
Rebus
Régulation
AlarmesSPC
Qualitémesures
MES
![Page 70: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/70.jpg)
Une application (4/5)
• Scénario: le lot est mesuré « mauvais »
• L’équipement précédent est arrêté… mais est ce que cette décision est juste ? vue la quantité d’influences possibles ?
C C C C C C
Lot produit
![Page 71: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/71.jpg)
Une application (5/5)
• Pour traiter cette question, une négiciation s’engage entre des agents lots – des agents équipements (qui vérifient leurs états) et qui se mettent en défaut ou pas
C C C C C C
Lot produit
![Page 72: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/72.jpg)
Très (trop) courte bibliographie
Jean-Paul Haton, Marie Christine Haton, “L’intelligence Artificielle, Que sais-je ?”, N°2444, PUF, 1993, ISBN 2130455123
Sutton & Barton, “Reinforcement learning, an introduction”, Cambridge, MA, 1998
Jacques Ferber, “MultiAgents, vers une intelligence collective”, Ed InterEditions, Collection iia, 1995
![Page 73: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/73.jpg)
L’apprentissage par rétropropagation du gradian
![Page 74: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/74.jpg)
Les outils techniques
• Les réseaux de neurones
Objectif : propager l’erreur pour modifier les poids
ineuroneentréeAi
ineuronesortieXi
désirableseuilf
__:
__:
_:
ii
jiij
i
iij
kkk
jjijiii
A
Cf
XA
C
w
A
A
C
w
C
ySCMin
xwAAfX
**
)(
),(
2
notons jiij
Xfw
C*,
alors
![Page 75: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/75.jpg)
Les outils techniques
• Les réseaux de neurones
Objectif : propager l’erreur pour modifier les poids
Sur la dernière couche:
)(')(2
)('*)(*2*)(*2*
iiii
iiii
iii
i
i
ii
AfYSf
Donc
AfYSA
SYS
A
S
S
C
A
C
![Page 76: Introduction à lIntelligence Artificielle 2007 – Khaled Hadj Hamou, Samuel Bassetto](https://reader036.vdocuments.site/reader036/viewer/2022062404/551d9dbc497959293b8df1ff/html5/thumbnails/76.jpg)
Les outils techniques
• Les réseaux de neurones
Objectif : propager l’erreur pour modifier les poids sur la couche cachée i
jjijii
j jiji
i
ij
ijji
i
j i
j
jj i
j
ji
fwAff
A
CwAf
A
C
Donc
AfwA
C
A
X
X
A
A
C
A
A
A
C
A
C
)('
)('
)('*****
fi dépend de fj, de la couche supérieure
On descend bien l’erreur d’une couche