behaviorisme iia: le conditionnement opérant i

19
Gendolla: « Motivation et apprentissage VII» 1 Behaviorisme IIa: Le conditionnement opérant I « La psychologie de la motivation et de l’apprentissage » Guido H.E. Gendolla et assistants

Upload: others

Post on 15-Jan-2022

3 views

Category:

Documents


0 download

TRANSCRIPT

Gendolla: « Motivation et apprentissage VII»

1

Behaviorisme IIa: Le conditionnement opérant I

« La psychologie de la motivation et de l’apprentissage »

Guido H.E. Gendolla et assistants

Gendolla: « Motivation et apprentissage VII»

2

L’étude de Edward THORNDIKE (1898)

•  Un chat se trouve dans une cage munie d’un levier mécanique (la « puzzle box »); à l’extérieur, de la nourriture est placée bien en vue.

•  Le chat explore la cage. Par hasard, il trébuche sur le levier, la porte de la cage s’ouvre et le chat a accès à la nourriture.

•  Qu’est-ce qui se passe si le chat est remis dans la cage?

•  Le chat devient de plus en plus expert à manipuler le levier et quitte la cage dès que la nourriture est présentée.

Gendolla: « Motivation et apprentissage VII»

3

La courbe d’apprentissage

Gendolla: « Motivation et apprentissage VII»

4

La « loi d’effet »

•  Sur la base de ses observations, THORNDIKE (1911) a proposé une loi importante de l’apprentissage: « La loi d’effet ».

•  La loi d’effet: La tendance d’un animal à reproduire un comportement dépend des effets de ce comportement sur l’environnement et de l’impact de ces effets sur l’animal - le comportement est donc une fonction de ses conséquences.

•  THORNDIKE a nommé ce processus de l’apprentissage le « conditionnement instrumental » parce que le comportement avait un caractère instrumental dans l’accomplissement d’un but – la satisfaction (p.ex. obtenir de la nourriture).

Edward THORNDIKE

Gendolla: « Motivation et apprentissage VII»

5

B.F. SKINNER (1938, 1953): Le conditionnement opérant

•  Sur la base de ses nombreuses expériences (surtout avec des pigeons et des rats), SKINNER a systématisé la façon dont le comportement est contrôlé par l’environnement selon la « loi d’effet ».

•  Position behavioriste radicale: Explication du comportement sans utilisation de concepts mentaux.

•  Introduction du terme « conditionnement opérant » qui signifie que le comportement opère sur l’environnement afin de produire une conséquence.

•  Les opérants sont des comportements émis (produits spontanément) plutôt que générés par l’environnement.

Gendolla: « Motivation et apprentissage VII»

6

SKINNER (1938): Trois suppositions fondamentales

1.  Les animaux sont très fréquemment actifs – par conséquent les organismes manifestent des comportements d’une manière continue.

2.  Les conséquences des comportements influencent la probabilité avec laquelle ces comportements seront répétés à l’avenir.

3.  L’état motivationnel de l’organisme et son environnement physique et social influencent l’efficacité de ces conséquences. - Exemple: L’efficacité de la nourriture pour augmenter la probabilité d’un

comportement dépend de la durée de la privation de la nourriture.

Gendolla: « Motivation et apprentissage VII»

7

Le conditionnement opérant

•  Lors du conditionnement opérant, le comportement précède l’ événement environnemental qui produit le futur comportement. -  (Rappel: lors du conditionnement classique le comportement suit le stimulus environnemental).

•  L’idée principale est que tout le comportement est déterminé par ses conséquences (selon la « loi d’effet »).

•  En général, il y a deux types de conséquences: -  Le renforcement (qui augmente la probabilité qu’une réaction se produise). -  La punition (qui diminue la probabilité qu’une réaction se produise).

Gendolla: « Motivation et apprentissage VII»

8

L’équipement de recherche: La fameuse « Skinner box »

Gendolla: « Motivation et apprentissage VII»

9

Renforcement positif •  Un renforçateur (SR) est une conséquence environnementale qui se

produit après la réaction d’un organisme et qui rend la réapparition de cette réponse (R) plus probable.

•  Il y a des renforçateurs positifs et négatifs.

•  Le renforcement positif est le processus par lequel la présentation d’un stimulus après un comportement augmente la probabilité que ce comportement se produise à nouveau.

•  Pour une simulation, regarder: http://www.uwm.edu/~johnchay/ocFrench.htm

•  Exemple: Dans l’étude de THORNDIKE (1898) la nourriture était le renforçateur pour appuyer sur le levier. (SKINNER a répliqué l’étude avec des pigeons dans une « Skinner box »).

Gendolla: « Motivation et apprentissage VII»

10

Renforcement négatif •  Le renforcement négatif est le processus par lequel l’élimination d’un

stimulus après un comportement augmente la probabilité que ce comportement se produise de nouveau.

•  L’apprentissage d’échappement: Renforcement par l’élimination d’un événement aversif déjà existant. - Exemples: Un rat apprend à appuyer sur un levier pour interrompre une

stimulation douloureuse comme un choc électrique ou du bruit. Un enfant apprend à ranger sa chambre pour ne plus entendre ses parents rouspéter.

•  L’apprentissage d’évitement: Renforcement par l’élimination d’un événement qui est signalé par avance. - Exemples: Un rat apprend à appuyer sur un levier si un son signale

qu’un choc électrique va suivre. Un enfant apprend à ranger sa chambre avant d’entendre ses parents rouspéter.

Gendolla: « Motivation et apprentissage VII»

11

Punition positive et négative

•  Une punition (SP) est une conséquence environnementale d’un comportement qui diminue la probabilité d’une réponse (R).

•  Dans la punition positive, un stimulus aversif est présenté. -  Exemple: Un rat évite d’appuyer sur un levier après avoir obtenu un choc

électrique. Un enfant ne fait plus de désordre dans sa chambre après avoir entendu ses parents rouspéter.

•  Dans la punition négative, un stimulus agréable est éliminé. - Exemple: Un employé n’obtient pas d’augmentation de salaire à cause de ses

fréquents retards.

Gendolla: « Motivation et apprentissage VII»

12

Problèmes du renforcement et de la punition

•  L’organisme doit savoir exactement quel comportement est renforcé ou puni. Il faut connaître des « contingences ».

•  Un des problèmes de la punition est la difficulté à distinguer quel opérant a été puni. -  Exemple: Les « experts » qui appellent plusieurs fois de suite leur chien

(ou enfant) et lui crient dessus parce qu’il n’est pas venu tout de suite, punissent le bon comportement – venir après l’appel.

•  A long terme, l’extinction est plus efficace que la punition positive (ESTES, 1944; SKINNER, 1938). Après l’arrêt de la punition positive, il y a fréquemment une récupération spontanée.

Gendolla: « Motivation et apprentissage VII»

13

L’étude de ESTES (1944): La punition et l’extinction

•  D’abord, des rats sont renforcés avec de la nourriture pour appuyer sur un levier.

•  Puis, on forme deux groupes: -  Punition: Au cours d’une session, des chocs électriques sont émis suite à l’action d’appuyer sur le levier. -  Extinction: Au cours d’une session, il n’y a plus de renforcement.

•  Puis on observe les rats au cours de quatre jours d’extinction.

•  Mesure: Fréquence d’appui sur le levier.

•  Résultat: La punition réduit le comportement cible (appuyer sur le levier), mais ensuite il y a une récupération spontanée.

William K. ESTES

Gendolla: « Motivation et apprentissage VII»

14

D’autres problèmes

•  Un autre problème de la punition est l’association de la peur de celui qui apprend avec la personne qui punit (via le conditionnement classique) plutôt qu’avec sa propre activité (via le conditionnement opérant).

•  La punition ne peut pas éliminer les récompenses déjà existantes pour un comportement (p.ex. punition d’un enfant qui suce son pouce).

•  « L’apprentissage secondaire » - un enfant puni apprend qu’on peut résoudre des problèmes par voie de l’agression.

•  La punition est seulement efficace lorsqu’elle est accompagnée d’un raisonnement et d’un comportement alternatif qui est renforcé.

Gendolla: « Motivation et apprentissage VII»

15

Comment peut-on changer une réaction conditionnée?

•  Il y a au moins trois stratégies pour changer ou éliminer des réactions conditionnées:

1.  L’extinction: Arrêter de renforcer une réaction (p.ex. ignorer le mauvais comportement d’un enfant).

2.  La punition: Présenter une conséquence aversive ou éliminer une conséquence agréable du comportement.

3.  Le contre-conditionnement: Renforcer un comportement incompatible (p.ex. féliciter un enfant d’être assis afin d’éliminer son habitude de courir partout).

Gendolla: « Motivation et apprentissage VII»

16

Renforcement et punition en bref

Renforcement

Punition

Positif

Présentation d’un

stimulus « agréable »

Présentation d’un stimulus « aversif »

Négatif

Elimination d’un

stimulus « aversif »

Elimination d’un

stimulus « agréable »

Rappel que les termes « agréable » et « aversif » dépassent les concepts utilisés selon la perspective du behaviorisme classique.

Un regard plus détaillé

Gendolla: « Motivation et apprentissage VII»

17

Gendolla: « Motivation et apprentissage VII»

18

Conditionnement classique et opérant

Gendolla: « Motivation et apprentissage VII»

19