resumen guia 10
DESCRIPTION
psicologíaTRANSCRIPT
CONDICIONAMIENTO INSTRUMENTAL
Edward L. Thorndike: Los gatos y la ley del efecto
Él formuló las leyes del condicionamiento operante. Descubrió que los animales aprenden por ensayo y error, pues acertaban solo por casualidad.
Ley del efecto: cuando las acciones, en cualquier situación, son seguidas de una experiencia satisfactoria, se relacionará tal ejecución con la satisfacción obtenida y tenderá a ejecutar las mismas acciones si se encuentra en situaciones similares. Si se vinculan con molestia, el animal no repetirá esas acciones. Esta asociación es automática.
La repetición sirve para consolidar el hábito (dominio de destreza)
Principios del condicionamiento operante
Skiner observó semejanzas y diferencias entre C.O. (Condicionamiento operante) y C.C. (Condicionamiento Clásico)
Semejanzas: proceso de adquisición y extinción, recuperación espontánea, el reaprendizaje y el proceso de generalización y discriminación
Diferencias:
CC CO
Asociación entre EC y EI Asociación entre R y Consecuencias de refuerzo
EI no depende de la R del sujeto
Las Consecuencias dependen de la R del sujeto
R involuntaria (RI) R voluntaria
RC se parece a RI R es arbitraria y no se parece a la forma de reaccionar ante un
reforzador
Triple relación de contingencia
Contingencia o Contingente: conjunto de condiciones temporales bajo las cuales una respuesta va seguida de ciertas consecuencias. Es la diferencia de probabilidades del refuerzo en presencia y/o ausencia se la conducta. Un reforzador es CONTINGENTE a una respuesta cuando la distribución temporal de las respuestas determina la distribución temporal de los reforzamientos.
Dependencia: la relación entre la conducta y sus consecuencias es obligada.
Análisis funcional: establecimiento de las relaciones entre la conducta de un organismo y las variables extremas de las cuales la conducta es función.
Estímulo discriminativo
Es el estímulo en cuya presencia la probabilidad de una conducta operante es elevada, porque anteriormente estuvo presente cuando fue reforzada. Por ej.: los semáforos.
Estos estímulos nos proporcionan los indicios para saber qué consecuencias obtendríamos si realizamos la conducta. No son estímulos que produzcan las conductas, sólo ayudan en el CONTROL DE LA CONDUCTA, pero no la causan.
Consecuencias y reforzamiento
Reforzamiento positivo: Cuando una consecuencia incrementa la probabilidad o fortalece la repetición de una conducta que le antecedió.
Estímulo reforzado: es aquel que aumenta la probabilidad de la respuesta.
Reforzador negativo: incrementa la probabilidad de la conducta cuando se aplica contingentemente a ésta y elimina un estímulo que es desagradable (estímulo aversivo) para el organismo como el dolor (por ej.: la aspirina que quita el dolor). Puede ser de dos clases: evitación y escape.
En el castigo, una respuesta produce un estímulo aversivo y no es lo mismo que el reforzamiento negativo.
Reforzamiento aumenta frecuencia de una conducta
Castigo suprime frecuencia de una conducta
Castigo positivo o por presentación: ocurre cuando la aparición de un E que sigue a una conducta la suprime o la disminuye. Por ej.: hacer aseo como castigo
Castigo por supresión: implica la desaparición o supresión de un estímulo positivo. Por ej.: quitar la TV y juegos.
Adquisición, extinción y recuperación
Adquisición: la probabilidad de que la conducta sea reforzada, el tiempo que transcurre desde que se produce la respuesta hasta que se recibe el refuerzo, la cantidad de refuerzo, el número de refuerzos y el estado de motivación del organismo, influye en la rapidez con la que se condiciona.
Extinción: ocurre cuando el reforzamiento es retirado. En el C.O. hay extinción respondiente y operante. Se define como la reducción en la fuerza de una operante condicionada mediante la suspensión del reforzamiento.
Generalización: En los estímulos, se presenta cuando las R.C. a un estímulo pueden ser provocadas también por otros estímulos en la misma dimensión (psicológica o física) por una función sintetizadora del sistema nervioso. En las respuestas, se presenta cuando el organismo tiende a producir respuestas similares a la que ha sido reforzada (decir papá, tatá, dadá).
Discriminación: proceso opuesto a la generalización. Suele ocurrir al comienzo y durante el aprendizaje, mientras que la discriminación ocurre cuando el aprendizaje está bien asentado. En el C.O., es el fortalecimiento diferencial de una respuesta con respecto a la propiedad de un estímulo. El organismo muestra discriminación cuando responde más rápidamente en presencia de la propiedad correlacionada con el reforzamiento.
Programas de reforzamiento
Ley de Thorndike: las respuestas son positivamente reforzadas cuando son seguidas de eventos satisfactorios.
Un programa de reforzamiento es simplemente un patrón de recompensas que mantiene las respuestas condicionadas.
Programa continuo de reforzamiento: un premio sigue a cada respuesta.
Lo normal es que unas veces ganemos y otras veces perdamos.
Reforzamiento intermitente: el reforzar todas las respuestas correctas llevaría mucho tiempo y resultaría prácticamente imposible. El reforzamiento intermitente ayuda al estudiante, por ejemplo, a aprender a no esperar el reforzamiento cada vez.
(nº)
Resultados de los programas
Frecuencia de las respuestas: Cuanto más rápido se acumule el número de respuestas correctas, más rápido llegará el reforzamiento.
Resistencia a la extinción: si el reforzamiento es eliminado por completo, la persona probablemente disminuirá su velocidad de ejecución, hasta que la conducta se extinga. Si el reforzamiento sigue a cada respuesta, la persona dejará de responder tan pronto cese éste.
Reforzadores primarios y secundarios
Teoría Reducción de impulsos Hull necesidades primarias deben ser satisfechas para sobrevivir.
Aire, alimento, agua, temperatura
+carencia de necesidad +rápida descarga de cél nerviosas +despierta el sistema nervioso +impulso primario +motivación para reducirlo
Reforzadores Secundarios: Son aquellos reforzadores que no reducen necesidades primarias y que han sido aprendidos por asociación con los reforzadores primarios.
El dinero es considerado como un poderoso reforzador secundario y también se le denomina generalizado, dado que refuerza una enorme variedad de comportamientos.
Paradigma de escape
Ambiente (reforzador negativo) su reducción o eliminación es reforzante para el organismo
El organismo responde eliminando el reforzador negativo fuertemente.
Ante un dolor de cabeza (E aversivo), tomo una aspirina y me libero del dolor. Si esta cadena produjo los resultados deseados, se incrementará.
Intensidad del estímulo incondicionado: es un estímulo aversivo que el organismo quiere eliminar, cuanto más intenso es el reforzador negativo incondicionado más rápidamente ocurre la adquisición de la respuesta.
Cantidad de reforzamiento: a mayor reducción de la descarga, se produce una mejor ejecución.
Demora en la terminación de la descarga: cuanto más demorada sea la descarga, más lenta es la velocidad de las respuestas.
Tipos básicos de programas de reforzamiento intermitente
intervalo
razón
fijo
variable
fijo
variable
Recompensa predecible
Recompensa predecible
Extinción relativamente rápida
Extinción relativamente rápida
Paradigma de evitación
Se caracteriza porque la conducta del animal trae como consecuencia la no aparición de un estímulo aversivo. La conducta del sujeto hace que el estímulo aversivo no aparezca. Un padre escapa de una situación comprándole un juguete a su hijo que llora. El padre realiza una respuesta de escape al comprarle el juguete y esta respuesta es reforzada negativamente porque cesa el llanto del niño.
Evitación discriminada: utilizar un estímulo discriminativo que actúa como una señal de aviso cuando el estímulo aversivo se va a presentar. Consiste en presentar un estímulo exteroceptivo que anteceda la presentación de un estímulo aversivo incondicionado
Sidman inventa otra forma menos frecuente que no utiliza estímulos discriminativos.
Indefensión aprendida
Indefensión: es la convicción, por parte de un animal o una persona, de que ha perdido el control, de que nada de lo que pueda hacer reportará cambio alguno en ningún aspecto importante de su vida. Este estado de “desmoralización”
¿Qué es lo que provoca la indefensión? Al creer que no pueden hacer nada para cambiar la situación, no tienen tampoco ninguna motivación para intentarlo. Se muestran incapaces de aprender una respuesta que pudiera, de hecho, controlar el resultado; ya que probablemente el resultado es traumático, tendrán miedo y caerán en la depresión.
Paradigma de castigo
El castigo es un procedimiento operante que disminuye la probabilidad de ocurrencia de una respuesta por la aplicación de un estímulo aversivo contingente a dicha conducta. Es una forma de manipular estímulos a fin de suprimir o debilitar la respuesta indeseable que antecede.
Castigo positivo (aplicación de un E aversivo): tiene como consecuencia la debilitación, reducción o eliminación de una conducta. En este caso, las consecuencias no se llaman estímulos reforzadores, sino punitivos.
Castigo negativo (costo de respuestas): se produce cuando se aprende a dejar de hacer una respuesta a causa de que tiene como consecuencia la retirada o el cese de algún evento positivo para el sujeto.
Saciación: algunos estímulos hasta cierto grado e intensidad funcionan como reforzadores, pero más allá de cierto límite empiezan a resultar aversivos.
Tiempo fuera: es un procedimiento de gran utilidad cuando, aun conociendo el reforzador que mantiene la conducta, no podemos suspender su administración. Lo que se hace entonces es sacar al sujeto de la situación cuando emita la conducta que deseamos suprimir.
Variables que actúan en el castigo
1. Modo de presentación: la presentación súbita i repentina del castigo produce mayor reducción de la conducta
2. Intensidad del castigo: cuanto mayor es la intensidad del estímulo aversivo, mayor es su eficacia.
3. Inmediatez del castigo: a mayor demora del castigo menor es la reducción de la conducta.
4. Duración del castigo: mayor duración producen una supresión mayor
5. Constancia: siempre que ocurra la conducta se ha de aplicar el mismo castigo.
6. Reforzamiento de conductas incompatibles: cuando las personas no sólo saben lo que no deben hacer, sino lo que deberían hacer, la modificación es más rápida y menos traumática.
Efectos secundarios del castigo
Se producen debido a la naturaleza emocional de nuestras respuestas. El intento por escapar o evitar situaciones desagradables, es también una respuesta humanamente predecible.