La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Programas de reforzamiento y conductas de elección

Presentaciones similares


Presentación del tema: "Programas de reforzamiento y conductas de elección"— Transcripción de la presentación:

1 Programas de reforzamiento y conductas de elección
Ps. Rafael Cendales Reyes Universidad El Bosque

2 Programas de reforzamiento
Los programas de reforzamiento son "reglas", que determinan cuándo seguirá la entrega o presentación contingente de un reforzador a la presentación de una respuesta o conducta.

3

4 Reforzamiento continuo
Se refuerza cada respuesta dada. Una operante que alcanza su tasa máxima es mantenida en toda su fuerza sólo si se la continúa reforzando. Las operantes obtenidas por este tipo de reforzamiento se extinguen rápidamente cuando se descontinúa el reforzamiento.

5 Reforzamiento intermitente
La operante es reforzada ocasionalmente. Las operantes obtenidas mediante este tipo de Reforzamiento tardan mucho más en extinguirse. Reforzamiento de razón Reforzamiento de intervalo

6 Reforzamiento de Razón
Sólo se refuerza la conducta después de un número de respuestas. Se utiliza un contador. Programa de Razón Fija: El número de respuestas requeridas para el reforzamiento deben ser constante. Ej: que paguen por la venta de cada 5 celulares. Cuando se grafica su curva muestra frecuentes pausas. Programa de Razón Variable: El número de respuestas requeridas para el reforzamiento deben ser Variable. Nos proporciona una alta tasa de respuestas sin pausas apreciables, su curva es más regular Ej: juegos de azar (por eso sontan adictivos)

7 Reforzamiento de Intervalo
La respuesta sólo es reforzada después de cierto tiempo .Se utiliza un tomador de tiempo (cronometro). Generalmente produce menor tasa que en los de razón. Programa de intervalo Fijo: Se refuerza después que haya pasado un intervalo fijo de tiempo a partir del último reforzamiento. Ocasiona que no haya respuestas inmediatamente después del reforzamiento, pero la tasa aumenta gradualmente y alcanza su máximo inmediatamente antes del próximo reforzamiento. Cuando se grafica no es constante. Programa de intervalo Variable: Una respuesta es reforzada después de un intervalo de tiempo que puede variar, por ejemplo desde segundos, hasta horas, a partir del último reforzamiento. La tasa es relativamente constante

8 Conducta de elección Los experimentos en los que se mide una sola respuesta ignoran parte de la riqueza y complejidad de la conducta. Incluso en una situación simple, los organismos realizan diversas actividades y continuamente eligen entre alternativas posibles. La situación de elección más sencilla es una que contiene dos alternativas de respuesta, cada una de las cuales es seguida por un reforzador de acuerdo con su propio programa de reforzamiento.

9 Programa de reforzamiento múltiple
Consiste en dos o más programas independientes, los cuales se presentan al organismo en forma sucesiva, cada uno de ellos en presencia de un estímulo característico. Los programas múltiples son programas combinados, en los que se agrega un estímulo discriminativo característico.

10 Programa concurrente  Están formados, también, por dos o más programas. A diferencia del múltiple, los programas no son sucesivos, sino simultáneos; es decir, que el sujeto puede emitir dos respuestas distintas que se refuerzan simultáneamente por programas independientes, pero paralelos en el tiempo. Los reforzamientos previstos en cada programa son independientes entre sí. Este tipo de programa se utiliza cuando se desea reforzar más de una respuesta a la vez.

11

12 Medidas de la conducta de elección
Tasa relativa de respuestas: C1/(C1+C2) C1: Conducta en la opción 1 C2: Conducta en la opción2

13 r1/(r1+r2) Tasa relativa de reforzamiento: r1: Conducta en la opción 1

14 La ley de igualación C1/(C1+C2)= r1 / (r1+r2) C1/C2 = r1/r2
De acuerdo a las investigaciones de R. J. Herrnstein, la tasa relativa de respuestas en una alternativa igualaba a la tasa relativa de reforzamiento obtenida en esa alternativa. C1/(C1+C2)= r1 / (r1+r2) C1/C2 = r1/r2

15 Subigualación, sobreigualación y sesgo de respuesta
Forma generalizada de la ley de igualación (Baum, 1974) C1/C2 = p (r1/r2)s S= sensibilidad de la conducta de elección a las tasas relativas de reforzamiento para las alternativas de respuesta. P= sesgo o preferencia de respuesta. Subigualación: menor sensibilidad de la conducta de elección a las tasas relativas de reforzamiento. Sobreigualación: mayor sensibilidad de la conducta de elección a las tasas relativas de reforzamiento.

16 Mecanismos de la ley de igualación
Igualación y maximización de las tasas de reforzamiento Maximización molecular: Se elige la alternativa de respuesta que tenga mayor probabilidad de ser reforzada en el momento. Maximización molar: Se distribuyen las respuestas entre varias alternativas de modo que se maximice la cantidad de reforzamiento que obtienen a largo plazo. Mejoramiento: las respuestas se distribuyen de tal manera que se mejoren las tasas locales de reforzamiento .

17 Taller Imagine que se divierte con un juego de video en el que puede presionar botones para hacer que sucedan cosas en la pantalla. Hay dos botones que puede presionar y las consecuencias sobre la pantalla (los reforzadores) están programadas de acuerdo a dos programas de reforzamiento distintos. Con base en lo anterior: Llene el valor faltante para satisfacer la ley de igualación en los dos escenarios que se presentan abajo. Izquierda Derecha Respuestas 25 20 Reforzadores 100 x Izquierda Derecha Respuestas x 80 Reforzadores 12 96

18 Suponga ahora que la respuesta es reforzada con un programa IF5¨ en el lado izquierdo y con un programa IF20¨ en el lado derecho. Según la ley de igualación, ¿qué porcentaje de cantidad total de tiempo debería dedicarse al lado izquierdo y al lado derecho? Digamos que tenemos dos programas concurrentes y que los reforzadores se distribuyen de la siguiente manera r1=65% y r2=35%. Dado lo anterior, ¿Qué valores tendríamos para R1 y R2 si ocurriese un total de 200 respuestas?

19 Elección compleja En la vida, las elecciones importantes implican un beneficio pequeño a corto plazo contra un beneficio mayor pero más demorado. Éste es en esencia el problema del autocontrol. Para estudiarlo, se ha usado el programa de reforzamiento encadenado-concurrente. En éste, una vez el participante ha hecho su elección, se queda con ésta, lo que involucra una elección con compromiso

20 Eslabón de elección Eslabón Terminal
Programa de reforzamiento 1 Programa de reforzamiento 2

21 Estudios sobre el autocontrol
De acuerdo a las investigaciones de Rachlin y Green, las recompensas cambian a favor de la recompensa demorada grande a medida que se exige que los participantes esperen más tiempo para recibir cualquiera de las recompensas después de hacer su elección. Si las recompensas son entregadas poco después de una respuesta de elección, los sujetos prefieren la recompensa pequeña e inmediata.

22 Reducciones del valor y explicaciones del autocontrol
El valor de un reforzador se reduce según el tiempo que tenga que esperarse para recibirlo. Función de descuento del valor: V=M/(1+KD) V=valor de un reforzador M= magnitud de la recompensa D= demora de la recompensa K= parámetro de la tasa de descuento

23 Funciones de descuento del valor e impulsividad de la conducta humana
Diversos estudios demuestran que la función de descuento de la recompensa (K) mide una característica importante de la conducta que es pertinente para el autocontrol en una amplia variedad de situaciones.

24 Taller Describa una situación en la que a alguien le resultara difícil mostrar autocontrol . ¿Cuáles son los dos reforzadores en esa situación? ¿Cómo difieren su valor? ¿Qué reforzador ocurre con una demora más corta? ¿Qué tácticas podrían alentar el autocontrol en esa situación?

25 Considere el valor percibido de obtener 100 dólares hoy
Considere el valor percibido de obtener 100 dólares hoy. En la tabla de abajo, indique qué tan valiosos serían los 100 dólares para usted si recibe el dinero hoy, mañana en 30 días, en 150 días o en 300 días a partir de ahora. Grafique los resultados. Demora de la entrega en días Valor percibido de $100 1 30 150 300


Descargar ppt "Programas de reforzamiento y conductas de elección"

Presentaciones similares


Anuncios Google