Tema 2: Procesos de condicionamiento: Fundamentos Aprendizaje y Condicionamiento Prof. Pablo Adarraga http://www.uam.es/pablo.adarraga pablo.adarraga@uam.es
Condicionamiento instrumental Aprender de los resultados de nuestra conducta. Repetiremos las conductas que nos funcionan bien, y no repetiremos las que den resultados dañinos.
Condicionamiento clásico Aprendemos a usar las señales que presagian sucesos importantes para nosotros Ello nos permitirá “anticipar” dichos sucesos e iniciar de antemano las conductas más adaptativas respecto a ellos.
¿Clásico o instrumental? En el CI el organismo recibe o no el premio, el castigo etc. dependiendo de su conducta. Si estudias, te dan chuches; si no, no. En el CC el organismo recibe la señal (la campana) Y a continuación el “evento señalizado” (la carne) con independencia de su conducta.
Condicionamiento instrumental
Condicionamiento instrumental Antecedente Caja de Skinner Respuesta Pulsar palanca Consecuente Pellet (comida)
Condicionamiento instrumental Antecedente Olor de Ana Respuesta Dar pata Consecuente Comida
Condicionamiento instrumental Antecedente Con los amigos Respuesta Decir burrada Consecuente Risas, celebración
Condicionamiento instrumental Antecedente Mesa familiar Respuesta Decir burrada Consecuente Bronca
Resultado La fuerza de esa respuesta se modifica, para las situaciones en que esté presente el antecedente Lo que es lo mismo, esa R se hace más o menos probable para el futuro. Cuando la fuerza de la R aumenta, decimos que el consecuente es un refuerzo Cuando la fuerza de la R disminuye, decimos que el consecuente es un castigo
Elementos del CI: Respuesta (R) En principio, puede ser cualquier R incluida en el repertorio conductual del organismo. Esta limitación se amplía drásticamente mediante el moldeado (ver más adelante) Desde una R muy simple hasta una secuencia conductual compleja Las Rs con importante componente innato pueden resultar problemáticas En humanos, pueden ser tipos de verbalizaciones, clases de pensamientos, etc.
Elementos del CI: Respuesta operante Un tipo especialmente importante son las Rs operantes o simplemente “operantes” Operante: respuesta definida exclusivamente por sus propiedades funcionales Estrictamente: condicionamiento operante es una subclase del CI que se caracteriza porque afecta a un operante. Sin embargo, a menudo se usan ambos términos como sinónimos.
Elementos del CI: Consecuente Suceso que afecta a la fuerza o probabilidad de la respuesta a la que sigue consistentemente. Dos grandes tipos Refuerzo o reforzador: Aumenta, fortalece la R a la que sigue Castigo: Reduce o debilita la R a la que sigue Por tanto, refuerzo y castigo se definen como tales por sus efectos en la R, no porque sean agradables o desagradables.
Elementos del CI: Consecuente - refuerzo Refuerzo – estribillo: “Un refuerzo es un refuerzo porque refuerza”
Consecuente – refuerzo positivo y negativo Refuerzo positivo (R+ o ”erre más”): La conducta aumenta, se fortalece (eso es lo que significa “refuerzo”) el organismo obtiene algo, se le administra alguna cosa, el ambiente le da algo (eso quiere decir “positivo”). Típicamente, algo “agradable” Refuerzo negativo (R- o ”erre menos”): La conducta aumenta, se fortalece (refuerzo) El organismo deja de recibir o experimentar algo, se le “quita” algo (eso quiere decir “negativo”). Típicamente, algo nocivo o dañino.
Consecuente – castigo positivo y negativo Castigo positivo (C+ o ”ce más”): La conducta se reduce (eso es lo que significa “castigo”) El organismo recibe algo, se le administra alguna cosa, el ambiente le da algo (eso es lo que significa “positivo”). Típicamente, algo doloroso, dañino, nocivo Castigo negativo (C- o ”ce menos”): La conducta se reduce ( “castigo”) El organismo deja de recibir o experimentar algo, se le “quita” algo (eso es lo que significa “negativo”). Típicamente, algo beneficioso, grato, apetitivo.
Atención - Zona de errores masivos “Positivo” no significa “bueno” “Negativo” no significa “malo o dañino” “Castigo positivo” suena raro. “Puesto que un castigo es algo que duele, ¿qué puede tener de positivo un castigo?” MAAAAL! “Refuerzo negativo” suena raro. “Si un refuerzo es algo agradable, cómo va a ser negativo”? MAAAAAL! Estos errores se deben a confundir los términos técnicos con palabras del lenguaje natural. CUIDADO con ellos.
Consecuente: R+ y R- Ejemplos Cada vez que el perro se sube al sofá, su sueño le da un cachete en el hocico Si la rata se sube a la plataforma, deja de recibir la descarga eléctrica. Llamó a su padre “bastardo degenerado”, por eso se ha quedado sin paga.
Consecuente: R+ y R- Ejemplos Ella suele conseguir que dejen de echarle la bronca poniendo carita de pena. El entrevistador detiene sus gestos de asentimiento cuando el candidato le tutea A la cuarta vez que insistió en pedírmelo, ya no supe cómo negarme
Elementos del CI: Contingencia Relación estadística (probabilística) entre la R y el consecuente. Es cuestión de grado. Es máxima si siempre que el organismo emita la respuesta, y sólo entonces, recibe el consecuente. Si el consecuente no sigue siempre a la R, la contingencia es más baja.
Elementos del CI: Contingencia Se puede pensar en las contingencias como “reglas” que rigen en una situación ambiental, p. ej.: Si se pulsa la palanca, siempre sale comida Si dices una palabrota, te llevas una bronca la mayoría de las veces Si pones cara triste, algunas veces te darán algo.
Elementos del CI: Contingencia La relación entre la magnitud de la contingencia y la eficacia del condicionamiento no es simple: Si se puede recibir el consecuente sin realizar la conducta, el condicionamiento pierde eficacia. Si se recibe el consecuente sólo en algunas Rs (no en todas), el reforzamiento se hace más eficaz, pero el castigo se debilita.
Elementos del CI: Antecedente Estímulo o configuración estimular que permite al organismo identificar la situación en que está activa una contingencia de refuerzo o de castigo A veces el CI queda muy vinculado al antecedente, otras veces es bastante independiente de él. MUY IMPORTANTE: No confundir con “historia” o “vida pasada”.
Elementos del CI: Antecedente Conducta: meter la moneda y pulsar Consecuente: producto Antecedente: luces encendidas. Si las luces están apagadas, la contingencia entre la conducta y el consecuente no está activa.
Elementos del CI: Antecedente Antecedente - estribillo: El antecedente está presente
Elementos del CI: Antecedente Cuando el antecedente es un estímulo concreto, puntual, se denomina “estímulo discriminativo”. Dos tipos: ED o E+ : indica la disponibilidad de un consecuente (la contingencia está activa) EΔ o E- : informa de su no-disponibilidad (contingencia no vigente o inactiva). La distinción terminológica entre “antecedente” y “E. discriminativo” debe entenderse como muy flexible.
Moldeado (“shaping”) Consecución gradual de una R que no estaba presente en el repertorio conductual del organismo, mediante reforzamiento de Rs que son aproximaciones sucesivas a la deseada. Es el principal procedimiento de aprendizaje de Rs genuinamente nuevas para el organismo. No confundir con “modelado” (modeling): aprendizaje de una conducta observando a otro organismo efectuarla.
Adquisición Periodo en el que se produce el condicionamiento (al organismo se le presenta la contingencia, y la va aprendiendo) En laboratorio o clínica, se llama así también al procedimiento concreto empleado para ello.
Extinción Situación en que se rompe la contingencia entre la respuesta y el consecuente El organismo cada vez realiza menos la respuesta que ya no es reforzada. Se refiere también al decaimiento de la respuesta por esa ruptura de la contingencia.
Mantenimiento Aquellas circunstancias que impiden que una conducta entre en extinción. Normalmente, son contingencias de refuerzo. El análisis del mantenimiento de las conductas problemáticas es uno de los aspectos más importantes de la intervención clínica.
Tipos de entrenamiento en CI Refuerzo (Más R) Castigo (Menos R) Positivo (dar) Entrenamiento de recompensa Entrenamiento de castigo Negativo (quitar) Entrenamiento de escape Entrenamiento de evitación Entrenamiento de omisión / LRS
Situaciones de laboratorio Procedimientos de ensayo discreto El entrenamiento se divide en sucesivos “ensayos” Inconvenientes: Interferencia con el proceso natural El O tiene “marcado” cuándo puede realizar la R. Ejemplos: laberintos, corredores, cajas problema, cajas de lanzadera, etc. Procedimientos de operante libre No hay ensayos, sino una situación “continua”. El organismo puede realizar la R “libremente” Dispositivos típicos: cámara operante.
Notas históricas sobre condicionamiento instrumental
Notas históricas sobre C.I.: Thorndike Primer autor en investigarlo sistemáticamente. Tesis doctoral (1898). Inspiración darwiniana. Método: cajas-problema Aprendizaje por ensayo y error Ley del efecto.
Notas históricas sobre C.I.: Thorndike Ley del efecto: Si una respuesta en una situación estimular dada es seguida por un suceso satisfactorio o placentero, la relación entre la situación y la respuesta se fortalece, de forma que el organismo tendrá más tendencia a dar esa respuesta en esa situación. Si por el contrario va seguida de un suceso nocivo o desagradable, la respuesta tenderá a no darse.
Notas históricas sobre C.I.: Thorndike
Notas históricas sobre C.I.: Thorndike
Notas históricas sobre C.I.: Skinner Concepto de operante Aportaciones metodológicas: Caja de Skinner (cámara operante) Registro acumulativo Etc. Etc. Numerosos descubrimientos Conductismo radical Ley del refuerzo
Notas históricas sobre C.I.: Skinner Ley del refuerzo Ciertos sucesos, cuando siguen consistentemente a una respuesta de un organismo, aumentan su probabilidad. Llamamos a esos sucesos “refuerzos”.
Condicionamiento clásico
Condicionamiento clásico Algunos estímulos constituyen señales más o menos fiables de sucesos importantes para nosotros. Mediante CC aprendemos, de forma inconsciente, a servirnos de ellas. No confundir con los medios intelectuales de anticipación.
Condicionamiento clásico El organismo recibe un estímulo neutro seguido de un estímulo importante para él. Esto se repite una y otra vez El organismo aprende a dar una R, que antes no daba, al estímulo originalmente neutro. Timbre … comida … Timbre (nada) Timbre R
Elementos del CC: Estímulo incondicionado (EI) Estímulo que suscita regularmente una R. no aprendida y medible en todos los miembros normales de una especie. Es decir, tiene importancia intrínseca. Ejemplos: Comida, descarga eléctrica, feromonas, golpe, quemadura, soplo de aire en los ojos, pinchazo, etc.
Elementos del CC: Respuesta incondicionada (RI) La R. no aprendida y medible suscitada por el EI de forma regular. Un EI puede suscitar más de una RI Ejemplos: huida, salivación, flexión, deglución, reflejo pupilar, náuseas...
Elementos del CC: Estímulo neutro/condicionado (EN/EC) Estímulo originalmente neutro Es neutro en el sentido de que por sí mismo no suscita una R. específica Puede producir alguna respuesta genérica (R. de orientación, parpadeos, etc.) Durante el condicionamiento actúa como “señal” del EI: le precede sistemáticamente.
Elementos del CC: Respuesta condicionada (RC) Respuesta que, una vez condicionado el organismo, resulta provocada por el EC. Frecuentemente (pero no siempre) es semejante a RI. En tales casos, la magnitud de RC es siempre inferior a la de RI.
Elementos del CC: Contingencia Relación estadística entre el EC y el EI por la cual el primero es más o menos fiable como predictor del segundo. Es lo mismo que en CI, sólo que aquí el vínculo es entre dos estímulos, en vez de entre una conducta y un consecuente. En CC, las contingencias de más magnitud producen siempre mejor aprendizaje que las más bajas.
Elementos del CC: tipos de contingencia Positiva total: EI siempre sigue a EC EC es una señal perfecta de EI Positiva parcial: EI sigue a EC la mayoría de las veces, pero no todas EC es una señal de EI, pero no perfecta. Negativa total: EI nunca sigue a EC. EC es una señal perfecta de la ausencia de EI Negativa parcial: EI no sigue a EC la mayoría de las veces. EC es una señal de la ausencia de EI, pero no perfecta. Contingencia nula: EC y EI van cada uno por su lado, sin relación alguna. La aparición de EC no nos dice nada sobre EI. Si aparece EC lo mismo puede aparecer EI que no.
Tipos de contingencia: ejemplos 9 de cada 10 veces que suena la campana, le damos un trocito de comida. Siempre que le pedimos algo y dice que “ya veremos” luego es que no. Cuando sale el sol entre las nubes, lo mismo me puedo encontrar el semáforo abierto que no. Si frunce el ceño de esa forma, lo más seguro es que no nos dé nada. Si suena el ruido del tubo, fijo que le cae pienso a la rata.
Fases del CC Adquisición: progresivo establecimiento de una RC al presentar seguidos EC y EI de forma repetida. Extinción: decaimiento de la RC al presentar el EC solo.
Generalización del CC Se refiere al hecho de que un organismo emita la RC ante estímulos algo diferentes del EC original Por ejemplo, si el EC es un tono de 200 Hz, un organismo puede emitir la RC ante un tono de 210 Hz Se tratará siempre de una R más débil que la que se da al EC original.
Discriminación en el CC Durante la adquisición se presentan dos ENs semejantes (por ejemplo, dos luces de diferente intensidad) Uno de ellos se empareja con el EI (y es por tanto el EC) mientras el otro no se empareja con EI. El organismo discrimina entre ambos estímulos: da la RC al verdadero EC y no al otro. Caso particular: “neurosis experimental”
Tipos de CC Según el carácter del EI: Apetitivo: Se usan EIs que naturalmente suscitan RIs de acercamiento, consumo, etc. Aversivo: se usan EIs que naturalmente suscitan RIs de huida, defensa, etc. Según el efecto conductual: Excitatorio: Produce una tendencia a responder al EC. Se obtiene con contingencias positivas Inhibitorio: Produce una tendencia a no responder al EC. Se obtiene con contingencias negativas.
Tipos de CC Muy importante: Existen situaciones de CC Excitatorias y apetitivas Excitatorias y aversivas Inhibitorias y apetitivas Inhibitorias y aversivas. (este punto es fuente típica de errores tontos en exámenes)
Tipos de CC: según la secuencia temporal Condicionamiento simultáneo: EC y EI aparecen (comienzan) a la vez Muy poco eficaz La contigüidad no es la clave de la asociación.
Tipos de CC: según la secuencia temporal Condicionamiento de demora breve: EC aparece un poco antes que EI Muy eficaz Para cualquier par de estímulos hay una demora que es óptima
Tipos de CC: según la secuencia temporal Condicionamiento de demora larga: EC se inicia bastante antes que EI, hasta 2 o 3 minutos Menos eficaz que el de demora breve en general, pero hay excepciones notables. En adquisiciones prolongadas, produce inhibición de demora.
Tipos de CC: según la secuencia temporal Condicionamiento de huella: EC se inicia y termina antes de que aparezca EI. Hay, pues, un intervalo vacío (“de huella”) entre ellos. Junto con demora breve, son los más eficaces en general.
Tipos de CC: según la secuencia temporal Condicionamiento hacia atrás: el EC se inicia después del EI. Totalmente ineficaz. A veces produce cierto efecto inhibitorio. Contribuye a demostrar que no importa la contigüidad, sino el valor de señal.
Notas históricas sobre condicionamiento clásico
Ivan Pavlov Primer autor en investigar el CC sistemáticamente (ya era conocido como “secreciones psíquicas”) Premio Nobel (1904) Gran cirujano. Técnicas innovadoras Los”reflejos condicionados” como método para estudiar el cerebro.
Bechterev Pionero en el estudio del CC aversivo. Estudio típico con perros: EC: sonido EI: descarga eléctrica en una pata RC: Retracción de la pata al oir el sonido.