CAPITULO 7. CONDICIONAMIENTO INSTRUMENTAL: MECANISMOS MOTIVACIONALES.
Las teorías de la regulación de la conducta detallan los efectos del reforzamiento en el contexto
más amplio del repertorio conductual de un organismo, para lo cual recurren a conceptos de
diversas fuentes de investigación que incluyen la economía y la ecología conductual. El enfoque de
la regulación conductual considera aspectos molares del comportamiento y considera que los
efectos del condicionamiento instrumental son manifestaciones de los procesos de maximización y
optimización. La motivación de la conducta instrumental se ha considerado desde dos
perspectivas radicalmente distintas. La primera se originó con Thorndike e involucra el análisis de
la estructura asociativa del condicionamiento instrumental. La segunda estrategia para el análisis
de los procesos motivacionales, en el aprendizaje instrumental, es la regulación conductual. Este
enfoque se desarrolló en la tradición skinneriana e involucra la consideración del
condicionamiento instrumental en el contexto más amplio de las numerosas actividades que los
organismos realizan constantemente.
LA ESTRUCTURA ASOCIATIVA DEL CONDICIONAMIENTO INSTRUMENTAL.
Edward Thorndike fue el primero en reconocer que el condicionamiento instrumental involucra
más que sólo una respuesta y un reforzador. La respuesta instrumental ocurre en el contexto de
estímulos ambientales específicos. Por consecuencia, en el análisis del aprendizaje instrumental
existen tres eventos a considerar: el contexto estímulo (E), la respuesta instrumental (R) y la
consecuencia de la respuesta (C) o reforzador.
Asociación E-R y la ley del efecto.
La estructura básica de un procedimiento de condicionamiento instrumental permite el desarrollo
de varios tipos distintos de asociaciones. La primera de las cuales fue planteada por Thorndike
como una asociación entre los estímulos del contexto (E) y la respuesta instrumental (R): la
asociación E-R. Thorndike consideraba que la asociación E-R era la clave para el aprendizaje
instrumental y fundamental para su Ley del efecto. De acuerdo con dicha ley, el condicionamiento
instrumental implica el establecimiento de una asociación E-R entre la respuesta instrumental (R) y
los estímulos contextuales (E) que están presentes cuando la respuesta es reforzada. El papel de
reforzador consiste en “estampar” la asociación E-R. Una implicación importante de la ley del
efecto es que el condicionamiento instrumental no involucra aprendizaje sobre el reforzador (C) o
la relación entre la respuesta y la consecuencia reforzante (la asociación R-C). La ley del efecto
supone que el único papel del reforzador es fortalecer la asociación E-R. El reforzador en sí no
forma parte de esta asociación.
Expectativa de la recompensa y la asociación E-C
Teoría de los dos procesos.
La teoría de dos procesos supone que existen dos tipos distintos de aprendizaje: el
condicionamiento pavloviano y el instrumental, un planteamiento que nada tiene de radical. En la
teoría se supone además que esos dos procesos de aprendizaje están relacionados de una forma
especial.
El diseño experimental básico para evaluar esa idea es lo que en la literatura de la neurociencia
algunos han llamado la prueba de transferencia pavloviana-instrumental. La prueba implica tres
fases separadas. En una fase los sujetos son sometidos a un condicionamiento instrumental
estándar (por ejemplo, la presión de palanca se refuerza con comida). En la siguiente fase son
sometidos a un procedimiento puro de condicionamiento pavloviano (se saca la palanca de
respuestas de la cámara experimental y se empareja un tono con comida). La fase crítica de
transferencia ocurre en la tercera, en que se permite nuevamente a los sujetos realizar la
respuesta instrumental de presionar la palanca, pero ahora se presenta periódicamente el EC
pavloviano. Si la asociación pavloviana E-C motiva la conducta instrumental, entonces la tasa de
presión de palanca debería incrementarse cuando se presenta el tono (EC). El experimento se
denomina prueba de transferencia pavloviana instrumental porque determina cómo es que un EC
pavloviano se transfiere para influir o motivar la conducta instrumental.
Instrucciones de la respuesta en la transferencia instrumental pavloviana.
Los estímulos condicionados clásicamente no sólo provocan estados emocionales, sino también
respuestas manifiestas. En consecuencia, un estímulo condicionado clásicamente puede influir en
la conducta instrumental por medio de dichas respuestas.
A los investigadores les ha preocupado mucho la posibilidad de que los resultados de los
experimentos de transferencia pavloviana instrumental se deban al hecho de que los estímulos
condicionados pavlovianos provoquen respuestas manifiestas que interfieran o se sumen a la
conducta requerida para obtener el reforzamiento instrumental.
¿Estados emocionales condicionados o expectativas de recompensa especifica?
La teoría de los dos procesos asume que el condicionamiento clásico media en la conducta
instrumental por medio del condicionamiento de emociones positivas o negativas, dependiendo
de la valencia emocional del reforzador. Sin embargo, en el curso del condicionamiento
instrumental y clásico los animales no sólo adquieren emociones categóricas, positivas o
negativas, sino también expectativas específicas de recompensa.
Relaciones R-C y E(R-C) en el condicionamiento instrumental
Primero, advierta que ni la asociación E-R ni la asociación E-C involucran una conexión directa
entre la respuesta (R) y el reforzador o consecuencia (C), lo cual resulta contraintuitivo. Si le
pregunta a alguien por qué realiza una respuesta instrumental, la respuesta probable sería que
espera que la respuesta (R) tenga como resultado el reforzador (C). La intuición sugiere que la
conducta instrumental implica asociaciones R-C.
Evidencia de asociaciones R-C
En el condicionamiento pavloviano se utiliza la devaluación del EI para determinar si la respuesta
condicionada es mediada por una asociación EC-EI. Si la devaluación del EI, posterior al
condicionamiento, interrumpe la RC, puede concluirse que la respuesta condicionada fue mediada
por la asociación EC-EI. De manera correspondiente, la devaluación del reforzador se ha empleado
para determinar si una respuesta instrumental es mediada por la asociación entre la respuesta y
su reforzador resultante.
Relaciones jerárquicas E(R-C)
Skinner (1938) sugirió hace muchos años que en el condicionamiento instrumental E, R y C están
conectados por medio de una relación condicional E(R-C). Esta sugerencia fue seguida con energía
al final del siglo XX. Se han desarrollado diversas líneas de evidencia, directa e indirecta, que
señalan al aprendizaje de relaciones E(R-C) en el condicionamiento instrumental.
REGUACION DE LA RESPUESA Y ECONOMIA CONDUCTUAL.
Teoría de la respuesta consumatoria.
La teoría de la respuesta consumatoria atribuye el reforzamiento a esas conductas típicas de la
especie. Afirma que las respuestas consumatorias típicas de la especie (comer, beber, etcétera)
son en sí mismas la característica esencial de los reforzadores. En apoyo a esa idea, Sheffield, Roby
y Campbell (1954) demostraron que la sacarina, un endulzante artificial, funcionaba como un
reforzador eficaz, aunque no tuviese valor nutritivo y consecuentemente no pudiese satisfacer una
necesidad biológica.
El principio de Premack.
Dadas dos respuestas de probabilidad distinta, A y B, la oportunidad para realizar la respuesta de
alta probabilidad (A) después de la respuesta de baja probabilidad (B) tendrá como resultado el
reforzamiento de la respuesta B. (B " A refuerza B.) La oportunidad para realizar la respuesta de
baja probabilidad (B) después de la respuesta de mayor probabilidad (A) no resultará en el
reforzamiento de la respuesta A. (A " B no refuerza A.) El principio de Premack se enfoca en la
diferencia en la probabilidad de la respuesta instrumental y la respuesta reforzante. Por tanto, se
conoce también como principio de probabilidad diferencial. Comer reforzará la presión de
palanca, pues, por lo regular, comer es más probable que palanquear. Fuera de eso, la teoría de
Premack niega que exista algo especial en un reforzador.
Aplicaciones del principio de Premack.
El principio de Premack ha tenido un gran impacto en el diseño de los procedimientos de
reforzamiento utilizados para ayudar a diversas poblaciones clínicas. En una aplicación inicial,
Mitchell y Stoffelmayr (1973) estudiaron a dos pacientes hospitalizados con esquizofrenia crónica
que rechazaban todos los reforzadores tangibles que se les ofrecían (dulces, cigarrillos, fruta,
panecillos).
Hipotesis de privación de la respuesta.
Premack (1965) reconoció la importancia de restringir el acceso al reforzador, pero no era esa la
idea principal detrás de su teoría. En contraste, Timberlake y Allison (1974; consulte también
Allison, 1993) abandonaron del todo el principio de probabilidad diferencial y argumentaron que
la restricción de la actividad reforzante era el factor fundamental para el reforzamiento
instrumental. La propuesta se denominó hipótesis de privación de respuesta o (en la investigación
aplicada) modelo de desequilibrio. La hipótesis de privación de respuesta proporcionó un nuevo
principio para la predicción de lo que funcionará como reforzador eficaz. También brindó un
nuevo procedimiento para crear reforzadores: restringir el acceso a la actividad reforzante.