U 6 Elección
U 6 Elección
CONDUCTA DE ELECCIÓN
En Situaciones Reales
• El condicionamiento operante es
raramente una situación en la que sólo
haya una fuente de reforzamiento.
• Por lo regular, las personas y los animales
suelen elegir entre fuentes alternativas de
reforzamiento.
Programas de Reforzamiento
Concurrentes
• la presentación simultánea de dos o más
programas independientes, cada uno
asociado a un reforzador.
• Así, al organismo se le permite realizar una
elección.
• Ejemplo:
– Una paloma puede elegir entre responder a una
tecla roja con un programa RV 20 y una tecla
verde con un programa RV 50.
Ley de Igualación
• la proporción de respuestas emitidas en un
programa, coincide con la proporción de los
reforzadores obtenidos en ese programa.
• Ejemplo:
– Una paloma emitirá aproximadamente el doble de
respuestas en el programa IV 30 seg si se compara
con un programa IV 60 seg.
• La ley de la igualación predice una relación
consistente entre la proporción de reforzadores
y la proporción de respuestas.
Ecuación de Ley de Igualación
RA SRA .
RA + RB = SRA + SRB
• Ejemplo:
– La ley de la igualación predice que la proporción de
respuestas en la tecla roja debe ser 0.67 en el programa
rico y 0.33 en el programa pobre.
– Si en vez de obtener los valores mencionados los
resultados son 0.77 en el programa rico y 0.43 en el
programa pobre: ha ocurrido un sesgo.
Ejemplo de Sesgo en Igualación
con Humanos
• Estefanía del Niñito Jesús podría dedicar más
tiempo al dirigir la conversación hacia Ángel
Gabriel, a quien ella se encuentra muy atractivo.
• En un día, él proporciona el 72% de los
reforzadores durante una conversación, pero sin
embargo, ella lo mira el 84% del tiempo.
• Otro día, él proporciona sólo el 23% de los
reforzadores, pero sin embargo, ella lo mira el
36% del tiempo.
• En cada caso, ella lo mira más de lo predicho por
igualación.
Sesgo desde Igualación y
Preferencia
• Sesgo en igualación puede ser utilizado para
indicar el grado de preferencia para diferentes
reforzadores.
• Ejemplo:
– En un programa concurrente IV 60 seg - IV 60 seg la
paloma debería responder por igual a ambos.
– Si cada alternativa conduce a un reforzador
cualitativamente diferente, la tasa de respuesta más
alta o sesgo hacia un programa podría indicar la
preferencia por ese reforzador.
Ejemplo de Preferencia
• A pesar de que un niño puede pasar poco
tiempo leyendo, esto no significa que la lectura
no sea una actividad reforzante para él.
• Si otras actividades altamente reforzantes están
disponibles al mismo tiempo, la lectura puede
estar “perdiendo” ante éstas.
• Limitar la cantidad de tiempo disponible para
esas otras actividades.
• El niño podría moverse naturalmente hacia la
lectura.
Teoría de Mejoramiento
• la distribución de comportamiento en una situación
de elección, se desplaza hacia aquellas alternativas
que tienen mayor valor independientemente del
efecto a largo plazo sobre la cantidad total de
reforzamiento.
• Ejemplo:
– El programa IV 30 seg tendrá un valor mucho más alto
que el programa IV 60 seg.
– La paloma se verá tentada en sesiones posteriores a
cambiar más y más de su comportamiento en esa
dirección.
Teoría de Mejoramiento,
continúa
• Mejoramiento en esta situación, por lo tanto, una
especie proceso de nivelación, en el que el
comportamiento se desplaza hasta que las dos
alternativas tienen aproximadamente el mismo valor en
los costos versus beneficios.
• La tendencia a moverse hacia la alternativa más rica, a
veces puede resultar en una reducción sustancial en la
cantidad total de refuerzo obtenido, debido a que:
1. la alternativa podría no requerir de responder en demasía
2. el exceso en una alternativa altamente reforzante a menudo
puede resultar en la habituación a largo plazo
3. mejoramiento es a menudo el resultado de una conducta que
está siendo fuertemente regulada por consecuencias inmediatas
1. Una alternativa que podría no
requerir de mucha respuesta
• Ejemplo:
– Una paloma obtiene el 60% de sus reforzadores de un
programa IV 30 seg.
– Dedicará el 60% de su tiempo en responder en el
programa IV 30 seg y sólo el 40% de su tiempo en
responder en el programa RV 100.
– Sin embargo, la paloma debe pasar la mayor parte de
su tiempo en el programa RV, porque el número de
reforzadores obtenidos está directamente relacionado
con el número de respuestas emitidas.
– La paloma debe cambiar brevemente a la alternativa IV
cada 30 segundos, en promedio, para recoger
cualquier reforzador que podría estar disponible en esa
alternativa.
Otro Ejemplo
• Los estudiantes a menudo pasan más tiempo
estudiando para el curso que más disfrutan y
menos tiempo estudiando para su curso menos
preferido.
• Sin embargo, el curso menos agradable es
probablemente uno en el cual los estudiantes
deberían pasar la mayor parte del tiempo
estudiando.
• El resultado es que gastan menos tiempo en el
estudio de cursos que requieren más trabajo.
2. Abuso puede resultar en una
Habituación a Largo Plazo
• Ejemplo:
– De repente te conviertes en alguien tan rico
que puedes comer tanto como quieras de lo
que desees, como… langosta.
– El problema es que si comes langosta con
mucha frecuencia, es probable que llegues a
habituarte a ella.
– Aunque todavía es agradable, ya no es el
placer celestial que alguna vez fue.
Otro Ejemplo
• Si beber en un bar es una actividad muy
agradable, es posible empieces a cambiar más y
más de tu comportamiento en esa dirección.
• Con el tiempo vas a pasar mucho tiempo en el
bar, de tal manera que la cantidad total de
reforzadores en tu vida social se reduce
sustancialmente.
• Beber ya no es tan agradable ya que estás
perdiendo los reforzadores de otras actividades
no relacionadas con el alcohol.
3. La Conducta es Gobernada por
la Consecuencias Inmediatas
• Ejemplos:
– El reforzador disponible de manera inmediata para
estudiar cursos más agradables, es una tentación
para alejarse de los cursos menos disfrutables y evita
la posibilidad de maximizar el promedio de las
calificaciones al fin del semestre.
– El reforzador disponible de manera inmediata para ir
al bar cada noche, es una tentación, sin embargo,
conviene alejarse para beber con moderación y
finalmente establecer un estilo de vida más saludable
y satisfactorio.
Autocontrol
• Ejemplo de la ausencia de autocontrol:
– Decides dejar de fumar pero la idea no la
llevas a cabo más que por un día
– Estás decidido a salir a correr cada mañana,
pero no puedes levantarse de la cama para
hacerlo.
– Diariamente decides estudiar, pero pasas la
mayoría de las noches ya sea viendo la
televisión o socializando.
Autocontrol y Fuerza de
Voluntad
• Una persona que se comporta sabiamente y resiste
las tentaciones se dice que tiene mucha fuerza de
voluntad, mientras que una persona que se
comporta mal y cede a las tentaciones se dice que
tiene poca fuerza de voluntad.
• La fuerza de voluntad se limita a describir lo que
alguien hizo.
• No explica por qué fue capaz de hacerlo.
• Ejemplo:
– Alguien intenta dejar de fumar.
Skinner sobre el Autocontrol
• El manejo de los resultados contradictorios
implica dos tipos de respuestas:
– una respuesta controladora que sirve para alterar la
frecuencia de una respuesta controlada
• Ejemplo:
– Para controlar la cantidad de dinero que gastas,
deja la mayor parte de tu dinero en casa cuando se
trata de salir por la noche (respuesta controladora).
– La cantidad que gastas posteriormente es la
respuesta controlada.
Tipos de Respuestas
Controladoras
• Restricción Física
– Ejemplos: Dejar el dinero en casa o prestar a tu
amiga la televisión por todo un semestre.
• Privación y Saciedad
– Ejemplos: saltar el almuerzo antes de una cena
cara o hacer la compra después de una comida
• Hacer otra cosa
– Ejemplo: mascar chicle para dejar de fumar
Tipos de Respuestas
Controladoras, continúa
• Autorrefuerzo y Autocastigo
– Ejemplo: Te prometes una pizza después de estudiar
durante 3 horas o te comprometes a hacer 20
lagartijas por cada cigarro fumado..
– El problema es no hacerse trampa uno mismo !!.
– Las consecuencias autoadministradas son más
eficaces cuando la persona percibe que la gente está
consciente de la contingencia.
– contingencias autoadministradas son un componente
recomendado de muchos programas de autocuidado.
El Problema del Tiempo
• consecuencias inmediatas son generalmente
más poderosas que las consecuencias
demoradas.
• El autocontrol consiste en elegir el reforzador
más grande con demora, en lugar del
reforzador más inmediato pero más pequeño.
• Ejemplo:
– Un estudiante que pudiera salir por la noche y
pasarse un buen rato o estudiar con la esperanza de
lograr una excelente calificación.
El Problema del Tiempo,
continúa
• El autocontrol consiste en la posibilidad de
elegir entre un castigo más inmediato y más
pequeño a un castigo posterior más grande.
• Ejemplo:
– Al decidir si acudir al dentista o no, elegimos
entre:
• soportar una ligera molestia ahora y un tratamiento
dental menor o
• correr el riesgo de una gran cantidad de molestias
en un diente infectado en un futuro lejano.
¡No es una simple elección!
• Ejemplo:
– Elegir no fumar conduce a dos resultados
• un castigo inmediato y menor en la forma de síntomas
de abstinencia y
• una recompensa más grande y más demorada en la
forma de mejora de la salud
– Continuar fumando conduce a dos resultados
• una recompensa más pequeña e inmediata en la forma
de una alta nicotina y
• un castigo más grande más adelante, en la forma de
deterioro de la salud.
Consecuencias Demoradas
• a menudo se presenta una especie de
doble golpe.
• Su valor se debilita debido a que se
retrasa y hay menos certeza sobre ellas.
• Ejemplo:
– No hay garantía de que alguien va a enfermar
y morir si continúa fumando, ni hay ninguna
garantía de que va a estar radiante y
saludable si deja de fumar.
Tarea de la Demora en la
Gratificación
• la tarea de elegir entre un reforzador más inmediato y
más pequeño y uno posterior y más grande.
• La persona o animal deben renunciar a la recompensa
más pequeña antes de obtener la recompensa posterior
más grande.
• El sujeto tiene que “demorar la gratificación”.
• El autocontrol consiste en elegir una recompensa
demorada más grande sobre una recompensa más
pronta pero más pequeña.
• Impulsividad consiste en elegir una recompensa más
pequeña cuanto antes sobre una recompensa posterior
más grande.
Demora de la Gratificación:
Paradigma de Mischel
• La investigación sistemática inicio utilizando un
procedimiento de demora de la gratificación, realizado
por Walter Mischel.
• Un niño fue llevado a una habitación que contenía dos
ítems, uno de los cuales era claramente preferido.
• Al niño se le dijo que podía alcanzar el ítem preferido
simplemente esperando a que el experimentador
regresara.
• Si el niño lo deseaba, sin embargo, el experimentador
podría llamarlo por una señal auditiva, y en ese
momento el niño recibía sólo el ítem más pequeño, no
preferido.
Demora de la Gratificación:
Paradigma de Mischel, continúa
• La pregunta de interés era observar qué tipo de estrategia
empleaban los niños para esperar a que transcurriera el
periodo de demora y así obtener la recompensa más
grande.
• Algunos niños simplemente evitaron ver los ítems o se
taparon los ojos para no ver las recompensas prometidas.
• Otros niños hicieron algo más para distraerse.
• Los niños que se centraron en las cualidades abstractas
del objeto obtuvieron mejores resultados.
• Los estudios de seguimiento revelaron que los niños que
habían esperado por recompensas preferidas eran más
competentes, cognitiva y socialmente.
La Reversión
• En un punto temprano en el ensayo, cuando ambas
recompensas son aún lejanas, se prefiere claramente la
mayor recompensa demorada (MaD).
• Sin embargo, a medida que pasa el tiempo, y la
recompensa más pequeña se hace inminente (MeI), su
valor aumenta bruscamente y llega a pesar más que el
valor de la MaD.
• Ejemplo:
– El estudiante que, cuando se despierta por la mañana, decide que
sin duda va a estudiar esa noche se encuentra en el extremo
izquierdo.
– A medida que se acerca la noche, sin embargo, y la posibilidad de
salir (MeI) se hace inminente, el estudiante será fuertemente
tentado a socializar.
Reversal Graph
Estudios de Reversión
• Ejemplos:
– Palomas con dos opciones de respuesta:
• Una respuesta en la tecla roja permite el acceso de 2 segundos
al grano después de un retraso de 20 segundos (MeI), o
• un picoteo en la tecla verde permite el acceso de 6 segundos al
grano después de un retraso de 24 segundos (MaD).
• .
– Humanos eligen entre:
• un cheque por $ 100 que puede ser cobrado inmediatamente, o
• un cheque por $ 200 que puede ser cobrado en 2 años.
Cambio de la forma de la función
de demora para MaD
• La razón fundamental por la que se produce la
reversión de preferencia se debe a que la MaD
tiene poco valor en largas demoras.
• Parece que hay diferencias innatas en la
impulsividad entre las especies.
• También puede haber diferencias entre los
individuos, con algunos más impulsivos que otros.
• Las personas se vuelven menos impulsivas a
medida que envejecen.
• La experiencia repetida con el responder para
recompensas demoradas, impacta la
impulsividad.
Cambio de la forma de la función
de demora para MaD, continúa
• La disponibilidad de otras fuentes de
refuerzo puede ser otro factor que influye
en la impulsividad.
• Podemos mantener más fácilmente
responder a un objetivo lejano mediante la
creación de una serie de sub-objetivos
explícitos.
Respuesta de Compromiso
• una acción realizada en un punto temprano en el
tiempo, sirve para eliminar el valor o reducir éste en
relación a una próxima tentación.
• Ejemplo:
– Para asegurarse de que va a estudiar esta noche, ella da
a su hermano menor $ 20 en la mañana y le da
instrucciones para quedarse con el billete si no cumple.
– La consecuencia aversiva que resultaría de no estudiar,
ha reducido el valor de cualquier actividad alternativa y la
más grande recompensa demorada de obtener una
buena nota.
Contrato Conductual
• una persona se organiza formalmente
para alcanzar ciertas recompensas por
resistirse a la tentación o recibir ciertos
castigos para ceder a la tentación.
• El contrato se negocia con un terapeuta.
• Las contingencias previstas en el contrato
sirven para reducir el atractivo de la
alternativa tentadora.
Incluso las palomas pueden asumir
compromisos
• En un estudio de Rachlin y Green (1972),
a las palomas se les dio la opción de
responder a otra tecla que eliminaría la
MeI como una de las opciones y salir de la
MaD como la única alternativa.
• Muchas de las palomas seleccionaron
esta opción, por lo tanto, eliminaron la
tentación antes de tiempo.
Efectos del modelo,pequeños pero
acumulativos
• Cada elección de MeI frente MaD tiene un efecto
pequeño pero acumulativo en alcanzar nuestras
metas.
• Esta es la razón por la que autocontrol es tan difícil.
• Ejemplo:
– La elección entre el mundialmente famoso restaurante
Grasa-Burger y el mucho más saludable, pero mucho
menos apetitoso, Tofu Ensalada Supremo, cuando se trata
de mantener un estilo de vida saludable.
– Es debido a que una hamburguesa es poco probable que
tenga un resultado aversivo que su valor puede elevarse
tan bruscamente.
Mejorando el Autocontrol
• Desarrollar un plan para manejar errores
ocasionales.
• Establecer normas que distinguen claramente entre
los comportamientos aceptables e inaceptables.
• El punto real cuando una conducta impulsiva se
vuelve dañina a menudo no es claro.
• La regla más clara podría ser la abstinencia total de
un evento tentador.
• Ejemplo:
– La regla de Alcohólicos Anónimos, en la que jamás se
debe consumir alcohol
Resumen
• Un programa concurrente ofrece la oportunidad
de responder sobre dos o más programas
independientes disponibles simultáneamente.
• la conducta de elección en tales situaciones a
menudo obedece a la ley de la igualación.
• Hay ciertas desviaciones de igualación:
• Subigualación
• Sobreigualación
• Sesgo
Resumen, continúa
• Según la teoría de mejoramiento, igualación
resulta de la tendencia del individuo a
cambiar la conducta hacia una alternativa
que paga mejor.
• Este exceso puede dar lugar a:
– la reducción de la cantidad global de
reforzamiento
– habituación a largo plazo de esa alternativa
– atracción por los reforzadores inmediatos
Resumen, continúa
• Skinner consideró el autocontrol como una elección o
conflicto entre resultados contradictorios.
• Él creía que el autocontrol es facilitado mediante la
emisión de una respuesta controladora que altera la
probabilidad de una respuesta controlada.
• Otros creen que el autocontrol implica una elección
entre una recompensa más inmediata pero más
pequeña y una recompensa más grande pero demorada
• Esto se llama perspectiva de la demora de la
gratificación.
Resumen, continúa
• Resistir a la tentación es ayudado por:
– distracción de la recompensa tentadora.
– pensar en la recompensa en términos de su
sus propiedades abstractas más que en sus
propiedades concretas
– El modelo Ainslie-Rachlin del autocontrol dice
que el valor de una recompensa aumenta
drásticamente, ya que se hace inminente.
• Por tanto, las preferencias para MaD y MeI
tienden a cambiar a través del tiempo.
Resumen, continúa
• Factores que podrían afectar el autocontrol
incluyen:
– variables biológicas,
– edad,
– experiencia en el responder a recompensas
demoradas,
– presencia de otras fuentes de reforzamiento, y
– la obtención de submetas relacionadas a la
MaD.
Resumen, continúa
• Una respuesta de compromiso sirve para reducir
el valor de la MeI para que su valor permanezca
por debajo del valor de la MaD.
• Privación de respuesta
– límite en el acceso a una respuesta
– no se requiere alta vs baja probabilidad
Teorías del Reforzamiento
Hipótesis de Privación de
Respuesta
• El principio de Premack requiere conocer
las probabilidades relativas de dos
conductas antes de saber sí una de ellas
será un reforzador efectivo para la otra
conducta. Pero, ¿qué ocurre sí sólo se
tiene información de una sola conducta?
• ¿Existe alguna forma de saber sí esa
conducta puede servir como reforzador
antes de intentarlo?
Teorías del Reforzamiento
Hipótesis de Privación de
Respuesta
• La Hipótesis de la Privación de
Respuesta establece que una conducta
puede servir como un reforzador
cuando: (1) el acceso a la conducta está
restringido y (2) por lo tanto la frecuencia
de esa conducta cae por debajo de su
nivel preferido de ocurrencia.
hago la tarea → leo el Libro Vaquero
R SR
Otras aproximaciones sobre
Regulación Conductual
• Regulación Conductual
– Contingencias de reforzamiento imponen
restricciones sobre la conducta
– Organismos buscan sus bliss points conductuales
• Homeostásis Conductual
– distribución preferida de actividades
– condicionamiento operante impone límites
– bliss point conductual
• e.g., el tiempo transcurrido estudiando vs el tiempo en
los videojuegos
–
Otras aproximaciones sobre
Regulación Conductual
Tiemp
Oportun
o de
idad de
estudi
ver tv
o
Estudio Ver tv
Amigos Ocio
Ejercicio Videojuegos
Celular
Número de Reforzador
respuestas =
= Bien
Dinero comprado
Reforzadores
Reforzadores
obtenidos
obtenidos