0% encontró este documento útil (0 votos)
123 vistas23 páginas

Tema 6 Clase

Este documento trata sobre técnicas derivadas del condicionamiento operante. Explica conceptos como conductas operantes, contingencias operantes, reforzamiento positivo y negativo. También describe el principio de Premack donde una respuesta de alta probabilidad puede usarse para reforzar una respuesta de baja probabilidad.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
123 vistas23 páginas

Tema 6 Clase

Este documento trata sobre técnicas derivadas del condicionamiento operante. Explica conceptos como conductas operantes, contingencias operantes, reforzamiento positivo y negativo. También describe el principio de Premack donde una respuesta de alta probabilidad puede usarse para reforzar una respuesta de baja probabilidad.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

TEMA 6.

TÉCNICAS DERIVADAS DEL


CONDICIONAMIENTO OPERANTE

Es la aplicación directa y estricta de los principios del condicionamiento operante, no son técnicas como tal. Es el CO
aplicado al cambio de conducta. Sirve para cambiar conducta o explicarla, sirve para entender el AF.

CONDUCTAS OPERANTES. Son aquellas que son función de sus consecuencias (que dependen de éstas y no de la
estimulación antecedente). La conducta operante no es la que causa la conducta. El estímulo antecedente que se llama
E. discriminativo puede aparecer y depende exclusivamente de sus consecuentes.

La conducta depende única y exclusivamente de sus consecuencias  Lo que depende de las consecuencias no es la
respuesta antecedente, sino la respuesta futura que ocurre cuando se dan diferentes antecedentes. Depende de sus
consecuencias el hecho de que ocurra en un futuro o no. NUNCA PODEMOS DEFINIR UN REFORZADOR
ESTABLECIENDO UNA ÚNICA SECUENCIA CONDUCTUAL.

- Un reforzador es reforzador porque hipotetizamos que se dará en el futuro de nuevo o porque se ha visto su función
o valor reforzante en el pasado.

La palabra consecuente no quiere decir que derive de la respuesta, no es una consecuencia es un estimulo que se pone
en relación con una respuesta; no todo lo que yo hago hace que ocurra lo siguiente; el azar, la vida, el profesor… pone
en relación una R con un E, pero es que sea consecuencia de…

Las técnicas de intervención sobre la respuesta operante obligan a cambiar el estimulo consecuente o el estímulo
antecedente, que es el discriminativo. Entonces la conducta operante tiene estos tres términos: el antecedente que es el
Ed, la R operante, y el Econsecuente. El estimulo consecuente puede tener cuatro funciones: refuerzo positivo, refuerzo
negativo, castigo positivo y castigo negativo.

La conducta es la relación E-R-C no la respuesta. La respuesta operante esta bajo control del estimulo
antecedente. La operante no depende de las consecuencias, el EA es el que controla la respuesta. El EA
discriminativo evoca o discrimina la respuesta operante. El Econs es un reforzador (que no se asocia a
reforzamiento pq también puede venir dps del castigo)

Respuesta controlada por el Ed y modificada por el Estimulo consecuente

Contingencias operantes

E-R-C

• Secuencias de tres términos (como mínimo)

• Contingencia operante es la relación entre el estímulo antecedente en presencia del cual


se emite o no la respuesta, dicha respuesta/acción operante y el estímulo que la sigue
(estímulo consecuente)

• La respuesta operante está bajo control del estímulo antecedente

• El estímulo antecedente (discriminativo) evoca la respuesta (operante)

 Contingencia de tres términos que se analizan dos a dos:

• Respuesta y las consecuencias apetitivas o aversivas


• Estímulo discriminativo y el procedimiento de reforzamiento o castigo (que se
establece en función de la consecuencia)

 Contingencias o correlaciones entre R y consecuencias: relación de la respuesta y


consecuencia

• Positivas si se establecen entre la R y los procedimientos de reforzamiento


positivo y castigo positivo. Si aparece uno, aparece otro si—si (+1). No debemos
relacionar positivo con reforzamiento.

• Negativas si se establecen entre la R y los procedimientos de reforzamiento


negativo y castigo negativo. Después de la respuesta desaparece algo. Si aparece
uno no aparece otro si—no (-1)

 Contingencias o correlaciones entre Ed y procedimiento: relación r-Rf

• E+ si el Ed señala un procedimiento de reforzamiento. La respuesta incrementa


(por aparición o desaparición de algo)

• E- (o E∆) si el Ed señala un procedimiento de castigo/extinción -> estimulo


discriminativo negativo o estimulo delta.

• Ambas son correlaciones positivas entre E d y procedimiento (si no fuera así, se


llamaría antecedente)

ED – R – Econs.

REFORZAMIENTO
Una respuesta no puede ser reforzada y castigada al mismo tiempo pero si puede tener ambos potenciadores
aunque siempre la pendiente va a ser reforzada o castigada.
REFORZAMIENTO: evento presentado inmediatamente después de una respuesta que incrementa la probabilidad de
ocurrencia o frecuencia de la misma  procedimiento de aprendizaje que incrementa la probabilidad de ocurrencia o
frecuencia de una respuesta es un estimulo que tiene la capacidad de que cuando ocurre después de una respuesta
aumenta la probabilidad de aparición de la misma. Se mide por el efecto que tiene sobre la respuesta, si es capaz de
aumentar la ocurrencia futura de la respuesta es un refuerzo.

Aunque el refuerzo sea positivo o negativo su función siempre va a ser incrementar la respuesta.

REFORZAMIENTO POSITIVO: incrementa la probabilidad de la aparición de la respuesta añadiendo algo. Se añade


un E (generalmente apetitivo) a continuación de la emisión de la respuesta:

 Primarios o incondicionados: tienen valor reforzante sin que hayan sido sometidos a alguna situación de
asociación o aprendizaje. Son todos aquellos que tienen que ver con cosas que satisfacen nuestras necesidades
básicas)

 Secundarios o condicionado: aprendidos; han adquirido su valor de refuerzo por asociación o aprendizaje. El
ejemplo máximo de este es el dinero porque se asociado a un montón de reforzadores primarios)

 Reforzadores de apoyo (condicionados e incondicionados). Todo aquel que se puede cambiar por uno
generalizado (como las fichas o el dinero). Se le llama de apoyo, porque es lo que les da el valor a las fichas o
al dinero.

o Se asocia a un estimulo al que queremos dar valor reforzante puede ser primario o secundario.

o Uno generalizado es uno que nos da la posibilidad de conseguir otro tipo de reforzadores tanto
primario como secundario. Como por ejemplo el dinero o la ficha de una economía de fichas, donde
por tantas dichas te dan algo y su valor va cambiando (en esto se basa el sistema económico de cada
país).

o Aquello que cambiamos por el refuerzo generalizado: por cada X te doy Y. Eso que nos van a dar o
que podemos cambiar por fichas y que es lo verdaderamente reforzante son reforzadores de apoyo
porque es lo que le da el valor a las fichas o al dinero. Es decir, si el dinero o las fichas no se puede
cambiar por nada no tendría valor, por lo que es lo que le da el valor al refuerzo generalizado.

o Los refuerzos de apoyo pueden ser tanto incondicionados como condicionados

 Generalizados (dinero, fichas). Como ya hemos dicho nos da la opción de obtener muchos tipos de reforzadores,
ya sean primarios (comida) o secundarios (joyas). Da acceso a muchos otros reforzadores (fichas en el casino)

Doy fichas como reforzadores. Las fichas se pueden canjear por muchos premios. ¿Los premios serian los
reforzadores de apoyo y las fichas el reforzados generalizado?

 Estímulos y respuestas: Principio de Premack, la respuesta más probable reforzará a la menos probable (comer
y correr en ratas, sentados y correr en niños en el aula). Me encanta la pasta y no los guisantes, si te comes los
guisantes puedes comer pasta. La respuesta que queremos instaurar tiene que estar reforzada masivamente
(mucha pasta y pocos guisantes).

o El principio de Premack: lo que dice es que una respuesta de alta probabilidad puede usarse como
reforzador de una respuesta de baja probabilidad.

o Ejemplos: en las ratas se les da la comida en función del tiempo que corran. La comida les gusta y
correr no tanto, entonces cada vez les pedimos más respuesta de baja probabilidad para la misma
respuesta de alta probabilidad: tiene que correr más para adquirir la misma cantidad de comida.

o Ejemplo en niños: los niños sentados y corriendo en el aula. A los niños pequeños lo que les cuesta
más es estar sentados, estar haciendo los deberes… Lo tenemos que hacer de la siguiente manera para
que funcione bien: poner en relación primero lo que no gusta, con lo que gusta. Los padres lo emplean
mal cuando dicen primero lo que gusta (comer, merendar…) y luego lo que no (hacer deberes).
o Cuando esto no funciona o falla el principio es porque estamos utilizando una respuesta de alta
probabilidad que no es tan reforzante o es que se está utilizando mal el principio: cuando se pide
mucha cantidad de respuesta para poco reforzador; por ejemplo, si le damos 5 minutos de televisión
por 1 hora estudiando, no vale para nada.

REFORZAMIENTO NEGATIVO o CONDICIONAMIENTO DE ESCAPE Y DE EVITACIÓN: incrementa la


probabilidad de la aparición de la respuesta quitando algo. Se retira un E (generalmente aversivo) tan pronto se ejecuta
la respuesta correcta. Se incrementa la respuesta porque quitamos algo que normalmente es aversivo para la persona, y
que está manteniendo la conducta:

 Primarios (electricidad, ruido intenso). No aprendidos o incondicionados, los efectos que provocan están
genéticamente determinados. En el laboratorio se utilizan este tioo de reforzamiento

o Ejemplo  Se quiere aumentar la interacción entre las personas que están en el comedor: se pone un
ruido intenso se fondo que se quita cuando alguien empieza a hablar con otra persona, entonces
aumenta la respuesta de conducta de hablar porque se iba quitando el ruido.

o En ambientes cotidianos por ejemplo, nos tomamos un analgésico cuando nos duele la cabeza, o nos
podemos el abrió si hace frío.

 Secundarios o condicionados (expresiones faciales de desaprobación). Cuando no queremos que un niño no haga
algo en una comida familiar ponemos esta expresión. Tenemos que tener en cuenta que para que el ceño
fruncido haya tenido control de la respuesta se ha tenido que asociar un elemento no aprendido como una
bronca o una prohibición de salir. La inmensa mayoría de los ocurridos en el contexto natural.

 Ejemplos de respuestas controladas por R-:

o Ponerse un abrigo en días de frío. Nos lo podemos porque es bonito, pero también porque nos quita el
frío.

o Tomarse un analgésico para el dolor de cabeza.

o En el entrenamiento de perros guías: se les elimina la tensión del collar cuando dejan de tirar.

FACTORES QUE INFLUYEN EN LA EFICACIA DEL R +

1. Selección del comportamiento a incrementar.

Ej. cuando queremos aplicar un reforzador sobre la conducta de “portarse bien” tenemos que especificar cuál
es esa conducta. Portarse bien no es la R, sino que es un conjunto de R y tenemos que especificarlas. Es
importante seleccionar la conducta de manera específica para luego poner ponerla en relación con el
reforzador. Además, la selección es individual porque lo que refuerza a una persona no es lo mismo que lo que
refuerza a otra (salvo los reforzadores primarios).

Además, si castigamos una conducta y no reforzamos otra que queramos conseguir, va a funcionar peor.

2. Elección de los reforzadores:

Esta elección es individual. Si no se pone en relación la R concreta con el E reforzador no se genera la relación
de contingencia.

a. De consumo. Es tomar algo, comer…

b. De actividad. hacer cosas.

c. De posesión. Banda que se le pone a un estudiante para que se sepa que ha sido el mejor estudiante
durante la semana.

d. Social. Todo lo que son gestos de aprobación, felicitación, sonrisas…


e. Manipulativo. Lo que implique hacer cosas con las manos.

f. Cualquier elemento puede actuar como reforzador y forman parte de la vida cotidiana; solo hay que
tener en cuenta si se produce o no la respuesta. Depende del valor o función que le demos o el efecto
que tiene sobre la R  muchas veces la atención funciona como un reforzador principal.

3. Operaciones motivadoras:

La motivación está mal definida y desde el análisis de la conducta la motivación es una operación que consigue
que la R aumente en probabilidad de aparición, es decir, que un contexto que es reforzante, lo sea todavía más.

a. Operación de establecimiento: privación. En la medida en la que estoy privado de un reforzador, ese


estimulo reforzante, ese reforzador va a tener un valor/potencia reforzante mayor.  esta es
motivación para hacer más.

i. si no tengo dinero, un poco de dinero me va a servir muchísimo.

b. Operación de abolición: saciedad. En la medida en la que tengo mucho estímulo reforzante, no va a


tener tanto valor reforzante.  esta es motivación para no hacer. -> se puede corregir con refuerzo
intermitente -> combinando reforzador con privacion

i. Si tengo mucho dinero, poco de dinero no me va a servir como reforzador. Por 1€ no me va a


importar.

Entonces, la operación motivadora es aquella alteración que se hace en un contexto determinado y


modifica el potencial del reforzador aumentándolo o discriminándooslo con estas dos formas:
privación o saciedad. Pero todo ello son acciones motivadoras.

Esto no es solo interesantísimo, sino que nos abre un campo de acción muy grande.

Utilizar siempre el mismo reforzador hace que pierda potencia entonces combinado reforzador con
privación (refuerzo intermitente) tiene más potencia y puede ser muy poderoso para mantener el valor
del reforzador. Es decir, la saciedad de reforzador es un peligro porque deja de tener valor,
combinando el reforzador con la privación, incrementa el valor.

No solo actúan sobre el reforzador, también sobre el D discriminativo y sobre la R, pero eso no lo
vamos a ver aquí.

4. Magnitud del reforzador. Cuanto más grande, intenso o valioso sea en estímulo, mayor magnitud va a tener el
reforzador.

5. Instrucciones: el uso de reglas.

A un organismo que no es verbal (en niños pequeños o animales), que le digamos verbalmente para qué sirve
qué no vale para nada, es decir, que mientras no se es verbal el establecimiento de la contingencia: decir lo que
tiene que hacer para conseguir el reforzador es inocuo.

En cambio, en las personas verbales, explicar para qué sirve algo, es muy útil, dar esta instrucción aumenta la
ejecución y hay más probabilidad de que se mantenga la respuesta porque se necesitan menos ensayos para
establecer esa contingencia de reforzamiento.

Son tan importantes las instrucciones que este establecimiento verbal, muchas veces, es suficientemente
reforzante, el establecimiento verbal de la relación de la R con el reforzador puede controlar mi respuesta: “si
estudio ahora mucho, en verano me iré de vacaciones”. Esto ocurre en adultos, porque ya somos capaces de
posponer el refuerzo (no en niños).

6. Inmediatez del reforzador. Instrucciones sobre la demora.

Para que funcione la aplicación del reforzador tiene que ser inmediata, salvo que se den instrucciones sobre el
reforzador. Podemos aumentar la demora dando las instrucciones o dando reforzadores generalizados: dando
un vale por… que tiene valor reforzante porque se asocia al reforzador de apoyo.
7. Refuerzo contingente y no contingente.

Esto es un error: refuerzo contingente y no contingente es imposible; el refuerzo tiene que ser inmediato y
contingente (sino, no es un reforzador), pero se habla de ello para hacer referencia que muchas veces el
estimulo reforzador aparece aleatoriamente en el medio sin estar asociado a una respuesta (se llama por eso no
contingente, disminuye la contingencia).

Quiere decir que el estimulo reforzante aparece de manera aleatoria, sin que se de la respuesta que diera ese
reforzador y esto hace que disminuya el efecto de la respuesta que daba a ese estimulo reforzante; pero puede
aumentar la probabilidad de respuesta. Ejemplo: si me dan dinero por recoger la habitación, pero me lo
empiezan a dar sin que recoja la habitación, al final disminuye el efecto.

8. Mantenimiento del cambio mediante reforzadores naturales.

Cualquier elemento artificial como las fichas deberían ir pasándose poco a poco como reforzadores naturales ,
como pueden ser los reforzadores verbales (ej. “muy bien”), las caricias, la atención… de forma que por
ejemplo, en un niño, la satisfacción de la profesora (sonrisa), sirva como reforzador.

CASTIGO

CASTIGO: estímulo que presentado inmediatamente después de una respuesta reduce la frecuencia (o probabilidad de
aparición futura) de la misma. Tiene efectos directos (disminución) e indirectos (efectos indeseables).

El castigo funciona para reducir una conducta que queremos que desaparezca. A veces la gente piensa que el castigo es
malo porque piensan solo en el castigo físico, pero no es así. Hay dos tipos: positivo, o negativo. El Ed siempre es
negativo.

CASTIGO POSITIVO O POR APLICACIÓN: se añade o aplica un E para reducir la probabilidad de aparición de
una respuesta; el estimulo o lo que se aplica es generalmente aversivo y va después de una R:

o Primarios o incondicionados (no son aprendidos; dolor o malestar físico)

o Secundarios o condicionados (son aprendidos; riñas, gestos)

CASTIGO NEGATIVO O POR SUPRESIÓN: este estimulo es generalmente apetitivo y se aplica al realizar la
conducta que se quiere eliminar.

Efectos indirectos: suprime la conducta pero no enseña la conducta qcon la que debe sustituirse. Otro ejemplo, la
persona que castiga se condiciona como estimulo aversivo. Se suele confundir castigo con estimulo aversivo o castigo
físico.

o Tiempo fuera: se retira a la persona de la situación reforzante (exclusivo y no exclusivo). Esto es porque no
podemos retirar el refuerzo de la situación o del contexto. Ejemplo: no podemos quitar el tobogán del parque
infantil, pero si podemos quitar al niño del parque infantil.

o Exclusivo: cuando por ejemplo te sacan de clase

o No exclusivo: te ponen mirando a la pared, aquí no te quitan totalmente del contexto.

o Coste de respuesta: se retira el reforzador. Como por ejemplo una multa, pero son un pésimo castigo porque no
es inmediato, tienes la posibilidad de saltarte el castigo y para la gente que tiene buena economía dan igual.

NO CONFUNDIR CON EXTINCIÓN: diferencia entre castigo – extinción

La extinción implica retirar todos los estímulos que mantienen la respuesta, es decir, dejar la R sin estímulos
reforzantes. En el coste de respuesta quitamos un estimulo reforzante, pero en la extinción quitamos los que mantienen
la respuesta, pero no tiene por qué ser reforzantes únicamente.
Ejemplo: si los padres quieren que lleguemos a una hora a casa, las 3 y llegamos a las 6 y aplican el coste de respuesta,
que es quitar la paga o ir al cine… porque no nos pueden quitar el reforzador que es que nos lo estábamos pasando bien.

Si voy por la carretera a toda velocidad lo que hace que corra es la serie que quiero ver en casa y si me ponen una multa
(que pretende ser un C- de correr, pero no es castigo del por qué corro) da igual, sólo me quitan dinero. Por ejemplo, si
mi padre quiere que llegue a una hora X y llego más tarde, un coste de respuesta sería quitarnos una parte de la paga,
pero no nos puede quitar el reforzador porque el reforzador es que me lo estaba pasando bien de fiesta. Extinción sería
quitarme todo lo que me mantiene la R y castigo hacer algo que disminuya mi respuesta, pero no tiene por qué ser lo
que mantiene mi respuesta.

*Aquellas respuestas reforzantes en sí mismas no pueden ser sometidas a extinción: correr, comer, beber, consumir
drogas…etc. Salvo que corras para algo (donde lo reforzante es el para).

Aumenta Disminuye
Añadir R+ C+
Retirar R- C-

FACTORES QUE INFLUYEN EN LA EFICACIA DEL CASTIGO

1. Optimizar las condiciones para conseguir una respuesta alternativa deseable (control de estímulos y
refuerzo positivo). Si la respuesta que se quiere castigar es la única respuesta de comportamiento, es más
difícil de disminuir y hay que facilitar una respuesta alternativa. Se hace mediante control estimular,
informando que esa conducta va a ser castigada, se facilita otra respuesta y esa respuesta es reforzada.

Es decir el castigo como algo que suprime la respuesta funciona mejor cuando permite que se den las
condiciones para que haya una R alternativa; la facilitación de la R alterativa es algo bueno, porque es
reforzada y funciona mejor.

2. Minimizar la probabilidad de ocurrencia de la respuesta que se quiere castigar. Si queremos disminuir la R


de consumir droga de una persona, podemos cambiar el contexto, aumentar el coste de la droga para disminuir
la R, etc. El castigo siempre intenta aumentar la probabilidad de otra respuesta y disminuye la que no se quiere
de diversas formas

3. Elegir el castigo para que sea eficaz: intensidad y que “solo castigue” (cuidado con la atención). El aplicar
un E aversivo si no disminuye la R no es castigo. Si se va a elegir un procedimiento de castigo hay que aplicar
la intensidad y el tiempo necesarios para que disminuya la R. Cuidado con la atención en esto. Muchas veces el
tema de la atención funciona más como reforzante que como castigador: regañar a un niño delante de sus
amigos puede ser reforzador si el niño quiere llamar la atención. Muchas veces se presta más atención a una
persona cuando hace las cosas mal (se sientan a hacer los deberes si no los hacen solos…) que cuando hace las
cosas bien entonces aprenden que cuanto peor se porten, más atención tienen de los padres.

4. Utilizar normas claras para el uso del castigo

5. Administrar el castigo de forma inmediata y en todas las ocasiones. Igual que el reforzador tiene que ser
inmediato y en todas las ocasiones, el castigo también y de esta forma se puede funcionar como elemento de
control de una Respuesta.

POSIBLES PROBLEMAS DERIVADOS DEL USO DEL CASTIGO

El castigo tiene algunos efecto ssecundarios por eso hay que aplicarlo solo cuando sea necesario:

1. Puede provocar comportamientos agresivos. El castigo enfada, muchas veces no nos gusta que nos quiten algo
que nos gusta o que nos den algo que no nos gusta.
2. Puede dar lugar a la aparición de respuestas emocionales condicionadas (miedo) y sus Ecs. Esto pasa
cuando se da el castigo con mucha intensidad y poder asociar una figura a ese castigo y puede dar respuesta de
miedo.

3. Puede dar lugar a comportamientos de escape y evitación. Aprendemos cosas inadecuadas para evitarlo.
Ejemplo: lo mas habitual es la mentira para escapar o evitar el castigo (la mentira es reforzada por refuerzo
negativo). Entonces hay que tener cuidado porque no solo no estaría castigando sino que estoy enseñando otra
conducta inadecuada como mentir.

4. No se enseña el comportamiento deseable. Entonces desaparece un comportamiento que no deseamos, pero no


estamos enseñando nada, por eso decimos que se tiene que dar una respuesta alternativa.

5. Se modela el comportamiento de castigar. Cuando aplicamos un estimulo aversivo, estamos enseñando a otra
persona a controlar la conducta a través de comportamientos aversivos.

cuando el castigo se aplica en situaciones de ira o cabreo se está enseñando un comportamiento muy
inadecuado porque se enseña que es la forma de actuar ante esas situaciones, en vez de castigar para extinguir
la conducta indeseada y reforzar la conducta deseada desde el modelado, que es comportándote tú como
quieres que aprenda.

Ej.: Niño que regaña al hermano pequeño cuando y como le regañan a él y niño que besa a su hermano
pequeño como le besan a él. Esto se puede solventar cuando se enseña la conducta deseable que se quiere
conseguir a la vez que se emite el castigo. Si yo castigo de forma agresiva, estoy enseñando a través del
modelado a castigar así, pero si enseño desde buena conducta, enseño desde el modelado cual es la conducta
que hay que tener en vez de la castigada.

6. El uso continuado y único del castigo obliga a incrementar la intensidad del mismo. Como el refuerzo
provoca saciación, también puede hacerlo el castigo. Al final nos acostumbramos y hay que aumentar la
intensidad del castigo.

Esto son efectos indirectos y que se pueden eliminar con programas de refuerzo.

DISCRIMINACIÓN Y GENERALIZACIÓN DE ESTÍMULOS (I)

El hecho de que una respuesta esté castigada o reforzada sistemáticamente en presencia de un estimulo (discriminativo)
hace que ese estimulo ejerza control sobre la R sin necesidad de que aparezca el refuerzo o el castigo.

En algunas situaciones o en presencia de ciertos estímulos, una determinada R puede reforzarse, en tanto que esto no
ocurrirá en presencia de otros estímulos. Los primeros señalan las consecuencias que con toda probabilidad seguirán.

Hemos tenido la experiencia del típico profesor bueno (permisivo, con el que hablabas en clase) y el típico profesor
malo (castigador si te pillaba haciendo algo). Una vez que esto ocurre, que las contingencias de actuación de uno son
más laxas que las de otro que son más aversivas, la sola presencia del profesor, sin necesidad de que hiciese nada,
generaba ya nuestra respuesta de no hacer nada y pasar (con el laxo) o de tener miedo (con el castigador).

Cuando un estimulo es sistemático en la aplicación de una contingencia la mera aparición del estimulo controla la
conducta, lo cual nos ahorra muchos refuerzos y castigos (economía conductual)  esto es lo que se llama
entrenamiento en discriminación: sistematicidad en la aplicación de un proceso hace que la mera aparición del
discriminativo controle la R.

- Si somos sistemáticos en la aplicación de refuerzo o castigo en presencia de un estimulo discriminativo, al final eso
controla la conducta.

Si el estimulo discriminativo no es claro, la respuesta de la persona es confusa, se llaman discriminaciones


neurotizantes. Ej: le voy a decir algo a mi padre y estoy nerviosa porque no sé como me va a responder.
o En algunas situaciones o en presencia de ciertos estímulos, una determinada R puede reforzarse, en tanto que esto
no ocurrirá en presencia de otros estímulos. Los primeros señalan las consecuencias que con toda probabilidad
seguirán.

o El reforzamiento de una conducta en presencia de un estímulo determinado y no de otros hace que dicho estímulo
(Ed) ejerza cierto control sobre la probabilidad de que la respuesta ocurra. Decimos entonces que ese
comportamiento está bajo CONTROL DE ese ESTÍMULO (o que hay una correlación alta entre un E y una R).
Esto se ha conseguido porque en presencia de ese E se ha castigado o se ha reforzado esa R.

o Con el tiempo, el efecto de reforzar diferencialmente la respuesta ante distintos estímulos (ENTRENAMIENTO
EN DISCRIMINACIÓN) hará que ésta ocurra probablemente en presencia de un Ed y que no ocurra en presencia
de un EΔ. (este proceso de entrenar que la R ocurra frente un E y no frente a otro, se llama APRENDIZAJE DE
LA

o GENERALIZACIÓN DE LOS ESTÍMULOS. Una respuesta puede aparecer en presencia de un estímulo por el
hecho de haber sido reforzada en presencia de otro (GENERALIZACIÓN DE LOS ESTÍMULOS). El efecto que
se puede derivar (no siempre) de la discriminación (que no ocurre siempre) es la generalización, es decir, si hay
una R que esté muy bien discriminada ante un estímulo, puede ocurrir que aquella que ha sido reforzada en
presencia de ese estímulo, aparezca también en presencia de otros (siempre que la discriminación ha sido clara

o Ejemplo: le damos la pata para que le demos una galleta, y al final el perro cada vez que quiere algo da la pata.
Entonces primero ha venido ha discriminación, y después la generalización. Se ha generalizado la conducta sin
que haya sido reforzada en todas.

o Aquel E que señala que si se da la R no aparece el reforzador, se llama Edelta ¿por qué este concepto no es tan
útil? Porque el mundo no es tan simple, porque puede haber un conjunto que sean delta.

Ejemplos de respuestas bajo control del estímulo:

- Antiguamente: levantar el teléfono (R) cuando suena el timbre (Ed) para oír la voz de alguien (R+). Sin timbre
de teléfono (EΔ) la probabilidad de descolgarlo para oír la voz de alguien es muy baja.

- En una conferencia, hacer preguntas mientras el conferenciante no finaliza su disertación.

- Durante la clase de la profesora Froxán, no entrar si la puerta está cerrada

- Ceño fruncido (EΔ) muy baja probabilidad para provocar un comienzo de conversación (R) que será reforzada
en presencia de un Ed como un saludo. El ceño fruncido reduce la probabilidad de que tú hagas una conducta
porque anticipa la señal del castigo, hace que no quieras hacer la conducta, aunque sea un elemento socia

- Cruzar la calle con el semáforo en rojo o cuando están pasando coches. Morderse las uñas, encenderse un
cigarillo en determinadas horas

Ejemplos de conductas bajo generalización del estímulo: ocurren en presencia de estímulos en los que no ha sido
especialmente entrado. Las diferentes situaciones tienen una misma morfologia

- Emitir una respuesta de evitación ante un ascensor y ante un metro. Un ejemplo de generalización son las fobias:
se puede haber quedado encerrado en un ascensor, pero ahora evita todo tipo de sitios que considera “cerrados”.
Otro ejemplo son las fobias: te ha podido pasar algo que “justifique” te dé miedo con un E y luego ante la simple
presencia del E tienes miedo.

- Ponerse traje y corbata en situaciones que exigen protocolo (entrevista, boda, funeral).

- Clasificar la compra en alimentos y productos de limpieza. Cuando clasificas las cosas que vas a comprar, por un
lado, las cosas de alimento y por otro las de limpieza. Eres capaz de clasificar, de hacer clases operantes.

- Tratar de usted a todas las personas mayores


- Reconocer todos los objetos verdes como verdes. Cuando aprendes los colores, no tienes que ver todas las cosas
verdes del mundo para saber lo que es el color verde, si tú le dices qué es verde y entienden lo que es algo verde,
ya van a saber generalizarlo a todo. Si un día lo llamas verde, otro día pistacho, otro día verde azulado, no van a
discriminar lo que es el verde y no van a poder generalizarlo

FACTORES QUE DETERMINAN LA EFICACIA DEL ENTRENAMIENTO EN


DISCRIMINACIÓN DE ESTÍMULOS

1. Elegir señales claras. Un estímulo claro señala lo que tenemos que hacer y lo que no tenemos que hacer. por
ejemplo, puerta entreabierta.

2. Minimizar las oportunidades de que se produzcan errores. Es decir, hacer entrenamiento en discriminación
en ambientes poco complejos. Por ejemplo, dejar entrar algunas veces y otras no

3. Maximizar el número de ensayos. Si quiere aprender objetos verdes, al principio aumentamos los ensayos en
estímulos verdes y quitamos los otros colores. Cuantos mas ensayos mejor

4. Utilizar las reglas: describir las contingencias. Utilizamos instrucciones en organismos verbales para facilitar
el entrenamiento y aprendizaje. Por ejemplo, usar reglas verbales3

EXTINCIÓN

La extinción es el procedimiento idóneo para eliminar una RO, es el mejor, pero no se puede aplicar en muchas
ocasiones. A veces nos tenemos que conformar con otros que no son tan idóneos.

Es la retirada de los E que están manteniendo la respuesta, por eso primero tenemos que identificar los E. No es tan fácil
esta identificación y cuando una conducta es reforzante en sí misma, no puede ser sometida a extinción.

- Suprimir el reforzamiento de una respuesta previamente reforzada.

- Reducción de la frecuencia de la respuesta que sigue a la suspensión del reforzamiento, "desconectar" la relación
previa entre una respuesta y sus consecuencias.

- Eficaz de forma definitiva, pero lenta e inicialmente incrementa la respuesta indeseable. Pero al principio la
extinción es lenta porque los organismos intentan conseguir los reforzadores y, por tanto, al principio aumenta
la respuesta para que podamos intentar obtener el refuerzo.

- Además, si la R ha sido mantenida con un reforzador intermitente, es mas difícil de extinguir, en cambio una R
que ha sido mantenida por refuerzo continuo se extingue con facilidad.

Ejemplos:

 Padre ignorar la conducta del hijo que llora 🡪 Si el niño llora de forma operante, si no consigue por lo que llora, la
R se extingue. Hay R que son reforzantes en sí mismas entonces no las puedes someter a extinción, por ejemplo:
comer tartas, beber, fumar, generan placer por sí mismas entonces no las puedes extinguir, solo castigar.

 Maestro ignorar a los niños que hablan sin levantar sus manos. Enseguida volverán a levantar la mano (recordar
dar siempre instrucciones a organismos verbales).

 Dejar de utilizar un aparato de radio estropeado.

 Tentativa de poner en marcha un coche si éste no arranca.

FACTORES QUE INFLUYEN EN LA EFICACIA DE LA EXTINCIÓN


1. Identificar y controlar todos los reforzadores de la respuesta. Para hacer extinción hay que hacer una
identificación de lo que son todos los reforzadores Para ello, primero tenemos que identificar los estímulos que
mantienen la respuesta y muchas veces es muy difícil identificarlos. Cuando una R es reforzante en sí misma, no
puede ser sometida a extinción y esto es una razón por la que a veces es imposible llevarla a cabo.

La extinción implica cortar el refuerzo, para que se llame extinción la R se tiene que dar. Si yo encierro a mi hija
para que no salga porque no quiero que llegue tarde, no estoy extinguiendo porque no se da la R. Tiene que darse la
R y quitar todos los reforzadores que mantienen la R. Aquí en este caso, podré controlar el castigo que le pongo o
no, pero no le puedo quitar el refuerzo porque el refuerzo es la diversión que está teniendo en la fiesta. Los
organismos van a luchar siempre por obtener el reforzador.

2. Combinar la extinción con reforzamiento positivo de una respuesta alternativa. Haciéndolo así, la extinción es
mucho más rápida. Si no sólo ignoramos al niño, sino que le reforzamos que levante la mano para hablar, lo hará
mucho antes

3. Iniciar la extinción en el contexto y momento apropiado

4. Uso de instrucciones: De esta forma se aprende mucho antes.

5. La extinción es más rápida tras un reforzamiento continuo: la extinción, por lo general es lenta pero eficaz. Es
lenta porque el organismo va a luchar por tener ese reforzador. Al principio la R aumenta cuando se deja de dar el
R (yo intento e intento por si acaso) por eso el refuerzo intermitente es muy difícil de extinguir, porque estoy
acostumbrada a que el refuerzo a veces esté y a veces no, entonces hasta que no me doy cuenta de que el reforzador
ha desaparecido definitivamente, tardo muchísimo más que si el aprendizaje ha sido contingente y sistemático.
Hasta que se comprueba que ya no hay refuerzo, se tarda mucho.

 Refuerzo continuo: extinción muy rápida.

 Refuerzo intermitente: extinción lenta.

6. Nivel de privación de los R+ contingentes y la intensidad de éstos: más lenta cuanto más intensos. El inicio de
la extinción es muy lento porque tienes que llevar a cabo varios ensayos para que la persona se dé cuenta de que
hay una pérdida del reforzador, porque el organismo está acostumbrado a tenerlo entonces emitirá la respuesta
hasta llegar a un nivel de privación: si aquello que hago tiene mucho valor para mí o llevo mucha privación la
extinción será más lenta porque yo voy a luchar por conseguirlo. El organismo lucha por obtener sus reforzadores.

7. Esfuerzo necesario para emitir la R: más lenta cuánto menos esfuerzo. Si la respuesta es muy fácil, si no me
cuesta nada emitir la conducta, si no me causa esfuerzo, se extinguirá más lento porque no me importará ni me
cansará tanto seguir intentándolo.

Dos problemas principales de la extinción operante: ESTO CAE*

8. Estallido de extinción o explosión de extinción: dejamos de aplicar el reforzador después de que se haya
mantenido firmemente una conducta por un refuerzo, entonces, cuando desaparece, la R incrementa muchísimo
hasta que se entiende que ya no hay relación entre R y reforzador. Incrementa en intensidad buscando el reforzador,
pero si no obtengo el reforzador, dejo la R. Si se hace caso a altas intensidades y se da el reforzante, se dificulta la
extinción porque se refuerza la alta intensidad y es mucho más difícil.

9. Agresión inducida por la extinción: Cuando no te dan aquello que quieres, en definitiva, que te extingan, genera
agresividad y enfado. Tampoco hay que dar la R a pesar del enfado porque si no, se refuerza el enfado como modo
de conseguir la Respuesta. Ej.: Alguien echa monedas a la máquina para que le dé la coca-cola, da y da patadas y
nada. Al final se va sin la coca-cola.

10. Recuperación espontánea: es repuntar. A veces, aunque se haya extinguido una R, aparece espontáneamente
(sobre todo en contextos donde no se ha dado la extinción) y esto si no se le hace caso ya desaparece por completo.

Lo peligroso de estos efectos es que, cuando no se avisa, normalmente las personas que llevan este programa (padres
con el hijo que llora en el supermercado), si no se avisa de que va a aumentar la respuesta intensamente y que puede
generar agresividad, los padres van a pensar que se ha dicho que eso funciona y en realidad no funciona. Por lo tanto,
para solucionar estos problemas hay que avisar: hay que explicar que la explosión de Respuesta se va a dar y que al
principio va a haber un estallido y no es que no funcione, sino que es así y que tienen que aguantar y que son efectos
indeseables pero que van a pasar, pero para ello, tienen que seguir con la extinción.

Debemos estar atentos al entorno en el que se lleva a cabo la extinción para que a) otras personas no refuercen la
conducta que se quiere reducir y b) maximizar las opciones de que los modificadores de conducta persistan en el
programa. Es decir, si, por ejemplo, una madre intenta extinguir la conducta de lloriqueo, si el niño la realiza en un
supermercado, las miradas desagradables de otros compradores reducirían las posibilidades de que la madre siguiera
adelante con el tratamiento de forma efectiva. Por eso es importante explicar que, si no van a ser capaces de extinguirle
en ese contexto porque les da mucha vergüenza, empiecen extinguiendo en otros contextos y que no se lleven al niño a
la compra, pero nunca ceder en el momento de explosión de respuesta.

Hasta aquí llegamos al final de los procedimientos que son elementos sacados directamente de la investigación
experimental: no hay ningún elemento técnico ni procedimiento combinado, sólo aquellas cosas que ocurren si
alteramos la secuencia E discriminativo- Respuesta- E consecuente. A partir de ahora vamos a combinar procedimientos
y así podemos hablar más o menos de técnicas: combinando extinción con reforzamiento, castigo con otra cosa…etc.

13:30

TÉCNICAS OPERANTES

Es la combinación de los procedimientos básicos de condicionamiento operante.

MOLDEADO

Es el procedimiento para el desarrollo de conductas en el que se refuerzan las aproximaciones sucesivas


a una respuesta objetivo final.

Es una técnica para desarrollar conductas, quiere decir que, si utilizamos un procedimiento para ir disminuyendo una
conducta poco a poco, por muy poco a poco que sea no será moldeado, porque el moldeado es para desarrollar. Se hace
reforzando aproximaciones sucesivas que se van acercando a la conducta final. Es decir, se hace un paso se refuerza, y
luego ese se deja en extinción para reforzar el siguiente paso. Debe haber un punto inicial y un punto final además de
puntos intermedios a reforzar.

La conducta inicial debe estar en el repertorio del individuo y que se asemeje a la conducta final, pero debe ser una
conducta sencilla (p.e si quiero que x estudie 5 h, la conducta 0 podría ser sentarse a la mesa o abrir el libro).

No se refiere únicamente a [Link] la más útil porque es un proceso de aprendizaje al que estamos sometidos
de manera general, aunque de manera explícita no nos demos cuenta, es eficaz cuando seguimos las pautas del CO.

Se divide la conducta en cuanto a la morfología (frecuencia o intensidad) hasta llegar al punto 10 (morfología de
la conducta final que queremos conseguir).

Importante: la respuesta inicial se tiene que parecer morfológicamente o funcionalmente con la conducta final
que queremos. El parecido de la conducta inicial para empezar a reforzar tiene que ser morfológico o funcional.

- Morfológicamente: si queremos moldear un acento de una lengua extranjera, tenemos que hablar, decir una
primera palabra con algún tipo de acento, esta se parece morfológicamente al acento final  la R inicial se
parece en cuanto a la forma que tienen esta y la final.

- Funcionalmente: si queremos moldear a niños pequeños de levantar la mano para hablar en clase, una conducta
que se parece funcionalmente puede ser decir “profe”, no se parece morfológicamente pero sí funcionalmente
 la R inicial se parece a la final en cuanto a la función que cumple.

- Poco a poco se va haciendo un reforzamiento más exigente, se van reforzando conductas mas concretas  aquí
vamos a ir reforzando para paso que se da. Ejemplo. De secuencia es Ed – R – R+  que esa R sea el Ed- R-
R+ de la respuesta siguiente así como si corro 5 minutos me bebo una cerveza, cuando consigo correr esos 5
minutos, eso ya no tiene valor y se deja de reforzar, paso a intentar correr 10, cuando lo hago, refuerzo y así
sucesivamente hasta que consigo la R objetivo.

- La clave del moldeado es que se refuerce cada paso, y tenemos que reforzar sistemáticamente para
aproximación sucesiva para poder conseguir la conducta final. Cada paso se refuerza como si fuera el más
importante y cuando este esta conseguido, ya no nos sirve y lo dejamos en extinción para reforzar el siguiente
paso.

DEFINICIÓN: procedimiento para el desarrollo de conductas en el que se refuerzan las aproximaciones sucesivas a
una respuesta objetivo final.

Se exige la emisión de una respuesta inicial que pueda ser reforzada (se elige aquella-s que más se parezcan topográfica
y funcionalmente a la respuesta meta). Poco a poco el reforzamiento se hará más exigente.

Dimensiones del comportamiento sensibles al moldeamiento. Se puede moldear cualquier conducta cuantitativa:

• Topografía: forma de conducta

• Frecuencia: cantidad de veces que se da una conducta

• Duración

• Latencia: el tiempo que pasa desde que aparece un E hasta que aparece una R.

• Intensidad

En adultos muchas veces el hecho se conseguir un paso puede ser un reforzamiento en sí, el pensar que lo están
consiguiendo (la ejecución del paso puede ser reforzante) en cambio, en niños no siempre es así.

Error común: confundir modelado (aprender por imitación) y moldeado (aprendizaje por aproximaciones sucesivas).

PROCEDIMIENTO A SEGUIR:

 Especificar la conducta final deseada. Cual es mi meta.

 Elegir una respuesta como punto de partida: estudiar el repertorio conductual del individuo. Para esto
tenemos que saber el repertorio de conducta del individuo porque, por ejemplo, para que un niño estudie, si no se
sienta lo primero que tiene que hacer es sentarse. Sacar los apuntes no se parece morfológicamente a la conducta,
pero si funcionalmente.

 Planificación de las aproximaciones sucesivas. Tenemos que planificarla para que no demos un salto muy
grande, entonces tenemos que ver como evoluciona el individuo para establecer bien las aproximaciones porque
si son pequeñas las aproximaciones puede que el individuo se aburra.

Si cuesta mucho llegar a cada paso, alomejor puedo dividir el proceso en pasos más pequeñitos, pero si son
demasiado alomejor se aburre, depende del caso. Correr de 5 a 10 min, y de 10 a 15 puede estar bien porque es
fácil, pero si el objetivo de la persona son 4h puede acabar aburriéndose de avanzar tan lento.

 Progresar a un ritmo adecuado y garantizar el reforzamiento. El ritmo puede variarse, lo importante es


garantizar el reforzamiento (la consecución del paso)

 Uso de estímulos discriminativos claros. Tiene que ser claro que tenemos que pasar de un paso a otro, una
señal que nos lo indique. Estos Ed claros ayudan a que el proceso se haga adecuadamente.

En el caso de correr, si tengo un reloj que me avisa pasados los 5/10/15 minutos, sé cuando he alcanzado mi
objetivo y cuándo tengo que pasar al siguiente paso, esto facilita el proceso.
ENCADENAMIENTO

Procedimiento para el desarrollo de cadenas conductuales o (se unen) secuencias del tipo ED – R en que
cada respuesta, excepto la última, produce un ED de la siguiente y es un reforzador condicionado de la
anterior. La última respuesta es seguida de un reforzador.

- Es un procedimiento para desarrollar conductas donde se unen secuencias sencillas E-R.

- Np es un sustituto del moldeamiento, permite resolver problemas del método anterior. El encadenamiento
requiere moldear algunas conductas del proceso del encadenamiento. *mirar apuntes papel

- La conducta final no es el ultimo final, sino que es toda la cadena (todos los pasos conjuntamente). Son
conductas complejas formadas por muchas secuencias que se encadenan. Aquí se unen distintos eslabones,
pero solo se refuerza el último. En cambio, en el moldeado lo importante es la ultima cadena.

Estos eslabones se unen gracias al EC: lo más importante son los estímulos condicionados. Ese E a partir del cual
se refuerza la conducta pasa a ser EC. Entonces el EC es condicionado porque ese E se ha asociado a un reforzador.
Ejemplo. Si me lo paso muy bien en el aula, el aula es lo que me causa bienestar porque es donde tengo reforzadores
de bienestar.

Es algo de este estilo: E – R – E – R – E – R – R+  si en algún caso ha fallado el reforzamiento del paso previo o no
ha sido suficientemente reforzante, la cadena será débil.

Una cadena es tan fuerte como lo es el más débil de sus eslabones, si en algún caso ha fallado el condicionamiento en
alguno de sus Ed o el Ed es confuso, la cadena se debilita porque la persona no tiene claro que es lo que le permite
llegar al eslabón final.

 Para que un encadenamiento funcione tengo que marcar bien cuales son los elementos que van a
volverse reforzadores condicionados.

 Reforzador condicionado *mirar apuntes hoja* Cada respuesta refuerza la anterior y discrimina la
siguiente. La última respuesta es la única que se refuerza explícitamente.

Ejemplos: vestirse. ¿Cuándo estoy vestida? Cuando tengo el pantalón, las botas, la camiseta… todo, no estoy vestida
solo con el pantalón, sino cuando tengo todo. Otro ejemplo es cuando me lavo los dientes: no tengo los dientes lavados
sin poner la pasta en el cepillo, y no la puedo poner sin antes haber abierto el tubo.

- Aquí lo importante es marcar la secuencia fija de una manera estable, hacerlo siempre en el mismo orden y
reforzar solo el eslabón final. Si se cambian las secuencias o se cambia el discriminativo, no aparecen los
refuerzos condicionados. Si estoy vistiendo a un niño con retraso porque le queremos enseñar la conducta, si le
cambiamos el orden, va a fallar a la hora de hacerlo solo porque no le va a quedar claro la secuencia.

Procedimiento para el desarrollo de cadenas conductuales o secuencias del tipo E D – R en que cada respuesta, excepto la
última, produce un ED de la siguiente y es un reforzador condicionado de la anterior. La última respuesta es seguida de
un reforzador.

MÉTODOS PARA ENSEÑAR UNA CADENA CONDUCTUAL:

 Presentación total de la tarea. Se hacen todos los pasos de la cadena, se da el reforzador al final, se repiten
todos los pasos hasta que se aprende la secuencia completa. por ejemplo, vestirse: se viste todo y se refuerza al
final; a la siguiente vez lo hace igual, lo reforzamos al final. Entonces exige la repetición de toda la secuencia
para que se pueda reforzar. Esto exige que estemos en cada paso de la cadena, pero solo reforzamos al final
(cuando está vestido completamente), nosotros podemos ir ayudando más o menos, pero es importante que
siempre sea el mismo orden de la cadena y que solo reforcemos al final.

Puede haber conductas que sean más complejas, por lo que alguna de esas las podemos someter a moldeado y
luego la metemos dentro del encadenamiento. En este caso, el monitor hace todo y el niño repite todo.
Ejemplo: hacer un puzzle para explicar la presentación total de la tarea. Si queremos hacer un puzzle nos
pueden enseñar todo el puzzle hecho (encadenamiento hacia atrás, quito una pieza y la vuelvo a poner, quito
dos y las vuelvo a poner) hacia delante seria poner una, luego otra (…) *buscar info en textos*

 Encadenamiento hacia atrás. Lo que se hace es que el monitor (el que enseña) realiza todos los pasos y el
último lo realiza el sujeto solo y se da el reforzador, es decir, al niño se le viste y el ultimo paso lo hace el solo
y lo reforzamos. Luego, el monitor hace todo y el niño hace el penúltimo paso y el último paso y lo refuerzo.
En la siguiente vez, el monitor hace todo y luego el niño hace el antepenúltimo, el penúltimo y el ultimo y
refuerzo.

 Encadenamiento hacia delante. En este caso, el niño realiza el primer paso, y el monitor hace todo lo demás y
lo reforzamos. Luego hace primer paso y segundo, y el monitor ayuda a todo lo demás y se refuerza; luego el
niño hace el primer paso, el segundo, y el tercero, el monitor ayuda a lo demás y se refuerza.

La diferencia entre este y el moldeamiento, es que en el encadenamiento se refuerza el eslabón final porque lo que se
enseña es una secuencia en conjunto, y se juega con el reforzador condicionado, mientras que, en el moldeamiento se va
reforzando cada aproximación y extinguiendo la anterior, se juega con reforzadores positivos.

Con correr 5 minutos a correr 10 no encadenas eslabones porque es la misma conducta que está siendo moldeada,
cualquier avance es reforzado, es el desarrollo de una respuesta que va cambiando en aspectos cuantitativos. Sin
embargo, vestirse tiene una serie de eslabones que contienen conductas distintas que, juntas, acaban dando lugar a la
conducta final esperada, que es la que se refuerza.

En el encadenamiento uno conductas distintas, pero en el moldeado lo que desarrollo es una conducta; en el moldeado
estamos desarrollando un parámetro cuantitativo y en el caso del encadenamiento estamos uniendo conductas distintas.

PROCEDIMIENTO A SEGUIR:

 Análisis de la tarea o conducta a enseñar: identificar los componentes de la secuencia final. Para
desarrollar una conducta completa, tengo que establecer las conductas simples que están perfectamente
definidas.

 Evaluación del repertorio de respuestas disponible. Tengo que saber el repertorio del sujeto. Que sabe
hacer.

 Utilizar estrategias para el uso independiente de señales por parte de los sujetos (dibujos,
autoinstrucciones, …). Podemos enseñarle un dibujo, películas, describir los pasos… todas las señales que
quiera.

 Ensayo previo de modelado. Le digo “mira como hago yo”

 Señalar el inicio del entrenamiento (instrucción). Le tenemos que decir “vamos a empezar a… (vestirnos)”.

 Utilizar reforzadores sociales y de otros tipos.

 Si se requiere ayuda adicional, retirarla cuanto antes.

COMPARACIÓN ENTRE ENCADENAMIENTO, MOLDEAMIENTO Y DESVANECIMIENTO

Los tres son procedimientos de cambio gradual:

o Moldeamiento: conseguir una nueva conducta mediante el reforzamiento de aproximaciones sucesivas cada vez
más parecidas a la meta final. La conducta final es el último paso del moldeamiento. P.e correr un amaratón.

o Desvanecimiento: conseguir un nuevo control estimular sobre una respuesta mediante el reforzamiento de la
respuesta deseada en presencia de aproximaciones cada vez más semejantes al estímulo final que se quiere que
controle la conducta. El estímulo de control final es el último paso del desvanecimiento. P.e quiero entrenar a
una persona a que entre cuando la puerta esta abierta, primero se ponen señales muy grandes (discriminativo
potente), poco a poco se va desvaneciendo el discriminativo hasta que la persona no entra con la puerta cerrada
(discriminativo).

Solo ha explicado dos, pero el desvanecimiento implica un cambio gradual; vamos retirando la señal artificial
o las ayudas que no forma parte del contexto habitual/natural para que quede finalmente bajo el control de los
estímulos el proceso. Ejemplo: vamos quitando la ayuda del monitor, de los dibujos… lo vamos retirando,
ayudando solo a veces, hasta que al final vamos desapareciendo poco a poco.

Se va reitrando paulatinamiente discrimativos que se han puesto anteriormente que son muy potentes y no
forman parte del contexto natural.

o Encadenamiento: conseguir una nueva cadena conductual mediante el reforzamiento de conexiones específicas
E-R que componen tal cadena. La conducta final es todos los pasos de la cadena. P.e no puedes vestirte sin
tener los pantalones, camiseta etc.

Es conseguir una nueva cadena mediante otras conexiones de E-R. la conducta final son todos los pasos de la
cadena, no el desarrollo de una conducta cuantitativa como en el moldeamiento. Ejemplo de encadenamiento:
la conducción. El monitor va dando instrucciones y al final no voy haciendo yo sola y el reforzador es que el
coche se mueva sin problemas.

REFORZAMIENTO DIFERENCIAL DE TASAS BAJAS

RDTB: Se refuerza la emisión de respuestas solo cuando se emiten con tasas bajas. A veces damos del reforzador
como algo dicotómico, pero podemos reforzar de muchas maneras. Por ejemplo, me interesa que se de la respuesta de
preguntar, pero que no estén todo el día preguntando, de esta manera la tasa es baja.

p.e quiero que la gente hable en clase pero que n o grite. El castigo a veces no funciona porque enseña lo que no hay
que hacer , en este caso se enseña lo que no hay que hacer a la vez que se refuerza lo que sí -> refuerzo cuando hablan
en el tono que quiero.

Entonces podemos reforzar una conducta, pero no queremos que ocurra a todas horas, simplemente lo que queremos a
una tasa baja. Lo reforzamos hasta esa tasa, y luego lo sometemos a extinción.

Reglas de aplicación:

- Seleccionar reforzadores efectivos.

- Aplicación inmediata de los reforzadores.

- Combinarlo con estímulos discriminativos.

- Espaciamiento del reforzamiento.

- Establecer la línea base para fijar el criterio de reforzamiento.

- Modificación gradual de intervalo o frecuencia de reforzamiento.

REFORZAMIENTO DIFERENCIAL DE OTRAS RESPUESTAS

RDO: Se refuerza la emisión de cualquier respuesta distinta de la que queremos eliminar durante un intervalo
de tiempo prefijado. Refuerzas unas conductas y otras no. Puedo reforzar estar sentado, elimino estar de pie. Se
refuerzan respuesta incompatible con la que quiero eliminar. También puedo reforzar cualquier otra conducta
que no sea la que quiero elinimar. No se puden reforzar conductas desadaptativas (no reforzar que se pegue)

Podemos hacer que desaparezca una respuesta sometiéndola a extinción y reforzando otras. Entonces las que va a
aumentar la tasa es las que están reforzadas. Estoy favoreciendo la extinción de una conducta si refuerzo otras también.

Reglas de aplicación:
 Seleccionar reforzadores efectivos.

 Establecimiento de un intervalo temporal (preferiblemente variable) de refuerzo.

 No reforzar otras respuestas que sean desadaptativas.

REFORZAMIENTO DIFERENCIAL DE RESPUESTAS INCOMPATIBLES

RDI: Reforzar una respuesta incompatible con la que se quiere eliminar.

Si quiero que desaparezca una conducta inadecuada debo tener en cuenta que esa conducta que refuerzo no sea
desfuncional o desadaptativa; lo mejor que podemos reforzar es la conducta incompatible con la que quiero que
desaparezca. Lo estamos haciendo sin tener que castigar la conducta desadaptativa.

Reglas de aplicación:

 Identificar y seleccionar una o varias respuestas incompatibles con la que se


quiere eliminar.

 Seleccionar reforzadores adecuados.

 Poner en extinción la respuesta indeseable.

COSTE DE RESPUESTA/CASTIGO NEGATIVO

Retirar algún reforzador positivo contingentemente a la emisión de una respuesta que se quiere eliminar.

Si retiramos el reforzador que mantiene la respuesta estamos haciendo extinción. Coste de respuesta es retirar algún
reforzador, por ejemplo, si llego tarde, te quito la paga. Si es un procedimiento de castigo y sabemos que lo ideal es
establecer un procedimiento de reforzamiento de lo que se quiere conseguir (para aparte, enseñar lo que no queremos,
enseñar lo que conviene), lo mejor es el coste de respuesta combinado con refuerzo positivo.

El coste de respuesta de echarte de clase solo es contingente cuando estar en el aula es reforzante.

Para que haya un coste de respuesta se necesitan reforzadores que se pueda retirar. P.e en economía de fichas, puedo
retirarte los puntos hasta que no quede ninguno.

Hay que evitar llegar a saldos negativos: padres que retiran la paga, retiras 20 euros, solo le das 20 euros, ¿Qué le vas a
quitar después? Si ya le quitas todo lo que tenía, ya no es eficaz.

Reglas de aplicación:

 Utilizar el coste de respuesta con reforzamiento positivo.

 Asegurarse que los estímulos que se retiran son eficaces como reforzadores.

 Tiene que haber un acúmulo inicial de reforzadores.

 Evitar los saldos negativos (ya no hay nada que perder).

TIEMPO FUERA

Eliminar las condiciones del medio que permiten obtener reforzamiento o sacar al sujeto de dichas condiciones,
de forma contingente a la emisión de la respuesta indeseada. Muy útil cuando no se puede controlar la emisión de
refuerzos.

Cuando no podemos quitar los reforzadores, quitamos al individuo del contexto reforzante. Ejemplo: no podemos quitar
el reforzador de que dos personas se lo estén pasando bien, entonces lo cambiamos de sitio con otro compañero.
Otra forma de castigo negativo, si no puedo retirar los reforzadores retiro a la persona del contexto reforzante. El
tiempo fuera tiene que tener una duración limitada (la norma general es un minuto por año de vida)

- Exclusivo: cuando se quita totalmente

- No exclusivo: es parcial (arriba está explicado).

Reglas de aplicación:

 Duración moderada del aislamiento (no más de 1 minuto por año).

 Asegurarse de que el tiempo fuera priva al sujeto de entretenimientos. Porque si fuera al final me lo paso
mejor que dentro no está siendo eficaz.

SACIACIÓN

Presentación masiva de un reforzador con el objetivo de que pierda su valor. Es la presentación masiva de un
reforzador que al final acaba cansando.

Dos modalidades:

 Emisión masiva de conducta (práctica masiva o negativa). Realizamos mucho la conducta hasta que la
persona se sacia. Ejemplo: el niño enciende muchas cerillas hasta que se cansa.

Practica masiva: conducta comer pasteles se de una y otra vez

Practica negativa: beber alcohol y al día siguiente tener resaca, tiene componente aversivo que va mas allá de
la saciación.

 Aplicación masiva de refuerzo. Damos mucho el refuerzo hasta que se sacia. Ejemplo: damos muchos
juguetes hasta que se cansa.

SOBRECORRECCIÓN

Corregir en exceso las consecuencias de la respuesta inadecuada. Una respuesta indeseada tiene consecuencias
indeseadas.

Dos modalidades:

 Restitutiva. Implica reparar el mal hecho multiplicado por n así amplias el efecto. Es decir, hemos pintado la
mesa, y entonces tenemos que limpiar la nuestra y la del resto de nuestros compañeros.

 Práctica positiva. Es repetir algo muchas veces. ejemplo. Repetir 1000 veces por ejemplo que VACA se
escribe con V.

ECONOMÍA DE FICHAS

Definición: programa para el cambio de conductas a través del uso sistemático de reforzadores condicionados (fichas).
Es una técnica muy eficaz, útil, aplicable en muchos contextos (nuestro sistema económico actual es una economía de
fichas). Se puede utilizar con grupos reducidos para enseñar una gran cantidad de conductas en cierto tiempo, entonces
nos permite utilizar un procedimiento para varias conductas simultáneamente y varias conductas simultáneamente.

Utilizar una economía de fichas para una única conducta, para solo una persona, es una pérdida de tiempo y de esfuerzo
porque es una técnica costosa y artificial.

NUNCA SE UTILIZA LA ECONOMIA DE FICHA SI HAY OTRO PROCEDIMIENTO MAS SENCILLO QUE SE
PUEDA APLICAR. Sueleser muy útil cuando queremos utilizarla en individuos que comparten un texto común como
un aula o una cárcel .
Primeramente se realiza el emparejamiento ficha-gominolas. Con una ficha puedo tener muchos reforzadores diferentes.

Reforzador de apoyo aquel que se intercambia por la ficha. Ficha: reforzador generalizado y gominola reforzador de
apoyo

Se consigue el cambio de conducta a través del uso sistemático de fichas, que son refuerzos condicionados que han
adquirido su valor por la asociación con otros reforzadores, que son reforzadores de apoyo. Una ficha es un elemento
que podemos sustituir por alguno de estos reforzadores de apoyo, es como el dinero, lo podemos cambiar por ropa
comida, viajes…

- cuanto menor es la edad del colectivo de los individuos , utilizaremos como dichas elementos llamativos y
atractivos

- cuanto mayor es la edad, la ficha puede ser una cosa básica, lo importante es lo que significa.

Ventajas de las fichas:

• Se pueden dar inmediatamente después de la respuesta. Las ventajas tienen la suerte de que se pueden dar
inmediatamente, a lo mejor el reforzador de apoyo no, pero con la ficha se está reforzando inmediatamente.
Recordar que el valor del reforzador depende a veces del tiempo que pasa entre la conducta y el reforzador
que doy.

• Se pueden cambiar por distintos reforzadores de apoyo. Es variable, controla la saciedad, con la ficha
puedo conseguir muchas cosas y puedo ir cambiando.

FASE DE IMPLANTACIÓN DE UN PROGRAMA DE ECONOMÍA DE FICHAS

1. Decidir las conductas-meta del sujeto o del grupo:

Según el sujeto y la priorización de objetivos a corto y largo plazo. Lo primero que voy a ver son las conductas que
voy a someter al programa: ¿qué quiero conseguir? Ej.: Enseñar conductas de autonomía en un internado, primero
tendré que priorizar lo que quiero y así desarrollar el programa que me interesa.

2. Registrar la línea base de ocurrencia de las conductas-meta.

Tengo que ver la línea base, tendré que basarme en un criterio para comparar porque si no, nunca sabré la eficacia
del programa.

3. Selección por parte del sujeto de los reforzadores:

El sujeto elige los reforzadores, cosas que quiere conseguir y que no importa que se obtengan a largo plazo porque
voy a tener las fichas.

4. Elegir reforzadores eficaces de consumo, de actividad, de manipulación, de posesión o sociales

 Controlar los reforzadores que el sujeto pueda obtener por otros me dios. Más que nada porque si no, no
me sirve para nada.

 Nunca privar a las personas de lo que les pertenece legal o moralmente . Esto es muy importante, nunca
privar a las personas de aquello que les pertenece por derecho moral y/o legal, por ejemplo, no privar
nunca de comida.

 Elegir el tipo de reforzadores condicionados, “fichas”, que se emplearán

5. Establecer las condiciones de administración:

 Número de “fichas” que se entregarán por cada conducta-meta

 Número de “fichas” que vale cada reforzador


 Momento, lugar, personas que colaborarán, forma de intercambio y de acceso a los reforzadores

El programa de contingencias es muy complejo, exige pensarlo mucho, valorar todas las condiciones (personas
que participaran en el intercambio, por ejemplo).

6. ¿Contingencias de castigo para penalizar comportamientos inadecuados?

 Debe emplear poco y sólo si es justificable a nivel ético. No siempre se corrigen las conductas
inadecuadas: no se debe castigar si se pueden utilizar otros procedimientos, a veces es necesario porque
son conductas muy desadaptativas, pero nunca mediante procedimientos deplorables.

 Coste de respuesta: pago de fichas tras una infracción / Tiempo fuera: intervalo de tiempo en el que se
pueden ganar fichas, pero no gastarlas.

El coste de respuesta implica que no se puede tener saldos negativos, si se parte de “ menos algo” el
comportamiento es como si se sometiera a extinción.

7. Elaborar un documento en el que todo lo anterior quede especificado.

Debe quedar todo bien especificado: todos los reforzadores que vamos a utilizar, los momentos en los que se
intercambian, quien participa…etc. Hay que redactar un documento en el que se explicite todo: reforzadores,
momentos en los que se intercambian reforzadores…todo. Refuerzo puede ser dormir en casa de una amigo, la Play
Station… o cualquier cosa. Normalmente cuando se estudia la conducta de un sujeto para aplicar la economía de
dichas nos damos cuenta de que hay personas que han sido privadas continuamente de algo, entonces cualquier
refuerzo les sirven en el programa de economía de fichas.

8. Poner en marcha el programa e ir realizando las modificaciones pertinentes. Una vez que se pone en marcha el
programa se va variando el coste de las fichas, los reforzadores por los que se pueden cambiar las fichas… no es
igual cuando empieza a cuando termina. Por ejemplo, el cambio puede ser semanal o quincenal.

9. Evaluación global del procedimiento de reforzamiento: comparación de niveles de ejecución iniciales y


finales.

Una vez que se tiene instaurado el programa y se han conseguido X objetivos, se va retirando el programa. Es algo
tan complejo como haberlo puesto en marcha. Por eso sólo se pone en marcha cuando se trabaja con un grupo
muchas conductas o con un sujeto que tiene muchas conductas disfuncionales.

Un contrato de trabajo no deja de ser una economía de fichas.

FASE DE DESVANECIMIENTO DE UN PROGRAMA DE ECONOMÍA DE FICHAS

Distintas estrategias (o combinación de las mismas):

o Aumentar el tiempo entre las sucesivas entregas de los reforzadores condicionados o hacer que la frecuencia de
administración de las mismas sea intermitente, es decir, cada vez pasa más tiempo hasta que obtengo la ficha
después de la respuesta o a veces doy la ficha si y otras veces no.

o Incrementar la exigencia para la obtención de reforzadores condicionados. Por ejemplo, si necesitaba hacer un
dia la cama para la ficha, y ahora necesito 3 días.

o Reducir el número de reforzadores condicionados ganados por la ejecución de las conductas-meta

o Disminuir el número de respuestas que permiten ganar reforzadores condicionados

o Incrementar la demora entre la respuesta meta y la obtención del reforzador condicionado

o Aumentar el número de reforzadores condicionados necesarios para ganar los reforzadores de apoyo

o Aumentar el retraso entre la adquisición de los reforzadores condicionados y la obtención de los reforzadores de
apoyo
Con cambios en los parámetros cuantitativos de la economía de fichas y al final queda bajo el control de los
reforzadores habituales.

Básicamente es que cada vez pasa más tiempo hasta que el sujeto consigue el R+ o incluso se le da de forma
intermitente. Incremento la exigencia, por ejemplo, si antes por hacer la cama le daba una ficha, ahora tiene que haber 3
días consecutivos haciendo la cama para darte una ficha. Cualquier variación cuantitativa va haciendo cada vez que las
respuestas cambien (aumentar el número de fichas, aumentar el tiempo entre R+ no dárselo al día sino a la semana) es
decir, se pide más por lo mismo o se da menos por lo mismo).

TÉCNICAS AVERSIVAS NO ENTRA EN EL EXAMEN

Decir que las técnicas versivas son malas es como decir que los cuchillos son malos.

Estas técnicas han sido descatalogadas porque los cambios conseguidos a través de lo aversivo, no se mantienen en el
tiempo (fallan a largo plazo) y no se desarrollo un procedimiento complementario para que se mantenga a largo plazo.
Ejemplo: película de la naranja mecánica.

Por otra parte, se empezó a difundir que los procedimientos aversivos que atentaban contra el individuo o que los
estímulos eran inadecuados porque no eran éticos.

 Las semiaversivas: La ventaja es que el elemento aversivo de la técnica que formaba parte de la propia conducta
apetitiva.

Las técnicas aversivas intentan:

a) Asociar un patrón de respuesta no deseado y socialmente sancionado con una estimulación desagradable. Se
une un EN con un EC aversivo.

b) Reorganizar la situación de manera que las consecuencias de la respuesta sean lo suficientemente


desagradables para que el sujeto deje de ejecutarlo.

Los resultados obtenidos no se mantenían en el tiempo. Las técnicas eran enormemente eficaces, pero a largo plazo
fallaban. Esto hizo que se eliminaran peo es un poco tontería porque esto pasa con muchos procedimientos, pero en este
caso no se quiso tener en cuenta porque no se desarrolló un procedimiento para mantener los cambios

Se usaban los estímulos aversivos de una forma inadecuada éticamente hablando, pero esto no quiere decir que la
técnica y su funcionamiento sea incorrecto, sino que los estímulos que se usaron no eran los adecuados y generaban
inconvenientes muy desagradables en las personas (por ejemplo: técnicas para dejar de fumar que son aversivas como
retener el humo o fumar rápido hasta provocar vómitos, mareos…etc.). El elemento aversivo formaba parte de la
conducta apetitiva como el fumar. La relación entre el humo y el tabaco es tan grande que funcionaba de forma muy top
en los tratamientos. Las técnicas aversivas se explican en operantes cuando hay dos vertientes: pavloviana (se asocia EN
a un EI aversivo) y operante (se asocia un estímulo aversivo con la aparición de una R posterior).

a) Condicionamiento clásico (contracondicionamiento): aplicación simultánea del E aversivo.

Estimulo que era apetitivo contracondicionarlo para hacerlo aversivo. Por ejemplo, con beber, asociamos la bebida
alcohólica a un veneno. El EN es la bebida porque, aunque sea apetitivo, es neutro respecto a la R que se quiere
condicionar, no es neutro en sí mismo, sino que es neutro respecto a lo que se quiere condicionar y como es
contracondicionamiento, la bebida alcohólica es el EN y el E aversivo sería el veneno o el shock y esto produce nausea
o ansiedad y esto es un procedimiento de condicionamiento clásico.

Primera fase:
EN EI RI
(Bebida (Drogas, (Nausea,
alcohólica) shock) ansiedad)
Segunda fase:
EC RC
(Bebida alcohólica) (Nausea,
ansiedad)
b) b) Condicionamiento operante:

 Castigo con escape: el castigo o E aversivo se aplica antes de que termine la respuesta a eliminar y al terminar la
respuesta también termina la estimulación aversiva.

 Castigo con evitación (pasiva o activa): el castigo o E aversivo no se presenta si el sujeto interrumpe la
respuesta a eliminar (no responde o realiza una respuesta alternativa) (las Rs que permiten la evitación del
castigo son muy resistentes a la extinción debido a la ansiedad generada por el castigo anticipado). Es decir,
cojo el vaso de bebida y al final no bebo.

Tenemos dos tipos de paradigmas: condicionamiento de escape o evitación. Siempre tendremos que permitir que si se
da la respuesta incompatible o contraria a la respuesta que se quiere castigar, no se aplica el castigo porque me interesa
mantenerla. Siempre que se plantee el estímulo aversivo, hay que permitir que la respuesta correcta se dé.

Escape: el estímulo aversivo se aplica antes de que se dé la respuesta que no queremos dar. Hay que dar lugar a que la
R correcta aparezca. Si se castiga la incorrecta, sí o sí voy a conseguir que la persona se libre del castigo y que haga
conductas de escape. El castigo tiene que desaparecer cuando dejo de hacer la R incorrecta

Evitación: el aversivo no se presenta si interrumpo la respuesta que va a ser castigada. Por ejemplo, cojo el vaso de
bebida, pero lo dejo antes de beber, no me castigo.

Este procedimiento (abajo) hay que ponerlo en marcha en la película de la naranja mecánica: condicionamiento previo
es lo que se tiene que identificar.

Modalidad 1
Castigo positivo:
ED ------------------------------- R -------------------------- C+
Bar, casa Beber Shock
Acercarse al bar Vómito
Modalidad 2
Aprendizaje por evitación:
ED ----------------- R ------------------------------- R-
Bar, casa Rechazar la bebida Bienestar
Alejarse del bar Alivio
Aprendizaje de escape:
ED ----------------------- R ------------- C+ ---------------------- R ------------- R-
Bar, casa Beber Shock Dejar de beber
Acercarse Vómito Alejarse
al bar

También podría gustarte