NEOCONDUCTISMO
Burrhus Frederic Skinner
(1904/03/20 - 1990/08/18)
B. F. Skinner
Psicólogo estadounidense
BURRHUS FREDERIC SKINNER
Nació el 20 de marzo de 1904 en Susquehanna, Pennsylvania.
Cursó estudios en la Universidad de Harvard. Profesor en la
Universidad de Indiana de 1945 a 1948 y luego en Harvard.
Fue el principal representante del conductismo en su país,
escuela que pretende explicar el comportamiento humano y
animal en términos de respuesta a diferentes estímulos.
Su obra está influenciada fundamentalmente por los trabajos de
John Watson y de la reflexología rusa: Vladimir Bechterev e Ivan
Pavlov
¿CUÁL ES LA DIFERENCIA ENTRE EL
CONDICIONAMIENTO OPERANTE Y
EL CONDICIONAMIENTO CLÁSICO?
En el condicionamiento
operante, una respuesta
voluntaria es seguida por un
reforzador. De esta manera, la
respuesta voluntaria (por
ejemplo, estudiar para un
examen) es más probable que se
realice en el futuro. Al contrario,
en el condicionamiento clásico
un estímulo activa
automáticamente una respuesta
involuntaria.
CONDICIONAMIENTO OPERANTE
El condicionamiento operante puede describirse
como un proceso que intenta modificar el
comportamiento mediante el uso del refuerzo
positivo y negativo. A través del
condicionamiento operante, un individuo hace
una asociación entre un comportamiento
particular y una consecuencia.
Ejemplos:
Los padres recompensan las buenas calificaciones
de un niño con dulces o algún otro premio.
Un maestro premia a aquellos estudiantes que
son tranquilos y educados. Los estudiantes se dan
cuenta que al comportarse así reciben más
puntos.
Un alimento se da a un animal cada vez
que presiona una palanca.
B.F. SKINNER (1938) ACUÑÓ EL TÉRMINO ACONDICIONAMIENTO
OPERANTE. SKINNER IDENTIFICÓ TRES TIPOS DE RESPUESTAS O
OPERANTES QUE PUEDEN SEGUIR EL COMPORTAMIENTO:
Operantes neutrales: respuestas del entorno
que no aumentan ni disminuyen la probabilidad de
que se repita un comportamiento.
Reforzadores: respuestas del entorno que
incrementan la probabilidad de repetición de un
comportamiento. Los reforzadores pueden ser
positivos o negativos.
Castigos: respuestas del entorno que disminuyen
la probabilidad de que se repita un
comportamiento. El castigo debilita el
comportamiento.
PARA SKINNER, PSICÓLOGO DEL CONDUCTISMO, EL CONDICIONAMIENTO
ERA EL FORTALECIMIENTO DE LAS CONDUCTAS SEGÚN LAS
CONSECUENCIAS QUE ANTERIORMENTE SE HUBIERAN OBTENIDO.
En esta línea, existen dos formas de
condicionamiento:
El clásico o pavloviano: se basa en la
asociación de estímulos incondicionados y
condicionados, siendo las respuestas
controladas por los estímulos antecedentes.
El condicionamiento operante: los
estímulos consecuentes o reforzadores
hacen que se emita una conducta
determinada. Skinner explica que si la
conducta es seguida de un reforzador
positivo, aumentaría la probabilidad de
emisión de dicha conducta en un futuro. Al
contrario, si una respuesta no va seguida de
un reforzador o ese reforzador es negativo,
la probabilidad de emitir dicha conducta en
un futuro será menor.
CONCEPTOS BÁSICOS DEL CONDICIONAMIENTO OPERANTE
Refuerzo:
Es el responsable de la emisión de respuestas, es decir, de la
probabilidad de que sucedan, sea mayor o menor en un futuro. Es
un estímulo reforzante y consecuente, ya que se da una vez se ha
producido la respuesta.
Es imposible saber si un reforzador determinado influye en la
conducta hasta que no se presenta de manera contingente con
una respuesta y se comprueba que el comportamiento cambia a
consecuencia del reforzador.
Existen dos tipos de refuerzo: positivo y negativo. Ambos
tienen la misma finalidad de aumentar la probabilidad de que la
respuesta se emita en situaciones futuras. Además, para Skinner
los reforzadores se definen por medio de las conductas que son
observables y medibles.
REFUERZO POSITIVO
El refuerzo positivo refuerza
un comportamiento
proporcionando una
consecuencia que un
individuo encuentra
gratificante.
REFUERZO NEGATIVO
La eliminación de un reforzador
desagradable también puede
fortalecer un comportamiento.
Esto se conoce como refuerzo
negativo porque es la
eliminación de un estímulo
adverso que es «gratificante»
para el animal o la persona. El
refuerzo negativo refuerza el
comportamiento porque detiene
o elimina una experiencia
desagradable.
REFORZADORES PRIMARIOS
Serían todos aquellos reforzadores
básicos que no necesitan de
ninguna historia de
condicionamiento previa para
funcionar como tales. Satisfacen
alguna necesidad biológica y
funciona de modo natural.
Algunos ejemplos serían el agua, la
comida, etc.
REFORZADORES SECUNDARIOS
Los reforzadores secundarios
si estarían basados en
historias previas de
condicionamiento gracias a la
asociación con estímulos
incondicionados. Son
aprendidos y asociados con
los reforzadores primarios
Algunos ejemplos serían el
dinero y las calificaciones.
CONTINGENCIA DE TRES TÉRMINOS
Es el modelo básico del condicionamiento operante y está formado por tres componentes: el estímulo
discriminativo, la respuesta y el estímulo reforzador.
Un estímulo discriminativo sería aquel que va a indicar al sujeto que el reforzador está disponible, señalando que
si lleva a cabo una determinada conducta podrá obtener dicho reforzador. En contraposición tenemos el estímulo
delta o estímulos que indican que la conducta no va a llevar a la obtención de ningún tipo de reforzador.
La respuesta sería la conducta que realizará el sujeto, cuya ejecución le llevará o no a la obtención del estímulo
reforzador.
Un estímulo reforzador, como se ha mencionado anteriormente, es el responsable de la emisión de la conducta ya
que gracias a su aparición la probabilidad de emisión de una respuesta aumentará o disminuirá en el futuro.
CONCEPTOS A CONOCER DEL CONDICIONAMIENTO OPERANTE
Castigo
El castigo también se mide por sus efectos en la conducta
del sujeto. En cambio, a diferencia del refuerzo, lo que se
pretende es la disminución o supresión de una
determinada conducta.
Un castigo reduce la probabilidad de emisión de una
conducta en situaciones posteriores. No obstante, no
elimina la respuesta ya que si la amenaza de castigo
disminuye, la conducta puede volver a aparecer.
En el castigo también existen dos tipos o procedimientos
diferentes, castigo positivo y castigo negativo.
CASTIGO POSITIVO
Este implica la presentación
de un estímulo aversivo
tras la realización de un
determinado
comportamiento. Es dado
de manera contingente a la
respuesta dada por el
sujeto.
CASTIGO NEGATIVO
Consiste en la eliminación de un
estímulo como consecuencia de
un determinado
comportamiento, es decir,
consiste en la retirada de un
estímulo positivo tras la
realización de una determinada
conducta.
EXTINCIÓN
Se deja de recompensar una conducta que
había sido reforzada con anterioridad. Esto
disminuye la probabilidad de que la respuesta vuelva
a darse. Formalmente la extinción es lo opuesto al
reforzamiento positivo.
A largo plazo la extinción es más eficaz para
eliminar respuestas que el castigo y el resto de
técnicas operantes para reducir conductas, si bien
puede ser más lenta.
Un ejemplo básico de extinción es lograr que un
niño pare de patalear simplemente ignorándolo hasta
que se dé cuenta de que su conducta no tiene las
consecuencias deseadas (por ejemplo el enfado de
los padres, que funcionaría como reforzador) y se
harte.
GENERALIZACIÓN
Ante una situación o estímulo
determinado se condiciona una
respuesta, que puede aparecer
ante otros estímulos o
situaciones parecidas.
Ejemplo:
El perro al escuchar una
campana saliva.
De igual manera al escuchar un
timbre saliva, reacciona a un
estimulo parecido al original.
DISCRIMINACIÓN
Este proceso es el opuesto al de
generalización, en él se responde
de manera diferente según el
estímulo y el contexto.
Ejemplo:
Los alumnos al tener un profesor
estricto se comportan, al
momento de cambiar de profesor
primero se comportan para
descubrir como comportarse
ante la nueva situación.
PROGRAMAS Skinner también estableció gracias a sus investigaciones
diversos programas de refuerzo, entre los que están los
DE REFUERZO programas de reforzamiento continuo y los programas de
reforzamiento intermitente.
PROGRAMAS DE REFUERZO CONTINUO
Están basados en el reforzamiento
constante de la respuesta cada vez que
se presente, es decir, cada vez que el
sujeto ejecute la conducta deseada
obtendrá un estímulo reforzador o
positivo.
Ejemplo:
El profesor pregunta algo a la clase y por
consecuencia los alumnos levantan la
mano.
Este tipo de reforzamiento sucede en el
momento.
PROGRAMAS DE REFUERZO INTERMITENTE
En cambio, aquí el sujeto no siempre obtiene el
reforzador al realizar la conducta deseada. Estos se
definen en base al número de respuestas dadas o al
intervalo de tiempo transcurrido entre respuestas,
dando lugar a diferentes procedimientos.
Ejemplo:
La maquina tragaperras funciona según un programa
de reforzamiento intermitente, pues no obtenemos
dinero de la maquina cada vez que introducimos una
moneda en la ranura y accionamos la palanca, debido
a que se refuerza el comportamiento
ocasionalmente.
PROGRAMAS DE RAZÓN FIJA
En estos programas el reforzador se
proporciona cuando el sujeto genera respuestas
fijas y constantes. Por ejemplo, en un programa
de razón 10 la persona obtiene el reforzador
tras haber realizado diez respuestas cuando se
presenta el estímulo.
Un ejemplo sería el de un padre que verifica cada
media hora que su hijo está estudiando, y cuando es
así le hace un halago. Los problemas de intervalo fijo
producen una tasa de respuestas desigual. Una vez que
se administra el refuerzo, la tasa de respuestas tiende
a ser baja. Durante el intervalo, la conducta aumenta
típicamente hasta alcanzar un nivel elevado
inmediatamente antes del siguiente reforzador
programado. La cantidad global de respuestas en un
programa de intervalos fijos es moderada.
PROGRAMAS DE INTERVALO VARIABLE
Programas de intervalo variable
En estos programas el reforzador se obtiene después de un
tiempo, aunque el tiempo es distinto para cada reforzador
recibido.
El refuerzo está disponible después de un tiempo que varía
aleatoriamente, pero alrededor de un promedio. Un
Un ejemplo es el de un profesor que realiza exámenes
sorpresa aproximadamente cada semana. Este tipo de
programa por lo general produce una tasa de respuesta
constante, pero moderada. Por lo general, los programas de
tasa (razón) producen una adquisición más rápida, pero
fácilmente extinguible una vez suspendida la administración
de reforzadores; y los de intervalo producen una adquisición
más estable y resistente a la extinción. En la vida real, estos
programas básicos a menudo se combinan.
CAMBIO CONDUCTUAL
Aproximaciones sucesivas o moldeamiento
El moldeamiento consiste en el cambio
conductual a través del moldeamiento de
conductas o el refuerzo diferencial de
aproximaciones sucesivas.
Para moldear una conducta concreta se
siguen una serie de pasos. En primer lugar se
identifica cuál es la conducta inicial que se
pretende moldear para saber a cuál se quiere
llegar.
ENCADENAMIENTO
Encadenamiento
Con él se forma una nueva conducta a partir de la
descomposición en pasos o secuencias más sencillas,
reforzando cada respuesta dada en cada uno de los
pasos para así llevar al establecimiento de una respuesta
más compleja en el repertorio conductual del sujeto.
Se pueden llegar a formar cadenas largas de respuestas
utilizando reforzadores condicionados, adoptando una
unidad funcional y cuyo establecimiento lleva a la
adquisición y definición de una destreza particular.