Briones Chapa Orihuela Tineo Torres PAF
Briones Chapa Orihuela Tineo Torres PAF
Autoras:
Resumen:
Los resultados indicaron que, efectivamente, el uso del refuerzo positivo y sus distintos
programas de reforzamiento generan un efecto notable en el comportamiento, destacando una
mayor capacidad para la adquisición de conductas en un ambiente controlado. En conclusión,
se plantea que el estudio demostró que el refuerzo positivo, aplicado a través de diferentes
programas de condicionamiento operante, incrementa de manera significativa en la
adquisición y adaptación de conductas en el sujeto, destacando la importancia de ajustar la
intensidad y frecuencia de los reforzadores para optimizar el aprendizaje.
The aim of this article is to analyze the operant behavior of a rat in a simulated environment
using the Cyber Rat software, in order to explore the impact of different reinforcement
programs on the acquisition of a behavior, specifically lever pressing. The study involved a
subject interacting in a controlled environment where various variables were modified to
observe the responses and decisions made under specific conditions. Direct observation
methods and data analysis techniques, such as anecdotal records and observation logs based
on ratio and interval schedules, were used to collect information on behavioral responses. The
methodology employed was experimental, allowing for modifications in the virtual
environment to assess their influence on the subject's behavior.
The results indicated that the use of positive reinforcement and its different reinforcement
programs had a notable effect on decision-making, highlighting a greater ability to acquire
behaviors in a controlled environment. In conclusion, the study demonstrated that positive
reinforcement, applied through different operant conditioning programs, significantly
influences the acquisition and adaptation of behaviors in the subject, emphasizing the
importance of adjusting the intensity and frequency of reinforcers to optimize learning.
La teoría del condicionamiento operante, misma que fue desarrollada por B.F. Skinner, es
fundamental en el estudio de la conducta tanto humana como animal. A diferencia del
condicionamiento clásico, que se enfoca en la relación entre estímulos, el condicionamiento
operante se interesa por cómo las consecuencias de una acción influyen en la probabilidad de
que esa acción se repita (Vanesaeiepp, 2024). A través de este enfoque, Skinner subrayó el
papel fundamental de los reforzadores y castigos, que modelan y modifican las conductas.
Este fenómeno fue explicado bajo la observación de que los perros podían comenzar a salivar
al oír el sonido de una campana, siempre que este se presentara antes de la comida. En este
contexto, el sonido de la campana pasa a ser considerado un estímulo condicionado, el cual
provoca la salivación, una respuesta inicialmente desencadenada solo por la comida, que en
este caso actúa como estímulo incondicionado. Este experimento, al día de hoy, forma parte
fundamental del estudio del comportamiento tanto animal como humano y es usado en
distintas áreas de aplicación, siendo también precursor de escritos relacionados a asociación
de estímulos.
A pesar de ser Thorndike aquel que inició la teoría, fue posteriormente Burrhus Frederic
Skinner en los años 30 quien profundizó en el estudio del condicionamiento operante bajo un
enfoque más experimental, es decir, desarrollando métodos para estudiar mejor los
experimentos que también fueron desarrollados con animales, en este caso, Manzueta (2022)
expone que también se probaron distintos tipos de reforzadores para lograr observar el
impacto d ellos mismos. Es así que, actualmente, se conoce como principal representante del
condicionamiento operante a Skinner.
En las ratas, por ejemplo, se buscaba la adquisición de conductas como la presión de palanca
gracias a refuerzos positivos como la comida o el agua además de refuerzo negativos como
eliminación de ausencia de comida, así mismo, se usó el castigo negativo como la ausencia
de comida con el objeto de disminuir la falta de respuestas deseadas, siendo este el origen del
experimento aplicado en el presente estudio.
Una vez explicada la teoría del condicionamiento operante, es fundamental explicar uno de
los aspectos clave en el presente estudio, es decir, los programas de reforzamiento. Estos,
según Wearden (2024), hacen referencia a aquellas condiciones bajo las cuales se brinda el
refuerzo respecto a la respuesta generada por el sujeto; existen distintos programas y, entre
los más comunes, se encuentran: Aproximaciones sucesivas (AP), refiriéndose, según Skinner
(1953), al incentivo brindado después de aquellos acercamientos operativos a la conducta
deseada, es necesario un entendimiento claro entre la relación de la conducta y el refuerzo.
Así mismo, se observa el programa de Razón fija (RF), haciendo alusión al refuerzo brindado
posterior a un número específico de respuestas deseadas; este genera una alta tasa de
conductas deseadas, desarrollando también espacios de pausa una vez se recibió el refuerzo.
También se observa el programa de intervalo fijo (IF), desarrollándose al ofrecer el refuerzo
posterior a un intervalo de tiempo en específico, siendo recomenzado una vez termina el
periodo de tiempo, con un solo refuerzo positivo; Skinner también menciona que, en este
programa, las respuestas deseadas se vuelven más frecuentes en la etapa final del intervalo de
tiempo, una vez el sujeto haya entendido el método de refuerzo, además, posteriormente al
incentivo, las respuestas bajan hasta, de nuevo, llegar a la etapa final. Existen otros
programas como el de razón variable (RV), o intervalo variable (IV) (Skinner, 1957), sin
embargo, no fueron aplicados en la presente investigación, por ello, no se profundiza en
dichos programas.
En tal sentido, es necesario también comprender los tipos de reforzadores existentes, entre los
cuales, según Roca, Gutiérrez & Benavides (2023), se encuentran los primarios y
secundarios. Al referir a los primarios, se hace alusión a aquellos que son capaces de
satisfacer necesidades fisiológicas y de instinto, por ejemplo, la comida o el agua, que pueden
satisfacer el hambre y sed. Así mismo, al hacer alusión a los secundarios, se refiere a los que
poseen un valor adquirido por una asociación con los reforzadores primarios, por ejemplo, se
encuentran los billetes o moneras de dinero, mismos que son usados como medio para la
obtención de alimentos o bebidas (necesidades primarias).
Del mismo modo, es necesario entender que, para la adquisición de una conducta, se exhiben
dos elementos fundamentales, estos son los refuerzos y los castigos. Según menciona Luna
(2021), los refuerzos son aquellos estímulos direccionados al objetivo de aumentar la
probabilidad de que una conducta aumente su frecuencia, aquí también se identifican dos
tipos, es decir, el refuerzo positivo, mismo que hace referencia al añadir un estimulo
confortable posterior a la respuesta deseada; y el refuerzo negativo, que se entiende como la
eliminación de un estímulo insatisfactorio para reforzar la conducta deseada. Respecto a los
castigos, estos hacen alusión a, según Santos & Carvalho (2020), la disminución de
probabilidad de repetición de conducta; entre ellos se encuentran los castigos positivos, que
se refieren a agregar un estímulo que resulte desagradable; y también el castigo negativo, que
hace alusión a la eliminación de un estímulo satisfactorio para el sujeto.
Es fundamental considerar, de igual forma, las fases que han sido aplicadas y evaluadas en el
presente experimento, es decir, la fase A y la fase B. Según indica Pujos (2020), la primera
fase (A), en ciertos casos llamada también línea base, consiste en la obtención de los datos
iniciales, cuando la intervención aún no ha sido aplicada y sirve para medir e identificar cual
es el efecto de la variable independiente en la dependiente. Por otro lado, la segunda fase (B)
es aquella en la que ya existe una intervención de por medio en el experimento.
Respecto al presente estudio, la fase A se representa también como una línea base, en esta se
observa la etapa de habituación del sujeto en el entorno donde ha sido colocado. Lo que se
espera en fase es que la rata se acostumbre y adapte al ambiente experimental, no se
mantienen expectativas de conductas complejas, simplemente en este caso, conductas de
husmeo o acicalamiento serían las esperadas. En tal sentido, Skinner (1953), alude que, en
esta esta etapa inicial, las conductas reflejan una línea base fundamental para poder
identificar posteriormente medir el impacto de los reforzadores.
Respecto a las variables experimentales, el control de las mismas es fundamental, ante ello es
necesario mencionar que aquellas variables externas a la hipótesis principal deben mantener
una revisión meticulosa, tal como indican Orase, et al. (2021). Sin embargo, al ser un
experimento llevado a cabo en una simulación virtual, no es necesario que manualmente
controlemos tales variables.
Respecto a los antecedentes, a nivel internacional, se encuentra una gran variedad de estudios
experimentales basados en el condicionamiento operante realizados en animales, uno de ellos
proviene de Chile, donde Veloso (2023)realizó una investigación en ratas usando el Software
Sniffy he Virtual Rat Pro, mismo que permitió modelar y analizar los procesos conductuales
en un contexto simulado, generando una reproducción de las condiciones experimentales del
condicionamiento operante en sujetos animales reales. Del estudio se observa que, a medida
que el número de ensayos aumentaba, la probabilidad de adquisición de conducta también
aumentaba, respectivamente, esto dio paso al desarrollo de un modelo más activo de
intervención.
De igual manera, Yabor et al. (2024), en Venezuela, desarrollaron una investigación acerca
del condicionamiento operante en animales, específicamente en hámsteres americanos,
usando el “Laberinto de Hampton Court”. Los sujetos recibieron motivación y recompensa,
respectivamente, mostrando resultados de que el segundo hámster se adaptó más rápidamente
acortó significativamente el tiempo necesario para completar el laberinto. El estudio concluyó
que el condicionamiento operante es una herramienta eficaz para cambiar el comportamiento
de los animales de experimentación.
Así mismo, Bastidas, Escobar & Paz (2021), realizaron un caso clínico de una danta
amazónica de 4 años, perteneciente al Zoologico de Cali en Valle Cauca, que presentaba
lesiones en las patas durante un mes, Posteriormente a estudios se logra diagnosticar la
enfermedad de línea blanca. El tratamiento brindado incluye tanto antibióticos, como
medicamento antiinflamatorio y quimioterapia. Los estudios mencionan que el
condicionamiento operante permite un manejo de animales más eficaz, sin necesidad de
fuerza física, logrando, de esta forma, un manejo efectivo de los tapires, destacando su
importancia en especies silvestres. Dichos resultados evidencian lo fundamental que es el
condicionamiento operante para el cuidado eficiente de especies del zoológico.
De manera similar, Apppalo et al. (2024), analizaron cuál es el efecto del condicionamiento
operante en hámsteres usando un laberinto experimental, Mediante el uso de métodos
cuantitativos y un diseño experimental, fueron examinados dos grupos de hámsteres de la
misma especie y edad, que fueron entrenados gracias a recompensas de comida. Los
resultados demostraron que la eficiencia de los sujetos para lograr el objetivo de cruzar el
laberinto mejoró gradualmente. El sujeto B mostró una velocidad más rápida comparación
del sujeto A. Los resultados del estudio se basan en que el condicionamiento operante
mantiene un efecto significativo en el desarrollo de habilidades especiales en los hámsteres.
Así mismo, Gamboa, et al. (2024), realizan un estudio con el objetivo de analizar la
capacidad de adaptación de jerbos en una caja de alimentación, explorando la conducta
generada por el condicionamiento operante. Se utilizó un diseño experimental descriptivo,
observando que los jerbos mostraban una curiosidad inicial hacia la caja y su adaptación
mejoraba conforme pasaba el tiempo, siguiendo recorridos específicos para obtener las
recompensas. Los resultados muestran la efectividad de los refuerzos positivos y negativos
para el aprendizaje, también tocando el tema de la motivación y procesos cognitivos de estos
roedores. El estudio contribuye al entendimiento animal mediante el condicionamiento
operante.
Otro estudio importante de mencionar a nivel nacional, es el de Catro, Rondo y Cieza (2024),
en Trujillo, mismos que se enfocaron en el análisis experimental del comportamiento
mediante el condicionamiento clásico y operante. Se utilizó un diseño experimental con
fichas de observación y registros seleccionados aleatoriamente. Los resultados exhibieron
mejoras significativas en el grupo experimental a diferencia del grupo control, estos
hallazgos, respaldados por la prueba U de Mann Whitney, demostraron una mejora en la
precisión del análisis experimental del comportamiento animal.
Así mismo, es posible observar a Maldonado, Trujillo &Morón (2024), quienes realizaron
una investigación que aborta la importancia de la etología aplicada como base científica para
entender y potenciar el comportamiento animal. Se exploran los principios trascendentales de
la etología, haciendo hincapié en la forma en la que la observación u análisis del
comportamiento animal, junto con las técnicas de condicionamiento operante, son esenciales
para establecer métodos de manejo que promuevan el bienestar animal en distintos
ambientes, incluyendo zoológicos y áreas de conservación. El escrito se encarga de resaltar la
esencialidad de los estímulos y el refuerzo del comportamiento animal.
Finalmente, como ultimo antecedente local, se encuentra el estudio de Romero & Roque
(2022), mismo que evaluó la efectividad de un programa de seguridad que se base en el
comportamiento con el objetivo de reducir los actos inseguros en una empresa
comercializadora. En primer análisis logró identificar 22 eventos que no son seguros y
ocurrieron entre 2017 y 2019, y el 63% fue cometido de manera consciente. Gracias a esta
información se elige a un comité de observaciones formado por seis empleados voluntarios.
Mediante las cuatro semanas de implementación, se exhiben distintas observaciones, en
conclusión, el estudio muestra la efectividad de un programa de seguridad basado en el
comportamiento para reducir los actos inseguros en una comercializadora de bebidas.
A nivel práctico, este estudio tiene relevancia en contextos de entrenamiento animal, donde el
refuerzo positivo se utiliza comúnmente para enseñar nuevas conductas. Al evaluar su
eficacia en el aprendizaje de la presión de palanca, se brindan herramientas prácticas para
mejorar los programas de entrenamiento, optimizando el tiempo y recursos en el proceso de
enseñanza y mejorando el bienestar de los animales al evitar métodos coercitivos.
Este procedimiento se llevó a cabo en dos fases principales: línea base (Fase A) e
intervención (Fase B). A continuación, se detalla el procedimiento seguido: En la etapa inicial
(Fase A), se registraron las conductas espontáneas del sujeto experimental, una rata
denominada "Nieve". La sesión N°01 y N°02 tuvo una duración de 20 minutos, durante los
cuales se observaron y registraron las conductas de husmeo, acicalamiento y Pausa. Los
registros se realizaron de manera sistematizada, anotando la hora de inicio y finalización de
cada sesión. Este proceso permitió establecer un patrón base de comportamientos sin la
influencia de ninguna intervención.
En la siguiente tabla se muestra la tasa comportamental del sujeto durante las primeras dos
sesiones, mismas que pertenecen al momento de identificación situacional del caso.
Tabla 1
CONDUCTAS
SESIONE
H % A % PP %
S
1 37 47% 5 63% 0 0
2 41 53% 3 38% 0 0
TOTAL 78 100% 8 100% 0 0
Nota. Esta tabla muestra el aumento de la conducta H (husmeo) y la disminución de la
conducta A (acicalamiento).
Los resultados mostraron a la conducta H como la más frecuente, dado su aumento del 47%
en la sesión 1 al 53% en la sesión 2, al contrario, la conducta A disminuyó del 63% al 38%.
Este patrón responde a la fase de habituación, en la cual no se manipula la variable
independiente y el sujeto es libre de explorar su entorno libremente. Como nos menciona
Skinner (1953), durante esta etapa inicial, las conductas reflejan una línea base espontanea, la
cual resulta indispensable para poder en fase posteriores medir el impacto de los reforzadores.
El incremento de la conducta husmeo, además, nos indica que se está dando un proceso
adaptativo en el cual el sujeto está explorando activamente su entorno y el ambiente
experimental.
Tabla 2
CONDUCTAS
SESIONES AP % PP %
3 32 13% 0 0
4 47 20% 0 0
5 60 25% 0 0
6 50 21% 0 0
7 51 21% 0 0
TOTAL 240 100% 0 0
Nota. Se observa un aumento en aproximaciones, sin embargo, no existe presión de palanca.
Tabla 3
De acuerdo con Skinner (1957), los programas de razón fija generan tasas persistentes de
respuestas, estos también generan pausas que son posibles de predecir tras la entrega de cada
refuerzo, principalmente en las peticiones más elevadas. En este ámbito, la baja respecto a
frecuencia de reforzadores brindados a medida que aumenta el PRF evidencia el esfuerzo
conductual que se asocia con programas más exigentes. Sin embargo, este fenómeno también
exhibe que el sujeto ha logrado comprender el funcionamiento del evento y la asociación
entre las presiones de palanca y la obtención del reforzador. Estos descubrimientos recalcan
la efectividad del programa de reforzamiento para moldear conductas operantes, a pesar de
que las pausas posteriores al reforzamiento puedan reducir la productividad en relaciones de
mayor exigencia.
Tabla 4
PROMEDIO
SESIONES PP REFORZADORES
(20 segunos)
11 447 53 7.45
12 426 43 7.1
TOTAL 436.5 48 7.27
Nota. En la presente tabla, se muestra una creciente continuidad de la conducta esperada
utilizando un programa de intervalo fijo.
Respecto a la fase inicial del estudio experimental (Fase A), se evidencia en el sujeto un
patrón comportamental determinado por una conducta de husmeo creciente, indicando una
esperada adaptación al contexto o ambiente experimental. La fase mencionada es
fundamental con el objeto de formular una “línea base”, misma que permite analizar la
conducta previamente a manipular la variable independiente, así mismo, hace posible evaluar
la eficacia de los programas de refuerzo positivo aplicados. Es importante considerar que la
variabilidad e las conductas exhibida demuestra una adecuada capacidad de adaptación en la
primera etapa.
Durante la etapa del programa determinado “aproximaciones sucesivas”, es decir, una vez
iniciada la fase B, se evidencia un aumento en conductas parecidas o cercanas a la respuesta
objetivo, sin embargo, la presión de palanca no logra concretarse, sugiriendo una desconexión
entre la acción requerida y el reforzador brindado, por lo que el entendimiento de la
dinámica no logró desarrollarse en la rata; esto hace referencia a una metodología de
reforzamiento inadecuado, además de un insuficiente discernimiento de la respuesta, lo que
puede haber impedido el aprendizaje completo del sujeto.
Finalmente, al aplicar el programa de reforzamiento por intervalo fijo, se logra identificar que
las respuestas muestran un patrón estable entre un aumento al acercarse al final del intervalo
y, así mismo, una pausa al cumplir la meta y recibir el reforzador. La tasa de respuesta se
mantuvo constante durante las sesiones, confirmando una adaptación del comportamiento
hacia las expectativas temporales, evidenciando un comportamiento regular esperado por el
refuerzo de intervalo fijo.
RECOMENDACIONES
Se sugiere iniciar el programa con un intervalo de tiempo corto y manejable para el sujeto, así
mismo, mantener estable el intervalo requerido para mejorar la estabilidad en la tasa de
respuesta. Así mismo, es fundamental introducir otro tipo de programas como los variables,
mismos que permitirán una mejor capacidad de adaptación al contexto para la obtención de
refuerzos.
REFERENCIAS:
Apupalo, S., Medina, M., Sailema, N., & Cortez, P. (2024). Efectos del condicionamiento
operante en el aprendizaje en hámsteres mediante el uso de un
laberinto. CIENCIAMATRIA, 10(2), 1224-1240.
[Link]
Bastidas, B., Escobar, A., & Paz, F. (2021). Enfermedad de la línea blanca: Reporte caso
clínico en tapir amazónico (Tapirus terrestris).
[Link]
Borase, P., Maghade, K., Sondkar, Y., & Pawar, N. (2021). A review of PID control, tuning
methods and applications. International Journal of Dynamics and Control, 9, 818-
827. [Link]
Castro, R., Rondo, & Cieza, E. (2024). Videojuego para Mejorar el Análisis Experimental:
Un estudio de Caso en una Universidad Privada de Trujillo. Revista Ibérica de
Sistemas e Tecnologias de Informação, (E67), 16-31.
[Link]
origsite=gscholar&cbl=1006393
Chávez, B., Huamani, J., Castro, L., Gonzales, C., Manco, S., & Chauca, M. (2023).
ESTUDIO DE REPLICABILIDAD DE DOS SUJETOS EXPERIMENTALES EN
UN TRABAJO DE INVESTIGACIÓN DE CONDUCTA
DISCRIMINATORIA. ACTA PSICOLÓGICA PERUANA, 8(2), 173-188.
[Link]
Colquehuanca, E. (2022). Implementación de un plan de condicionamiento operante para
reducir el uso del celular como posible factor causal de actos subestándar, en la
empresa transportes Elio S.A.C. operación Petro Perú Juliaca Sur 2022 [Tesis de
licenciatura, Universidad Tecnológica del Perú]. Repositorio de la UTP.
[Link]
Domínguez, M., Gómez, A., Pinto, L., Mira, R., & Spencer, I. (2023). El proceso de
aprendizaje basado en la respuesta operante y estimulo reforzante: Un estudio
comparativo. Conducta Científica: Revista de investigación en ciencias de la
salud, 6(2), 37-47. [Link]
Gamboa, D., Yauli, A., Aldas, L., & Suarez, G. (2024). Descripción del condicionamiento
operante en un experimento con jerbos. Un estudio de caso. CIENCIAMATRIA, 10(2),
1257-1269. [Link]
Maldonado, G., Trujillo, O., & Morón, U. (2024). Etología aplicada: fundamento científico
del comportamiento y bienestar animal. [Link]
hl=es&lr=&id=tKcrEQAAQBAJ&oi=fnd&pg=PT11&dq=condicionamiento+operant
e+animales+trujillo&ots=8zQUBcYOpa&sig=vexOt0HN4-njcJzzitkEJn-n_AA
Manzueta, N. (2022). Teoría del aprendizaje desde las perspectivas de Albert Bandura y
Burrhus Frederic Skinner: vinculación con aprendizaje organizacional de Peter
Senge. UCE Ciencia. Revista de postgrado, 10(3).
[Link]
Mendoza, M., & Arroba, E. (2021). Refuerzo académico y rezago escolar en estudiantes de
educación básica superior. Polo del conocimiento, 6(4), 54-72.
[Link]
Roca, A., Gutiérrez, B., & Benavides, R. (2023). Reforzamiento cualitativamente variado:
una replicación del experimento de Steinman (1968). Acta Comportamentalia, 31(1).
[Link]
Sánchez, S., & Teodoro, S. (2022). Desarrollo de un entorno de realidad aumentada para la
enseñanza del condicionamiento operante en Psicología. Revista Tecnología, Ciencia
y Educación, 115-136.
[Link]
Wearden, H. (2024). Meeting of minds: Skinner and Michotte at the International Congress of
Psychology, Stockholm, 1951. Journal of the Experimental Analysis of Behavior.
[Link]
Yabor, A., Mull, V., Analuiza, E., & Suárez, G. (2024). Condicionamiento operante en
hámsters de raza americana en el laberinto Hampton Court. Un estudio
experimental. CIENCIAMATRIA, 10(2), 1241-1256.
[Link]