0% encontró este documento útil (0 votos)
20 vistas4 páginas

Tema 4

Psicología del aprendizaje

Cargado por

pilarsierz
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
20 vistas4 páginas

Tema 4

Psicología del aprendizaje

Cargado por

pilarsierz
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Condicionamiento instrumental

1 Conceptos básicos
• El organismo aprende a emitir respuestas para evitar u obtener las consecuencias que le
interesen en cada momento
• Conducta provocada por estímulos o consecuencias. Si es por estímulos
○ Conducta refleja
○ Respuesta Condicionada
2. Conducta instrumental
• Controlada por sus consecuencias -> fortalecer (reforzador) o debilitar la conducta
• Aprendizaje entre la conducta y las consecuencias derivadas de esta
○ Consecuencia -> relación directa con el EI
2.1 Edward Thorndike
• Problema de gatos y cajas
• Ensayos discretos: delimitados por el inicio y fin de una conducta
○ VD: necesaria operativizar antes de iniciar el Experimento
• Aprendizaje por ensayo y error
• VD: latencia de respuesta (disminuye con el aumento a la exposición)
• Ley del efecto

2.1.1 Técnica de operante libre: Burrus Fiedrich Skinner


• Condicionamiento operante:
○ Permite al aprendiz operar libremente en el contexto de aprendizaje (Caja de Skinner)
○ Elimina ensayos directos
○ Incorpora frecuencia de la respuesta como VD
○ Registro acumulativo de las respuestas
3. Componentes de las asociaciones
• Estímulo (E) -> Respuesta (R) -> Consecuencia (C)
○ Reforzadores: ↑ probabilidad emitir respuesta
○ Castigo: ↓ probabilidad emitir respuesta
4. Estímulo discriminativo (ED)
• Indica cuándo debemos responder para obtener la consecuencia
○ Ej. Silbato de inicio de carrera (E) indica correr (R) para ganar (C)
• No emitir una respuesta cuando hubiera sido correcto es: Error por hábito
4.1 Caja de Skinner
• Estímulo (E) -> ED+ y ED-
• Respuesta (R) -> Generalización, moldeamiento y encadenamiento
• Consecuencia (C) -> Reforzadores y castigos
4.1.1 Respuesta
• Generalización: tendencia a tratar dos estímulos diferentes como si fueran iguales.
○ Ej. Obtener comida si presiona la palanca
○ Gradiente de Generalización -> Lashey y Wade (1946)
• Discriminación: tendencia a responder diferencialmente entre estímulos
○ Dimensión: en torno a características del estímulo (color, tamaño)
○ Extradimensional: discriminación entre ≠ dimensiones
○ Intradimensional: discriminación entre = dimensión
▪ Resultados: gradientes + estrechos -> mejor discriminación (Jenkins y Harrison)
• Transposición y desplazamiento del vértice
○ Experimento de Köhler (1939) -> Discriminación simulltánea
○ Aprendizaje en términos ABSOLUTOS vs. En términos ABSTRACTOS
○ Transposición de una regla previa a otra situación
○ Desplazamiento del vértice: Alejamiento del máximo del gradiente de generalización al
E+ en dirección opuesta al E-

TEMA 4 página 1
• Problemas para la transposición y el desplazamiento del vértice
○ Posición absoluta: no explica el desplazamiento
○ Posición relacional: "responder a los verdes"
λ=530nm
4.1.1.1 Teoría de Spence: Predicciones
• Teoria ABSOLUTA
• Se aprende sobre los estímulos -> no sobre las relaciones
• Fuerzas excitadoras e inhibidoras se contrarrestan
4.1.2 Reforzadores
• Primarios: cumplen necesidades
○ Teoría de la relación del impulso (Hull) -> organismos tienen capacidad para
desarrollar de manera innata conductas que le permitan obtener estos reforzadores
• Secundarios: son sustituibles por los primarios (Dinero -> comprar comida)
4.1.4 Castigo
• Reducir la probabilidad de repetir una conducta en el futuro
• Castigo inmediato: estímulos aversivos inmediatamente después de la conducta objetivo
• Castigo demorado: tiempo después por lo que no se asocia el castigo con esa conducta
• Castigo negativo u omisión: emitir la conducta elimina una consecuencia apetitiva.
¿Por qué no siempre es eficaz el castigo?
1. Nos enseñan a hacer trampa y beneficiarnos de alguna forma
2. Reforzamiento concurrente -> conducta doblemente reforzada
3. Mas eficaz reforzar la conducta que aplicar un castigo

Refuerzos: ↑ la conducta
Castigos: ↓ la conducta

5. Moldeado por el Método de aproximaciones sucesivas


• Primero: determinar una conducta objetivo
• Segundo: establecer la línea base de respuesta (nivel operante)
• Tercero: reforzar las respuestas similares a la conducta objetivo y ↑ exigencia sobre éstas
6. Principios básicos para organizar eficazmente la cadena E-R-C
• Contigüidad, contingencia y magnitud/valor afectivo
• Función de demora: la capacidad reforzante de una consecuencia decrece a medida que
aumenta la demora entre la conducta y la consecuencia
6.1 Conducta supersticiosa e interferencia concurrente
• Conductas casualmente reforzadas que se mantienen por la creencia de que realizarlas dará
lugar a la obtención del reforzado
6.2 Demora de las consecuencias y continuo
• Autocontrol ↔ Impulsividad
• Autocontrol: Control por las consecuencias demoradas. Exceso -> baja tolerancia a la
demora de la gratificación
• Impulsividad: Control por las consecuencias inmediatas. Exceso -> conductas disruptivas
6.3 Función del decaimiento hiperbólico
• V=M/(1+K*D)
○ V -> valor del reforzador ○ K -> parámetro de descuento
○ M -> magnitud del reforzador ○ D -> demora entre conducta y reforzador

TEMA 4 página 2
7. Consideraciones para un Condicionamiento Instrumental efectivo
• Pertinencia (Thorndike): conductas coherentes con la historia evolutiva
• Derivas instintivas
• Variabilidad de la conducta: entrenar varias respuestas -> Page y Neuringer 1985
• Relevancia del estímulo: cantidad y calidad del reforzador
• Privación del reforzador: Principio de Premack (8)
8. Principio de Premack
• Dadas 2 respuestas en un procedimiento de C.I la respuesta + probable servirá como
reforzador a la - probable
• Hipótesis de privación de respuesta: desde la base de resultados experimentales en los que
reorganiza las preferencias de respuesta
○ Impedir a un organismo emitir determinadas respuestas puede ↑ su preferencia
9. Programas de reforzamiento
• Definen cuando se deben administrar los reforzadores
○ Continuo
○ Intermitente
• Por su valor motivacional
○ Positivo: inducen la aproximación
○ Negativo: inducen el escape
9.1. Programas de reforzamiento: Razón o Intervalo
• Criterios que determinan si una conducta es o no reforzada
Intervalo (I) Razón (R)
Entre la emisión de la respuesta y aparición Número de respuestas emitidas para obtener
del reforzador el reforzador
• Fijo (F) • Fijo (F)
• Pautas de festón: patrón de respuesta
• Variable (V) • Variable (media de respuestas)
✓ Pausa postreforzamiento

• Tipos de refuerzo según la situación


Niños consiguen una estrella por recoger los juguetes Refuerzo + en RF
Chicle de menta para quitar el mal aliento Refuerzo - en RF
Leemos ávidamente cada capítulo y hacemos una pausa al final Refuerzo intermitente
Empresa revisa el trabajo de sus empleados bianualmente Refuerzo + en IF

9.2 Programas concurrentes


• 2 alternativas de respuesta cada una asociada a programa de reforzamiento con libre acceso
• Tasa de Respuesta: RA / (RA + RB)
Ley de igualación a la muestra (Herrnstein 1961)
○ IV30"= 2 reforzadores/min
RA/(RA+RB) = rA/(rA+rB)
○ IV60"= 1 reforzador/min • Se ajusta mejor en IV que en razón (F y V)
• Tasa de Reforzamiento: rA / (rA + rB) ▪ Distribución de respuestas
▪ Influencias de las tasas relativas de refuerzo

TEMA 4 página 3
9.3 Programas encadenados
• 2 alternativas de respuesta cada una asociada a un programa de reforzamiento
• Sin libre acceso
• Implica un COMPROMISO
• Se estudia mediante -> autocontrol
○ Elección de una opción implica no poder realizar la otra
9.3.1 Autocontrol vs. Impulsividad
Autocontrol Impulsividad
Control por consecuencias demoradas Control por consecuencias inmediatas
Exceso -> baja tolerancia a la demora Exceso -> conductas disruptivas
de gratificación

Conducta Consecuencia inmediata Consecuencia demorada


Ir al dentista Dolor (-) Evitación problemas dentales (+)
NO ir al dentista Evitación del dolor (+) Problemas dentales (-)

10. Resumen de los principios básicos para organizar la secuencia E-R-C


• Contigüidad
• Contingencia
• Magnitud-Valor afectivo
• Función de demora
○ ↓ capacidad reforzante de una consecuencia mientras ↑ demora entre conducta
y consecuencia
• El valor atribuido a una conducta determina su capacidad como reforzador

TEMA 4 página 4

También podría gustarte