Estudia cómo detectamos los efectos que tienen nuestras conductas y cómo estos efectos o consecuencias influyen a su vez en nuestro comportamiento. Nuestra conducta es el instrumento que nos permite modificar el entorno, bien sea en un entorno físico o social, por este motivo esta conducta recibe el nombre de conducta instrumental, y que a menudo es definida como conducta instrumental dirigida a una meta”. La adquisición del hábito de morderse las uñas la podemos explicar mediante el condicionamiento instrumental y por lo tanto mediante procesos asociativos, el hecho en sí produce una consecuencia positiva y por lo tanto la probabilidad de que la conducta se repita es alta.
Descartes diferenció entre la conducta involuntaria y la conducta voluntaria. El primer caso sería la conducta refleja, esto es, todo comportamiento provocado por un estímulo y que estaría sometido a unos principios mecanicistas como el arco reflejo. Por otra parte, la conducta voluntaria no estaría controlada por ningún mecanismo, sino que estaría determinada por el libre albedrío. Hobbes propuso que la conducta voluntaria seguiría el principio del hedonismo, según el cual y en sentido estricto el placer es el único o principal bien de la vida, en consecuencia, viéndolo desde la óptica del control de la conducta voluntaria el objetivo de esta es el de la búsqueda del placer y la huida del dolor. Los procedimientos del condicionamiento instrumental se centran en las consecuencias que tiene nuestro comportamiento sobre los estímulos, bien sean apetitivos (agradables), o aversivos (desagradables).
Si establecemos comparación entre el condicionamiento clásico y el instrumental, vemos que los dos están basados en el mecanismo de la asociación y sus principios. La idea básica es que dos acontecimientos que se presentan contiguos en el tiempo quedan asociados. A pesar de esta generalidad, en la actualidad se conocen muchas condiciones que modulan este mecanismo y muchas de ellas son aplicables a los dos tipos de condicionamiento. En todo caso, la diferencia básica entre condicionamiento clásico y condicionamiento instrumental radica en la naturaleza de los elementos que se asocian.
• En el condicionamiento clásico los acontecimientos que quedan asociados son dos estímulos que el organismo no puede manipular, las conductas en ningún caso alterarán la presentación de los estímulos.
• En cambio, en el condicionamiento instrumental los acontecimientos implicados son una conducta y un estímulo; de tal manera que la conducta alterará este estímulo, haciéndolo aparecer si estaba ausente o haciéndolo desaparecer si estaba presente.
Como consecuencia de estas características, el condicionamiento clásico nos sirve para anticipar hechos importantes o su ausencia, mientras que el condicionamiento instrumental nos sirve para alterar nuestro entorno con el objetivo de hacerlo más agradable.
El primer investigador formalmente aceptado dedicado al estudio del condicionamiento instrumental fue Thorndike (1898, 1911). Sus trabajos tenían como finalidad estudiar la inteligencia animal, según Thorndike, cuando un animal ejecuta una conducta que va seguida de un acontecimiento agradable entonces los estímulos presentes en el momento de la respuesta y la respuesta quedaban conectados de modo que en el futuro la presencia de los estímulos activaba directamente la respuesta a ellos conectada. Si la consecuencia era aversiva, entonces la conexión se debilitaba. Este mecanismo se conoce como ley del efecto. Skinner, (1938), creó un procedimiento que permitía el estudio de la conducta de manera continua. Si analizamos el comportamiento de una persona o de un animal, podremos darnos cuenta de que la conducta fluye constantemente y a menudo se hace difícil determinar claramente las diferentes unidades de conducta. Skinner resolvió este problema introduciendo el concepto de respuesta operante, que se define a partir del efecto que tiene una conducta sobre el entorno del animal. Skinner propuso la medida de la tasa de respuesta para analizar la conducta operante. La tasa de respuesta es la frecuencia con la que la conducta aparece por unidad de tiempo, siendo la manera más habitual de medir la tasa de respuesta el registro acumulativo de respuestas, la representación de la repetición de respuestas a lo largo del tiempo.
Procedimientos de condicionamiento instrumental.
Hay muchas otras situaciones de condicionamiento instrumental, por ejemplo, el premio de los padres al hijo en la comida, cuando este come el primer plato los padres le dan postre, o pueden prohibirle ver la televisión si ha tratado mal a su hermano. Podemos parar el reloj para no saber la hora, o quitarle las pilas al despertador porque nos molesta, hay un sinfín de situaciones en el quehacer cotidiano. En el condicionamiento instrumental la respuesta ejecutada supone una consecuencia que puede ser un hecho agradable, (un helado, ver la televisión), es decir, un estímulo apetitivo, o puede ser un hecho desagradable (un golpe, un ruido molesto), hechos que serían lo contrario, es decir, estímulos aversivos.
La respuesta provoca la presentación del estímulo que no estaba presente antes de dar la respuesta (comer el plato de verdura). En estos casos hablamos de una contingencia positiva entre la respuesta y el estímulo. Por el contrario, algunas veces la conducta instrumental provoca que un estímulo presente antes de dar la respuesta desaparezca cuando ésta se produce (quitar las pilas del reloj). Es decir, en estas situaciones la contingencia entre respuesta y estímulo es negativa. Así los diferentes procedimientos de condicionamiento instrumental se agrupan en función de la contingencia positiva o negativa entre la respuesta y el estímulo sobre la que actúa, y por la naturaleza del estímulo consecuente. Dos aclaraciones, los términos positivo y negativo se refieren exclusivamente a la contingencia entre la respuesta y el estímulo, y otra es que el hablar de reforzamiento es hablar de que la conducta será reforzada, es decir, se mantendrá o tenderá a incrementar su probabilidad de aparición. En cambio, al hablar de castigo la referencia son procedimientos que provocarán una reducción en la frecuencia de la conducta.
1.- Reforzamiento positivo.
Al echar una moneda a la máquina y obtener el café o el refresco apetecido, al hacer un regalo, al cobrar la nómina a fin de mes, cuando la pareja nos da un beso, todos son ejemplos de reforzamiento positivo. En cada uno de ellos, una respuesta ha provocado la aparición de un estímulo apetitivo. Si se realiza la respuesta, el estímulo apetitivo aparece, si no está la respuesta, entonces el estímulo apetitivo no aparece, por lo que la contingencia entre la respuesta y el estímulo es positiva. El efecto del reforzamiento positivo sobre la conducta incrementa la probabilidad de aparición de la misma.
2.- Castigo positivo o simplemente castigo.
Cuando nos quemamos cocinando, o con el café, o nos da una pequeña descarga eléctrica, en cada una de estas situaciones la conducta ha provocado la aparición de un estímulo aversivo y son ejemplos de castigo. La contingencia entre la respuesta y el estímulo apetitivo es positiva, ya que el estímulo sólo se presenta si antes se ha dado la respuesta. Las consecuencias del castigo sobre la conducta es que provoca una tendencia a desaparecer o a disminuir. En su escuela de primaria Julen ha aprendido a no pegar a sus compañeros de clase, ya que así evita que la profesora le eche la bronca, la conducta instrumental es pegar a los compañeros y el estímulo reforzador la bronca de la profesora, que actúa como un estímulo aversivo. Cuando Julen ejecuta la conducta, (pega a sus compañeros), aparece el estímulo aversivo, sino la ejecuta no ocurre el estímulo aversivo (el grito). Se trata de una contingencia positiva y el procedimiento es de castigo positivo. La constructora Ortiz devuelve tres meses más tarde los andamios alquilados, al devolverlos tuvo que pagar el retraso a 50 Euros por día. En consecuencia a partir de ahora tiene más cuidado y no devuelve los andamios fuera de plazo. Es un castigo Positivo, el dinero como reforzador aversivo mantiene una contingencia positiva. La conducta instrumental es devolver los andamios más tarde del plazo acordado, y el reforzador es el pago correspondiente. Este comportamiento (que es secundario por estar modelado por el aprendizaje), es el que origina el tener que pagar más dinero de lo acordado, lo que originará un valor aversivo.
3.- Reforzamiento negativo.
Una persona fóbica puede salir corriendo ante una situación que le angustia, o una que tiene fobia a los perros tiende a huir si se encuentra de frente con un perro, en ambos casos se establece una contingencia negativa entre la respuesta y un estímulo aversivo, o un conductor que lleva a revisar el coche al mecánico antes de vacaciones, para evitar una avería. Son ejemplos del procedimiento de reforzamiento negativo. En ambos casos se establece una contingencia negativa entre la respuesta y un estímulo aversivo. La persona que huye en presencia de un perro puede conseguir alejarse del perro. El conductor que lleva el coche al mecánico puede evitar una avería y sus consecuencias aversivas. Aunque las dos situaciones son prácticamente iguales, existe una diferencia notable entre ellas. – En el caso de las fobias la persona se ha encontrado directamente con el estímulo aversivo, y la respuesta ha provocado la desaparición del estímulo. La persona ha escapado de la situación aversiva, es el procedimiento de escape. – En el caso del coche el estímulo aversivo no se produce, es decir, la conducta se realiza sin que esté presente el estímulo aversivo e impide que aparezca, es en consecuencia un procedimiento de evitación. La diferencia es que en el caso de la evitación, debe haber algún hecho que anticipe la posibilidad de la situación aversiva, así, si la persona con fobia siente asfixia y se siente invadida al ver la aglomeración, el que tiene fobia a los perros puede oír ladrar a uno, y en consecuencia cambiar de camino antes de encontrárselo. El conductor del coche tal vez tuvo una avería y quedó tirado de noche en la carretera, por eso puede anticipar la posibilidad de una avería, y revisa su coche para evitar que le vuelva a ocurrir. Sea cual sea el caso, evitación o escape, el reforzamiento negativo provoca que la conducta se repita en el futuro. Después de discutir con su pareja Miguel se siente muy nervioso, la mejor manera que conoce para relajarse es salir a correr durante un rato. El discutir tiene una consecuencia aversiva, el estado de ansiedad generado (estímulo aversivo). Miguel sabe que si sale a correr la ansiedad desaparece, haciéndolo así la conducta lleva a la retirada de la ansiedad, lo que implica un reforzamiento negativo, de huida ya que la situación aversiva está presente en el momento de la respuesta.
4.- Castigo negativo o entrenamiento de omisión.
Cuando nos quitan puntos del carné por ir demasiado rápido, cuando el hijo adolescente responde mal a sus padres y éstos le quitan el ordenador durante un tiempo, ambos casos nos muestran una contingencia negativa entre una conducta y un estímulo apetitivo. Cuando se produce la conducta hay castigo, pérdida del ordenador o de los puntos del carné, es decir, se retira un estímulo agradable para la persona. La esperada consecuencia de estas situaciones es que la conducta tienda a desaparecer.