Saltar a un capítulo clave
- Empezaremos por la definición de condicionamiento operante.
- A continuación, exploraremos los principios y conceptos que conforman la teoría del condicionamiento operante y el experimento de condicionamiento operante de Skinner.
- A continuación, exploraremos algunos ejemplos de la teoría del condicionamiento operante.
- Por último, compararemos el condicionamiento clásico y el condicionamiento operante.
Definición de Condicionamiento Operante
B.F. Skinner creía que es posible estudiar el comportamiento científicamente. También pensaba que la conducta es voluntaria y tiene una finalidad: afectar al entorno. Este comportamiento, al que denominó comportamiento operante, es el objeto del condicionamiento operante.
Skinner describe la conducta operante como una conducta influida por sus resultados.
En otras palabras, una persona actúa sobre su entorno para obtener los resultados deseados. Entonces, ¿qué es el condicionamiento operante?
El condicionamiento operante es un método de aprendizaje o modificación de conductas en el que la consecuencia de una respuesta, ya sea buena o negativa, influye en la repetición de una acción.
Supón que le das una golosina a tu perro cuando se da la vuelta. El perro aprende a asociar la acción con la recompensa mediante el condicionamiento operante y probablemente repetirá el comportamiento.
El condicionamiento operante afirma que cada acción que realizamos al relacionarnos con nuestro entorno tiene consecuencias. Es más probable que repitamos comportamientos con resultados positivos que acciones con resultados negativos. Cuando recibimos un castigo como consecuencia de un comportamiento, lo más probable es que nunca repitamos ese comportamiento.
Teoría del condicionamiento operante
Skinner dividió la conducta en tres partes para su estudio científico: el estímulo discriminativo, la respuesta operante y el reforzador o castigador. Estos tres términos constituyen la contingencia, que ilustra una relación entre la respuesta operante y la consecuencia (un reforzador o castigador).
Definamos estos tres términos:
- Un estímulo discriminativo sirve como antecedente del comportamiento, como los acontecimientos o situaciones en los que se produce un comportamiento.
- Losreforzadores son las respuestas que aumentan la probabilidad del comportamiento que sigue.
- Loscastigadores son las respuestas que disminuyen la probabilidad del comportamiento que sigue.
Se acerca un examen (estímulo discriminativo), y repasaste bien y te esforzaste al máximo para prepararlo. Llegaron los resultados y obtuviste una puntuación alta. Tus padres estaban orgullosos y te llevaron a tu restaurante favorito (reforzador). Si te pasabas el día jugando a videojuegos y suspendías el examen, tus padres te regañaban por irresponsable (castigador).
La contingencia de tres términos sirvió de base al estudio de Skinner sobre el condicionamiento operante. Con su análisis, también identificó varios tipos de condicionamiento operante.
Condicionamiento operante: Tipos
Skinner desarrolló cuatro tipos de condicionamiento operante: refuerzo positivo, refuerzo negativo, castigo positivo y castigo negativo.
Hemos mencionado que el condicionamiento operante implica recompensar o castigar conductas.
En el refuerzo positivo, un resultado favorable sigue al comportamiento para aumentar su recurrencia.
Cuando apliques el refuerzo positivo, querrás reforzar una respuesta (por ejemplo, en términos de frecuencia o probabilidad) utilizando un reforzador operante. En este caso, un reforzador positivo.
John se dio cuenta de que su amigo Luke parecía triste, así que decidió gastarle una broma para animarle. Luke se rió, lo que reforzó positivamente la conducta de John. Así, la próxima vez que Luke se ponga triste, es probable que John repita ese comportamiento.
El refuerzo positivo refuerza un comportamiento, mientras que el refuerzo negativo lo debilita. ¿Verdad? El refuerzo negativo también puede reforzar un comportamiento. Este tipo de refuerzo entra dentro del condicionamiento aversivo operante.
Elrefuerzo negativo se produce cuando eliminas un acontecimiento desagradable (estímulo aversivo o reforzador negativo) tras un comportamiento.
Vas conduciendo y de repente oyes un chirrido al pisar el freno. Preocupado, llevas el coche al mecánico y descubre que hay que cambiar las pastillas de freno. El mecánico las cambió y el chirrido desapareció. La eliminación del chirrido reforzó negativamente la conducta de llevar el coche al mecánico.
Hay dos tipos de refuerzo negativo: la conducta de evitación y la de escape.
En la evitación, el alumno evita que se produzca el acontecimiento desagradable. Si el suceso desagradable ya ha ocurrido, la eliminación del reforzador negativo se produce mediante la conducta de escape.
Evitación: Cuando dejas los platos en el fregadero, oyes a tu madre llegar a casa de la compra y aparcar el coche en la entrada. Te apresuras a lavar los platos antes de que ella entre en casa para evitar el regaño.
Escape: ¿Pero qué pasa si tu madre llega y ve los platos en el fregadero antes de lo esperado? Tu madre empieza a regañarte y tú lavas los platos para que deje de regañarte.
El castigo es otra forma de condicionamiento aversivo operante que pretende debilitar los comportamientos. Cuando los comportamientos se debilitan, significa que hay una disminución de la frecuencia, la duración y los intervalos.
El castigo se refiere a las consecuencias negativas (estímulos aversivos) que siguen a un comportamiento.
El castigo positivo se produce cuando un estímulo aversivo (algo que no quieres) sigue a una respuesta.
Un grupo de alumnos se enfrenta a un castigo tras negarse a seguir a su profesor.
Los resultados adversos tras un mal comportamiento deben ser inmediatos y constantes para que el alumno asocie la consecuencia del comportamiento con una mayor probabilidad de dejarlo.
Elcastigo negativo consiste en retirar algo valioso (un objeto o una actividad) tras una respuesta.
A una persona se le suspende el carné de conducir tras múltiples infracciones de tráfico.
Sin embargo, los psicólogos advierten del castigo excesivo, ya que el castigo te dice lo que no debes hacer; esto puede no conducir al comportamiento deseado. Los castigos pueden volver agresivo al alumno porque es un mecanismo de afrontamiento (para hacer frente a los problemas de la vida).
En pocas palabras, el castigo positivo (+) añade una consecuencia negativa, mientras que el castigo negativo (-) consiste en quitar algo.
Condicionamiento Operante: Propiedades del refuerzo
Antes hemos definido qué son los reforzadores y los refuerzos positivos y negativos de la conducta. En el condicionamiento operante, Skinner identificó las propiedades del refuerzo, como los distintos tipos de reforzadores y los horarios de refuerzo.
Los reforzadoresprimarios, como la comida, el agua y el sueño, tienen importancia biológica para nosotros. Este refuerzo es universal, lo que significa que puede ocurrirle a cualquiera.
Los reforzadoressecundarios, también conocidos como reforzadores adquiridos o condicionados, son inicialmente neutros, pero pueden reforzar conductas cuando se emparejan con un reforzador primario. Algunos ejemplos son las fichas, los puntos y las pegatinas.
Los programas de refuerzo describen la forma y el momento de dar los reforzadores a un alumno.
Hay dos tipos de programas de refuerzo: continuo y parcial.
Elrefuerzo continuo consiste en dar refuerzos cada vez que el alumno realiza la conducta objetivo.
El profesor da una estrella dorada cada vez que un alumno participa en clase.
El refuerzoparcial, en cambio, consiste en dar reforzadores en función de un número determinado de acciones deseables (programas de proporción) o de tiempo (programas de intervalo).
Los programas de proporciónfija requieren un número concreto de respuestas antes de que se produzca el refuerzo.
El jefe de ventas da a un empleado una bonificación por alcanzar el objetivo de ventas durante seis meses consecutivos.
Los programas de intervalofijo implican el refuerzo de un comportamiento deseable después de un periodo específico. Este esquema conduce a un aumento del número de respuestas a medida que se acerca el refuerzo.
Alice se prepara para su examen de licenciatura. Tenía tres meses para prepararse el examen, pero en los dos primeros meses no dedicó mucho tiempo a repasar. A medida que se acercaba el examen, dedicó el último mes de su preparación a estudiar sus lecciones para asegurarse de aprobar (refuerzo) el examen.
Los esquemas de proporción variable se refieren a un refuerzo de conductas deseables sin un número concreto de respuestas.
El ejemplo más común de programa de refuerzo de proporción variable son las máquinas tragaperras. La imprevisibilidad del refuerzo fomenta la conducta de juego.
Los programas deintervalo variable se refieren a un refuerzo de conductas deseables en intervalos de tiempo impredecibles.
La imprevisibilidad de recibir un mensaje (refuerzo) a través de la mensajería instantánea puede fomentar la conducta de comprobar tus notificaciones a distintas horas del día.
Condicionamiento Operante: Principios
Hemos visto cómo se produce el refuerzo y los tipos de reforzadores que se dan. Ahora veremos tres principios esenciales del condicionamiento operante.
El principio de inmediatez destaca el momento de la entrega del refuerzo. Si el refuerzo se produce justo después de la conducta, mayor será su efecto sobre el alumno. Cuanto menos inmediatas, menos eficaces son las consecuencias.
El principio de contingencia se refiere a la constancia con que una consecuencia sigue a un comportamiento. Este principio destaca la importancia de transmitir una respuesta de forma fiable para aumentar la eficacia de la consecuencia.
El principio de saciedad nos dice que si el alumno no tiene apetito por un estímulo concreto (por ejemplo, la recompensa), la consecuencia no será tan eficaz; sin embargo, si tiene necesidad de un estímulo específico, el efecto de la consecuencia aumenta.
Condicionamiento Operante de Skinner: Experimento
Para probar su teoría, B. F. Skinner realizó experimentos de condicionamiento operante con animales observando su comportamiento en la caja de Skinner. Skinner desarrolló la caja de Skinner, o cámara de condicionamiento operante, que registraba el comportamiento de un organismo en un tiempo determinado.
El animal recibe una recompensa (paleta de comida) o un castigo (descargas eléctricas desagradables) cuando muestra determinados comportamientos, como presionar la palanca en el caso de las ratas o picotear las teclas en el caso de las palomas.
Mientras la rata se movía por la caja, pulsó accidentalmente la palanca conectada a una bolita de comida. La bolita de comida dejaba caer automáticamente comida en un dispensador de comida (refuerzo positivo). La rata aprendió este comportamiento gratificante rápidamente tras haber sido colocada en la caja de Skinner sólo unas pocas veces.
Skinner probó el refuerzo negativo dando a la rata descargas eléctricas desagradables mientras estaba dentro de la caja. Cuando la rata se movía dentro de la caja, pulsaba accidentalmente la palanca, y las descargas eléctricas cesaban inmediatamente (refuerzo negativo).
Después de colocarla en la caja unas cuantas veces, la rata aprendió rápidamente este comportamiento. La siguiente vez que la rata fue colocada en la caja, se apresuró inmediatamente a pulsar la palanca para evitar la desagradable experiencia de las descargas eléctricas.
Ejemplos y aplicación del condicionamiento operante
Hay varios ejemplos de aplicación del condicionamiento operante en la vida cotidiana. El condicionamiento operante de Skinner contribuyó a desarrollar terapias de tratamiento como la economía de fichas y el moldeamiento de la conducta.
Los padres y los profesores utilizan la economía de fichas para reforzar el comportamiento deseado mediante fichas como pegatinas, cupones, dinero o puntos que el niño puede canjear por recompensas como comida, actividades o privilegios. La economía de fichas ayuda a enseñar a los niños a seguir las normas en casa y en la escuela.
El molde amiento de la conducta consiste en obtener respuestas simplificando la conducta deseada en pasos pequeños y manejables, seguidos de una recompensa cuando el alumno completa cada paso.
Por ejemplo, los adiestradores utilizan el moldeado del comportamiento para enseñar trucos complejos a los animales de circo.
En la terapia conductual, los psicólogos utilizan el condicionamiento operante y sus principios para alterar el comportamiento y tratar trastornos psicológicos como la depresión, los trastornos alimentarios y el trastorno obsesivo-compulsivo (TOC).
Condicionamiento clásico y operante
Entendemos que tanto el condicionamiento clásico como el condicionamiento operante son formas de aprendizaje asociativo. Pero, ¿cuál es la diferencia? Veamos esta tabla para comparar los dos tipos de condicionamiento.
Condicionamiento clásico | Condicionamiento Operante |
Los comportamientos son involuntarios. | Los comportamientos son voluntarios. |
El aprendizaje tiene lugar antes de que se produzca una respuesta (presentación de un estímulo incondicionado después de un estímulo condicionado). | El aprendizaje tiene lugar después de que se produzca una respuesta (mediante refuerzo o castigo). |
El aprendiz es pasivo. | El alumno es activo. |
El alumno asocia un estímulo neutro a un estímulo incondicionado, provocando una respuesta. | El aprendiz asocia una respuesta con una consecuencia que le sigue, afectando a la recurrencia de un comportamiento. |
Condicionamiento operante - Puntos clave
El condicionamiento operante es un método de aprendizaje o modificación de conductas en el que la consecuencia de una respuesta, ya sea buena o negativa, influye en la repetición de una acción.
Utilizando la Caja de Skinner, B. F. Skinner llevó a cabo investigaciones sobre el condicionamiento operante en animales, que registraban el comportamiento a lo largo del tiempo.
Las propiedades del refuerzo incluyen el refuerzo primario y el secundario, y esquemas de refuerzo basados en el número de respuestas o intervalos de tiempo.
Ejemplos reales de condicionamiento operante son la economía de fichas, el moldeamiento de la conducta y la terapia conductual.
El condicionamientooperante difiere del condicionamiento clásico en que los comportamientos son voluntarios y el aprendizaje se produce después de una respuesta. El condicionamiento clásico considera las conductas como reflejos, y el aprendizaje se produce antes de que se produzca una reacción.
Referencias
- Fig. 2. Imagen del experimento de la rata de Skinner (https://commons.wikimedia.org/wiki/File:Skinner_box_scheme_01.png) por Andreas1 (https://commons.wikimedia.org/w/index.php?title=User:Andreas1&action=edit&redlink=1) Licencia CC BY-SA 3.0 (https://creativecommons.org/licenses/by-sa/3.0/deed.en)
Aprende más rápido con las 14 tarjetas sobre Condicionamiento Operante
Regístrate gratis para acceder a todas nuestras tarjetas.
Preguntas frecuentes sobre Condicionamiento Operante
Acerca de StudySmarter
StudySmarter es una compañía de tecnología educativa reconocida a nivel mundial, que ofrece una plataforma de aprendizaje integral diseñada para estudiantes de todas las edades y niveles educativos. Nuestra plataforma proporciona apoyo en el aprendizaje para una amplia gama de asignaturas, incluidas las STEM, Ciencias Sociales e Idiomas, y también ayuda a los estudiantes a dominar con éxito diversos exámenes y pruebas en todo el mundo, como GCSE, A Level, SAT, ACT, Abitur y más. Ofrecemos una extensa biblioteca de materiales de aprendizaje, incluidas tarjetas didácticas interactivas, soluciones completas de libros de texto y explicaciones detalladas. La tecnología avanzada y las herramientas que proporcionamos ayudan a los estudiantes a crear sus propios materiales de aprendizaje. El contenido de StudySmarter no solo es verificado por expertos, sino que también se actualiza regularmente para garantizar su precisión y relevancia.
Aprende más