Cuando los clickers funcionan

Por: Karolina Westlund

Puedes ver el original aquí

Traducción: Pablo Herrera, con permiso de Karolina Westlund

Usar un clicker cuando se entrena: ¿es útil o no?

Revisado en diciembre de 2020 (¡ve el final de la publicación!)

El entrenamiento usando un clicker es muy popular y está ganando terreno entre los entrenadores de animales, pero hay algo que te podría sorprender:

Cuando los científicos comparan la efectividad de usar un clicker cuando se entrena contra el entrenamiento usando solo premios como refuerzos (o reforzadores, para ser más precisos) fuera del laboratorio, los resultados son inconclusos.

Un estudio encontró que el clicker llevó a un aprendizaje más rápido, otro que llevó a un aprendizaje más lento y cuatro estudios no encontraron diferencia entre los dos procedimientos.

"¡¿Qué?! ¡Eso es absurdo! ¡Yo sé que funciona!", algunos de los defensores más entusiastas del clicker por ahí podrían decir, y simplemente ignorar ese tipo de publicaciones.

"¡Lo sabía!" la multitud anti-clicker podría decir, y usar esos artículos como munición.

La semilla de la duda, desafortunada, ya que podría dañar tu entrenamiento.

Para el resto, ese tipo de datos no concluyentes o contradictorios podrían sembrar una semilla de duda, una pequeña voz de incertidumbre inquietante.

Y dado que la duda probablemente interferirá con tu éxito en el entrenamiento, el propósito de esta publicación de blog es disiparla.

Personalmente, creo que esos estudios tienen algunos problemas metodológicos serios que podrían explicar los resultados. Tal vez, mientras te guío a través de mi línea de pensamiento, estarás de acuerdo conmigo.

En esta publicación, no explicaré cómo entrenar usando un clicker, sino que asumiré que tienes una comprensión básica de cómo funciona. Si no es así, comienza leyendo esto. O esto.

Para simplificar, el término "click" en esta publicación podría incluir cualquier estímulo que se haya emparejado consistentemente con un premio, como el sonido de un clicker, un silbato o una luz láser intermitente. “Premio” podría referirse a cualquier estímulo incondicionado que tenga propiedades de refuerzo intrínsecas: por ejemplo, comida, juego o atención.

Entonces, ¿cómo funciona ya establecido el clicker en el entrenamiento de animales?

Las tres funciones del click

Una pregunta aparentemente trivial, pero hagamos. El intento con el entrenamiento de un comportamiento simple.

Dices "siéntate", el perro entrenado con clicker se sienta, haces click y le das un premio.

¿Qué acaba de pasar? ¿Cuál fue la función esperada del click?

El click predijo los premios (era un reforzador)

El click marcó el momento exacto en que se cumplió el criterio (era un marcador)

El click abarcó el intervalo entre el comportamiento y la consecuencia (era un puente)

Entonces, esas fueron las funciones esperadas o potenciales. ¿Los clicks siempre tienen las tres funciones o solo a veces?

Reforzador. El poder del click como reforzador secundario (o condicionado o aprendido) depende del grado de condicionamiento clásico: la cantidad de emparejamientos (click-premio), la calidad de los premios, la singularidad de la combinación del sonido y el premio elegido, y así sucesivamente. El poder del click como reforzador no es todo o nada: también hay de todo en el medio.

Marcador. Si el click sirve como función de marcado depende de la otra información disponible para el animal en la configuración actual. ¿Puede obtener información de "marcado" de algo más que ocurre simultáneamente? Por ejemplo, cuando el animal toca un objetivo y obtiene un click al mismo tiempo, esos dos estímulos deben ser procesados por el cerebro del animal, y a veces tal vez el toque será más notorio para el animal, a veces el clic. Los animales están cableados para atender a los estímulos; se orientarán hacia ellos, se acercarán, olfatearán e investigarán. Tocar es parte del comportamiento de apuntar y la retroalimentación táctil probablemente será muy evidente para el animal, tal vez más que la retroalimentación auditiva de escuchar simultáneamente un sonido de clic. Además, tocar la nariz involucra un componente olfativo para muchas especies animales: tal vez oler el objetivo eclipsará la estimulación auditiva de escuchar simultáneamente un sonido de clic. Además, cuánto atenderá el animal al sonido de click probablemente será una función de la exposición previa a ese sonido: ¿es reforzante?

Puente. Los animales aprenden más lentamente, o no logran aprender la tarea en absoluto, cuando las consecuencias se retrasan incluso por un intervalo muy corto después del comportamiento relevante. El click predice la consecuencia próxima, por lo que puede disminuir los efectos del refuerzo primario demorado.

Guau, tres en uno: ¡un marcador, un reforzador y un puente! Si el click puede hacer todo eso, no es de extrañar que sea una herramienta tan popular. Entonces, ¿cuál es el problema?

Empecemos con estudios de laboratorio sobre el aprendizaje.

Esperamos que usar un clicker funcione

Se ha hecho mucho trabajo, principalmente con ratas y palomas en el entorno de laboratorio, sobre el efecto de los reforzadores condicionados (el click siendo un ejemplo) en la adquisición de comportamientos. Se ha demostrado que los reforzadores condicionados aceleran el aprendizaje, conducen a una mejor retención del comportamiento aprendido, producen una respuesta eufórica debido a la activación del SEEKING SYSTEM y la liberación concurrente de dopamina, así como mejoran la resistencia a la extinción. En el entorno de laboratorio, que yo sepa, no hay mucho desacuerdo sobre los efectos de los reforzadores condicionados en la química cerebral y el comportamiento.

Los problemas comienzan cuando movemos todos estos hallazgos al entorno aplicado. El mundo real, fuera del laboratorio.

Pero antes de hacer eso: ¿qué dicen los entrenadores de clicker sobre sus experiencias prácticas?

Los entrenadores de clicker dicen que el clicker funciona

Los entrenadores de clicker hablan muy bien y con entusiasmo de los beneficios del entrenamiento con clicker. Ven compromiso y enfoque, experimentan una rápida adquisición de nuevos comportamientos y que los animales recuerdan lo que aprendieron a través del entrenamiento con clicker años después.

Dicen que alienta al animal a pensar por sí mismo, convirtiéndose en un participante activo y pensante.

Dicen que lo hace feliz y seguro.

En una revisión que incluye 25 fuentes, un estudio reciente citó a un entrenador:

"El entrenamiento con clicker convertirá a tu perro en un adicto al aprendizaje, un perro que está ansioso por ofrecer comportamientos y experimentar para hacer que lo recompenses".

Esos informes anecdóticos no son muy científicos, sin embargo. Los críticos podrían argumentar que los entrenadores de clicker están sesgados, son ignorantes o están desinformados. Que si nunca has usado un clicker cuando entrenas animales, no estás calificado para hacer esa comparación.

Yo por uno, no pasaría. Leo, escribo y enseño más de lo que entreno realmente, y cuando lo hago, uso mucho el clicker. Probablemente más de lo que tendría que hacer.

Pero muchos entrenadores han entrenado tanto usando clickers como sin usarlos, así que me interesó su experiencia.

Participo en algunos grupos de capacitación en Facebook, así que pregunté: "Aquellos de ustedes que han entrenado tanto usando como sin usar clickers (u otros marcadores de eventos), ¿con cuál de las siguientes declaraciones están más de acuerdo? "

Y luego podrían elegir si los clickers siempre aceleraban el aprendizaje de los animales, a veces, nunca, o si no veían una diferencia.

Lo sé, no es la mejor encuesta. Tiendo a disparar desde la cadera, por así decirlo.

En aproximadamente 24 horas, tuve 73 respuestas. Dentro de este diverso grupo de entrenadores, con experiencias desde el entrenamiento de mascotas, animales de granja, así como animales de zoológico: este fue el resultado.

Muchas personas eligieron la categoría "a veces más rápido". Los entrenadores experimentados han aprendido cuándo el clicker produce resultados más rápidos y, por lo tanto, eligen usar clickers en algunas situaciones y no en otras. Probablemente debería haber formulado la pregunta de otra manera para capturar esta diferencia, pero esta fue una encuesta del momento y eso no se me ocurrió hasta más tarde.

Entonces, cuando los científicos comenzaron a configurar estudios experimentales, esperábamos que confirmaran lo que estos estudios científicos básicos y las observaciones de los entrenadores de clicker han sugerido.

Sin embargo....

Los estudios publicados hasta la fecha no lo han corroborado.

Los datos actuales dicen que los clickers no funcionan

Por lo tanto, la eficacia del clicker no ha sido corroborada por estudios científicos realizados en entornos aplicados. En el mundo real, fuera del laboratorio, cinco de seis estudios encontraron que no había diferencia o que el aprendizaje en realidad se ralentizó. Solo uno encontró que el uso de un clicker cuando se entrena aumentó la velocidad de aprendizaje.

¡Ups!

Entonces, ¿estaban mal los datos de laboratorio originales o los entrenadores de clicker son delirantes?

O, nos atrevemos a preguntar: ¿esos 6 estudios se hacen las preguntas correctas? ¿Mirando la hipótesis desde el ángulo correcto?

Creo que no. Después de hojear esos artículos con ojo crítico, encuentro algunos problemas importantes con ellos.

Problema 1: condicionamiento insuficiente

En primer lugar, en todos esos estudios, condicionan el clicker un máximo de 20 veces (clic-premio, clic-premio, clic-premio) y luego comparan el "grupo clicker" con el grupo de control sin condicionar. De hecho, en varios de los estudios, no hay condicionamiento clásico en absoluto antes de que comience el aprendizaje operante, si los leí bien.

En otras palabras, los animales comienzan de inmediato a aprender la tarea, un grupo obteniendo "click-premio" y el otro solo "premio" como consecuencia.

Entonces el animal en el grupo de click tiene que resolver tanto que:

el comportamiento tiene un efecto (aprendizaje operante)

el sonido de click predice confiablemente la entrega del premio (condicionamiento clásico)

Y los científicos comienzan a recolectar datos desde el primer ensayo. Entonces, si acaso, esperaríamos que los animales comiencen en el mismo punto, tal vez los animales entrenados con click incluso estén en cierta desventaja porque necesitan desentrañar más información que los animales entrenados solo con comida.

En otras palabras, si el poder del click tarda más en establecerse que el máximo de 20 emparejamientos que cualquiera de estos estudios permitió, los investigadores están buscando el efecto en el intervalo de entrenamiento incorrecto.

No deberían comenzar a medir en el ensayo uno sino tal vez en el ensayo 150. O 300. O cuando sea que esperemos que el efecto reforzante del clicker esté bien establecido.

Permítame explicar lo que quiero decir por medio de una analogía.

En Suecia, estamos cambiando nuestro dinero. Tenemos un nuevo billete de 500 coronas, con uno de los mejores cantantes que han pisado esta tierra, Birgit Nilsson.

Digresión: una vez canté en un coro que tenía el siguiente castigo escrito en sus estatutos: si alguna vez éramos lo suficientemente presuntuosos como para pensar que habíamos dado una actuación de primera clase, debíamos escuchar a Birgit Nilsson cantando el aria de la muerte de Isolde de Wagner de la grabación en vivo de Beyreuth de 1966, dirigida por Karl Böhm, para ponernos en nuestro lugar y expulsar tales ideas tontas de nuestras mentes. Esto sucedió en una ocasión memorable: todavía recuerdo cómo los sentimientos exuberantes, felices y orgullosos que sentimos al salir del escenario se desinflaron y desinflaron mientras escuchábamos el formidable, imposible e impecable aria de Birgit. ¿Mencioné que su aria fue grabada en vivo?

Lo sé, eso fue extraño y frustrante si entiendes la teoría del aprendizaje. En lugar de celebrar una actuación sobresaliente, la hundimos.

De todos modos.

¿Dónde estaba?

Ah, dinero. Entonces, en teoría, ambos billetes tienen el mismo valor en este momento. Estamos en el medio año más o menos en que ambos están disponibles. Ahora imagina que encuentras uno de ellos en la calle. Miras hacia abajo y ves un billete de 500 coronas. Alrededor de 55 dólares estadounidenses. 52 euros.

¿Importa si es Birgit o Carlos XI? Apuestas, al menos para cualquier persona sueca, en 2016.

No me emocionaría demasiado si encontrara el de Birgit Nilsson, y no porque me castigaron escuchando su actuación que patea traseros en una extraña y maravillosa noche hace 15 años.

¿Cuál es el problema entonces?

Esa nota es demasiado nueva.

Es desconocida.

Francamente, probablemente ni siquiera sabría si era falsa o la real. Mientras que la otra, con Carlos XI, de 2001, es instantáneamente reconocible: puedo ver una fracción de ella y reconocerla de inmediato.

¿A qué quiero llegar? Que los reforzadores condicionados adquieren sus propiedades reforzantes gradualmente. Se necesita familiaridad antes de que puedan evocar completamente una respuesta condicionada.

Entonces, cuando los investigadores le enseñan a un perro ingenuo que el sonido del clicker significa que un premio es inminente, y pasa solo un máximo de 20 ensayos condicionando el clicker, eso es el equivalente a que yo encuentre una nota de Birgit Nilsson, en lugar de la nota de Carlos XI.

Lo recogería con cautela, frunciendo el ceño, dándole la vuelta en mi mano pensando "me pregunto si esto es... tal vez".

No reconocería inmediatamente su valor.

Y a lo que voy es que para el perro ingenuo que solo ha escuchado un click y ha obtenido un premio 20 veces, lo está dando vueltas en su mente preguntándose si eso significa lo que cree que podría significar.

Si acaso, esperaríamos que el animal entrenado con clic-premio esté más confundido, no menos, que el animal entrenado solo con comida, en esas sesiones de aprendizaje iniciales.

Volviendo a los animales. En una revisión reciente en la que se entrevistó a entrenadores de clicker, uno dijo:

"Para ser realmente un perro sólidamente entrenado con clicker... probablemente tomaría dos meses".

En otras palabras, esperamos que el animal entrenado con click-comida se desvíe del animal entrenado solo con comida en su trayectoria de aprendizaje después de un tiempo.

No al instante, lo cual todos esos científicos parecen estar pensando.

Sugerencia para los investigadores:

Si planea investigar la eficacia del clicker, haga el procedimiento de emparejamiento (clic-premio) al menos 150 veces para el grupo de click antes de comenzar el experimento real de aprendizaje operante.

Alimente al grupo de control la misma cantidad de veces, para que no introduzca un sesgo en la familiaridad que los animales obtienen con la situación.

Esto no significa que deba hacer el procedimiento de emparejamiento tan ridículamente muchas veces en el entrenamiento ordinario. Entonces, menos de 20 suele ser apropiado, y el proceso de condicionamiento continuará a medida que comience el entrenamiento operante. 150 es un número semi aleatorio que elegí con el único propósito de garantizar que se produzca un condicionamiento completo y absoluto en todos los individuos del estudio. La elección de un número más bajo corre el riesgo de que no haya ocurrido para algunos individuos. No estoy diciendo que eso sea lo que necesita para el entrenamiento desde una perspectiva práctica, solo que cuando está haciendo investigaciones necesita eliminar posibles variables extrañas (como un condicionamiento insuficiente antes de que comience el aprendizaje operante).

Muy bien. Entonces es probable que estos estudios en realidad no hayan estudiado el efecto reforzante de usar un clicker, porque no se condicionó adecuadamente, o eligieron el intervalo incorrecto.

Y eso aún deja fuera el efecto marcador o el efecto puente.

Problema 2: el comportamiento operante contiene elementos marcadores

Uno de los posibles efectos del click es que es una señal de marcador, como se explicó anteriormente. La retroalimentación auditiva le dice al animal el momento preciso en que ocurrió un comportamiento correcto.

Y en todos los estudios científicos que han tratado de estudiar la eficacia del clicker en un entorno aplicado, los investigadores han utilizado un comportamiento de orientación como el comportamiento bajo investigación. En otras palabras, un comportamiento que contiene elementos marcadores, por lo que esperaría que el sonido de click sea redundante.

En todos los estudios, se enseñó a todos los animales a tocar un cono o una palanca con la nariz. Tenían estimulación visual, táctil y olfativa que los ayudaba a orientarse hacia los estímulos, dando como resultado la aparición del comportamiento deseado. Y dado que el clicker no se había condicionado lo suficiente, probablemente era mucho menos notorio que la otra abundante información disponible.

Además, algunos investigadores señalaron el objetivo (el cono o la palanca) o usaron señuelos (mostrando un premio de comida junto al objetivo) para lograr que los animales prestaran atención al estímulo.

En mi encuesta de Facebook, recibí algunos comentarios de algunos entrenadores muy experimentados.

Esto es lo que escribió Stephanie Edlund: (djursmart; entendiendo loros)

"Absolutamente depende del comportamiento para mí. Si estoy enseñando algo donde necesito un clicker, que para mí es moldeado de alta precisión, elegir una respuesta en una serie de respuestas u otros contextos donde no puedo entregar reforzadores lo suficientemente rápido, es decir, animal en el aire o lejos, entonces sí, esos comportamientos generalmente se aprenden más rápido con una señal de marcador distinta.

Cuando el comportamiento que quiero enseñar es muy distinto para el animal (un pájaro aterrizando en la mano, el trasero tocando el piso) y puedo entregar refuerzo rápidamente, parado frente al animal muy cerca, muy rara vez uso marcadores".

¡Observa que Stephanie se refiere al clicker como el marcador!

En otras palabras, muchos entrenadores de animales hábiles no se molestan en usar clickers cuando entrenan targets, porque no ven ninguna ventaja obvia en hacerlo. El trasero tocando el piso, en el caso de enseñar la posición de sentado, es lo suficientemente notorio para el animal, no se necesita ningún "marcado" adicional. ¡Usan el clicker para otros propósitos!

Entonces, esos estudios científicos han investigado un comportamiento donde no esperaríamos que haya ninguna diferencia tangible entre los grupos.

Sugerencia para los investigadores:

Si planean estudiar la eficacia de los clickers, elijam una respuesta donde espere que los clickers marquen una diferencia en comparación con la condición de refuerzo solo con comida, como el moldeado de alta precisión o la selección de un comportamiento de una serie de respuestas potenciales.

Eviten respuestas que incluyan estímulos externos obvios que puedan llevar a los animales a la respuesta correcta.

No usen indicaciones o señuelos.

Muy bien, entonces los estudios no condicionaron el clicker lo suficiente y enseñaron respuestas que los entrenadores de clicker ni siquiera se molestarían en usar un clicker para enseñar.

En otras palabras, tampoco examinaron las propiedades de refuerzo del clicker, ni las propiedades de marcado. ¿Qué hay de las propiedades de puente?

Problema 3: los premios aparecen de inmediato

Dada la elección de la respuesta entrenada, los investigadores pudieron presentar el premio inmediatamente cuando ocurrió el comportamiento correcto.

Específicamente, no hubo necesidad de un estímulo de puente que abarcara el tiempo desde el comportamiento correcto hasta el momento en que se produjo la consecuencia.

Desde la perspectiva del puente, ¿cuándo esperamos que los clickers sean más poderosos? Cuando se usan en situaciones en las que hay unos segundos (o más) de retraso entre el comportamiento y la entrega del reforzador, como cuando el animal se desempeña a cierta distancia de la persona que entrega el refuerzo.

Entonces, desde esta perspectiva, esperamos que la condición de clic-premio en estos estudios científicos no sea diferente de la condición de solo alimento. En ambos procedimientos, los animales obtendrían refuerzo inmediato por hacer el comportamiento correcto.

En otras palabras, estos estudios tampoco probaron las propiedades de puente del clicker.

Sugerencia para futuros investigadores:

En su estudio, elijan entrenar una respuesta en la que sea imposible entregar el premio directamente a la boca del animal exactamente cuando ocurre el comportamiento deseado.

Más bien, elijan un comportamiento con cierta distancia entre el animal y el dispensador de premios, de modo que haya unos segundos de intervalo entre el comportamiento y la consecuencia.

Conclusión

El clicker es una herramienta, y se desempeña mejor en contextos específicos.

A veces es innecesario.

A veces es una herramienta de precisión, que enciende el aprendizaje.

Si queremos entender qué tan efectivo es el entrenamiento con clicker, debemos comenzar examinándolo en el contexto en el que esperamos que tenga el mayor impacto, en comparación con el entrenamiento que utiliza solo premios.

Eso implica analizar los efectos de refuerzo, los efectos de marcado, los efectos de puente, o cualquier combinación de estos para desentrañar cuál tiene el efecto principal en la velocidad de aprendizaje.

Los estudios publicados hasta ahora no han examinado ninguno de ellos, desafortunadamente.

Además, podríamos querer saber qué hace el clicker para el entrenador. Como dijo Eva Bertilsson (carpemomentum) cuando respondió a mi encuesta:

"Mi entrenamiento a menudo avanza más rápido cuando uso un marcador. Es decir, puedo obtener el comportamiento más rápido. Mi sensación es que tiene que ver conmigo y mi capacidad en lugar de "el aprendizaje del animal", si eso pudiera de alguna manera separarse”.

Un punto muy válido. ¿Cómo cambia el comportamiento del entrenador cuando usa un clicker, en comparación con no usar uno? Tanto en lo que respecta a la filosofía de entrenamiento (y créame, hay más en el "entrenamiento con clicker" que simplemente hacer click antes de alimentar dentro de una sesión de entrenamiento), pero también sobre la mecánica de la entrega oportuna de reforzadores y la elección de criterios .

Después de todo, se necesitan dos para bailar tango: el aprendizaje del animal es solo una pieza del rompecabezas.

No me preocupa la falta de apoyo rotundo para el uso de un clicker cuando se entrena en la literatura académica actual. Ausencia de evidencia no es evidencia de ausencia, y espero que la investigación futura nos permita saber cuán efectivo puede ser el entrenamiento con clicker, en el contexto adecuado.

Actualización diciembre 2020

Hasta donde sé, se han publicado otros 3 estudios que abordan la diferencia de usar un enfoque de refuerzo con clic-premio en comparación con el refuerzo solo con comida desde 2017, cuando escribí esta publicación de blog por primera vez.

En estos estudios, los investigadores abordaron mi segunda objeción y examinaron otros tipos de comportamiento que el mero objetivo, y descubrieron que de hecho, el resultado varió según el comportamiento que se enseñaba: a veces la alternativa de alimento solo era más efectiva, a veces la condición de click- premio lo fue.

Por ejemplo, los perros de refugio aprendieron una "permanencia" mejor cuando se entrenaron solo con comida que con clic-comida, pero no hubo diferencia en cómo los grupos aprendieron a “hacer la ola".

Como recordarás, mi segunda objeción tenía que ver con las propiedades de marcado del clicker, y uno podría argumentar que al aprender el comportamiento de "permanencia", el clicker no daría información adicional en comparación con solo comida, ya que no hay un cambio obvio de comportamiento para indicar al animal el momento preciso en que ocurre el comportamiento correcto, que no sea el paso del tiempo.

En otras palabras, no hay nada que marcar. De hecho, que yo sepa, la mayoría de los entrenadores experimentados no usan clickers cuando entrenan comportamientos de duración, específicamente por esa razón: el click no marca ningún movimiento específico, a diferencia de cuando se moldea una ola, o un giro. Y tal vez, dado que este estudio en particular aún sufría de mis otras dos objeciones, eso puede explicar por qué el grupo de solo comida superó al grupo de click-premio en el entrenamiento de "permanencia".

Otro estudio reciente descubrió que cuando el comportamiento era complejo (girar 360 grados), 3 de 7 perros entrenados con clic-premio aprendieron el comportamiento dentro del tiempo asignado, y 0 de 8 perros solo con comida lo hicieron.

¡Sí!

¡Mi segunda objeción, que depende del tipo de comportamiento entrenado si los clickers agregan algún valor, ha sido corroborada en los últimos años!

Dos de los nuevos estudios aún tienen la deficiencia de realizar solo 20 emparejamientos de clic-premio antes de embarcarse en el estudio experimental, en uno de ellos, los perros entrenados con clic-premio solo llegaron a escuchar el clicker 70 veces en total.

Nuevamente, creo que es injusto comparar la eficacia del clicker cuando se trata de estudiantes inexpertos; esperamos que las diferencias surjan a medida que el animal se vuelve experto en clicker, lo cual sospecho que ocurre durante un tiempo considerablemente mayor a 70 repeticiones... También, los entrenadores podían reforzar a los perros en las condiciones de solo comida de inmediato, por lo que mi tercera objeción no se abordó en ninguno de estos documentos recientes. ¡Mi segunda objeción sí lo fue, con suerte también lo serán la primera y la tercera en el futuro!

Ahora que lo pienso, hay un par de otros aspectos del entrenamiento con clicker que aún no se han abordado (que yo sepa) en la literatura científica: el efecto eufórico y la retención de la memoria (algunos de los primeros estudios científicos analizaron la extinción, pero eso es realmente bastante poco interesante para el tutor de mascota promedio).

Entonces, me quedan dos preguntas que me gustaría ver abordadas, para todos los investigadores:

¿Muestran los animales expertos en clicker más entusiasmo y enfoque que los animales entrenados solo con comida, como podríamos esperar debido a la liberación de dopamina que está documentada que está involucrada en el refuerzo secundario?

¿Y: recuerdan los perros entrenados con clic-comida lo que aprendieron mejor que los perros entrenados solo con un enfoque de comida (también esperado, impulsado por esa misma descarga de dopamina)?

Curiosamente, un tercer estudio novedoso descubrió que los propietarios de mascotas inexpertos les resultó más fácil entrenar el comportamiento de orientación de la nariz utilizando el refuerzo con clic-comida que cuando usaban solo refuerzo con comida, lo que se alinea con lo que dijo Eva Bertilsson: usar clickers lo hace más fácil para el humano.

Espero que el uso de un clicker pueda afectar al alumno, al instructor, así como al comportamiento que se enseña. Actualmente, los estudios científicos solo han analizado una fracción de estas perspectivas, ¡así que realmente espero las próximas publicaciones en esta área!

¡Háganos saber en los comentarios si ve alguna adición nueva de este tipo, y actualizaré esta publicación de blog para reflejar nuestro nuevo estado del conocimiento!

Referencias

Blandina, A.G., n.d. To click or not to click: Positive reinforcement methods on the acquisition of behavior, Unpublished honours thesis.

Burton (2020). Does Clicker Training Lead to Faster Acquisition of Behavior for Dog Owners?

Chiandetti et al. (2016). Can clicker training facilitate conditioning in dogs?

Dorey et al. (2020) Clicker training does not enhance learning in mixed-breed shelter puppies (Canis familiaris).

Ellis & Greening (2016). Positively reinforcing an operant task using tactile stimulation and food–a comparison in horses using clicker training.

Feng et al. (2018) Is clicker training (Clicker+ food) better than food-only training for novice companion dogs and their owners?

Feng et al. (2017). Comparing trainers’ reports of clicker use to the use of clickers in applied research studies: methodological differences may explain conflicting results.

Feng et al. (2016). How clicker training works: Comparing Reinforcing, Marking, and Bridging Hypotheses.

Langbein et al. (2007). The impact of acoustical secondary reinforcement during shape discrimination learning of dwarf goats (Capra hircus).

McCall & Burgin (2002). Equine utilization of secondary reinforcement during response extinction and acquisition.

Smith & Davis (2008). Clicker increases resistance to extinction but does not decrease training time of a simple operant task in domestic dogs.

Williams et al. (2004). The efficacy of a secondary reinforcer (clicker) during acquisition and extinction of an operant task in horses.


 

Comentarios

Entradas más populares de este blog

¿Entrenador, adiestrador, educador, etólogo? ¿Quién es quién?

Encontrando el Equilibrio en la Educación Canina