Utilizando grabaciones iEEG intracorticales, un grupo internacional de investigadores en neurociencia identificó la existencia de dos sistemas corticales diferentes para el aprendizaje de aproximación y evitación.
Dados los resultados inconsistentes provenientes de estudios de neuroimagen humana y electrofisiología animal, el Dr. Pablo Billeke, investigador del Centro de Complejidad Social (CICS), junto con un grupo internacional de neurocientíficos, publicó “Anatomical disociation of intracerebral Signals for Reward and Casting Prediction Errors ( PE) en humanos”. Su objetivo era cerrar la brecha entre las técnicas, registrando la actividad intracerebral de veinte participantes mientras realizaban una tarea de aprendizaje instrumental.
«Aproximarse a la recompensa y evitar el castigo son los dos impulsos fundamentales del comportamiento animal. En principio, tanto la búsqueda de recompensas como evitar del castigo podrían aprenderse a través de los mismos pasos algorítmicos», comienza el artículo publicado por Nature Communications. Sin embargo, advierten los investigadores, diferentes líneas de evidencia apuntan a una división anatómica entre los sistemas de aprendizaje de recompensa y castigo, en relación con los comportamientos motores de acercamiento y evitación del oponente.
El equipo registró la actividad cerebral de pacientes que debieron elegir entre dos señales para maximizar las ganancias monetarias (durante el aprendizaje por recompensa) o minimizar las pérdidas monetarias (durante el aprendizaje por castigo). La predicción de error (PE) de recompensa y castigo podría, entonces, inferirse del historial de eventos de las tareas, usando un modelo computacional.
“Lo que se investigó fue la toma de decisiones en el aprendizaje a base de castigo y refuerzo, con la ventaja de que tenían muchos pacientes con estos registros intracorticales”, explica el Dr. Billeke, quien contribuyó en la fase de análisis y al modelo.
Probaron el principio teórico de que la predicción de error para recompensa y el castigo podrían ser procesados por la misma maquinaria cerebral (siendo uno el negativo del otro). Pero, por el contrario, encontraron que tanto la PE de recompensa como la de castigo se correlacionaron positivamente con la actividad gamma de banda ancha (BGA) en todas las regiones del cerebro.
“Sin embargo, algunas regiones amplificaron las señales de PE de recompensa y otras las señales de PE de castigo. Por lo tanto, la disociación entre los sistemas cerebrales de recompensa y castigo no tiene que ver con el signo de la correlación, sino con el dominio de valencia de los resultados (mejor o peor que nada). Estos dominios apetitivo y aversivo corresponden a diferentes conductas que deben ser aprendidas: más o menos acercamiento para la PE recompensa y más o menos evitación para la PE castigo. Se necesita más investigación para desentrañar los roles de las diferentes regiones de recompensa y castigo en estos procesos de aprendizaje”, explicaron los autores.
Colaboración internacional
La revista de acceso abierto destacó el trabajo desarrollado por el investigador del CICS, Pablo Billeke, junto con un grupo de investigadores en neurociencias de la Université de Lyon, University Grenoble Alpes, Sorbonne Université y Université Pierre et Marie Curie.
La colaboración con el grupo de Grenoble comenzó en 2013 y, desde entonces, la investigadora Maëlle C. M. Gueguen visitó el CICS en una ocasión y, del mismo modo, tanto el Dr. Billeke como la investigadora del CICS Patricia Soto-Icaza realizaron amplias visitas a sus compañeros franceses.
Esta colaboración también generó aprendizajes que, según el Dr. Billeke, podrían traducirse en nuevas publicaciones. A esto se suma el trabajo de la Dra. Soto-Icaza analizando los datos recopilados durante su visita, lo que fortalecerá la asociación con el grupo de Grenoble, que ha dado como resultado las siguientes publicaciones: