¿Cómo y dónde evalúa el cerebro las consecuencias de nuestras decisiones?

José L. Pardo-Vázquez, Víctor Leborán y Carlos Acuña
Departamento de Fisiología, Universidad de Santiago de Compostela, España

(cc) Diego F. Goberna (http://feiss.be/). Imagen recreada de la evolución temporal (de izquierda a derecha) de la tasa de actividad de una neurona de la corteza premotora ventral durante la tarea de discriminación visual. Durante el período de comparación (sombreado) la neurona responde de manera distinta en función de la alternativa conductual elegida. Después de la respuesta conductual (línea blanca) la neurona indica, en su tasa de descarga, si los ensayos han sido correctos o incorrectos.Para aprender de la experiencia y ajustar nuestro comportamiento necesitamos evaluar las consecuencias de nuestra conducta. ¿Cómo y dónde tiene lugar esta evaluación en el cerebro? Recientemente hemos descrito que la información necesaria para alcanzar una decisión y evaluar sus consecuencias está representada en la corteza premotora ventral.

[Versión en pdf]

La toma de decisiones es el proceso mediante el cual se seleccionan los comportamientos adecuados en función del contexto, tanto interno como ambiental. Es un proceso complejo en el que el conocimiento previo, almacenado en la memoria a largo plazo (MLP), se combina con la información presente en el entorno para alcanzar una decisión. Nosotros estudiamos cómo se toman las decisiones perceptivas, que son aquéllas que se basan en información sensorial, con elecciones entre dos alternativas.

En este tipo de decisiones el proceso comienza con la entrada de información a través de los sentidos. De esta información se selecciona aquélla que resulta útil para la decisión: la evidencia sensorial (e). La evidencia se combina con el conocimiento previo en la llamada variable de decisión (VD), que representa la relación entre la probabilidad de obtener el resultado deseado si elegimos una alternativa y la probabilidad de obtenerlo si elegimos la otra alternativa. La elección de una alternativa se alcanza comparando el valor de la VD con la regla de decisión. La regla de decisión más simple consiste en establecer un criterio para cada alternativa conductual de modo que, cuando la VD supere ese criterio, se elige una de las conductas disponibles. Una vez que se ha elegido y ejecutado la conducta se evalúan sus resultados y esta evaluación influye sobre todo el proceso, pudiendo modificar las decisiones futuras (Gold y Shadlen, 2007).

En los últimos años se ha avanzado mucho en el estudio de los correlatos neuronales del proceso de decisión. En las primeras etapas, que llevan hasta la elección de una alternativa, participan las áreas cerebrales relacionadas con la codificación de información sensorial (p.ej., cortezas temporal y parietal) y las implicadas en la ejecución de la conducta, p. ej., los movimientos de los ojos (campos oculares frontales). Las etapas posteriores a la ejecución de la conducta, en las que se representan los resultados y se evalúan las consecuencias, han sido estudiadas principalmente en decisiones basadas en el valor (que son aquéllas que se toman en función del valor subjetivo asociado con cada una de las alternativas posibles; p.ej., Lau y Glimcher, 2007), pero han recibido mucha menos atención en el contexto de las decisiones perceptivas.

Aunque originalmente se le atribuyó una función exclusivamente motora, la corteza premotora es un centro integrador que participa en procesos cognitivos superiores (Romo, Hernandez y Zainos, 2004). Este precedente nos llevó a buscar los correlatos neuronales de la toma de decisiones perceptivas en la corteza premotora ventral (PMv). Para ello entrenamos a dos monos para que ejecutaran dos tareas de discriminación visual. En la tarea de discriminación continua (DC) se presentan dos líneas separadas por un intervalo de tiempo. El animal tiene que percibir la orientación de la primera línea (S1) y, cuando desaparece, mantenerla en la memoria de trabajo (MT). Entonces percibe la orientación de la segunda línea (S2) y debe compararla con la huella de memoria para decidir si está orientada a la derecha o a la izquierda de S1. Finalmente, comunica el resultado de la decisión con un movimiento ocular. Los ensayos correctos son recompensados con una gota de líquido. La primera línea puede tener tres orientaciones (87º, 90º y 93º) y se utilizan ocho S2 para cada S1 (cuatro “a la izquierda de” y cuatro “a la derecha de”). Ambos estímulos cambian aleatoriamente de ensayo a ensayo. En la segunda tarea (discriminación con S1 implícito) no se presenta la primera línea, que se mantiene constante a lo largo de un bloque de 90 ensayos. Se utilizan las mismas orientaciones que en la tarea DC. El mono tiene que averiguar mediante ensayo y error la orientación de S1 de entre las tres posibles. Una diferencia crucial entre las dos tareas reside en la información necesaria para evaluar las consecuencias del proceso de decisión. Mientras que en la primera es suficiente con combinar el recuerdo de la elección previa con su resultado, en la segunda tarea también es necesario recordar la orientación de S1 recuperada de la MLP para, en caso de haber cometido un error, recuperar y utilizar otra orientación en el siguiente ensayo (Figura 1).

Figura 1

Figura 1.- Tareas de discriminación visual. En la tarea de discriminación continua (arriba) cada ensayo comienza con la presentación del punto de fijación (PF) en el centro de la pantalla y dos círculos a ambos lados. Cuando el mono fija visualmente PF se presentan sucesivamente dos líneas con orientaciones diferentes durante 500 ms (S1 y S2) separadas por un intervalo de 1 seg. El mono debe percibir S1 y, cuando desaparece, mantener una huella de su orientación en memoria de trabajo hasta que aparezca S2; percibe S2, compara S2 con la traza de S1 y decide si S2 está a la derecha o a la izquierda de S1. Finalmente, cuando S2 desaparece debe comunicar el resultado de su decisión con un movimiento ocular a uno de los dos círculos. Si la elección ha sido correcta es recompensado. La orientación de S1 y S2 varía, aleatoriamente, en cada ensayo. En la tarea de discriminación con S1 implícito (abajo) la secuencia temporal es la misma, pero S1 no se presenta, está implícito, y ha de recuperarse de la memoria a largo plazo mediante ensayo y error. En esta tarea, la orientación de S1 es la misma en bloques de 90 ensayos. RC, respuesta conductual.

Una vez entrenados, se registró la actividad de neuronas individuales mientras los monos realizaban las tareas. Estos experimentos revelaron que la PMv está implicada en las etapas que llevan a la decisión. Se encontraron neuronas que representan sucesivamente en su actividad: 1) la evidencia sensorial (e) necesaria para alcanzar la decisión, tanto cuando esa información se ha mostrado recientemente y se mantiene en la MT como cuando ha sido recuperada de la MLP (Figura 2); 2) la variable de decisión, es decir, la comparación de la orientación de las dos líneas, de tal modo que la respuesta neuronal depende de la diferencia en la orientación de los estímulos (Figura 3); y 3) la elección del sujeto (Figura 4).

Pero el proceso de decisión no termina con la elección y ejecución de una alternativa conductual, sino que continúa con la evaluación de los resultados. En PMv existen neuronas que, además de codificar todo el proceso anterior, codifican, después de la respuesta conductual, el resultado de la decisión (Figura 5). Es importante tener en cuenta que en muchas de esas neuronas está representada toda la información necesaria para evaluar las consecuencias de las decisiones. Es decir, cuando la tarea conductual requiere la representación simultánea de la elección previa y su resultado, las neuronas muestran dichas representaciones; cuando la tarea conductual requiere, además, una huella de memoria de los estímulos utilizados, las neuronas representan también esta información (Pardo-Vázquez, Leborán, & Acuña, 2008, 2009).

Figura 2

Figura 2.- Neuronas de la corteza premotora ventral codifican la orientación del primer estímulo (S1) o sus trazas en diferentes momentos, tanto cuando ha sido recientemente presentado como cuando ha de ser recuperado de la MLP. Esta información está disponible cuando se presenta el segundo estímulo (S2) para que se pueda realizar la comparación. Tasa de descarga de dos neuronas de ejemplo en función del tiempo y de la orientación de S1. Los sombreados señalan los períodos de presentación de los estímulos. Las barras horizontales negras señalan los períodos en los que la codificación de la orientación de S1 es significativa. 

Figura 3

Figura 3.- Las neuronas codifican la variable de decisión (VD), es decir, la comparación entre S1 y S2. Tasa de descarga promedio, normalizada, de 64 neuronas de la corteza premotora ventral, en las dos tareas conductuales, en función del tiempo, de la elección y de la dificultad de la comparación. Las neuronas codifican la elección (preferida/no preferida) y además, la respuesta neuronal se gradúa en función de la diferencia entre S1 y S2 (VD). Ensayos fáciles/difíciles: diferencia de 4º y 1º entre S2 y S1, respectivamente. Preferida/ No preferida: la elección preferida de cada neurona es aquélla para la que responde con tasas de descarga más altas.

Figura 4

Figura 4.- Las neuronas codifican la elección del mono durante la presentación del segundo estímulo. Tasa de descarga de una neurona de ejemplo, en función del tiempo y de la elección del mono, en las dos tareas conductuales. Las barras horizontales negras señalan los períodos en los que la repuesta es significativamente diferente en función de la elección. RC, respuesta conductual. 

Figura 5

Figura 5.- La información necesaria para evaluar las consecuencias del proceso de decisión está representada en la actividad neuronal. Tasa de descarga de una neurona de ejemplo, sincronizada con la respuesta conductual (RC) en función del tiempo y de la orientación de S1 (paneles superiores) y en función del tiempo y del resultado (correcto vs. incorrecto) de la decisión previa (paneles inferiores). La neurona codifica el resultado de la decisión previa en las dos tareas conductuales. La orientación de S1, sin embargo, sólo está representada en la tarea de discriminación con S1 implícito. Las barras horizontales negras señalan los períodos en los que la neurona codifica significativamente la orientación de S1 (paneles superiores) y el resultado de la elección previa (paneles inferiores). 

Estos resultados validan las etapas propuestas para la toma de decisiones perceptivas y revelan cómo el cerebro, y en concreto, la corteza premotora ventral, realiza esta compleja tarea que da lugar a ajustes en la conducta en función de la experiencia previa.

Referencias

Gold, J. I., y Shadlen, M. N. (2007). The neural basis of decision making. Annual Review of Neuroscience, 30, 535-574.

Lau, B., y Glimcher, P. W. (2007). Action and outcome encoding in the primate Caudate Nucleus. Journal of Neuroscience, 27, 14502-14514.

Pardo-Vázquez, J. L., Leborán, V., y Acuña, C. (2008). Neural correlates of decisions and their outcomes in the ventral premotor cortex. Journal of Neuroscience, 28, 12396-12408.

Pardo-Vázquez, J. L., Leborán, V., y Acuña, C. (2009). A role for the ventral premotor cortex beyond performance monitoring. Proceedings of the National Academy of Sciences of the United States of America, 106, 5.

Romo, R., Hernandez, A., y Zainos, A. (2004). Neuronal correlates of a perceptual decision in ventral premotor cortex. Neuron, 41, 165-173.

Manuscrito recibido el 3 de diciembre de 2009.
Aceptado el 4 de enero de 2010.

Los comentarios están cerrados.

Post Navigation