Una estrategia óptima para la toma de decisiones surge del aprendizaje continuo
Crédito: CC0 Public Domain
A diferencia de las máquinas, el comportamiento de los animales y los humanos casi siempre tiene un elemento de imprevisibilidad. Innumerables experimentos han demostrado que nuestras respuestas al mismo desafío son a veces más rápidas, a veces más lentas, a veces correctas ya veces incorrectas.
En el campo de la neurociencia, esta variabilidad a menudo se atribuye a lo que se denomina ruido, un «balbuceo neuronal» siempre presente que influye en la forma en que el cerebro procesa y responde a la información entrante.
Una nueva colaboración Un estudio en roedores realizado por un equipo de científicos del Centro Champalimaud para lo Desconocido en Portugal, la Facultad de Medicina de Harvard en los EE. UU. y la Universidad de Ginebra en Suiza, muestra que esta variabilidad a veces podría interpretarse erróneamente como ruido. En cambio, en realidad puede ser el reflejo de una estrategia de comportamiento que se pasó por alto debido a suposiciones previas sobre cómo debería comportarse el sujeto. Sus resultados, publicados hoy (2 de junio) en la revista científica Nature Communications, cuestionan qué significa realmente «comportamiento óptimo».
Una estrategia inesperada
«Todo comenzó con un experimento simple», recuerda Maria Ins Vicente, quien recopiló los datos experimentales como parte de su trabajo de posgrado en el Centro Champalimaud para lo Desconocido y actualmente trabaja en la Universidad de Leiden. «Tomamos dos olores diferentes y creamos varias mezclas de los dos. Durante el experimento, las diferentes mezclas se presentaron a las ratas, una a la vez. En cada prueba, las ratas tenían que informar cuál de los dos olores era más dominante. Si pensaba que la respuesta era el olor A, se acercaría a un chorro de agua por la derecha, y si optaba por el olor B, iría por la izquierda. Algunas mezclas tenían mucho más de un olor en comparación con otro, lo que facilitaba la decir cuál era más sobresaliente. Mientras que en otras mezclas, la diferencia era más sutil. Si la rata obtenía la respuesta correcta, recibía una recompensa de agua».
Los investigadores registraron la rapidez con la que respondieron las ratas y si su respuesta fue correcta o incorrecta. Para su sorpresa, cuando analizaron los datos, se dieron cuenta de que el comportamiento de las ratas no seguía una regla común de toma de decisiones. «En este tipo de tareas, tendemos a ver una clara dependencia entre la dificultad y el tiempo de decisión: en las pruebas más duras y sutiles, los animales (y los humanos) tardan más en decidirse que en las pruebas fáciles», dice Andr Mendona, del Centro Champalimaud para el desconocido. «En cambio, nuestras ratas tardarían, en promedio, la misma cantidad de tiempo en tomar decisiones difíciles y fáciles».
«La explicación de esta observación inesperada no fue fácil de encontrar», agrega Jan. Drugowitsch, coautor afiliado a la Escuela de Medicina de Harvard. «Finalmente, lo encontramos al construir un modelo matemático que unía ramas separadas en el campo de la toma de decisiones. En cierto sentido, nuestro objetivo era replicar el comportamiento de las ratas en un ‘cerebro de máquina’ con la esperanza de descubrir las variables subyacentes. que produjo este sorprendente resultado».
El modelo reveló una estrategia inesperada. En cada prueba, la rata reajustaba su comportamiento de acuerdo con los resultados de la prueba anterior. Si la rata acertaba en un ensayo, estaría sesgada hacia el mismo olor en el siguiente. Y viceversa, una respuesta incorrecta en un ensayo llevaría a cambiar en el siguiente.
¿Por qué los animales adoptaron esta estrategia en particular? «Esta estrategia es coherente con una visión del mundo en la que el entorno cambia continuamente, lo que lleva a los animales a actualizar su enfoque de toma de decisiones prueba por prueba. Desde el exterior, su comportamiento parece muy variable, pero de hecho, simplemente se estaban adaptando demasiado rápido. Es por eso que habría sido fácil interpretar erróneamente esta variabilidad como solo ruido», dice Drugowitsch.
La optimización está en el ojo del espectador
¿Por qué ¿las ratas optaron por una estrategia diferente a la esperada? Los autores explican que hay varias razones. El primero es la naturaleza de la tarea. «No hay un solo tipo de tarea de discriminación sensorial», dice Mendona. «Diversos elementos en el diseño de la tarea pueden generar diferentes estrategias de toma de decisiones. Por ejemplo, si le hubiéramos pedido a las ratas que localizaran el lado del que proviene un sonido en lugar de discriminar entre olores, su estrategia se habría alineado con nuestra expectativa inicial. Esto se debe a que existe una categoría derecha-izquierda incorporada en el cerebro para ciertas modalidades sensoriales que están naturalmente separadas espacialmente, pero ese no es el caso del olfato».
Otra razón es la confianza. «Al igual que los humanos, las ratas parecen evaluar sus propias decisiones y cambiar su comportamiento en consecuencia. Cuando tienes mucha confianza y terminas tomando la decisión correcta, en realidad no hay mucho que aprender. Pero, ¿qué sucede cuando tienes confianza y luego lo descubres? que en realidad estás equivocado? En este caso, debes cambiar tu comportamiento drásticamente. Que es precisamente lo que vimos con nuestras ratas», dice Zachary Mainen, uno de los líderes del grupo que dirigió el estudio y que está afiliado al Centro Champalimaud. para lo Desconocido.
Según los autores, otra explicación para la elección de estrategia de la rata es su circuito «cableado» para el aprendizaje. «Irónicamente, si no reajustaran constantemente sus respuestas de acuerdo con el resultado de la última prueba, en realidad lo harían mejor. De hecho, lo que originalmente esperábamos que hicieran era construir una categoría de ‘olor A-olor B’ y implementarlo», dice Alex Pouget, líder de grupo en la Universidad de Ginebra y coautor del estudio. «Aún así, la estrategia de las ratas tiene sentido».
Como explican los autores, esta observación no significa que la rata sea un animal inadaptado. Por el contrario, reclaman que la comunidad científica debería reconsiderar lo que definen como “comportamiento óptimo”.
«Las ratas han evolucionado durante millones de años para buscar y explorar un entorno en constante cambio. Por lo tanto, cuando evaluamos el comportamiento de estos animales, debemos recordar que no se trata necesariamente solo del rendimiento per se. Optimalidad debería depender tanto del problema en cuestión como de la naturaleza del solucionador de problemas», argumenta Pouget.
«Creemos que nuestro trabajo es un buen punto de partida para explorar más a fondo cómo pueden interactuar los diferentes subcampos de la toma de decisiones También esperamos que otros científicos utilicen y perfeccionen nuestros modelos en experimentos de seguimiento. Sería fascinante e informativo ver cuándo, cómo y por qué nuestro modelo comienza a fallar. Cometer un error es una oportunidad para aprender algo nuevo, y ese es tanto el resultado como el mensaje final de nuestro estudio», dice Mendona.
Explore más
Los investigadores descubren cómo recuerda el cerebro Más información: Andr G. Mendona et al. El impacto del aprendizaje en las decisiones de percepción y su implicación en las compensaciones entre velocidad y precisión, Nature Communications (2020). DOI: 10.1038/s41467-020-16196-7 Información del diario: Nature Communications
Proporcionado por Champalimaud Center for the Unknown Cita: Surge una estrategia óptima para la toma de decisiones from nonstop learning (2 de junio de 2020) recuperado el 31 de agosto de 2022 de https://medicalxpress.com/news/2020-06-optimal-decision-making-strategy-emerges-nonstop.html Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, ninguna parte puede reproducirse sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.