
En estas últimas décadas, el avance en materia neurocientífica es notable. Sin embargo, las experiencias realizadas hasta el momento de redes neuronales, o bien los procesos individuales de cada neurona, han sido estudiados únicamente dentro del cerebro -lo que se llama estudio in vivo-.
En este contexto, Karl Friston, reconocido científico en este campo de estudio, lideró la publicación de un trabajo sin precedentes: la sintetización de un cultivo de neuronas humanas que aprendieron a jugar al Pong.
Sabemos que este juego no es de los más complejos: enseguida entendemos por qué razones perdemos y deducimos inmediatamente cómo podemos ganar. Ahora bien, ¿cómo se les enseña a unas cuantas neuronas, sin la complejidad de redes neuronales ni la cantidad de neuronas presentes en un cerebro, a jugar a un juego? De forma más general, ¿cómo pueden aprender qué está bien y qué está mal? ¿Cómo se les puede enseñar?
Este trabajo, publicado en diciembre de 2022, da sentido a estas preguntas. A pesar de lo nimio que nos parecen los procesos de enseñar y aprender -puesto que son naturales y los realizamos sin siquiera preguntarnos por ellos-, este paper nos muestra que hay razones por las cuales ocurren y no son por obra de magia.
El trabajo consistió, en primera instancia, en tomar células madre pluripotentes -las cuales se pueden tomar de la médula espinal o bien de un embrión- para luego diferenciarlas y convertirlas en neuronas. Este proceso ocurre naturalmente, cuando las células madre se convierten en algún tipo de célula específica que el cuerpo necesite. No obstante, desde hace ya unos años se han podido dominar distintas técnicas para llevarlo a cabo en el laboratorio.
Teniendo estas neuronas, el siguiente paso fue ubicar el plato en el que estaban contenidas sobre un High Density Multielectrode Arrays (HD-MEA). Este dispositivo, que con su nombre asusta hasta a quien sabe inglés, es una placa de chip que tiene la capacidad de enviar pulsos de energía a través de sus múltiples electrodos y a distintas frecuencias. El HD-MEA, conectado a una computadora y su respectivo software, fueron la tecnología necesaria para que las neuronas se conecten directamente al entorno de juego.

Cultivo de la red neuronal. Cada cuadrado que se observa de fondo son los electrodos del HD-MEA
En esta instancia, la red neuronal ya tenía la posibilidad de jugar al Pong. Mediante los electrodos del HD-MEA se comunicaba la posición de la pelota, mientras que dos regiones de la red tenían la capacidad de emitir señales que indiquen a la paleta si debía subir o bajar. Ahora bien, la red neuronal no sabía jugar. No entendía qué interés había en mover la paleta y si estaba bien o mal pegarle a la pelota. Como alguien que no sabe jugar a algún juego, a este cultivo de neuronas había que enseñarle. ¿Cómo le comunicamos que debían pegarle a la pelota por medio de la paleta?
El aprendizaje a nivel neuronal se caracteriza por la recompensa. Una neurona lleva a cabo una acción si, a cambio, recibe un estímulo que le resulta adecuado o beneficioso. El principio de energía libre postula que cualquier sistema autónomo organizado a cualquier escala busca reducir al mínimo la variación de energía libre. En otras palabras, las redes neuronales, atadas a este principio, buscan reducir al mínimo la obtención de información impredecible. Prefieren recibir información que puedan prever.
Utilizando este principio como fundamento, los experimentadores diseñaron un sistema de recompensa en el que si la red neuronal perdía el juego -la paleta no impactaba la pelota-, iba a recibir un estímulo impredecible mediante el HD-MEA y la pelota resetearía su posición, mientras que, si se efectuaba el impacto de la pelota con la paleta, la red recibiría una señal predecible y constante por unos segundos como recompensa.

Simulación de las regiones de input (donde algunas neuronas reciben información de la posición de la pelota) y las regiones de output (donde las neuronas ordenan si la paleta debe subir o bajar)
Incluido este sistema de recompensa, comenzaron a experimentar con el cultivo neuronal. El DishBrain -nombre otorgado por los creadores- jugó al Pong por 20 minutos, demostrando que fue aprendiendo a jugar, aumentando la longitud de las partidas y la reducción de desaciertos conforme pasaba el tiempo.
Para contrastar -y confirmar- las hipótesis adyacentes a este experimento, se realizaron múltiples experimentos con distintas variaciones. Se modificaron el volumen de información que recibían las neuronas, la forma en la que se realizaba el sistema de recompensa -se probó con silencios cuando la pelota impactaba o no la paleta, sin estimulación e incluso sin información de la posición de la pelota- y hasta se experimentó con redes neuronales de ratones.
Con estos contrastes probados, los investigadores pudieron deducir que el sistema de recompensa más óptimo es aquel en el que se depende del principio de energía libre, que las redes neuronales humanas poseen más plasticidad neuronal y, por tanto, aprenden y juegan mejor que redes neuronales de otros seres vivos, como así también pudieron observar que, en sistemas donde las neuronas recibían más y mejor información de la posición de la pelota, su progreso en el aprendizaje era notable.
El desarrollo de este trabajo marca un antes y un después en múltiples aspectos. Por un lado, demuestra avances en nuestra comprensión del funcionamiento neuronal y cuáles son los ladrillos constitutivos de procesos tan naturales como el aprendizaje. La habilidad técnica empleada en este trabajo es algo también a destacar. La conjunción de múltiples técnicas en un solo trabajo dio como resultado la síntesis de un modelo de red neuronal funcional, siendo de las primeras veces que se experimenta con estas estructuras in vitro.
Esta publicación también abre las puertas a nuevos desarrollos. Si bien el avance en computación ha sido enorme estos últimos años -con la invención de las GPU, por ejemplo-, aún no se han logrado crear procesadores que soporten más de 2 grados de complejidad -o sea, no existen estructuras artificiales que superen las 2 variables que emplean hoy los bits, ceros y unos-. A la espera de desarrollos que rompan con esta imposibilidad, como podrían ser las computadoras cuánticas, el empleo de sistemas de hardware híbridos, donde se utilizan componentes artificiales y naturales, podría ser una opción interesante. Estos sistemas, llamados wetware, son útiles puesto que las neuronas emplean 3 variables -activo, reposo e inhibido-.
Los sistemas basados en wetware son tan solo un ejemplo de tantos otros en el que podría ser útil este experimento. Hay nuevos trabajos, basados en la tecnología empleada en este paper, en los que estudian a fondo otros procesos neuronales, tales como la distinción de fonemas y el aprendizaje del lenguaje.
Con las múltiples publicaciones de estudios de neuronas in vitro que surgieron posteriormente a estos trabajos, es de esperar que en el futuro próximo nos encontremos con mas avances en la comprensión de cómo funcionamos. En este camino, los cerebros se encuentran en el dilema de entender el mecanismo por el cual ellos piensan y entienden por sí solos.
Escrito por: Dorsch, Santiago