La médula espinal virtual se optimiza continuamente - ScienceDaily

Una jirafa o potro recién nacido debe aprender a caminar sobre sus patas lo más rápido posible para evitar a los depredadores. Los animales nacen con redes de coordinación muscular ubicadas en la médula espinal. Sin embargo, aprender la coordinación precisa de los músculos y tendones de las piernas lleva algún tiempo. Inicialmente, los animales bebés dependen en gran medida de los reflejos de la médula espinal. Aunque algo más básicos, los reflejos de control motor ayudan al animal a evitar caerse y lastimarse durante sus primeros intentos de caminar. Se debe practicar el siguiente control muscular más avanzado y preciso, hasta que finalmente el sistema nervioso se adapte bien a los músculos y tendones de las patas del animal joven. No más tropiezos incontrolados: el animal joven ahora puede seguir el ritmo de los adultos.

Investigadores del Instituto Max Planck para Sistemas Inteligentes (MPI-IS) en Stuttgart realizaron un estudio de investigación para descubrir cómo los animales aprenden a caminar y aprender de los tropiezos. Construyeron un robot de cuatro patas, del tamaño de un perro, que los ayudó a descubrir los detalles.

«Como ingenieros y especialistas en robótica, buscamos la respuesta mediante la construcción de un robot que presenta reflejos como un animal y aprende de los errores», dice Felix Ruppert, ex estudiante de doctorado en el grupo de investigación de Locomoción Dinámica en MPI-IS. «Si un animal tropieza, ¿es un error? No si sucede una vez. Pero si tropieza con frecuencia, nos da una medida de qué tan bien camina el robot».

Felix Ruppert es el primer autor de «Aprendizaje de coincidencias plásticas de dinámicas de robots en generadores de patrones centrales de circuito cerrado”, que se publicará el 18 de julio de 2022 en la revista Nature Machine Intelligence.

Algoritmo de aprendizaje optimiza la médula espinal virtual

Después de aprender a caminar en solo una hora, el robot de Ruppert hace un buen uso de la compleja mecánica de sus piernas. Un algoritmo de optimización bayesiano guía el aprendizaje: la información medida del sensor del pie se compara con los datos objetivo de la médula espinal virtual modelada que se ejecuta como un programa en la computadora del robot. El robot aprende a caminar comparando continuamente la información del sensor enviada y esperada, ejecutando bucles reflejos y adaptando sus patrones de control motor.

El algoritmo de aprendizaje adapta los parámetros de control de un Generador Central de Patrones (CPG). En humanos y animales, estos generadores de patrones centrales son redes de neuronas en la médula espinal que producen contracciones musculares periódicas sin la intervención del cerebro. Las redes generadoras de patrones centrales ayudan a generar tareas rítmicas como caminar, parpadear o hacer la digestión. Además, los reflejos son acciones de control motor involuntario desencadenadas por vías neuronales codificadas que conectan sensores en la pierna con la médula espinal.

Siempre que el animal joven camine sobre una superficie perfectamente plana, las CPG pueden ser suficientes para controlar las señales de movimiento de la médula espinal. Un pequeño bache en el suelo, sin embargo, cambia el andar. Los reflejos se activan y ajustan los patrones de movimiento para evitar que el animal se caiga. Estos cambios momentáneos en las señales de movimiento son reversibles o ‘elásticos’, y los patrones de movimiento vuelven a su configuración original después de la perturbación. Pero si el animal no deja de tropezar en muchos ciclos de movimiento, a pesar de los reflejos activos, entonces los patrones de movimiento deben volver a aprenderse y hacerse ‘plásticos’, es decir, irreversibles. En el animal recién nacido, las GPC inicialmente aún no están lo suficientemente ajustadas y el animal tropieza, tanto en terrenos llanos como irregulares. Pero el animal aprende rápidamente cómo sus CPG y sus reflejos controlan los músculos y los tendones de las piernas.

Lo mismo ocurre con el perro-robot del tamaño de un labrador llamado «Morti». Aún más, el robot optimiza sus patrones de movimiento más rápido que un animal, en aproximadamente una hora. El CPG de Morti se simula en una computadora pequeña y liviana que controla el movimiento de las piernas del robot. Esta médula espinal virtual se coloca en la espalda del robot cuadrúpedo donde estaría la cabeza. Durante la hora que tarda el robot en caminar sin problemas, los datos de los sensores de los pies del robot se comparan continuamente con la toma de contacto prevista por el CPG del robot. Si el robot tropieza, el algoritmo de aprendizaje cambia qué tan lejos se balancean las piernas hacia adelante y hacia atrás, qué tan rápido se balancean las piernas y cuánto tiempo está una pierna en el suelo. El movimiento ajustado también afecta qué tan bien el robot puede utilizar su mecánica de piernas compatible. Durante el proceso de aprendizaje, el CPG envía señales motrices adaptadas para que el robot tropiece en adelante menos y optimice su marcha. En este marco, la médula espinal virtual no tiene conocimiento explícito sobre el diseño de las piernas del robot, sus motores y resortes. Sin saber nada sobre la física de la máquina, carece de un «modelo» de robot.

«Nuestro robot prácticamente ‘nace’ sin saber nada sobre la anatomía de sus piernas o cómo funcionan», explica Ruppert. «El CPG se asemeja a una inteligencia para caminar automática incorporada que proporciona la naturaleza y que hemos transferido al robot. La computadora produce señales que controlan los motores de las piernas, y el robot inicialmente camina y tropieza. Los datos fluyen de vuelta desde los sensores al médula espinal virtual donde se comparan los datos del sensor y del CPG. Si los datos del sensor no coinciden con los datos esperados, el algoritmo de aprendizaje cambia el comportamiento de la marcha hasta que el robot camina bien y sin tropiezos. Cambiando la salida del CPG manteniendo los reflejos activos y monitoreando el los tropiezos de los robots son una parte fundamental del proceso de aprendizaje».

Control de perros robot de bajo consumo

La computadora de Morti consume solo cinco vatios de energía en el proceso de caminar. Los robots cuadrúpedos industriales de fabricantes destacados, que han aprendido a funcionar con la ayuda de controladores complejos, consumen mucha más energía. Sus controladores están codificados con el conocimiento de la masa exacta y la geometría del cuerpo del robot, utilizando un modelo del robot. Por lo general, consumen varias decenas, hasta varios cientos de vatios de potencia. Ambos tipos de robots funcionan de forma dinámica y eficiente, pero el consumo de energía computacional es mucho menor en el modelo de Stuttgart. También proporciona información importante sobre la anatomía animal.

«No podemos investigar fácilmente la médula espinal de un animal vivo. Pero podemos modelar uno en el robot», dice Alexander Badri-Spröwitz, coautor de la publicación con Ruppert y director del Grupo de Investigación de Locomoción Dinámica. «Sabemos que estos CPG existen en muchos animales. Sabemos que los reflejos están incrustados, pero ¿cómo podemos combinar ambos para que los animales aprendan movimientos con reflejos y CPG? Esta es una investigación fundamental en la intersección entre la robótica y la biología. El modelo robótico da respuestas a preguntas que la biología por sí sola no puede responder».