Los investigadores del MIT han desarrollado un tipo de red neuronal que aprende en el trabajo, no solo durante su fase de entrenamiento. Estos algoritmos flexibles, denominados redes «líquidas», cambian sus ecuaciones subyacentes para adaptarse continuamente a las nuevas entradas de datos. El avance podría ayudar a la toma de decisiones basadas en flujos de datos que cambian con el tiempo, incluidos los involucrados en el diagnóstico médico y la conducción autónoma.
«Este es un camino a seguir para el futuro del control de robots, el procesamiento del lenguaje natural, el procesamiento de video, cualquier forma de procesamiento de datos de series de tiempo», dice Ramin Hasani, autor principal del estudio. «El potencial es realmente significativo».
La investigación se presentará en la Conferencia AAAI sobre Inteligencia Artificial de febrero. Además de Hasani, un postdoctorado en el Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT (CSAIL), los coautores del MIT incluyen a Daniela Rus, directora de CSAIL y el profesor Andrew y Erna Viterbi de Ingeniería Eléctrica y Ciencias de la Computación, y el estudiante de doctorado Alexander Amini. Otros coautores incluyen a Mathias Lechner del Instituto de Ciencia y Tecnología de Austria y Radu Grosu de la Universidad Tecnológica de Viena.
Los datos de series de tiempo son omnipresentes y vitales para nuestra comprensión del mundo, según Hasani. «El mundo real se trata de secuencias. Incluso nuestra percepción, no estás percibiendo imágenes, estás percibiendo secuencias de imágenes», dice. «Entonces, los datos de series de tiempo realmente crean nuestra realidad».
Señala el procesamiento de video, los datos financieros y las aplicaciones de diagnóstico médico como ejemplos de series de tiempo que son fundamentales para la sociedad. Las vicisitudes de estos flujos de datos en constante cambio pueden ser impredecibles. Sin embargo, analizar estos datos en tiempo real y usarlos para anticipar el comportamiento futuro puede impulsar el desarrollo de tecnologías emergentes como los automóviles autónomos. Entonces Hasani construyó un algoritmo adecuado para la tarea.
Hasani diseñó una red neuronal que puede adaptarse a la variabilidad de los sistemas del mundo real. Las redes neuronales son algoritmos que reconocen patrones analizando un conjunto de ejemplos de «entrenamiento». A menudo se dice que imitan las vías de procesamiento del cerebro: Hasani se inspiró directamente en el nematodo microscópico C. elegans. «Solo tiene 302 neuronas en su sistema nervioso», dice, «pero puede generar dinámicas inesperadamente complejas».
Hasani codificó su red neuronal prestando especial atención a cómo las neuronas de C. elegans se activan y se comunican entre sí a través de impulsos eléctricos. En las ecuaciones que usó para estructurar su red neuronal, permitió que los parámetros cambiaran con el tiempo en función de los resultados de un conjunto anidado de ecuaciones diferenciales.
Esta flexibilidad es clave. El comportamiento de la mayoría de las redes neuronales se corrige después de la fase de entrenamiento, lo que significa que no se ajustan bien a los cambios en el flujo de datos entrantes. Hasani dice que la fluidez de su red «líquida» la hace más resistente a datos inesperados o ruidosos, como si una fuerte lluvia oscureciera la vista de una cámara en un automóvil autónomo. «Entonces, es más robusto», dice.
Hay otra ventaja de la flexibilidad de la red, agrega: «Es más interpretable».
Hasani dice que su red líquida bordea la inescrutabilidad común a otras redes neuronales. «Simplemente cambiando la representación de una neurona», lo que Hasani hizo con las ecuaciones diferenciales, «realmente puedes explorar algunos grados de complejidad que no podrías explorar de otra manera». Gracias a la pequeña cantidad de neuronas altamente expresivas de Hasani, es más fácil mirar dentro de la «caja negra» de la toma de decisiones de la red y diagnosticar por qué la red hizo una determinada caracterización.
«El modelo en sí es más rico en términos de expresividad», dice Hasani. Eso podría ayudar a los ingenieros a comprender y mejorar el rendimiento de la red líquida.
La red de Hasani se destacó en una batería de pruebas. Superó a otros algoritmos de series de tiempo de última generación por unos pocos puntos porcentuales en la predicción precisa de valores futuros en conjuntos de datos, que van desde la química atmosférica hasta los patrones de tráfico. «En muchas aplicaciones, vemos que el rendimiento es confiablemente alto», dice. Además, el pequeño tamaño de la red significó que completó las pruebas sin un alto costo de computación. «Todo el mundo habla de ampliar su red», dice Hasani. «Queremos reducir la escala, tener menos nodos pero más ricos».
Hasani planea seguir mejorando el sistema y prepararlo para su aplicación industrial. «Tenemos una red neuronal demostrablemente más expresiva que está inspirada en la naturaleza. Pero esto es solo el comienzo del proceso», dice. «La pregunta obvia es ¿cómo extender esto? Creemos que este tipo de red podría ser un elemento clave de los futuros sistemas de inteligencia».
Esta investigación fue financiada, en parte, por Boeing, la National Science Foundation, el Austrian Science Fund y Electronic Components and Systems for European Leadership.