Saltar al contenido

El MIT resolvió una ecuación diferencial centenaria para romper el cuello de botella computacional de la IA ‘líquida’

16 de noviembre de 2022

El año pasado, el MIT desarrolló un algoritmo AI/ML capaz de aprender y adaptarse a nueva información mientras está en el trabajo, no solo durante su fase inicial de capacitación. Estas redes neuronales «líquidas» (en el sentido de Bruce Lee) literalmente juegan al ajedrez en 4D (sus modelos requieren datos de series de tiempo para operar), lo que las hace ideales para usar en tareas sensibles al tiempo como monitoreo de marcapasos, pronóstico del tiempo, pronóstico de inversiones o Navegación de vehículos autónomos. Pero el problema es que el rendimiento de datos se ha convertido en un cuello de botella, y escalar estos sistemas se ha vuelto prohibitivamente costoso, computacionalmente hablando.

El martes, los investigadores del MIT anunciaron que habían ideado una solución a esa restricción, no ampliando la tubería de datos sino resolviendo una ecuación diferencial que ha dejado perplejos a los matemáticos desde 1907. Específicamente, el equipo resolvió “la ecuación diferencial detrás de la interacción de dos neuronas a través de sinapsis… para desbloquear un nuevo tipo de algoritmos de inteligencia artificial rápidos y eficientes”.

“Los nuevos modelos de aprendizaje automático que llamamos ‘CfC’ [closed-form Continuous-time] reemplazar la ecuación diferencial que define el cálculo de la neurona con una aproximación de forma cerrada, preservando las bellas propiedades de las redes líquidas sin necesidad de integración numérica”, dijo la profesora del MIT y directora de CSAIL, Daniela Rus, en un comunicado de prensa el martes. “Los modelos CfC son causales, compactos, explicables y eficientes para entrenar y predecir. Abren el camino hacia el aprendizaje automático confiable para aplicaciones críticas para la seguridad”.

Recomendado:  El aprendizaje automático ayuda a determinar el estado de

Entonces, para aquellos de nosotros que no tenemos un doctorado en Really Hard Math, las ecuaciones diferenciales son fórmulas que pueden describir el estado de un sistema en varios puntos discretos o pasos a lo largo del proceso. Por ejemplo, si tiene un brazo robótico que se mueve del punto A al B, puede usar una ecuación diferencial para saber dónde se encuentra entre los dos puntos en el espacio en cualquier paso dado dentro del proceso. Sin embargo, resolver estas ecuaciones para cada paso rápidamente también resulta computacionalmente costoso. La solución de «forma cerrada» del MIT soluciona ese problema al modelar funcionalmente la descripción completa de un sistema en un solo paso computacional. COMO explica el equipo del MIT:

Imagínese si tiene una red neuronal de extremo a extremo que recibe información de conducción de una cámara montada en un automóvil. La red está entrenada para generar resultados, como el ángulo de dirección del automóvil. En 2020, el equipo resolvió esto utilizando redes neuronales líquidas con 19 nodos, por lo que 19 neuronas más un pequeño módulo de percepción podrían conducir un automóvil. Una ecuación diferencial describe cada nodo de ese sistema. Con la solución de forma cerrada, si la reemplaza dentro de esta red, le daría el comportamiento exacto, ya que es una buena aproximación de la dinámica real del sistema. Por lo tanto, pueden resolver el problema con un número aún menor de neuronas, lo que significa que sería más rápido y menos costoso computacionalmente.

Al resolver esta ecuación a nivel neuronal, el equipo tiene la esperanza de poder construir modelos del cerebro humano que midan millones de conexiones neuronales, algo que no es posible hoy en día. El equipo también señala que este modelo CfC podría tomar el entrenamiento visual que aprendió en un entorno y aplicarlo a una situación completamente nueva sin trabajo adicional, lo que se conoce como generalización fuera de distribución. Eso no es algo que los modelos de la generación actual realmente puedan hacer y demostraría ser un paso significativo hacia los sistemas de IA generalizados del mañana.

Recomendado:  Cómo actualizar modelos de redes neuronales con más datos

Todos los productos recomendados por Engadget son seleccionados por nuestro equipo editorial, independiente de nuestra empresa matriz. Algunas de nuestras historias incluyen enlaces de afiliados. Si compra algo a través de uno de estos enlaces, podemos ganar una comisión de afiliado. Todos los precios son correctos en el momento de la publicación.