Saltar al contenido

Menos neuronas, más inteligencia… ScienceDaily

23 de octubre de 2020

La inteligencia artificial ha llegado a nuestra vida cotidiana… desde los motores de búsqueda hasta los coches auto-conductores. Esto tiene que ver con el enorme poder de computación que se ha hecho disponible en los últimos años. Pero los nuevos resultados de la investigación de la IA muestran ahora que las redes neuronales más simples y pequeñas pueden ser usadas para resolver ciertas tareas aún mejor, más eficientemente y más confiablemente que nunca antes.

Un equipo internacional de investigación de la Universidad de Viena, el Instituto Tecnológico de Austria y el Instituto Tecnológico de Massachusetts (EEUU) ha desarrollado un nuevo sistema de inteligencia artificial basado en los cerebros de animales diminutos, como los gusanos de hilo. Este novedoso sistema de IA puede controlar un vehículo con sólo unas pocas neuronas artificiales. El equipo dice que ese sistema tiene ventajas decisivas sobre los anteriores modelos de aprendizaje profundo: Se las arregla mucho mejor con entradas ruidosas, y, debido a su simplicidad, su modo de funcionamiento puede ser explicado en detalle. No tiene que ser considerado como una compleja «caja negra», pero puede ser entendido por los humanos. Este nuevo modelo de aprendizaje profundo se ha publicado ahora en la revista La inteligencia de la máquina de la naturaleza.

Aprendiendo de la naturaleza

Al igual que los cerebros vivos, las redes neuronales artificiales consisten en muchas células individuales. Cuando una célula está activa, envía una señal a otras células. Todas las señales recibidas por la siguiente célula se combinan para decidir si esta célula también se activará. La forma en que una célula influye en la actividad de la siguiente determina el comportamiento del sistema… estos parámetros se ajustan en un proceso de aprendizaje automático hasta que la red neuronal pueda resolver una tarea específica.

Recomendado:  Una revisión crítica de las 'Pautas éticas para una IA confiable' de la UE

«Durante años, hemos estado investigando lo que podemos aprender de la naturaleza para mejorar el aprendizaje profundo», dice el profesor Radu Grosu, jefe del grupo de investigación «Sistemas Ciberfísicos» en la Universidad Técnica de Viena. «El nematodo C. elegans, por ejemplo, vive su vida con un número sorprendentemente pequeño de neuronas, y todavía muestra interesantes patrones de comportamiento. Esto se debe a la forma eficiente y armoniosa en que el sistema nervioso del nematodo procesa la información.»

«La naturaleza nos muestra que todavía hay mucho que mejorar», dice la Prof. Daniela Rus, directora del Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT (CSAIL). «Por lo tanto, nuestro objetivo era reducir masivamente la complejidad y mejorar la interpretabilidad de los modelos de redes neuronales.»

«Inspirados por la naturaleza, desarrollamos nuevos modelos matemáticos de neuronas y sinapsis», dice el Prof. Thomas Henzinger, presidente de IST Austria.

«El procesamiento de las señales dentro de las células individuales sigue principios matemáticos diferentes a los de los anteriores modelos de aprendizaje profundo», dice el Dr. Ramin Hasani, asociado postdoctoral del Instituto de Ingeniería Informática, TU Wien y MIT CSAIL. «Además, nuestras redes son muy escasas, lo que significa que no todas las células están conectadas a todas las demás. Esto también hace que la red sea más simple».

Mantenimiento de carriles autónomos

Para probar las nuevas ideas, el equipo eligió una tarea de prueba particularmente importante: los coches autoconductores que se mantienen en su carril. La red neuronal recibe imágenes de cámara de la carretera como entrada y debe decidir automáticamente si se dirige a la derecha o a la izquierda.

«Hoy en día, los modelos de aprendizaje profundo con muchos millones de parámetros se utilizan a menudo para el aprendizaje de tareas complejas como la conducción autónoma», dice Mathias Lechner, ex-alumno de la TU Wien y estudiante de doctorado en el IST Austria. «Sin embargo, nuestro nuevo enfoque nos permite reducir el tamaño de las redes en dos órdenes de magnitud. Nuestros sistemas sólo utilizan 75.000 parámetros entrenables».

Recomendado:  agente invisible | febrero 2022

Alexander Amini, estudiante de doctorado en el MIT CSAIL explica que el nuevo sistema consiste en dos partes: La entrada de la cámara se procesa primero por una llamada red neural convolucional, que sólo percibe los datos visuales para extraer características estructurales de los píxeles entrantes. Esta red decide qué partes de la imagen de la cámara son interesantes e importantes, y luego pasa señales a la parte crucial de la red, un «sistema de control» que luego dirige el vehículo.

Ambos subsistemas se apilan y se entrenan simultáneamente. Se recogieron muchas horas de videos de tráfico de conducción humana en el área metropolitana de Boston, y se alimentan en la red, junto con información sobre cómo dirigir el coche en cualquier situación dada – hasta que el sistema ha aprendido a conectar automáticamente las imágenes con la dirección de dirección apropiada y puede manejar independientemente nuevas situaciones.

La parte de control del sistema (llamada política de circuito neural, o NCP), que traduce los datos del módulo de percepción en un comando de dirección, sólo consta de 19 neuronas. Mathias Lechner explica que los NCP son hasta 3 órdenes de magnitud más pequeños de lo que hubiera sido posible con los modelos anteriores de última generación.

Causalidad e interpretación

El nuevo modelo de aprendizaje profundo fue probado en un vehículo autónomo real. «Nuestro modelo nos permite investigar en qué centra su atención la red mientras conduce. Nuestras redes se centran en partes muy específicas de la imagen de la cámara: El borde de la acera y el horizonte. Este comportamiento es muy deseable, y es único entre los sistemas de inteligencia artificial», dice Ramin Hasani. «Además, vimos que el papel de cada célula en cualquier decisión de conducción puede ser identificado. Podemos entender la función de las células individuales y su comportamiento. Lograr este grado de interpretabilidad es imposible para los modelos de aprendizaje profundo más grandes».

Recomendado:  Un enjambre de pequeños drones autónomos puede localizar fugas de gas

Robustez

«Para comprobar la robustez de los PCN en comparación con los modelos profundos anteriores, perturbamos las imágenes de entrada y evaluamos lo bien que los agentes pueden lidiar con el ruido», dice Mathias Lechner. «Mientras que esto se convirtió en un problema insuperable para otras redes neuronales profundas, nuestros PCN demostraron una fuerte resistencia a los artefactos de entrada. Este atributo es una consecuencia directa del nuevo modelo neural y la arquitectura.»

«La interpretabilidad y la robustez son las dos principales ventajas de nuestro nuevo modelo», dice Ramin Hasani. «Pero hay más: Con nuestros nuevos métodos, también podemos reducir el tiempo de entrenamiento y la posibilidad de implementar la IA en sistemas relativamente simples. Nuestros PCN permiten el aprendizaje por imitación en una amplia gama de aplicaciones posibles, desde el trabajo automatizado en almacenes hasta la locomoción de robots. Los nuevos hallazgos abren nuevas e importantes perspectivas para la comunidad de la IA: Los principios de computación en los sistemas nerviosos biológicos pueden convertirse en un gran recurso para crear IA interpretable de alto rendimiento – como una alternativa a los sistemas de aprendizaje de máquinas de caja negra que hemos utilizado hasta ahora».

Repositorio de códigos: https://github.com/mlech26l/keras-ncp

Video: https://ist.ac.at/en/news/new-deep-learning-models/