Saltar al contenido

Entrenando a los robots para que aprendan y tomen decisiones sobre la marcha

13 de julio de 2023

Los rovers de Marte tienen equipos de expertos humanos en la Tierra que les dicen qué hacer. Pero los robots en misiones de aterrizaje a las lunas que orbitan Saturno o Júpiter están demasiado lejos para recibir órdenes oportunas de la Tierra. Investigadores de los Departamentos de Ingeniería Aeroespacial y Ciencias de la Computación de la Universidad de Illinois Urbana-Champaign desarrollaron un método novedoso basado en el aprendizaje para que los robots en cuerpos extraterrestres puedan tomar decisiones por sí mismos sobre dónde y cómo recoger muestras del terreno.

«En lugar de simular cómo recoger todo tipo posible de roca o material granular, creamos una nueva forma para que los módulos de aterrizaje autónomos aprendan a aprender a recoger rápidamente un nuevo material que encuentre», dijo Pranay Thangeda, Ph.D. estudiante del Departamento de Ingeniería Aeroespacial.

«También aprende a adaptarse a los paisajes cambiantes y sus propiedades, como la topología y la composición de los materiales», dijo.

Usando este método, Thangeda dijo que un robot puede aprender a extraer un nuevo material con muy pocos intentos. «Si hace varios intentos fallidos, aprende que no debe sacar en esa área y lo intentará en otra parte».

El modelo de proceso gaussiano profundo propuesto se entrena en la base de datos fuera de línea con metaaprendizaje profundo con brechas de implementación controladas, que divide repetidamente el conjunto de entrenamiento en entrenamiento medio y entrenamiento del núcleo y aprende los parámetros del núcleo para minimizar los residuos de los modelos medios. En la implementación, el tomador de decisiones utiliza el modelo entrenado y lo adapta a los datos adquiridos en línea.

Recomendado:  ¿ChatGPT es gratuito y de código abierto? Tenemos algunas alternativas que puedes probar

Uno de los desafíos para esta investigación es la falta de conocimiento sobre mundos oceánicos como Europa.

«Antes de que enviáramos los rovers recientes a Marte, los orbitadores nos dieron información bastante buena sobre las características del terreno», dijo Thangeda. «Pero la mejor imagen que tenemos de Europa tiene una resolución de 256 a 340 metros por píxel, que no es lo suficientemente clara para determinar las características».

El asesor de Thangeda, Melkior Ornik, dijo: «Todo lo que sabemos es que la superficie de Europa es hielo, pero podrían ser grandes bloques de hielo o mucho más finos como la nieve. Tampoco sabemos qué hay debajo del hielo».

Para algunas pruebas, el equipo ocultó material debajo de una capa de otra cosa. El robot solo ve el material superior y piensa que podría ser bueno para recogerlo. «Cuando realmente recoge y golpea la capa inferior, aprende que no se puede recoger y se mueve a un área diferente», dijo Thangeda.

La NASA quiere enviar rovers alimentados por baterías en lugar de nucleares a Europa porque, entre otras consideraciones específicas de la misión, es fundamental minimizar el riesgo de contaminar los mundos oceánicos con materiales potencialmente peligrosos.

«Aunque los suministros de energía nuclear tienen una vida útil de meses, las baterías tienen una vida útil de unos 20 días. No podemos permitirnos perder algunas horas al día para enviar mensajes de ida y vuelta. Esta es otra razón por la que la autonomía del robot para tomar decisiones por sí sola es vital», dijo Thangeda.

Este método de aprender a aprender también es único porque permite que el robot use la visión y muy poca experiencia en línea para lograr acciones de excavación de alta calidad en terrenos desconocidos, superando significativamente a los métodos no adaptativos y otros métodos de última generación. Métodos de metaaprendizaje del arte.

Recomendado:  BIOHM recauda 7,5 millones de dólares para acelerar la investigación de microbiomas, las capacidades de inteligencia artificial y el desarrollo de productos

A partir de estos 12 materiales y terrenos hechos de una composición única de uno o más materiales, se creó una base de datos de 6.700.

El equipo usó un robot en el Departamento de Ciencias de la Computación en Illinois. Está modelado a partir del brazo de un módulo de aterrizaje con sensores para recopilar datos de excavación en una variedad de materiales, desde granos de arena de 1 milímetro hasta rocas de 8 centímetros, así como materiales de diferentes volúmenes, como cartón triturado y cacahuetes de embalaje. La base de datos resultante en la simulación contiene 100 puntos de conocimiento para cada uno de los 67 terrenos diferentes, o 6700 puntos en total.

«Hasta donde sabemos, somos los primeros en abrir un conjunto de datos a gran escala en medios granulares», dijo Thangeda. «También proporcionamos código para acceder fácilmente al conjunto de datos para que otros puedan comenzar a usarlo en sus aplicaciones».

El modelo que creó el equipo se implementará en el banco de pruebas de autonomía Ocean World Lander del Laboratorio de Propulsión a Chorro de la NASA.

«Estamos interesados ​​en desarrollar capacidades robóticas autónomas en superficies extraterrestres y, en particular, en superficies extraterrestres desafiantes», dijo Ornik. «Este método único ayudará a informar el interés continuo de la NASA en explorar mundos oceánicos.

«El valor de este trabajo está en la adaptabilidad y la transferencia de conocimientos o métodos desde la Tierra a un cuerpo extraterrestre, porque está claro que no tendremos mucha información antes de que el módulo de aterrizaje llegue allí. Y debido a la corta vida útil de la batería, no tendrá mucho tiempo para el proceso de aprendizaje. El módulo de aterrizaje puede durar unos pocos días y luego morir, por lo que aprender y tomar decisiones de forma autónoma es extremadamente beneficioso».

Recomendado:  un nuevo punto de referencia para los modelos de lenguaje

El conjunto de datos de código abierto está disponible en: drillaway.github.io/scooping-dataset.html.