Para los humanos, encontrar una billetera perdida enterrada debajo de una pila de artículos es bastante sencillo: simplemente retiramos cosas de la pila hasta que encontramos la billetera. Pero para un robot, esta tarea implica un razonamiento complejo sobre la pila y los objetos que contiene, lo que presenta un gran desafío.
Los investigadores del MIT demostraron previamente un brazo robótico que combina información visual y señales de radiofrecuencia (RF) para encontrar objetos ocultos que fueron etiquetados con etiquetas RFID (que reflejan las señales enviadas por una antena). A partir de ese trabajo, ahora han desarrollado un nuevo sistema que puede recuperar de manera eficiente cualquier objeto enterrado en una pila. Siempre que algunos elementos de la pila tengan etiquetas RFID, no es necesario etiquetar el elemento de destino para que el sistema lo recupere.
Los algoritmos detrás del sistema, conocidos como FuseBot, razonan sobre la probable ubicación y orientación de los objetos debajo de la pila. Luego, FuseBot encuentra la forma más eficiente de eliminar los objetos que obstruyen y extraer el elemento objetivo. Este razonamiento permitió a FuseBot encontrar más elementos ocultos que un sistema robótico de última generación, en la mitad del tiempo.
Esta velocidad podría ser especialmente útil en un almacén de comercio electrónico. Un robot encargado de procesar las devoluciones podría encontrar artículos en una pila sin clasificar de manera más eficiente con el sistema FuseBot, dice el autor principal Fadel Adib, profesor asociado en el Departamento de Ingeniería Eléctrica y Ciencias de la Computación y director del grupo Signal Kinetics en el Media Lab.
«Lo que muestra este documento, por primera vez, es que la mera presencia de un elemento con etiqueta RFID en el entorno hace que sea mucho más fácil realizar otras tareas de manera más eficiente. Pudimos hacer esto porque agregamos razonamiento multimodal al sistema: FuseBot puede razonar sobre la visión y la RF para comprender una pila de elementos», agrega Adib.
Junto a Adib en el artículo están los asistentes de investigación Tara Boroushaki, quien es el autor principal; Laura Dodds; y Nazish Naeem. La investigación se presentará en la conferencia Robótica: Ciencia y Sistemas.
Etiquetas de orientación
Un informe de mercado reciente indica que más del 90 por ciento de los minoristas de EE. UU. ahora usan etiquetas RFID, pero la tecnología no es universal, lo que lleva a situaciones en las que solo se etiquetan algunos objetos dentro de las pilas.
Este problema inspiró la investigación del grupo.
Con FuseBot, un brazo robótico utiliza una cámara de video adjunta y una antena de RF para recuperar un elemento de destino sin etiquetar de una pila mixta. El sistema escanea la pila con su cámara para crear un modelo 3D del entorno. Simultáneamente, envía señales desde su antena para localizar etiquetas RFID. Estas ondas de radio pueden atravesar la mayoría de las superficies sólidas, por lo que el robot puede «ver» profundamente en la pila. Dado que el artículo de destino no está etiquetado, FuseBot sabe que el artículo no se puede ubicar exactamente en el mismo lugar que una etiqueta RFID.
Los algoritmos fusionan esta información para actualizar el modelo 3D del entorno y resaltar las posibles ubicaciones del elemento de destino; el robot conoce su tamaño y forma. Luego, el sistema razona sobre los objetos en la pila y las ubicaciones de las etiquetas RFID para determinar qué artículo eliminar, con el objetivo de encontrar el artículo objetivo con la menor cantidad de movimientos.
Fue un reto incorporar este razonamiento en el sistema, dice Boroushaki.
El robot no está seguro de cómo se orientan los objetos debajo de la pila, o cómo un elemento blando puede deformarse al presionarlo elementos más pesados. Supera este desafío con razonamiento probabilístico, utilizando lo que sabe sobre el tamaño y la forma de un objeto y la ubicación de su etiqueta RFID para modelar el espacio 3D que probablemente ocupará ese objeto.
A medida que elimina elementos, también usa el razonamiento para decidir qué elemento sería «mejor» para eliminar a continuación.
«Si le doy a un ser humano una pila de artículos para buscar, lo más probable es que primero retiren el artículo más grande para ver qué hay debajo. Lo que hace el robot es similar, pero también incorpora información RFID para tomar una decisión más informada. pregunta: ‘¿Cuánto más entenderá sobre esta pila si elimina este elemento de la superficie?'», Dice Boroushaki.
Después de eliminar un objeto, el robot vuelve a escanear la pila y utiliza nueva información para optimizar su estrategia.
Resultados de recuperación
Este razonamiento, así como su uso de señales de RF, le dio a FuseBot una ventaja sobre un sistema de última generación que solo usaba visión. El equipo realizó más de 180 pruebas experimentales con brazos robóticos reales y montones de artículos para el hogar, como suministros de oficina, animales de peluche y ropa. Variaron los tamaños de las pilas y la cantidad de artículos con etiquetas RFID en cada pila.
FuseBot extrajo con éxito el elemento de destino el 95 % de las veces, en comparación con el 84 % del otro sistema robótico. Logró esto utilizando un 40 por ciento menos de movimientos y pudo ubicar y recuperar elementos específicos más del doble de rápido.
«Vemos una gran mejora en la tasa de éxito al incorporar esta información de RF. También fue emocionante ver que pudimos igualar el rendimiento de nuestro sistema anterior y superarlo en escenarios donde el artículo de destino no tenía RFID etiqueta», dice Dodds.
FuseBot podría aplicarse en una variedad de entornos porque el software que realiza su complejo razonamiento puede implementarse en cualquier computadora; solo necesita comunicarse con un brazo robótico que tiene una cámara y una antena, agrega Boroushaki.
En un futuro cercano, los investigadores planean incorporar modelos más complejos en FuseBot para que funcione mejor en objetos deformables. Más allá de eso, están interesados en explorar diferentes manipulaciones, como un brazo robótico que empuja objetos fuera del camino. Las iteraciones futuras del sistema también podrían usarse con un robot móvil que busca objetos perdidos en múltiples pilas.
Este trabajo fue financiado, en parte, por la Fundación Nacional de Ciencias, una beca de investigación Sloan, NTT DATA, Toppan, Toppan Forms y el MIT Media Lab.