Cómo desarrollar IA autónoma

Algunos entusiastas argumentarían que la inteligencia artificial (IA) es a punto de convertirse en consciente. Pero no Yann LeCun, quien ganó un premio Turing 2018 por su contribución a aprendizaje profundo.

De hecho, LeCun cree que la IA es no en el camino correcto para pensar y aprender como humanos. Señala que, si bien un adolescente puede aprender a conducir en unas 20 horas, un automóvil autónomo decente hoy en día requeriría millones o miles de millones de muestras de datos de entrenamiento etiquetados o pruebas de aprendizaje de refuerzo en entornos simulados, y aún no alcanzaría el nivel de un ser humano. capacidad para conducir de manera confiable. (Lea también: Hackear vehículos autónomos: ¿es por eso que todavía no tenemos autos autónomos?)

Sobre la base de esta realización, LeCun esbozó una hoja de ruta para crear «inteligencia artificial autónoma». La hoja de ruta de LeCun se inspira en varias disciplinas, como el aprendizaje profundo, la robótica, la ciencia cognitiva y la neurociencia, para esbozar una estructura modular configurable. Y aunque la implementación de esta hoja de ruta requeriría una mayor exploración, es útil pensar en los diferentes componentes necesarios para replicar la inteligencia animal y humana.

Este artículo profundiza en la metodología detrás de la hoja de ruta de inteligencia artificial autónoma de LeCun.

Cómo funciona

El modelo mundial

El núcleo del marco de LeCun es un «modelo mundial» que predice las condiciones o estados del mundo. LeCun argumenta que los animales y las personas tienen cada uno su propio «modelo del mundo» en algún lugar de su corteza prefrontal.

Si bien ya se han realizado intentos para desarrollar un modelo mundial basado en IA, estos modelos dependen de la tarea y no se pueden adaptar a diferentes tareas. LeCun, sin embargo, no está de acuerdo con la noción de múltiples modelos mundiales dependientes de tareas y cree en un único modelo mundial dinámicamente configurable. Según LeCun, el modelo de mundo único de cada individuo permite compartir conocimientos entre múltiples tareas, lo que lleva a los humanos a razonar a través de la analogía.

En el contexto de la hoja de ruta de IA autónoma de LeCun, la idea del modelo mundial se acompaña de otros modelos que ayudan al sistema de IA a comprender el mundo y realizar acciones en él.

El modelo de percepción

El modelo de «percepción» recopila y procesa señales de sensores y estima el estado del mundo. Por lo tanto, imita los cinco sentidos de las personas. El modelo del mundo ayuda al modelo de percepción a realizar dos tareas esenciales:

Rellenar piezas de información ausentes en los datos sensoriales. (p. ej., objetos ocluidos).

Predecir los estados futuros más probables del mundo (por ejemplo, la ubicación de un automóvil en movimiento dentro de cinco segundos).

La arquitectura de IA autónoma de LeCun también contiene otros modelos que funcionan junto con el modelo mundial para facilitar la capacidad de aprendizaje de la IA. Éstos incluyen:

El modelo de costos

El modelo de costos insta a un sistema de IA a lograr los objetivos deseados. Mide el nivel de malestar en el sistema y consta de dos submodelos:

El costo intrínseco: un modelo integrado no entrenable que calcula la incomodidad instantánea (p. ej., daño al sistema).
El crítico: un modelo aprendible que predice el estado futuro del costo intrínseco.

El sistema de IA tiene como objetivo reducir el costo intrínseco durante un período de tiempo. Según LeCun, es el modelo de costos donde existen impulsos conductuales básicos y motivaciones intrínsecas. Es importante diferenciar este modelo porque permite que los gradientes del costo se propaguen hacia atrás a través de otros modelos, capacitándolos para trabajar juntos para reducir el costo intrínseco.

El actor modelo

El modelo del “actor” toma acciones en un intento de minimizar el nivel de incomodidad (es decir, el costo intrínseco).

El modelo de memoria a corto plazo

El modelo de «memoria a corto plazo» memoriza información importante sobre el estado del mundo y el costo intrínseco correspondiente. Desempeña un papel importante para ayudar al modelo mundial a hacer predicciones precisas.

El modelo del configurador

Por último, la arquitectura de IA autónoma de LeCun incluye un modelo de «configurador» para proporcionar control ejecutivo al sistema.

El objetivo clave del configurador es permitir que la IA maneje una variedad de tareas diferentes. Lo hace regulando los otros modelos en la arquitectura, por ejemplo, modulando sus parámetros.

Volviendo al ejemplo anterior de «vehículos autónomos», si desea conducir un automóvil, su «modelo de percepción» (sus cinco sentidos) debe absorber información de las partes de un automóvil relevantes para conducir: debe mira por el parabrisas, toca el volante y escucha el motor. Mientras tanto, su «modelo de actor» debe planificar las acciones en consecuencia: enciende el motor y cambia de marcha, y su «modelo de costos» tiene en cuenta las reglas de tránsito.

Curiosamente, la hoja de ruta de LeCun se inspiró en la teoría del proceso dual de Daniel Kahneman, que propuso en «Thinking Fast and Slow». El modelo de Kahneman permite que los sistemas de IA muestren dos tipos de comportamientos:

Modo 1. El modo 1 es un comportamiento rápido y reflexivo como resultado del mapeo directo de percepción a acción.
Modo 2. El modo 2 es un comportamiento lento y deliberado que utiliza el modelo mundial, el modelo de percepción, el modelo de costo, el modelo de actor, el modelo de memoria a corto plazo y el modelo de configuración para el razonamiento y la planificación.

Cómo implementar el marco de IA autónomo de Yann LeCun

Según LeCun, un desafío clave en la realización de su marco conceptual es la implementación.

LeCun cree en la implementación de su modelo utilizando modelos de aprendizaje profundo que se pueden entrenar con algoritmos de optimización basados en gradientes. No está convencido de usar el sistema simbólico, que requiere conocimiento codificado a mano por parte de los humanos.

Dos metodologías prometedoras para implementar este marco son:

1. Aprendizaje autosupervisado

Debido a que los modelos de aprendizaje profundo requieren una gran cantidad de conjuntos de datos anotados por humanos para aprender mediante el aprendizaje supervisado, LeCun aboga por el uso del aprendizaje autosupervisado (SSL): un enfoque de aprendizaje no supervisado que utiliza las supervisiones disponibles naturalmente dentro de un conjunto de datos (es decir, sin anotaciones humanas). LeCun argumenta que los niños humanos también usan el aprendizaje autosupervisado para obtener conocimiento del mundo basado en el sentido común, como la gravedad, la dimensionalidad, la profundidad y las relaciones sociales.

Además de las motivaciones teóricas, SSL también ha demostrado una increíble utilidad práctica en el aprendizaje de modelos de lenguaje fundamentales utilizando arquitecturas de aprendizaje profundo basadas en transformadores. (Lea también: Modelos básicos: la próxima frontera de la IA.)

2. Modelos basados en energía

Si bien existen varios enfoques SSL, como la codificación automática y el aprendizaje contrastivo, LeCun enfatiza el uso de modelos basados en energía (EBM).

Los EBM se ocupan de la codificación de datos de alta dimensión, como imágenes, en espacios de incrustación de baja dimensión al preservar solo la información relevante. Recuerde: los modelos de IA se entrenan midiendo si dos observaciones son similares o no. Con este fin, LeCun propone una arquitectura de aprendizaje basada en EBM llamada “Arquitectura predictiva de incorporación conjunta (JEPA)” para aprender modelos mundiales.

Según LeCun, una característica clave de JEPA es que puede optar por pasar por alto los detalles irrelevantes que no se pueden predecir fácilmente. Por ejemplo, en el procesamiento de imágenes, en lugar de predecir el estado del mundo a nivel de píxel, JEPA tiende a aprender características de baja dimensión que son vitales para una tarea determinada. LeCun también explica cómo las arquitecturas JEPA se pueden apilar una encima de la otra para formar «JEPA jerárquica» (H-JEPA), que podría ser crucial para manejar tareas complejas como el razonamiento y la planificación en múltiples escalas de tiempo.

Conclusión: el ascenso hacia la IA autónoma

Si bien algunos investigadores creen que la inteligencia general artificial (AGI) se puede lograr mediante el escalado masivo de arquitecturas de aprendizaje profundo, LeCun afirma que el escalado no es suficiente para lograr una IA autónoma. Si bien el escalado ha producido avances increíbles en modelos de lenguaje que involucran datos discretos, no logra un impacto similar en datos continuos de alta dimensión, como videos. (Lea también: Introducción a las tecnologías de comprensión del lenguaje natural (NLU).)

LeCun tampoco está convencido de que las funciones de recompensa y los algoritmos de refuerzo sean suficientes para lograr el AGI. Argumenta que el aprendizaje por refuerzo requiere una interacción continua con el entorno, a diferencia de los humanos y los animales, que utilizan principalmente su percepción para aprender.

Claramente, el marco de LeCun requiere una mayor exploración para abordar sus desafíos de implementación.