a mitad de camino
Desde el lanzamiento de la API GPT-4 de OpenAI el mes pasado para los probadores beta, un grupo suelto de desarrolladores ha estado experimentando con implementaciones similares a agentes («agentes») del modelo de IA que intentan llevar a cabo tareas de varios pasos con la mínima intervención humana. como sea posible. Estos scripts caseros pueden repetir, iterar y derivar nuevas instancias de un modelo de IA según sea necesario.
Dos proyectos experimentales de código abierto, en particular, han captado mucha atención en las redes sociales, especialmente entre aquellos que bombo publicitario Proyectos de IA sin descanso: Auto-GPT, creado por Toran Bruce Richardsy BabyAGI, creado por yohei nakajima.
¿Qué hacen? Bueno, ahora mismo, no mucho. Necesitan mucho aporte humano y apoyo en el camino, por lo que aún no son tan autónomos como se prometió. Pero representan los primeros pasos hacia modelos de IA de encadenamiento más complejos que podrían ser potencialmente más capaces que un solo modelo de IA que trabaja solo.
“Consigue de forma autónoma cualquier objetivo que te propongas”
Richards anuncia su guión como «una aplicación experimental de código abierto que muestra las capacidades del modelo de lenguaje GPT-4». El guión «encadena los ‘pensamientos’ de LLM para lograr de forma autónoma cualquier objetivo que te propongas».
Básicamente, Auto-GPT toma la salida de GPT-4 y la retroalimenta a sí misma con una memoria externa improvisada para que pueda seguir iterando en una tarea, corregir errores o sugerir mejoras. Idealmente, dicho script podría servir como un asistente de IA que podría realizar cualquier tarea digital por sí mismo.
Para probar estas afirmaciones, ejecutamos Auto-GPT (una secuencia de comandos de Python) localmente en una máquina con Windows. Cuando lo inicia, solicita un nombre para su agente de IA, una descripción de su función y una lista de cinco objetivos que intenta cumplir. Al configurarlo, debe proporcionar una clave de API de OpenAI y una clave de API de búsqueda de Google. Cuando se ejecuta, Auto-GPT pide permiso para realizar cada paso que genera por defecto, aunque también incluye un modo totalmente automático si te sientes aventurero.
Si se le asigna la tarea de hacer algo como «Comprar un par de Air Jordan antiguos», Auto-GPT desarrollará un plan de varios pasos e intentará ejecutarlo. Por ejemplo, podría buscar vendedores de zapatos y luego buscar un par específico que cumpla con sus criterios. Pero ahí es cuando se detiene porque en realidad no puede comprar nada, en este momento. Si se conecta a una API de compras adecuada, eso podría ser posible.
Si desea probar lo que Auto-GPT hace usted mismo, alguien creó una versión basada en la web llamada AgentGPT que funciona de manera similar.
Richards ha sido muy abierto sobre su objetivo con Auto-GPT: desarrollar una forma de AGI (inteligencia general artificial). En IA, la «inteligencia general» generalmente se refiere a la capacidad aún hipotética de un sistema de IA para realizar una amplia gama de tareas y resolver problemas para los que no está específicamente programado o capacitado.
Ars Technica
Al igual que un ser humano razonablemente inteligente, un sistema con inteligencia general debería poder adaptarse a nuevas situaciones y aprender de la experiencia, en lugar de simplemente seguir un conjunto de reglas o patrones predefinidos. Esto contrasta con los sistemas con inteligencia estrecha o especializada (a veces llamada «IA estrecha»), que están diseñados para realizar tareas específicas u operar dentro de una gama limitada de contextos.
Mientras tanto, BabyAGI (que recibe su nombre de un objetivo aspiracional de trabajar hacia la inteligencia artificial general) funciona de manera similar a Auto-GPT pero con un sabor diferente orientado a tareas. Puede probar una versión en la web en un sitio no tan modestamente titulado «Modo Dios».
Nakajima, el creador de BabyAGI, nos dice que se inspiró para crear su guión después de presenciar el movimiento «HustleGPT» en marzo, que buscaba usar GPT-4 para construir negocios automáticamente como una especie de cofundador de IA, por así decirlo. «Me dio curiosidad si podía construir un fundador completamente de IA», dice Nakajima.
La razón por la que Auto-GPT y BabyAGI no llegan a AGI se debe a las limitaciones de GPT-4 en sí. Si bien es impresionante como transformador y analizador de texto, GPT-4 todavía se siente restringido a un rango estrecho de inteligencia interpretativa, a pesar de algunas afirmaciones de que Microsoft ha visto «chispas» de comportamientos similares a AGI en el modelo. De hecho, la utilidad limitada de herramientas como Auto-GPT en este momento puede servir como la evidencia más potente hasta el momento de las limitaciones actuales de los grandes modelos de lenguaje. Aún así, eso no significa que esas limitaciones no se superarán eventualmente.
Además, el problema de las confabulaciones, cuando los LLM simplemente inventan cosas, puede resultar una limitación significativa para la utilidad de estos asistentes similares a agentes. Por ejemplo, en un hilo de Twitter, alguien usó Auto-GPT para generar un informe sobre las empresas que fabrican zapatos impermeables buscando en la web y consultando las reseñas de los productos de cada empresa. En cualquier paso del camino, GPT-4 podría tener revisiones, productos o incluso empresas enteras potencialmente «alucinantes» que se incluyeron en su análisis.
Cuando se le preguntó por una aplicación útil de BabyAGI, Nakajima no pudo ofrecer ejemplos sustantivos aparte de «Do Anything Machine», un proyecto creado por Garrett Scott que aspira a crear una lista de tareas pendientes autoejecutable, que actualmente se encuentra en desarrollo. Para ser justos, el proyecto BabyAGI tiene solo una semana. «Es más una introducción a un marco/enfoque, y lo más emocionante es lo que la gente está construyendo sobre esta idea,» él dice.