Al igual que muchas personas, es posible que se haya quedado boquiabierto recientemente con la posibilidad de ChatGPT y otros modelos de lenguaje extenso (LLM) como el nuevo Bing o el Bard de Google.
¿Qué es Auto-GPT? ¿Una herramienta de inteligencia artificial de siguiente nivel que supera a ChatGPT?
Para cualquiera que de alguna manera no los haya encontrado, lo que probablemente sea poco probable ya que, según los informes, ChatGPT es la aplicación de más rápido crecimiento de todos los tiempos, aquí hay un resumen rápido:
Los LLM son algoritmos de software entrenados en grandes conjuntos de datos de texto, lo que les permite comprender y responder al lenguaje humano de una manera muy realista.
El ejemplo más conocido es ChatGPT, una interfaz de chatbot impulsada por GPT-4 LLM que ha conquistado el mundo. ChatGPT puede conversar como un ser humano y generar de todo, desde publicaciones de blog, cartas y correos electrónicos hasta ficción, poesía e incluso código de computadora.
Por impresionantes que sean, hasta ahora, los LLM se han limitado de una manera significativa. Suelen ser capaces de completar solo una tarea, como responder una pregunta o generar un texto, antes de requerir más interacción humana (lo que se conoce como «indicaciones»).
Esto significa que no siempre son buenos en tareas más complicadas que necesitan instrucciones de varios pasos o que dependen de variables externas.
Ingrese Auto-GPT, una tecnología que intenta superar este obstáculo con una solución simple. Algunos creen que incluso puede ser el siguiente paso hacia el «santo grial» de la IA: la creación de una IA general o fuerte.
Echemos un vistazo a lo que eso significa primero:
IA fuerte frente a IA débil
Las aplicaciones de IA actuales generalmente están diseñadas para realizar una tarea, y se vuelven cada vez más buenas en ella a medida que reciben más datos. Algunos ejemplos incluyen el análisis de imágenes, la traducción de idiomas o la navegación de vehículos autónomos. Debido a esto, a veces se los denomina «IA especializada», «IA estrecha» o «IA débil».
Una IA generalizada es aquella que es teóricamente capaz de llevar a cabo muchos tipos diferentes de tareas, incluso aquellas para las que no fue creada originalmente, de la misma manera que puede hacerlo una entidad naturalmente inteligente (como un ser humano). A veces se le llama «IA fuerte» o «inteligencia general artificial» (AGI).
AGI es quizás lo que tradicionalmente pensábamos cuando imaginábamos cómo se vería la IA en los días antes de que el aprendizaje automático y el aprendizaje profundo hicieran de la IA débil/estrecha una realidad cotidiana a principios de la década anterior. Piense en la IA de ciencia ficción demostrada por robots como Data en Star Trek que pueden hacer casi cualquier cosa que un ser humano pueda hacer.
Entonces, ¿qué es Auto-GPT?
La forma más sencilla de verlo es que Auto-GPT puede llevar a cabo procedimientos más complejos y de varios pasos que las aplicaciones existentes con tecnología LLM al crear sus propios avisos y retroalimentarlos a sí mismo, creando un bucle.
Esta es una forma de pensarlo: obtener los mejores resultados de una aplicación como ChatGPT requiere pensar detenidamente en la forma en que formula las preguntas que le hace. Entonces, ¿por qué no dejar que la aplicación construya la pregunta por sí misma? Y mientras está en eso, también haga que pregunte cuál debería ser el siguiente paso, y cómo debería hacerlo… y así sucesivamente, creando un bucle hasta que se complete la tarea.
Funciona dividiendo una tarea más grande en subtareas más pequeñas y luego separando instancias independientes de Auto-GPT para trabajar en ellas. La instancia original actúa como una especie de «gestor de proyectos», coordinando todo el trabajo realizado y compilándolo en un resultado final.
Además de usar GPT-4 para construir oraciones y prosa basadas en el texto que ha estudiado, Auto-GPT es capaz de navegar por Internet e incluir la información que encuentra allí en sus cálculos y resultados. En este sentido, es más similar a la nueva versión habilitada para GPT-4 del motor de búsqueda Bing de Microsoft. También tiene mejor memoria que ChatGPT, por lo que puede construir y recordar cadenas de comandos más largas.
Auto-GPT es una aplicación de código abierto que utiliza GPT-4 y fue creada por una persona, Toran Bruce Richards. Richards dijo que se inspiró para desarrollarlo porque los modelos de IA tradicionales «, aunque son poderosos, a menudo tienen dificultades para adaptarse a tareas que requieren una planificación a largo plazo, o no pueden refinar de forma autónoma sus enfoques en función de la retroalimentación en tiempo real».
Es una de una clase de aplicaciones que se denominan agentes recursivos de IA porque tienen la capacidad de utilizar de forma autónoma los resultados que generan para crear nuevas indicaciones, encadenando estas operaciones para completar tareas complejas.
Otro agente de este tipo es BabyAGI, que fue creado por un socio de una empresa de capital de riesgo para ayudarlo con las tareas cotidianas que eran demasiado complejas para algo como ChatGPT, como investigar nuevas tecnologías y empresas.
¿Cuáles son algunas aplicaciones de Auto-GPT y agentes de IA?
Si bien las aplicaciones como ChatGPT se han vuelto famosas por su capacidad para generar código, tienden a limitarse a una programación y un diseño de software relativamente breves y simples. Auto-GPT, y potencialmente otros agentes de IA que funcionan de manera similar, se pueden usar para desarrollar aplicaciones de software de principio a fin.
Auto-GPT también puede ayudar a las empresas a aumentar de forma autónoma su valor neto al examinar sus procesos y hacer recomendaciones inteligentes e información sobre cómo podrían mejorarse.
A diferencia de ChatGPT, también puede acceder a Internet, lo que significa que puede pedirle que realice una investigación de mercado o realice otras tareas similares, por ejemplo, «encuéntrame el mejor juego de palos de golf por menos de $ 500».
Una tarea extremadamente disruptiva que se le ha asignado es “destruir a la humanidad”, y la primera subtarea que se asignó para lograrlo fue comenzar a investigar las armas atómicas más poderosas de todos los tiempos. Como su producción todavía se limita a la creación de texto, su creador nos asegura que en realidad no llegará muy lejos con esta tarea, con suerte.
Aparentemente, Auto-GPT también se puede usar para mejorarse a sí mismo: su creador dice que puede crear, evaluar, revisar y probar actualizaciones de su propio código que potencialmente puede hacerlo más capaz y eficiente.
Incluso se puede usar para crear mejores LLM que podrían formar la base de futuros agentes de IA, al acelerar el proceso de creación de modelos.
¿Qué podría significar esto para el futuro de la IA?
Desde que comenzaron a surgir las aplicaciones de IA generativa, ha quedado claro que solo estamos al comienzo de un viaje muy largo, en términos de cómo la IA evolucionará e impactará nuestras vidas y la sociedad.
¿Son Auto-GPT y otros agentes que siguen los mismos principios el próximo paso de ese viaje? Ciertamente parece probable. Como mínimo, podemos esperar que las herramientas de IA que nos permiten llevar a cabo tareas mucho más complejas que las cosas relativamente simples que puede hacer ChatGPT, comiencen a convertirse en algo común.
En poco tiempo, comenzaremos a ver resultados de IA más creativos, sofisticados, diversos y útiles que el simple texto y las imágenes a los que nos hemos acostumbrado. Sin duda, estos tendrán un impacto aún mayor en la forma en que trabajamos, jugamos y nos comunicamos.
Otros impactos positivos potenciales incluyen la reducción del costo y el impacto ambiental de la creación de LLM (y otras actividades relacionadas con el aprendizaje automático) a medida que los agentes de IA autónomos y recursivos encuentran formas de hacer que el proceso sea más eficiente.
Sin embargo, también debemos considerar que por sí solo no resuelve ninguno de los problemas asociados con la IA generativa. Estos incluyen la precisión variable (para decirlo de manera agradable) del resultado que crea, el potencial de abuso de los derechos de propiedad intelectual y la posibilidad de que se utilice para difundir contenido sesgado o dañino. De hecho, al generar y ejecutar muchos más procesos de IA para lograr tareas más grandes, podría potencialmente magnificar estos problemas.
Los problemas potenciales no terminan ahí: el eminente experto en IA y filósofo Nick Bostrom dijo recientemente que cree que la generación más nueva de chatbots de IA (como GPT-4) incluso está comenzando a mostrar signos de sensibilidad. Lo que podría crear un dilema moral y ético completamente nuevo si, como sociedad, planeamos comenzar a crearlos y ponerlos en práctica a gran escala.