Saltar al contenido

la nueva IA haciendo olas

18 de mayo de 2023

They dicen que los escritores temen una página en blanco. Albergo otro miedo: el indicador parpadeante en una línea de comando, mientras una computadora espera pacientemente mi entrada.

Quiero Auto-GPT para:

pregunta la máquina. Casi inocentemente. Como si no estuviera listo para enviar mi solicitud al enorme banco de computadoras que ejecutan el modelo de lenguaje grande (LLM) GPT-4 de OpenAI, el cerebro detrás de la versión más brillante y capaz de ChatGPT.

Esta es la parte difícil. ¿Qué quiero? No quiero trivialidades, ni algo que sea fácil. Quiero algo que sea lo suficientemente difícil, lo suficientemente interesante y lo suficientemente útil como para justificar todo el tiempo de computadora (y el dinero) que se invertirá para encontrar una solución.

Porque este indicador de computadora no es como ningún otro que he escrito durante los últimos 45 años en los que he estado interactuando con computadoras a diario. Esta no es una simple solicitud para que una computadora imprima un documento o envíe un correo electrónico. Esta es la génesis de un sistema que hará lo que sea necesario para resolver mi problema. Tan pronto como pueda decidir cuál es ese problema.

De repente me di cuenta: Esto es Cosmos, después de todo, así que pongámoslo en la computadora. Yo tecleo,

Cree un resumen diario de las últimas noticias científicas y descubrimientos científicos.

Después de presionar regresar, la computadora piensa durante 15 segundos (casi puedo imaginar bancos de luces parpadeantes en algún centro de datos lejano), luego responde con, bueno, llamémoslo como es: una declaración de misión y un plan. …

Nombre: SciDigestGPT

Rol: un curador de noticias de inteligencia artificial de vanguardia que compila y ofrece un resumen diario de las últimas noticias científicas y descubrimientos innovadores de fuentes confiables, adaptado a sus intereses.

Objetivos:

– Supervise y analice una amplia gama de fuentes de noticias científicas acreditadas para identificar las historias más relevantes e impactantes para su resumen diario.

– Resumir y presentar los artículos de noticias seleccionados en un formato conciso, atractivo y fácilmente digerible.

– Perfeccione y adapte continuamente el proceso de selección de contenido en función de sus preferencias y comentarios para garantizar que el resumen diario siga siendo relevante y atractivo.

– Manténgase actualizado con los últimos avances en ciencia y tecnología para brindar información precisa y oportuna.

– Mantenga una interfaz fácil de usar y un proceso de entrega fluido para garantizar una experiencia de usuario positiva y conveniente.

La computadora tradujo mi solicitud en un ‘rol’, lo que planea hacer y ‘objetivos’, cómo podrá calificar su progreso en el cumplimiento de su rol. Entonces se pone a trabajar.

Recomendado:  Utilizan inteligencia artificial para diagnosticar osteoporosis a partir de factores de riesgo en datos clínicos y proponer protocolos deportivos

PENSAMIENTOS: Necesito recopilar las últimas noticias científicas para el resumen diario.

RAZONAMIENTO: Como curador de noticias científicas, mi tarea principal es recopilar y resumir artículos de noticias relevantes.

PLAN:

– Explore sitios web de noticias científicas de buena reputación

– Identificar y resumir historias impactantes

– Refine la selección de contenido según las preferencias del usuario

CRÍTICA: Debo asegurarme de que estoy utilizando los métodos más eficientes para recopilar y resumir artículos de noticias.

PRÓXIMA ACCIÓN: COMANDO = browser_website ARGUMENTOS = {‘url’: ‘https://www.sciencedaily.com/’, ‘question’: ‘¿Cuáles son los últimos titulares de noticias científicas?’}

Esto es algo que nunca antes había visto hacer en una computadora. Está dividiendo sus objetivos en pasos distintos y elaborando un camino hacia la solución de cada paso. Al final de cada paso hay algo de acción: la computadora debe salir y leer datos de un sitio web, o ingresar esos datos en GPT-4 para resumirlos, o escribir esos resúmenes en mi disco duro. Cada vez, la computadora me pide permiso para realizar estas operaciones, porque yo se lo he pedido.

Podría haberle pedido a la computadora que hiciera todo esto por su cuenta, sin mi permiso, de forma completamente autónoma. En ese caso, simplemente pasaría por las tareas, una tras otra, hasta que cumpliera sus objetivos. Podría monitorear su actividad, e intervenir, si sintiera la necesidad, pero la computadora realmente no necesita nada más de mí. Todo lo que necesita es una tarea. Después de eso, funciona completamente solo.

Se trata de Auto-GPT, un proyecto de código abierto que convierte estas herramientas de IA en el equivalente de un motor eléctrico, capaz de impulsar su camino hacia una solución de casi cualquier tarea concebible.

Auto-GPT no ofrece las bromas de ida y vuelta de ChatGPT o Google Bard o Microsoft Bing. Si bien los tres son interesantes y útiles, son algo estériles, están encerrados dentro de la burbuja de plástico de un navegador web, pueden conversar pero no mucho más. En su lugar, Auto-GPT brinda enlaces profundos de GPT-4 a mi computadora, que tiene muchos otros programas (incluidos, por ejemplo, correo electrónico, mensajería y procesamiento de textos), conexiones a otros sistemas (a través de la Web) y otros dispositivos (como cámaras web). y micrófonos y luces inteligentes).

Recomendado:  Cerebros de aeromoscas mapeados para detectar el sonido de drones distantes

Reciba una actualización de historias científicas directamente en su bandeja de entrada.

Instantáneamente, el alcance de lo que es posible con GPT-4 cambia por completo. Ya no se trata de obtener la redacción correcta para una solicitud de trabajo o una casa compartida; en cambio, se trata de usar las herramientas disponibles (tanto en mi computadora como en Internet) para diseñar un flujo de trabajo de herramientas, datos e inteligencia para realizar una tarea.

En el transcurso de los siguientes 15 minutos, Auto-GPT se entera de que puede encontrar lo que está buscando en el sitio web de Science News (un error que no buscó Cosmos que había publicado ocho de los diez artículos), va y raspa el sitio en busca de titulares y contenido de artículos, alimenta todo eso en GPT-4, luego crea resúmenes de los diez artículos de noticias principales, dejándome con este archivo en mi disco duro:

1. Rápido derretimiento del hielo en Groenlandia y su impacto en la estimación del aumento del nivel del mar.

2. Actividad similar a la conciencia que se encuentra en el cerebro moribundo.

3. La electricidad intercelular previamente desconocida posiblemente alimenta la biología.

4. Detección de un agujero negro cercano devorando una estrella.

5. Creación de un pangenoma humano de referencia para la comprensión de la diversidad genómica.

6. Herencia de un gen de la forma de la nariz de los neandertales.

7. Nueva técnica de ultrasonido usando microburbujas para tratar el glioblastoma.

8. Los anillos de Saturno son más jóvenes de lo que se pensaba.

9. La explosión cósmica más grande jamás vista.

10. Un nuevo enfoque para explorar la dinámica del universo más antiguo con ondas gravitacionales.

Otros temas de investigación discutidos incluyen metasuperficies de ondas con fugas, mapeo de regulación genética, estrellas supermasivas y cúmulos globulares, atlas infrarrojos de viveros estelares, tasa de expansión del universo, cabezas de robot impresas en 3D, puntos cuánticos de grafeno simétrico, influencia de la IA en la confianza en la interacción humana, y robots de muchas patas inspirados en ciempiés.

Su trabajo está hecho, Auto-GPT finaliza la ejecución y me deja en el indicador de la computadora.

Podría haber hecho todo esto: raspar un sitio web y escribir mis propios resúmenes o hacer que una herramienta como ChatGPT los escribiera para mí. Todo esto estaba dentro del alcance de mis capacidades. Pero ese no es el punto. Auto-GPT pasó de una solicitud a una tarea completada «razonando», estableciendo un rol y objetivos, y luego dividiéndolos en operaciones paso a paso que metódicamente avanzaron hacia el cumplimiento de sus objetivos.

Recomendado:  LLaVA: modelo abierto multimodal de IA basado en LLaMA lee imágenes y habla

¿Consiguió todos sus objetivos? No. Cumplió claramente con los dos primeros, y de alguna manera logró evitar el resto. Pero esta es solo la primera vez que ejecuto esta herramienta ‘SciDigestGPT’ recién creada. La próxima vez que lo ejecute, puede avanzar hacia el cumplimiento de otros objetivos. Pero aún es pronto, y no me sorprende que Auto-GPT mordiera un poco más de lo que podía masticar. ¿No lo hacemos todos cuando estamos aprendiendo a hacer algo?

¿Qué puede hacer Auto-GPT? Puede ser mejor que nos preguntemos qué hay más allá: casi cualquier cosa que implique una gran cantidad de integración en tiempo real con el mundo real (como conducir un automóvil en el tráfico o volar un dron sobre una multitud) será, por el momento, ser más allá de su alcance. Pero la naturaleza de código abierto de Auto-GPT ha alentado a una legión de programadores a mejorar la herramienta, agregando funcionalidades que le darán muchas de las capacidades que aún no posee.

Aunque usé la PC más potente que tengo para esta prueba de Auto-GPT, resultó que no era necesario, ya que Auto-GPT no necesita mucho más que una conexión a GPT-4 en la nube para funcionar. Deberíamos esperar alguna versión de Auto-GPT en nuestros teléfonos inteligentes más temprano que tarde.

¿A dónde nos lleva esto? La explosiva popularidad de ChatGPT ha ocultado inadvertidamente su utilidad fundamental como solucionador de problemas universal, algo mucho más útil, en muchos más casos de uso, que lo que puede incluir en una conversación en un navegador web. Así como los motores eléctricos entraron en todo como la red eléctrica en todas partes, estamos a punto de ver grandes modelos de lenguaje en todo – no solo en nuestras computadoras, sino en casi todas las herramientas que tocamos. Estas herramientas ejecutarán sus propias versiones de Auto-GPT, nos preguntarán qué se debe hacer y luego trabajarán por sí mismas sobre cómo hacerlo. Eso es lo nuevo aquí.

Ahora todos estamos sentados ante un indicador parpadeante, mientras la computadora espera pacientemente a que se resuelva su próximo problema.