de Tom Cruise Misión: Imposible – Tiempo muerto muestra al mundo cómo la IA puede ser el villano perfecto. Mientras La entidad, el antagonista sin rostro de la película, manipula el curso de la humanidad, los grandes tecnológicos avanzan poco a poco hacia AGI en la vida real y se esfuerzan mucho por construir una entidad más segura. Pero, aquí hay un jinete: todos todavía están descifrando lo que creen que los llevará hacia él.
A cada cual lo suyo
“La misión de OpenAI es garantizar que la inteligencia general artificial (AGI), por lo que nos referimos a sistemas altamente autónomos que superan a los humanos en el trabajo económicamente más valioso, beneficie a toda la humanidad”, — Carta OpenAI 2018.
OpenAI ha sido claro desde el principio al definir sus objetivos y AGI es su misión. El CEO Sam Altman dice que los LLM podrían allanar el camino para construir un AGI. También cree que esta entidad no tendrá un cuerpo. “Aquí nos adentramos en lo desconocido”, dijo Altman, en el podcast de Lex Fridman. “Para mí, un sistema que no puede agregar significativamente a la suma total del conocimiento científico al que tenemos acceso, descubrir, inventar, como quieras llamarlo, nueva ciencia fundamental, no es una súper inteligencia”, dijo Altman.
Dijo además que existe la posibilidad de que GPT-10 pueda evolucionar hacia un verdadero AGI con solo unas pocas ideas innovadoras. Sin embargo, él cree que la verdadera emoción radica en que la IA actúa como una herramienta que participa en un ciclo de retroalimentación humana, actuando como una extensión de la voluntad humana y amplificando sus capacidades.
Confianza en el modelo de las grandes tecnologías
* Los pesos se han proporcionado en función del uso de cada tipo de modelo/funcionalidad
El modelo de hierro de los transformadores
La dedicación de OpenAI para construir una lista exhaustiva de modelos de transformadores entrenados en grandes conjuntos de datos es probablemente su clave para desbloquear AGI, ya que incluso Sam Altman cree que LLM podría ser «una parte del camino para construir un AGI». También siente que la expansión del paradigma GPT en formas importantes ayudará, pero no sabe cuáles son esas formas.
El modelo de transformador es la arquitectura de red neuronal clave para los modelos OpenAI GPT. Desde el primer modelo GPT en 2018 que fue entrenado en aprox. 117 millones de parámetros para el último modelo GPT-4 lanzado en marzo de este año, cuyos parámetros, aunque no confirmados, el GPT 3.5 anterior se entrenó en 175 mil millones de parámetros, OpenAI se ha estado enfocando a través de la forma LLM. La lista de modelos de transformadores de la empresa se extiende incluso a los modelos de texto a imagen DALL-E y DALL-E-2, Whisper de voz a texto y Jukebox de texto a música.
El aprendizaje de refuerzo todo y poderoso
El CEO de Google DeepMind, Demis Hassabis, cree que con el progreso que está ocurriendo, AGI está a solo unos años de distancia, tal vez dentro de los próximos diez años. Sin embargo, prevé incertidumbres ya que se requiere una exploración cuidadosa en el campo.
Jurando por aprendizaje reforzado, un método que aprende a través del proceso de prueba y error, Google DeepMind tiene la corona. Con modelos como AlphaFold, AlphaZero y otros, DeepMind también cree que la maximización de la recompensa total podría ser suficiente para comprender la inteligencia y sus habilidades asociadas, y esa recompensa es suficiente para alcanzar la inteligencia artificial general.
Si bien DeepMind ha tenido su parte de las conversaciones de AGI, Sundar Pichai cree que la carrera no es una prioridad. “Si bien algunos han tratado de reducir este momento a solo una carrera competitiva de IA, lo vemos como mucho más que eso”. También mencionó que su énfasis está en la carrera para construir IA de manera responsable y asegurarse de que «como sociedad lo hagamos bien».
La viuda negra del aprendizaje autosupervisado
«No creo que tenga una idea particular sobre cuándo se creará un sistema de IA singular que es una inteligencia general». – Mark Zuckerberg cuando se le preguntó sobre los plazos de AGI en el podcast de Lex Fridman.
Yann LeCun de Meta dijo que el aprendizaje supervisado y el aprendizaje reforzado no conducirán a AGI ya que estos enfoques son inadecuados para desarrollar sistemas capaces de razonar con conocimiento de sentido común sobre el mundo. Él cree que el aprendizaje autosupervisado es el camino hacia AGI.
Este método no se basa en datos que han sido etiquetados por humanos con fines de capacitación; en su lugar, se entrena con datos completamente nuevos o sin etiquetar. Ha habido resultados prometedores con modelos de comprensión del lenguaje autosupervisados, bibliotecas, marcos que han superado los modelos tradicionales y totalmente supervisados. Desde 2013, la empresa ha ampliado sus esfuerzos de investigación hacia el aprendizaje autosupervisado.
El Camino de Ultrón
Con el último lanzamiento de xAI, Musk busca construir una ‘buena AGI’ con el propósito de ‘comprender el universo’. Musk explica cómo construir una IA que se preocupe por comprender el universo «probablemente aniquile a los humanos porque somos una parte interesante del universo». También predice que el AGI se logrará para 2029.
Mientras que otros se están moviendo hacia AGI con una forma sin cuerpo, la inversión de Musk en todo lo relacionado con la robótica es probablemente un reflejo de cómo una forma física puede ser la respuesta. En el Día de la IA de Tesla, el año pasado, se presentó un prototipo funcional del robot Optimus, que funciona con la misma computadora autónoma que hace funcionar los autos Tesla. Musk creía que estos avances algún día contribuirían a AGI.
Shape Shifters de Multimodalidad
Google y OpenAI (aunque no en gran medida) han incorporado funciones de multimodalidad en sus modelos. PaLM-E, MedPalM-2 de Google tienen capacidades multimodales. La arquitectura CLIP basada en transformadores de OpenAI, lanzada en enero de 2021, procesa descripciones textuales asociadas con imágenes y realiza un aprendizaje de disparo cero para la clasificación de imágenes y la detección de objetos. GPT-4 admite la carga de imágenes y la aplicación ChatGPT admite comandos de voz a través de la integración de Whisper.
También hay una serie de otros modelos que están bajo investigación que pueden tener un papel futuro para ayudar a las empresas a lograr AGI; la causalidad es uno de ellos. Se cree que trae una gran transformación, la causalidad se refiere a la relación entre causa (lo que hacemos) y efecto (lo que sucede como resultado) donde las máquinas intentan aprender como nosotros.
Un adivino para navegar el laberinto
Sam Altman está arriba Pío sobre la prueba de la última función de instrucciones personalizadas fue demasiado específica. Recurrir a ChatGPT para abrir un camino hacia la superinteligencia puede ser un número lúdico, pero al observar la interpretación de los líderes tecnológicos de AGI y la superinteligencia, su ambigüedad al respecto es muy clara. Sin embargo, su enfoque para llegar allí, ya sea intencionalmente o no, es diferente y está alineado con lo que parecen encajar con los objetivos de la empresa a largo plazo.
Al igual que ellos, parece oscuro quién podría terminar primero en la carrera AGI. Cada una de las compañías discutidas aquí ha empleado diferentes modelos, pero su confianza en cada uno es de diversos grados. Sin embargo, la enorme dependencia de OpenAI de los modelos de lenguaje transformador y el hecho de que el objetivo principal de OpenAI en sí era AGI, la empresa podría estar a la vanguardia de la llamada carrera AGI.