¿Una nueva cadena de bloques para la IA generativa?

La inteligencia artificial generativa (IA) se ha convertido rápidamente en una de las tendencias tecnológicas más populares y posiblemente más transformadoras de las últimas décadas. El impacto de la IA generativa es evidente en todas las áreas de la pila tecnológica, desde la infraestructura hasta las aplicaciones.

Desde el lanzamiento de ChatGPT y el posterior GPT-4, la comunidad Web3 ha estado especulando sobre la posible intersección de la IA generativa y Web3. Si bien hay muchos casos de uso obvios, como billeteras conversacionales o exploración de idiomas, hay tesis más sofisticadas que vale la pena explorar.

Jesús Rodríguez es el CEO de IntoTheBlock.

¿Qué pasa si la IA generativa merece su propia cadena de bloques?

Impulso de código abierto versus control centralizado

Para analizar la viabilidad de una cadena de bloques para la IA generativa, es importante comprender el estado actual de las cosas con respecto a los modelos básicos, en particular la aparición de alternativas de código abierto a la tecnología basada en API como GPT-4, y las crecientes preocupaciones en torno al control centralizado. de esos modelos de fundación.

Hasta hace unos meses, la brecha entre los modelos básicos basados en API y los de código abierto era significativa. Modelos como GPT-4 de OpenAI, Claude de Anthropic en el espacio lingüístico, DALL-E y Midjourney en el espacio de visión artificial parecían significativamente avanzados en comparación con las alternativas de código abierto. Sin embargo, un cambio comenzó a ocurrir a fines del año pasado con el sorprendente lanzamiento de código abierto de Stable Diffusion, que brindó una alternativa viable a los modelos de texto a imagen basados en API. A pesar de esto, los modelos de lenguaje grande (LLM) continuaron siendo el punto focal de la IA generativa y, en ese dominio, los modelos de código abierto palidecieron en comparación con las alternativas basadas en API en términos de calidad.

A principios de este año, Meta AI Research publicó un artículo que presentaba LLaMA, un LLM que igualaba el rendimiento de GPT-3 y era significativamente más pequeño. Inicialmente, el modelo no estaba destinado a ser de código abierto, pero sucedió algo inesperado. Una semana después de su publicación, el modelo se filtró en 4chan y miles de personas lo descargaron rápidamente. El «accidente» de LLaMA hizo que un LLM básico estuviera disponible para cualquiera y provocó un impulso inesperado en la innovación de código abierto.

Poco después de la filtración, comenzaron a surgir por todas partes nuevos modelos de base de código abierto con divertidos nombres de animales. La Universidad de Stanford lanzó Alpaca, Databricks presentó a Dolly, Koala de código abierto de la Universidad de Berkeley, UC Berkeley y la Universidad Carnegie Mellon colaboraron en el lanzamiento de Vicuna, Juntos anunciaron el proyecto Red Pajama, y la lista continúa. Stable Diffusion y LLaMA han ayudado a cambiar la escala de la IA generativa de código abierto y han generado un impulso significativo. Además, los modelos básicos de código abierto están cerrando rápidamente la brecha con los titulares comerciales en términos de calidad.

Otro factor que contribuye a la aparición de una cadena de bloques de IA generativa es la preocupación por la falta de transparencia y el control centralizado de los modelos básicos. El tamaño y la complejidad de las arquitecturas neuronales que impulsan los modelos básicos hacen que la interpretación exacta sea casi imposible. Como resultado, la industria debe confiar en pasos intermedios como arquitecturas más abiertas y una regulación cuidadosa. Que unas pocas entidades centralizadas controlen los modelos más poderosos del mercado agrega otra capa de preocupación con respecto a la viabilidad de lograr una rendición de cuentas, transparencia e interpretabilidad reales en la IA generativa.

Leer más: Jesús Rodríguez – El próximo ChatGPT no estará en Web3 a menos que cambien algunas cosas

La combinación de la innovación de código abierto en los modelos básicos y la creciente preocupación por el control centralizado en el campo crea una ventana de oportunidad única para las arquitecturas Web3. La abundancia de modelos de código abierto de alta calidad reduce las barreras para la adopción en las plataformas Web3. Resolver los riesgos de transparencia y control en la IA generativa está lejos de ser trivial, pero no hay duda de que las arquitecturas de cadenas de bloques poseen propiedades clave que pueden ayudar en esta área.

Construyendo una base de IA generativa en Web3

La explosión de la innovación en los modelos básicos de código abierto ha reducido significativamente la barrera de entrada para que las plataformas Web3 incorporen capacidades de IA generativa. La adopción de modelos básicos en las plataformas Web3 puede seguir dos caminos fundamentales y probablemente secuenciales:

Creación de DApps que permiten capacidades inteligentes impulsadas por IA generativa.
Construir nuevas plataformas Web3 diseñadas con IA generativa como componente fundamental.

En el primer escenario, es probable que veamos herramientas como intercambios, exploradores o billeteras que incorporan capacidades de conversación impulsadas por grandes modelos de lenguaje. Además, se construirá una nueva generación de DApps con modelos generativos como piedra angular. En este escenario, Web3 actúa principalmente como un consumidor de capacidades de IA generativa, con modelos que se ejecutan en infraestructuras de nube tradicionales de Web2.

Surgen alternativas más intrigantes cuando se consideran plataformas Web3 que pueden admitir de forma inherente modelos generativos de IA. Imagine modelos básicos de código abierto como LLaMA, Dolly o Alpaca ejecutándose en nodos dentro de una cadena de bloques distribuida. La realización final de esta visión es una cadena de bloques diseñada específicamente para la IA generativa.

El concepto de una nueva cadena de bloques optimizada para un paradigma tecnológico como la IA generativa puede sonar atractivo, pero es innegablemente controvertido. Después de todo, no se crearon nuevas cadenas de bloques únicamente para DeFi o NFT. Entonces, ¿qué hace que la IA generativa sea tan diferente?

La respuesta radica en el desajuste arquitectónico entre los requisitos para ejecutar modelos básicos y tiempos de ejecución de blockchain. Un modelo básico preentrenado típico consta de millones de neuronas repartidas en decenas de miles de capas interconectadas, que se ejecutan en clústeres de GPU o topologías de hardware de aprendizaje profundo especializadas. Ningún contrato inteligente en la historia de Web3 se acerca a ese nivel de complejidad. Por lo tanto, es lógico concluir que se necesita un nuevo tipo de arquitectura. Incluso las infraestructuras Web2 están evolucionando para admitir modelos de IA generativos a gran escala, lo que ilustra la magnitud de los cambios necesarios en las arquitecturas Web3.

Al contemplar una nueva cadena de bloques para la IA generativa, las posibilidades parecen infinitas. Pero, la iteración más simple de esta idea debería abarcar un conjunto de capacidades básicas. La capacidad de ejecutar nodos que ejecutan modelos básicos es fundamental para una cadena de bloques dedicada a la IA generativa. Lo mismo se aplica a la capacidad de ejecutar flujos de trabajo de preentrenamiento, ajuste y de inferencia, que son las tres etapas principales en el ciclo de vida de los modelos básicos. La publicación y el intercambio de conjuntos de datos utilizados para el entrenamiento previo o el ajuste fino de los modelos también es una función deseada. Una vez que establecemos un tiempo de ejecución de blockchain como la capa fundamental, se pueden habilitar numerosas capacidades en las áreas de transparencia e interpretabilidad. Por ejemplo, podemos imaginar un protocolo de prueba de conocimiento que ofrezca transparencia con respecto a los pesos específicos de un modelo, validando que se usaron conjuntos de datos no tóxicos o sesgados para el entrenamiento previo.

¿Por qué una nueva cadena de bloques?

El concepto de una cadena de bloques especializada para la IA generativa es tentador, pero ¿es realmente necesario? Hay una propuesta de valor válida en la integración de las capacidades generativas de IA en los tiempos de ejecución de blockchain existentes. Sin embargo, la historia del software demuestra una tendencia recurrente de nuevos paradigmas de arquitectura que influyen en las tecnologías de infraestructura. Tendencias recientes como la computación en la nube o el big data sirven como ejemplo. Los modelos básicos representan paradigmas de arquitectura fundamentalmente diferentes que probablemente requieran infraestructuras de blockchain más especializadas para operar de manera efectiva.

Además, no podemos pasar por alto el potencial de la IA generativa para transformar las capas inferiores de la pila de blockchain. No es descabellado imaginar una cadena de bloques de prueba de participación donde los validadores procesen transacciones basadas en lenguaje natural. Del mismo modo, los contratos inteligentes podrían utilizar el lenguaje como medio fundamental para intercambiar mensajes.

La IA generativa tiene el potencial de impulsar cambios en toda la pila de blockchain. Desde esta perspectiva, parece lógico adoptar un enfoque de primeros principios al habilitar un nuevo tiempo de ejecución con la flexibilidad para incorporar estos cambios.

El riesgo de ignorar la IA generativa en Web3

De hecho, la idea de una cadena de bloques de IA generativa puede ser controvertida y no está exenta de desafíos. Sin embargo, animo a explorar esta idea usando un argumento negativo vía.

¿Qué podría pasar si nos negamos a construir nuevas cadenas de bloques para la IA generativa?

Actualmente, la IA generativa ha creado una brecha tecnológica significativa entre las arquitecturas Web2 y Web3. Esta brecha continúa ampliándose ante la ausencia de capacidades nativas de IA generativa en Web3. La IA generativa está remodelando aspectos fundamentales del desarrollo de software, y están surgiendo rápidamente nuevos marcos y plataformas para respaldar este cambio de paradigma.

Desarrollar capacidades nativas de IA generativa es nada menos que un desafío existencial para Web3, ya que es crucial para permitir nuevas oleadas de innovación en el campo. Una cadena de bloques de IA generativa nativa representa solo uno de los muchos enfoques que pueden facilitar esta transición al mundo de los modelos básicos. La construcción de una nueva cadena de bloques conlleva numerosos desafíos, pero la rápida evolución de los tiempos de ejecución L2, las plataformas como Cosmos y la aparición de ecosistemas L1 de alto rendimiento como Aptos o Sui hacen que la posibilidad de una cadena de bloques de IA generativa sea mucho más factible que en años anteriores.