La IA generativa es la nueva tecnología de moda detrás de los chatbots y los generadores de imágenes. Pero, ¿qué tan caliente está haciendo el planeta?
Como investigador de IA, a menudo me preocupo por los costos energéticos de construir modelos de inteligencia artificial. Cuanto más poderosa es la IA, más energía consume. ¿Qué significa la aparición de modelos de IA generativa cada vez más potentes para la huella de carbono futura de la sociedad?
«Generativo» se refiere a la capacidad de un algoritmo de IA para producir datos complejos. La alternativa es la IA «discriminativa», que elige entre un número fijo de opciones y produce un solo número. Un ejemplo de un resultado discriminatorio es elegir si se aprueba una solicitud de préstamo.
La IA generativa puede crear resultados mucho más complejos, como una oración, un párrafo, una imagen o incluso videos cortos. Se ha utilizado durante mucho tiempo en aplicaciones como altavoces inteligentes para generar respuestas de audio o en autocompletar para sugerir una consulta de búsqueda. Sin embargo, solo recientemente obtuvo la capacidad de generar un lenguaje humano y fotos realistas.
Usando más energía que nunca
La creación de un modelo de IA llamado BERT absorbió la energía equivalente a un vuelo internacional de ida y vuelta.
Olga Pankova/Momento/Getty Images
El costo de energía exacto de un solo modelo de IA es difícil de estimar e incluye la energía utilizada para fabricar el equipo informático, crear el modelo y utilizar el modelo en producción. En 2019, los investigadores descubrieron que crear un modelo de IA generativo llamado BERT con 110 millones de parámetros consumía la energía de un vuelo transcontinental de ida y vuelta para una persona.
El número de parámetros se refiere al tamaño del modelo, siendo generalmente los modelos más grandes los más hábiles. Los investigadores estimaron que crear el GPT-3 mucho más grande, que tiene 175 mil millones de parámetros, consumió 1287 megavatios hora de electricidad y generó 552 toneladas de dióxido de carbono equivalente, el equivalente a 123 vehículos de pasajeros a gasolina conducidos durante un año. Y eso es solo para preparar el modelo para su lanzamiento antes de que los consumidores comiencen a usarlo.
El tamaño no es el único predictor de las emisiones de carbono. El modelo BLOOM de acceso abierto, desarrollado por el proyecto BigScience en Francia, es similar en tamaño a GPT-3 pero tiene una huella de carbono mucho menor, ya que consume 433 MWh de electricidad para generar 30 toneladas de CO2eq.
Un estudio realizado por Google descubrió que para el mismo tamaño, el uso de una arquitectura y un procesador modelo más eficientes y un centro de datos más ecológico puede reducir la huella de carbono entre 100 y 1000 veces.
Los modelos más grandes usan más energía durante su implementación. Hay datos limitados sobre la huella de carbono de una sola consulta de IA generativa, pero algunas cifras de la industria estiman que es de cuatro a cinco veces mayor que la de una consulta de motor de búsqueda. A medida que los chatbots y los generadores de imágenes se vuelven más populares, y Google y Microsoft incorporan modelos de lenguaje de IA en sus motores de búsqueda, la cantidad de consultas que reciben cada día podría crecer exponencialmente.
Bots de IA para búsqueda
ChatGPT tuvo más de 1500 millones de visitas en marzo de 2023.
Imágenes SOPA/LightRocket/imágenes Getty
Hace unos años, no mucha gente fuera de los laboratorios de investigación usaba modelos como BERT o GPT. Eso cambió el 30 de noviembre de 2022, cuando OpenAI lanzó ChatGPT. Según los últimos datos disponibles, ChatGPT tuvo más de 1500 millones de visitas en marzo de 2023.
Microsoft incorporó ChatGPT en su motor de búsqueda, Bing, y lo puso a disposición de todos el 4 de mayo de 2023. Si los chatbots se vuelven tan populares como los motores de búsqueda, los costos de energía para implementar las IA realmente podrían aumentar. Pero los asistentes de IA tienen muchos más usos que solo buscar, como escribir documentos, resolver problemas matemáticos y crear campañas de marketing.
Otro problema es que los modelos de IA deben actualizarse continuamente. Por ejemplo, ChatGPT solo se entrenó con datos de hasta 2021, por lo que no sabe nada de lo que ha sucedido desde entonces. La huella de carbono de crear ChatGPT no es información pública, pero es probable que sea mucho más alta que la de GPT-3. Si tuviera que ser recreado regularmente para actualizar su conocimiento, los costos de energía aumentarían aún más.
Una ventaja es que preguntarle a un chatbot puede ser una forma más directa de obtener información que usar un motor de búsqueda. En lugar de obtener una página llena de enlaces, obtiene una respuesta directa como lo haría con un ser humano, suponiendo que se mitiguen los problemas de precisión. Llegar a la información más rápido podría compensar potencialmente el mayor uso de energía en comparación con un motor de búsqueda.
Caminos a seguir
El futuro es difícil de predecir, pero los grandes modelos generativos de IA llegaron para quedarse, y es probable que la gente recurra cada vez más a ellos en busca de información. Por ejemplo, si un estudiante necesita ayuda para resolver un problema de matemáticas ahora, le pregunta a un tutor oa un amigo o consulta un libro de texto. En el futuro, probablemente le preguntarán a un chatbot. Lo mismo ocurre con otros conocimientos especializados, como el asesoramiento jurídico o la experiencia médica.
Si bien un solo modelo grande de IA no arruinará el medio ambiente, si mil empresas desarrollan bots de IA ligeramente diferentes para diferentes propósitos, cada uno utilizado por millones de clientes, el uso de energía podría convertirse en un problema. Se necesita más investigación para hacer que la IA generativa sea más eficiente.
La buena noticia es que la IA puede funcionar con energía renovable. Llevando el cómputo a donde la energía verde es más abundante o programando el cómputo para los momentos del día en que la energía renovable está más disponible, las emisiones pueden reducirse en un factor de 30 a 40, en comparación con el uso de una red dominada por combustibles fósiles.
Finalmente, la presión social puede ser útil para alentar a las empresas y los laboratorios de investigación a publicar las huellas de carbono de sus modelos de IA, como ya lo hacen algunos. En el futuro, tal vez los consumidores podrían incluso usar esta información para elegir un chatbot «más ecológico».
Este artículo fue publicado originalmente en La conversación por Kate Saenko en la Universidad de Boston. Lee el artículo original aquí.