La creatividad se ha definido como el uso de la imaginación o de ideas originales, especialmente en la producción de una obra artística. Si bien se puede debatir la fuente del desarrollo de esas ideas (la creatividad surge del corazón, el cerebro, el alma o las propias experiencias), se ha aceptado en gran medida que solo los humanos poseen la capacidad de crear verdaderamente.
El surgimiento de las computadoras y la inteligencia artificial (IA) ha llevado a sistemas que, alimentados con una cantidad suficiente de datos de entrenamiento, pueden imitar la producción de un escritor, artista o músico creativo, invadiendo así el monopolio de los humanos sobre el proceso creativo. Las técnicas de inteligencia artificial se pueden usar para crear nuevas ideas de diferentes maneras, como producir combinaciones únicas de ideas familiares, crear nuevos trabajos basados en los atributos de trabajos anteriores y ofreciendo nuevas ideas basadas en combinaciones de atributos e ideas que los humanos puede que no hayas pensado durante la creación de una nueva obra.
Un ejemplo notable del poder de la IA para generar el llamado trabajo «creativo» se demostró en 2016 cuando se utilizó la plataforma IBM Watson AI para crear un tráiler de película para 20el La película de terror de Century Fox, morgan. Watson, el primer ejemplo de un tráiler creado únicamente por IA, se utilizó para analizar las imágenes, el sonido y la composición de cientos de tráileres de películas de terror existentes, y luego seleccionó escenas del completo. morgan película para que los editores la mezclen en un tráiler. El uso de IA para analizar escenas y crear un tráiler al estilo de otras películas de terror ayudó a reducir la cantidad de tiempo que los editores necesitaban dedicar al proyecto de una semana a un solo día.
Volver arriba
Cómo la IA puede imitar las obras creativas
El proceso de uso de IA para generar contenido creativo se basa en gran medida en el uso de modelos fundamentales o redes antagónicas generativas. Estos enfoques utilizan redes neuronales profundas diseñadas para imitar las formas en que el cerebro humano aprende mediante la creación de asociaciones entre elementos específicos que se pueden combinar para crear un trabajo terminado.
Cifra. Imagen creada por DALL•E 2 cuando se le solicitó, «IA imaginada como un artista creando bellas artes».
Cifra. Imagen creada por DALL•E 2 cuando se le solicita, «la imagen más tremendamente creativa imaginable».
Estas redes neuronales reciben millones o miles de millones de ejemplos de una salida particular (que podría incluir imágenes, muestras de sonido o pasajes de texto), que someten a un tipo sofisticado de coincidencia de patrones para «aprender» atributos, patrones o señales específicos. Por ejemplo, a los algoritmos que se utilizan para crear obras de arte al estilo de los artistas impresionistas se les mostrarán obras de Monet, Renoir, Manet, Degas, Cezanne y Matisse, generalmente considerados maestros en este estilo de arte. La red neuronal examina las obras como patrones de píxeles y puede entrenarse para identificar los patrones específicos que definen el estilo impresionista. Esto crea un marco de conocimiento que se puede utilizar para crear un nuevo trabajo basado en los parámetros y atributos aprendidos. Cuantas más «capas» o «profundidad» tenga el modelo, más complejos pueden ser los patrones y las correlaciones resultantes.
Grandes empresas de IA como OpenAI (que se describe a sí misma en su sitio web como «una empresa de investigación y despliegue» cuya misión es «garantizar que la inteligencia artificial general beneficie a toda la humanidad») han creado aplicaciones como DALL-E (haciendo referencia al artista Salvador Dali), que se anunció en enero de 2021 y demostró que este enfoque podía reproducir y recombinar características de esas imágenes existentes en formas nuevas y estéticamente agradables. La siguiente versión, DALL-E 2, lanzada un año después, presentó mejoras en la calidad de la imagen y demostró que el sistema podía reproducir diferentes estilos artísticos.
Hay un nivel inherente de realidad dentro de las obras creadas por IA, porque los modelos se entrenan en obras existentes que incorporan aspectos que los humanos encuentran agradables.
Se puede adoptar un enfoque similar con otros tipos de trabajos creativos, como la música, donde una red neuronal se alimentaría con ejemplos de música para aprender patrones específicos (como progresiones de acordes comunes, melodías, ritmos y estructuras) utilizados dentro de un género dado, repertorio del artista u otros datos de estilo (por ejemplo, datos que distinguen un vals de un blues de 12 compases o una improvisación al estilo de una jam-band).
Cifra. Imagen creada por DALL•E 2 cuando se le solicita «Autorretrato creativo con IA».
Este enfoque se utilizó para crear una canción llamada «Break Free», que fue compuesta por el músico y YouTuber Taryn Southern. Southern utilizó una plataforma de código abierto llamada Amper Music (www.ampermusic.com) para crear los stems básicos, una colección agrupada de fuentes de audio agrupadas como una sola unidad que se combinará con otros stems durante el proceso de mezcla. Al elegir los parámetros que regían la estructura de la canción, incluidos el tempo, el ritmo, el tipo de instrumentación y el estilo, la plataforma de IA creó posibilidades entre las que Southern podía elegir para crear una canción. Southern escogió las posibilidades que le gustaban y luego arregló las piezas en una estructura de canción que encajara con la letra que había escrito.
Volver arriba
¿Puede la IA ser considerada «creativa»?
A pesar de la capacidad de la IA para producir resultados creativos basados en los atributos de las obras existentes, el proceso no es el mismo que el de la creatividad humana, que proviene de una combinación de experiencia, emoción e inspiración del mundo real. De hecho, estos sistemas impulsados por redes neuronales carecen de una comprensión real del mundo y, sin las barandillas o parámetros adecuados, pueden producir obras que no tienen sentido o son extrañas. Además, debido a que estas salidas se basan en las imágenes, los clips de sonido o los textos en los que se entrenan, pueden reflejar ciertos sesgos sociales, como la creación de obras de arte que muestran, por ejemplo, a los pilotos como hombres, a las enfermeras como mujeres o letras de canciones superadas. con insultos raciales u obscenidades.
«La creatividad real es difícil de replicar. Sin embargo, el aprendizaje automático es un experto en encontrar patrones», dice Wayne Butterfield, socio de ISG Automation, una unidad de la firma de asesoría e investigación tecnológica global ISG. «Si estos patrones se consideran creatividad, entonces, sí, las computadoras pueden parecer creativas. La realidad es que, para la IA, cada nota, pincelada, diseño u otro aspecto de la expresión artística se basa en datos existentes, en lugar de en datos reales». original golpe de genialidad».
Hay un nivel inherente de humanidad dentro de las obras creadas por IA, porque los modelos se entrenan en obras existentes que incorporan atributos que los humanos encuentran agradables, como ciertas combinaciones de colores, notas o palabras. Dicho esto, «una computadora no es un ser sensible, por lo que necesita tener una entrada y luego tendrá una salida», dice Roger Firestien, miembro senior de la facultad del Centro de Imaginación Aplicada de la Universidad Estatal de Nueva York. College en Buffalo, consultor de creatividad de las empresas Fortune 500 y autor de libros que detallan cómo se pueden generar y aplicar ideas creativas a los problemas. «Parece que siempre va a haber algún tipo de elemento humano allí, al menos en la génesis del uso de la tecnología».
Volver arriba
Un catalizador para la creatividad
Quizás el mayor cambio que la IA impondrá en las artes creativas es la expansión del número de personas u organizaciones que pueden generar y experimentar con el arte, la escritura y la música. Esto puede afectar no solo a los creadores individuales, sino también a las organizaciones que utilizan obras creativas. Para aplicaciones puramente comerciales, como partituras de televisión o jingles, la IA puede verse como un método para mejorar la calidad general de una producción, al tiempo que reduce los costos.
«Hace veinte años, programas de televisión como el de A&E Biografía todavía pagaban a los compositores para que escribieran música original en los episodios», dice Bob Higgins, un productor de televisión y compositor con sede en la ciudad de Nueva York. «Esa práctica fue reemplazada por acuerdos generales con bibliotecas de música que ofrecían cortes instrumentales más baratos, aunque genéricos, por centavos. Ahora, parece que los programas pueden volver a tener música original, cortes creados específicamente para el programa, pero también hechos a bajo costo por AI».
«Para la IA, cada nota, pincelada, diseño u otro aspecto de la expresión artística se basa en datos existentes, en lugar de un verdadero golpe de genio original».
Aunque la IA mejore, es probable que la tecnología se utilice para aumentar, en lugar de reemplazar, a los creadores humanos. «En lugar de dejar a las personas sin trabajo, el uso de IA junto con sus propias habilidades permite que incluso los escritores de jingles, artistas, etc., hagan más, más rápido y potencialmente más barato», dice Butter-field. Además, dice, la IA ya ha ayudado a los creadores de contenido a escalar sus esfuerzos en otro dominio: el desarrollo de videojuegos realistas y ricos en funciones.
«Ya estamos viendo paisajes generados por IA en videojuegos haciendo el trabajo pesado en nuestros juegos más inmersivos», dice Butterfield. «La IA está permitiendo que se construya un juego más grande, lo que simplemente sería antieconómico si se usaran programadores informáticos puramente humanos».
Desde una verdadera perspectiva artística, es probable que la IA encuentre uso como catalizador para estimular una mayor creatividad humana, de manera muy similar a la forma en que los músicos han utilizado la tecnología de estudio de grabación para expandir la forma en que se presentaron sus trabajos finales. El artista de grabación y guitarrista Les Paul fue un pionero en el uso de tecnologías como la grabación multipista y el doblaje para crear grabaciones ahora clásicas con su entonces esposa, Mary Ford, cantando no solo la melodía de una canción, sino armonías de varias partes.
De manera similar, Higgins señala que los Beatles encontraron nuevos sonidos en su innovador Revólver álbum tocando la cinta de un solo de guitarra al revés. «Eso [was] música inspirada en la tecnología utilizada para crearla”, dice Higgins. “La inspiración es el pan y la mantequilla de un compositor”.
Es probable que la IA se convierta en otra herramienta para los creadores, en lugar de reemplazar el acto de creación en sí mismo, que generalmente se considera un proceso satisfactorio y placentero para artistas, escritores y músicos. Firestien, que también es músico, dice que el proceso de usar IA para crear riffs o motivos musicales novedosos podría servir como catalizador o iniciador para un compositor que sufra un bloqueo de escritor. De hecho, Firestien señala: «Gran parte de la alegría de la música está en la composición. ¿Por qué querríamos enseñarle a una computadora a componer cuando componer es tan divertido?»
Para los consumidores de arte, poesía, literatura, música u otro contenido creativo, el disfrute a menudo se deriva de las experiencias humanas auténticas y compartidas a las que se hace referencia para crear ese arte. «Está en la persona», dice Firestien. «¿Se puede enamorar una computadora? No. ¿Se puede deprimir una computadora? No. ¿Se puede pasar una computadora por la pandemia? No».
La tecnología se utiliza cuando es conveniente y deseable para determinadas tareas. A pesar de inventos como el telégrafo, el teléfono, el correo electrónico y las videoconferencias web, la gente todavía desea visitarse en persona. Del mismo modo, es probable que los artistas, músicos y otros creadores utilicen la IA solo en la medida en que se adapte a las necesidades de su proceso creativo.
«Las computadoras y la IA pueden ser buenos comienzos», dice Firestien. «Y tal vez buenos finalizadores también».
Otras lecturas
Schwelbel, D.
Cómo Taryn Southern usó IA para crear un álbum, Forbes26 de septiembre de 2017, https://bit.ly/3PNYPR3
DALL•E: creación de imágenes a partir de texto, OpenAI, 5 de enero de 2021, https://openai.com/blog/dall-e/
Brownlee, J.
Una introducción a las redes antagónicas generativas (GAN), dominio del aprendizaje automático, https://bit.ly/3pNjV7J
¿Qué son los modelos de base?, Blog de investigación de IBM, https://research.ibm.com/blog/what-are-foundation-models
Volver arriba
Autor
keith kirkpatrick es director de 4K Research & Consulting, LLC, con sede en Nueva York, NY, EE. UU.
©2023 ACM 0001-0782/23/02
Se otorga permiso para hacer copias digitales o impresas de parte o la totalidad de este trabajo para uso personal o en el aula sin cargo, siempre que las copias no se hagan o distribuyan con fines de lucro o ventaja comercial y que las copias lleven este aviso y la cita completa en la primera página. Deben respetarse los derechos de autor de los componentes de este trabajo que no pertenezcan a ACM. Se permite hacer resúmenes con crédito. Para copiar de otro modo, volver a publicar, publicar en servidores o redistribuir a listas, se requiere un permiso y/o tarifa específicos previos. Solicite permiso para publicar a permisos@acm.org o envíe un fax al (212) 869-0481.
La Biblioteca digital es una publicación de la Association for Computing Machinery. Derechos de autor © 2023 ACM, Inc.
entradas no encontradas