¿Alguna vez has querido ver a un oso polar montando una patineta? ¿Qué tal un perrito caliente con un chándal?
Bueno, si te conformas con imágenes generadas por IA de esas cosas, o cualquier otra cosa que puedas soñar, entonces apreciarás DALL·E mini, el sitio web gratuito que actualmente se está apoderando de Internet.
Puede parecer ciencia ficción, pero la premisa es simple: en su teléfono o computadora, vaya a huggingface.co/spaces/dalle-mini/dalle-mini. Escriba cualquier mensaje en el cuadro de texto, por ejemplo, «Dak Prescott sosteniendo un plátano». Presione el botón que dice «Ejecutar» (es posible que deba presionarlo varias veces antes de que el tráfico disminuya y su solicitud se complete).
Eventualmente, aparecerán nueve imágenes generadas completamente por inteligencia artificial, dando vida a su concepto con diferentes niveles de precisión e hilaridad. En el caso de «Dak Prescott sosteniendo un plátano», los resultados fueron buenos para reírse, pero no alcanzaron el realismo, ver más abajo.
El programa ripe-for-memes fue creado por Boris Dayma, un ingeniero de aprendizaje automático con sede en Houston. Hizo el sitio web disponible para uso público el año pasadopero solo en las últimas dos semanas ha despegado en popularidad en las redes sociales, con usuarios compartiendo imágenes de todo, desde Pesca en el hielo de Darth Vader a Karl Marx haciendo una aparición en Seinfeld. una cuenta de Twitter que comparte algunas de las creaciones más extrañas ha acumulado más de 600.000 seguidores.
Dayma se inspiró para construir el programa después de leer un artículo de investigación sobre DALL·E, un sofisticado programa de inteligencia artificial de texto a imagen creado por OpenAI, una compañía de inteligencia artificial cofundada por Elon Musk. El verano pasado, como parte de un programa organizado por la empresa de inteligencia artificial Hugging Face, Dayma y un equipo desarrollaron DALL·E mini, una versión reducida que, a diferencia del programa original, está abierta al público. (Actualmente existe una lista de espera para acceder al DALL·E original).
“Poder crear una imagen que se parece a lo que querías, en el nivel técnico, para mí fue muy interesante”, dijo Dayma. “Quiero poder probarlo yo mismo, y quiero poder dejar que otras personas lo usen”.
La forma en que funciona el mini programa DALL·E, dijo Dayma, es procesando imágenes y subtítulos de Internet. Lentamente, el programa comienza a discernir patrones, como un parche visual de azul cuando la leyenda indica «cielo». Cuando un usuario escribe un mensaje de texto, el programa, usando estas asociaciones, “intentará juntarlo para hacer algo que tenga sentido”, dijo Dayma.
“Aprende conceptos muy pequeños como ese y, con el tiempo, se vuelve cada vez mejor”, dijo.
La demanda de la aplicación, confirmó Dayma, se ha disparado últimamente. Muchos usuarios ahora se quejan de recibir una ventana emergente que dice: «Demasiado tráfico, inténtelo de nuevo» cuando intentan generar imágenes.
Todos ustedes, aburranse de DALLE mini para que lo pueda volver a usar
— Todd en las sombras (@ShadowTodd) 13 de junio de 2022
“Obviamente no planeamos un tráfico tan loco, así que hemos estado trabajando para mejorar el código, mejorar el modelo”, dijo Dayma. “A la gente parece gustarle, por lo que necesitan poder usarlo”.
A pesar de los tiempos de espera, Dayma dijo que la naturaleza pública del programa es una ventaja para la tecnología. Más allá del entretenimiento futurista que brinda a las masas, el programa es de «código abierto», lo que significa que el código está disponible públicamente, por lo que «algunas personas pueden jugar con el modelo en sí, programarlo y modificarlo», dijo. Dado que todavía está entrenando al modelo para producir mejores imágenes, las aportaciones de otros usuarios resultan valiosas.
“La gente puede aprender sobre las limitaciones del modelo, los sesgos, en qué es bueno, para qué se puede usar”, dijo. “Todos pueden beneficiarse de tener un modelo público como este”.
Después de que se realicen mejoras en la capacidad de tráfico y en el modelo en sí, dijo Dayma, el cielo es el límite. “Puedes generar videos, puedes generar música”, dijo. “Es una nueva área que se está abriendo”.
Es un área, sin embargo, que está llena de controversia. Los expertos han expresado su preocupación de que la tecnología de inteligencia artificial perpetúe los sesgos o promueva la desinformación. Pero con DALL·E mini, dijo Dayma, «simplemente no hay calidad» para que la mayoría de la gente se deje engañar por las imágenes, al menos por ahora. Al sacar la IA de las torres de marfil de Silicon Valley y ponerla en manos de cualquier persona con un teléfono inteligente, dijo Dayma, espera no solo divertir, sino también hacer sonar la alarma.
“Al menos la gente puede aprender que ese tipo de cosas se avecinan, y ahora debes estar al tanto del contenido que ves en línea”, dijo. “Espero que ayude a las personas a desarrollar su pensamiento crítico”.