GPT-4 de OpenAI llegará a las salas de escritores de programas de comedia

Hay una cita sobre el humor que suele atribuirse al escritor EB White: “Explicar un chiste es como diseccionar una rana. Lo entiendes mejor, pero la rana muere en el proceso”. Si bien ese adagio ha demostrado que puede ser muy cierto una y otra vez, eso no ha impedido que uno de los chatbots más poderosos del mundo lo haga.

La semana pasada, OpenAI lanzó GPT-4, la última edición de su modelo de lenguaje grande (LLM), al público. El poderoso chatbot parece capaz de algunas hazañas realmente impresionantes, como aprobar el examen de la barra y el LSAT, desarrollar código para videojuegos completos e incluso convertir una fotografía de un boceto en una servilleta en un sitio web funcional.

Junto con el nuevo modelo, OpenAI también publicó un informe técnico adjunto de 98 páginas que muestra algunas de las capacidades y limitaciones de GPT-4. Curiosamente, esto incluía varias secciones que mostraban que GPT-4 también podía explicar por qué exactamente ciertas imágenes y memes eran divertidos, incluido un desglose de una imagen de un cargador de teléfono novedoso y un meme de nuggets de pollo dispuestos para parecerse a un mapa del mundo. .

GPT-4 se las arregla para hacer esto con una precisión sorprendente, presentando exactamente lo que hace que estas imágenes sean divertidas en un lenguaje tan simple y técnico que se vuelve, nos atrevemos a decir, casi divertido.

“Este meme es una broma que combina dos cosas no relacionadas: imágenes de la tierra desde el espacio y nuggets de pollo”, dice una descripción. “El texto del meme sugiere que la imagen de abajo es una hermosa imagen de la tierra desde el espacio. Sin embargo, la imagen es en realidad de nuggets de pollo dispuestos para parecerse vagamente a un mapa del mundo”.

Si bien es probable que la inclusión de estas descripciones de disección de ranas muestre las capacidades multimodales de GPT-4 (lo que significa que puede usar imágenes como entradas además de texto), también es uno de los ejemplos más importantes de un LLM que parece entender humor—al menos, algo. Sin embargo, si puede entender el humor, eso plantea la pregunta: ¿ChatGPT puede ser realmente divertido?

No es para reirse

El humor es complejo, por decir lo menos. Cualquiera que haya incursionado en la improvisación o haya elaborado una rutina apretada de cinco minutos para probar en una noche local de micrófono abierto puede decirte que ser divertido es mucho, mucho más difícil de lo que piensas. Hay una razón por la que los comediantes profesionales como Jerry Seinfeld o Chris Rock son famosos por agonizar con la elección precisa de las palabras y la cadencia de sus chistes durante años.

Esto es algo con lo que Thomas Winters está muy familiarizado. Durante casi una década, ha estado realizando comedia de improvisación y ayudó a hacer crecer la escena en su Bélgica natal. Sin embargo, cuando no está en el escenario o organizando talleres de improvisación, también es estudiante de doctorado en KU Leuven en Bélgica e investiga la IA y el humor, una combinación de dos de sus grandes pasiones.

Si bien muchos pueden resistirse a la idea de que un chatbot escriba o incluso haga bromas, Winters adopta el enfoque opuesto. Investigó la capacidad de los modelos anteriores de OpenAI, como GPT-2 y GPT-3, para crear chistes, e incluso cree que puede ser una herramienta increíble para que los comediantes los ayuden con su oficio.

“Este es un momento fascinante para el humor computacional”, dijo Winters a The Daily Beast. “Llevamos décadas hablando de ello. Ahora, en los últimos años, finalmente tenemos estos modelos que tienen estas capacidades lingüísticas o de razonamiento”.

Winters cree que GPT-4 representa otro gran paso en la búsqueda de construir bots para escribir chistes. Según él, la última edición es mucho mejor que sus predecesores, como GPT-2, que era «bastante malo» para hacer bromas decentes, incluso con muchos ajustes en lo que respecta a las indicaciones. Si bien GPT-3 podía producir una tasa más alta de material divertido, estaba bastante limitado a «acertijos insignificantes», como «¿Por qué el pollo cruzó la calle?» construcciones del tipo.

Ahora, con GPT-4, el modelo es mucho más sofisticado. No solo produce respuestas más realistas, sino que requiere mucho menos tiempo y esfuerzo para producir una tasa más alta de chistes de calidad decente.

“Claro, cuando lo miras, es solo un análisis de predicción de la siguiente palabra, ¿verdad? Pero es sorprendente, como la cantidad de capacidades que se desbloquean una vez que escalas estas cosas”, agregó Winters. “Es bastante fascinante de ver. Es un mundo de diferencia”.

La comedia es ingeniería rápida más tiempo

Mientras Winters escribe un aviso en GPT-4 para una posible broma sobre la inminente acusación del expresidente Donald Trump, es difícil para él deshacerse de la sensación de que está sentado en la sala de escritores del programa de entrevistas nocturno del futuro.

Le pedí que me diera una demostración de la destreza del chatbot para elaborar chistes, y nos mostró varios ejemplos. El primero se inspiró en un juego de improvisación que se hizo famoso en el programa. ¿De cualquier manera De quien es esta linea? llamado «Scenes from a Hat», donde los jugadores reciben indicaciones y escenarios para interpretar.

El mensaje: escribe cinco chistes cortos sobre «Cosas que puedes decirle a tu computadora pero no a tu pareja». Mientras tanto, el bot también recibió instrucciones de actuar como si fuera un «experto de renombre mundial en escribir chistes».

Los resultados, aunque algo anodinos, fueron impresionantes:

Con las indicaciones correctas, GPT-4 es capaz de crear chistes decentes al estilo de «Scenes from a Hat».

thomas inviernos

“Wow, te has vuelto muy lento con los años. ¡Es hora de actualizar a un modelo más nuevo!”
“No me importa si chocas y pierdes todo en lo que hemos estado trabajando. Siempre puedo encontrar un reemplazo”.

“Cuando empiezas a hacer ruidos extraños, solo te doy un buen golpe y vuelves a la normalidad”.

Según Winters, este nivel de sofisticación y coherencia con los chistes hubiera sido bastante difícil de lograr en modelos anteriores como GPT-2 y GPT-3. Sin embargo, aún requiere un poco de ingeniería rápida, o el proceso de dar una descripción precisa de una tarea que desea que realice un chatbot para obtener el resultado que desea.

Por ejemplo, si solo le pide a ChatGPT que le cuente un chiste sobre computadoras, es posible que le diga uno que encuentre en un libro de chistes para niños («¿Por qué la computadora fue al médico? ¡Porque tenía un virus!»). Sin embargo, si desea que le cuente un tipo específico de broma sobre computadoras, por ejemplo, una broma al estilo de «Escenas de un sombrero» sobre «cosas que puede decirle a su computadora, pero no a su pareja», entonces necesita Sea mucho más específico en su aviso.

En este ejemplo, Winters necesitaba incluir la estipulación de que el bot era un «experto de renombre mundial en escribir chistes» y un «comediante de improvisación experto que puede responder a las sugerencias de «Escenas de un sombrero». Solo con este nivel de especificidad, el chatbot es capaz de obtener una respuesta que se asemeje a lo que podrías estar buscando.

Además, el chatbot necesita una fórmula rígida a seguir. El mensaje «Escenas de un sombrero» que usamos tenía una estructura clara: encuentre dos cosas diferentes y encuentre el vínculo sorprendente entre ellas.

Hay una especie de hermosa ironía en eso: para obtener un chiste bien elaborado de ChatGPT o cualquier otro LLM, debe desglosar un chiste en sus elementos más básicos y sostener la mano del chatbot a través del intrincado proceso de contar un broma. O, dicho de otra manera: necesitas diseccionar la rana muerta.

¿Cómo se vería si la broma fuera un poco más compleja como, por ejemplo, en el monólogo de apertura de un programa nocturno de televisión?

Para esto, Winters diseñó una fórmula muy precisa que utiliza para provocar bromas de monólogo sobre prácticamente cualquier tema de noticias. Se inspiró para el mensaje utilizando una estructura para la construcción de chistes monólogos que encontró en Escritura de comedia para Late Night TV por el veterano escritor de comedia Joe Toplyn. Esto incluye cinco pasos:

Identificar dos temas distintos en el título de un artículo

Encuentra tres asociaciones para cada tema.
Encuentra un vínculo sorprendente entre una asociación de cada tema
Escribe tres chistes divertidos basados en estos enlaces.

Selecciona el remate más divertido

Luego, ChatGPT lo junta todo y listo: tienes una broma lista para las tarjetas de referencia de Jimmy Fallon.

Los modelos de lenguaje grande como GPT-4 requieren un poco de ingeniería rápida para producir chistes de calidad decente, algo que a menudo es más arte que ciencia.

thomas inviernos

Para nuestro ejemplo, elegimos un titular sobre la próxima acusación de Donald Trump. Winters ingresó el título del artículo en el indicador, presionó «enviar» y pronto tuvimos una broma.

“Entonces escuché que Donald Trump enfrenta varias investigaciones, y finalmente sabemos cuál es su posición. Es curioso cómo sus años como estrella de la telerrealidad nunca lo prepararon para el giro de trama más dramático de todos. Parece que el próximo proyecto de televisión de realidad de Trump se llamará ‘Mantenerse al día con las evasiones de impuestos’”.

Solo dale a ChatGPT el Emmy ahora.

Aunque la broma podría no aterrizar en sí misma el show de esta noche en el corto plazo, la respuesta sigue siendo bastante impresionante. Está claro que ChatGPT puede crear la cadencia y la estructura básica de un monólogo de broma. Si bien el remate no es hilarante a carcajadas, no lo es no divertido. Es más una broma de papá que provoca gemidos que un forraje nocturno, pero el humor está ahí.

Es algo que Winters cree que solo se volverá más sofisticado a medida que estos LLM crezcan con cada interacción e iteración también. Claro, es posible que todavía no esté reemplazando a los comediantes, improvisadores y escritores, pero con cada nuevo modelo, se acerca cada vez más a poder descubrir qué hace que algo sea divertido y cómo hacer reír a los humanos.

Winters tampoco cree que los escritores de comedia necesariamente deban temer a los bots. De hecho, él piensa que los comediantes se estarían perjudicando a sí mismos si no adoptaran el uso de GPT-4 como una herramienta para ayudarlos a mejorar su trabajo. Más una caja de resonancia para la inspiración que el robot aterrador que viene a tomar sus trabajos.

De esa manera, en realidad podría darles a los comediantes una ventaja sobre su material, si tan solo pudieran aprender a dejar de preocuparse y amar al bot.

“Los artistas se sienten amenazados por eso”, dijo Winters. “Pero siento que este tipo de herramientas también son más poderosas en sus manos exactas”.