La escritura académica a menudo tiene la reputación de ser difícil de seguir, pero ¿qué pasaría si pudiera usar el aprendizaje automático para resumir argumentos en artículos científicos para que incluso un niño de siete años pueda entenderlos? Esa es la idea detrás de tl; dr papers, un proyecto que aprovecha los avances recientes en el procesamiento del lenguaje de IA para simplificar la ciencia.
El trabajo en el sitio comenzó hace dos años por los amigos universitarios Yash Dani y Cindy Wu como una forma de «aprender más sobre el desarrollo de software», dice Dani. el borde, pero el servicio se volvió viral en Twitter durante el fin de semana cuando comenzaron las actividades académicas. compartir resúmenes de IA de sus investigaciones. Los resultados generados por IA a veces son inexactos o simplificados hasta el punto de la idiotez. Pero con la misma frecuencia, son satisfactoria y sorprendentemente concisos, cortando la jerga académica para ofrecer lo que podría confundirse con sabiduría infantil.
Tome este resumen de un artículo de la profesora Michelle Ryan, directora del Instituto Global para el Liderazgo de la Mujer en la Universidad Nacional de Australia. Ryan ha escrito sobre el concepto del “acantilado de cristal”, una forma de discriminación de género en la que las mujeres ocupan puestos de liderazgo en momentos en que las instituciones corren el mayor riesgo de fracasar. ¿El resumen de AI de su trabajo? “El acantilado de cristal es un lugar donde se mete a muchas mujeres. Es un mal lugar para estar”.
«Es simplemente excelente», como dijo Ryan.
ryan dice el borde el resumen fue «preciso y conciso», aunque eliminó muchos matices en torno al concepto. En parte, esto se debe a una advertencia crucial: tl; dr papers solo analiza el abstracto de un artículo científico, que es en sí mismo una versión condensada del argumento de un investigador. (Ser capaz de condensar un documento completo sería un desafío mucho mayor, aunque es algo en lo que los investigadores de aprendizaje automático ya están trabajando).
Ryan dice que aunque tl; dr papers es sin duda una herramienta muy divertida, también ofrece «una buena ilustración de cómo debería ser una buena comunicación científica». “Creo que muchos de nosotros podríamos escribir de una manera que sea más fácil de leer”, dice ella. “Y el público objetivo de un niño de segundo grado es un buen lugar para comenzar”.
Zane Griffin Talley Cooper, candidato a doctorado en la Escuela de Comunicación Annenberg de la Universidad de Pensilvania, describió los resúmenes de IA como «refrescantes y transparentes». Usó el sitio para condensar un documento que había escrito sobre «periferias de datos», que rastrea la historia física de los materiales esenciales para la infraestructura de big data. O, como dicen los documentos de tl; dr:
“Los grandes datos se almacenan en unidades de disco duro. Estas unidades de disco duro están hechas de imanes muy pequeños. Los imanes se extraen del suelo.“
Cooper dice que aunque la herramienta es una «broma en la superficie», sistemas como este podrían tener serias aplicaciones en la enseñanza y el estudio. Los estudiantes podrían utilizar los resúmenes de IA como una forma de elaborar documentos complejos, o podrían incorporarse a revistas en línea, produciendo automáticamente resúmenes simplificados para el consumo público. «Por supuesto», dice Cooper, esto solo debe hacerse «si se enmarca correctamente y se discuten las limitaciones y lo que significa (tanto en la práctica como en la ética) usar el aprendizaje automático como una herramienta de escritura».
Las empresas que fabrican estos sistemas de IA aún están explorando estas limitaciones, incluso cuando el software se incorpora a herramientas cada vez más convencionales. tl; dr papers se ejecutó en GPT-3, que es una de las herramientas de escritura de IA más conocidas y está hecha por OpenAI, un laboratorio de investigación combinado y una empresa emergente comercial que trabaja en estrecha colaboración con Microsoft.
Microsoft ha utilizado GPT-3 y otros similares para crear herramientas como software de autocompletado para codificadores y recientemente comenzó a ofrecer a las empresas acceso al sistema como parte de su suite en la nube. La compañía dice que GPT-3 se puede usar para analizar el sentimiento del texto, generar ideas para negocios y, sí, condensar documentos como las transcripciones de reuniones o intercambios de correo electrónico. Y ya se están utilizando herramientas similares a GPT-3 en servicios populares como Gmail y Docs de Google, que ofrecen a los usuarios funciones de autocompletado impulsadas por IA.
Pero el despliegue de estos sistemas de lenguaje de IA es controvertido. Una y otra vez, se ha demostrado que estas herramientas codifican y amplifican el lenguaje dañino en función de sus datos de entrenamiento (que generalmente son solo grandes volúmenes de texto extraídos de Internet). Repiten estereotipos e insultos racistas y sexistas y también pueden estar sesgados de maneras más sutiles.
Un conjunto diferente de preocupaciones surge de la inexactitud de estos sistemas. Estas herramientas solo manipulan el lenguaje a nivel estadístico: no tienen una comprensión equivalente a la humana de lo que están «leyendo», y esto puede conducir a algunos errores muy básicos. En uno ejemplo notorio que apareció el año pasado, la búsqueda de Google, que usa IA para resumir los temas de búsqueda, proporcionó consejos médicos engañosos a una consulta que preguntaba qué hacer si alguien sufre una convulsión. Mientras que en diciembre pasado, Alexa de Amazon respondió a un niño que le pidió un desafío divertido diciéndole que tocara con un centavo las puntas expuestas de un enchufe.
El peligro específico para la vida que plantean estos escenarios es inusual, pero ofrecen ilustraciones vívidas de las debilidades estructurales de estos modelos. Jathan Sadowski, investigador sénior en el Laboratorio de Investigación de Tecnologías Emergentes de la Universidad de Monash, fue otro académico entretenido con el resumen de su investigación de tl;dr papers. Él dice que los sistemas de inteligencia artificial como este deben manejarse con cuidado, pero pueden tener un propósito en el contexto correcto.
«Tal vez algun dia [this technology will] sea tan sofisticado que pueda ser este asistente de investigación automatizado quien le brinde una bibliografía anotada de literatura académica perfecta, precisa y de alta calidad mientras duerme. Pero estamos extremadamente lejos de ese punto en este momento”, dijo Sadowski. el borde. “La utilidad real e inmediata de la herramienta es, ante todo, una novedad y una broma. Pero más prácticamente, podría verlo como un catalizador de la creatividad. Algo que te proporcione esta perspectiva ajena a tu trabajo”.
Sadowski dice que los resúmenes proporcionados por los documentos de tl;dr a menudo tienen una especie de «sabiduría accidental», un subproducto, tal vez, de la incapacidad del aprendizaje automático para comprender completamente el lenguaje. En otros escenarios, los artistas han usado estas herramientas de inteligencia artificial para escribir libros y música, y Sadowski dice que la perspectiva de una máquina podría ser útil para los académicos que han profundizado demasiado en su tema. “Puede darte una distancia artificial de algo a lo que has pasado mucho tiempo muy cerca, de esa manera tal vez puedas verlo bajo una luz diferente”, dice.
De esta manera, los sistemas de IA como los documentos tl;dr podrían incluso encontrar un lugar similar a las herramientas diseñadas para promover la creatividad. Tomemos, por ejemplo, «Estrategias oblicuas», una baraja de cartas creada por Brian Eno y Peter Schmidt. Ofrece consejos concisos a artistas en apuros como «pregúntale a tu cuerpo» o «¡intenta fingir!» ¿Estas palabras de sabiduría están imbuidas de una profunda inteligencia? Tal vez tal vez no. Pero su papel principal es provocar en el lector nuevos patrones de pensamiento. AI podría ofrecer servicios similares y, de hecho, algunas empresas ya venden asistentes de escritura creativa de AI.
Desafortunadamente, aunque tl;dr papers ha tenido una recepción entusiasta entre el mundo académico, su tiempo en el centro de atención parece limitado. Después de volverse viral este fin de semana, el sitio web ha sido etiquetado como «en mantenimiento» y los creadores del sitio dicen que no tienen planes de mantenerlo en el futuro. (También mencionan que se han construido otras herramientas que realizan la misma tarea).
dani dijo el borde que tl; dr papers “fue diseñado para ser un experimento para ver si podemos hacer que aprender sobre ciencia sea un poco más fácil, más divertido y atractivo”. Él dice: “Aprecio toda la atención que ha recibido la aplicación y agradezco a todas las personas que la han probado. [but] dado que esto siempre tuvo la intención de ser un proyecto educativo, planeo cancelar los artículos de tl; dr en los próximos días para concentrarme en explorar cosas nuevas”.