Sesde su lanzamiento en noviembre pasado, ChatGPT ha sacudido el mundo de la educación. Según los informes, el chatbot y otras herramientas sofisticadas de inteligencia artificial se utilizan en todas partes, desde ensayos universitarios hasta proyectos de arte de la escuela secundaria. Una encuesta reciente de 1,000 estudiantes en universidades de cuatro años realizada por Intelligent.com encontró que el 30% de los estudiantes universitarios informaron que usan ChatGPT en tareas escritas.
Este es un problema para las escuelas, los educadores y los estudiantes, pero una bendición para una pequeña pero creciente cohorte de empresas en el negocio de detección de IA. Jugadores como Winston AI, Content at Scale y Turnitin están facturando por su capacidad para detectar la participación de la IA en el trabajo de los estudiantes, ofreciendo servicios de suscripción donde los maestros pueden ejecutar el trabajo de sus estudiantes a través de un panel web y recibir un puntaje de probabilidad que califica qué tan «humano». o “AI” es el texto.
En esta etapa, la mayoría de los clientes son maestros que actúan por iniciativa propia, aunque Winston AI dice que está iniciando conversaciones con los administradores escolares a nivel de distrito a medida que crece el problema. Y con solo un semestre académico completo desde que se lanzó ChatGPT, la interrupción y los dolores de cabeza solo están comenzando.
Los métodos para detectar contenido generado por IA suelen implicar la búsqueda de una «información», una característica que distingue a un autor de IA de uno humano. Según la guía de MIT Technology Review, en el contenido de IA “la palabra ‘el’ puede aparecer demasiadas veces”. El texto también puede tener una especie de anti-estilo que indica una falta de estilo humano. La presencia de errores tipográficos a menudo es un claro indicio para la mente humana: los LLM (modelos de idiomas grandes como ChatGPT) tienen habilidades ganadoras de Scripps Spelling Bee. La IA generativa visual tiene sus propios problemas iniciales; errores como una mano con demasiados dedos son comunes.
AI se basa en patrones y frases en sus datos de entrenamiento, al igual que el problema del uso excesivo de la palabra «el», a veces puede confiar demasiado en estos patrones.
John Renaud, cofundador de Winston AI, dice que dos de los indicios más notables que están buscando son «perplejidad» y «estallido». «Perplejidad» se refiere a la sofisticación de los patrones de lenguaje que aparecen dentro de una muestra de texto (¿es este un patrón que existe en los datos de entrenamiento, o es lo suficientemente complejo como para parecer novedoso?), mientras que «explosión» se refiere a «cuando un texto presenta un grupo de palabras y frases que se repiten en un corto espacio de tiempo”.
Renaud dice que la compañía vio un aumento en el interés a raíz de ChatGPT: «Todo sucedió en una o dos semanas, de repente no pudimos satisfacer la demanda». Y no es solo la academia: los ensayos escolares son el contenido escaneado más comúnmente, pero el segundo «sería que los editores escanearan el trabajo de sus periodistas/redactores publicitarios antes de publicar».
La compañía afirma ser uno de los detectores más precisos que existen, con una tasa de precisión del 99,6%. A pesar de que estaba «muy preocupado» por la ruptura inicial de ChatGPT, desde entonces Renaud se ha vuelto más optimista.
“Con la IA predictiva, siempre podremos construir un modelo para predecirlo”, dice. En otras palabras, la generación actual de algoritmos de autocompletado con esteroides siempre será lo suficientemente determinista como para tener indicios.
Annie Chechitelli, directora de productos de Turnitin, también cree que los temores de la IA son exagerados, publicando una carta recientemente en Chronicle of Higher Education titulada «No es cierto que ChatGPT no se pueda detectar con precisión» y rechazando las afirmaciones de que hemos pasado por el generado -contenido espejo.
“Creemos que siempre habrá una revelación”, dice por Zoom. “Y estamos viendo otros métodos para desenmascararlo. Ahora tenemos casos en los que los maestros quieren que los estudiantes hagan algo en persona para establecer una línea de base. Y tenga en cuenta que tenemos 25 años de datos de estudiantes para entrenar nuestro modelo”.
omitir la promoción del boletín anterior
después de la promoción del boletín
Y al igual que Renaud en Winston AI, Chechitelli está viendo una explosión de interés en sus servicios y en la detección de IA en general. “Cada año se realiza una encuesta sobre los principales desafíos educativos de los maestros. En 2022, ‘prevenir las trampas de los estudiantes’ ocupó el décimo lugar”, dice. “Ahora es el número uno”.
En conjunto, el estado de la industria da la impresión de una carrera armamentista entre los generadores de IA y los detectores de IA que dura años, cada uno intercambiando la supremacía a medida que se desarrolla el ojo por ojo tecnológico. Mientras que algunos creen que los humanos se mantendrán un paso por delante, otros son más pesimistas sobre el potencial de estas herramientas para eventualmente evitar nuestra detección. Irene Solaiman, directora de políticas de la startup de IA Hugging Face, escribió recientemente en MIT Technology Review: “Cuanto más grande y poderoso sea el modelo, más difícil será construir modelos de IA para detectar qué texto está escrito por un humano y qué no. .”
Una solución más amplia que se está proponiendo son las «marcas de agua». La idea es que se puedan hacer modelos como ChatGPT para estructurar oraciones de manera que identifiquen que el contenido es generado por IA, insertando deliberadamente los «indicadores» que el software de detección ya está buscando.
Pero tanto Chechitelli como Renaud están de acuerdo en que la idea tiene fallas, especialmente si no se adopta universalmente. Si hubiera una alternativa, «todo el mundo acudiría en masa a la que no tiene la marca de agua», dice Renaud. ¿Por qué alguien usaría un algoritmo que los delató, en lugar de uno que simplemente produjo contenido convincente en silencio?
La era de la web creada por humanos está terminando, y nadie está completamente seguro de lo que vendrá después. Ya sea que el contenido de IA se vuelva indistinguible o que el toque humano resulte imposible de replicar, una cosa es segura: habrá poder para aquellos que puedan notar la diferencia.