Saltar al contenido

Investigador politécnico revela 5 claves esenciales para detectar el uso de Chat GPT en la creación de textos

20 de junio de 2023

Chat GPT, o Generative Pre-trained Transformer, es una tecnología de inteligencia artificial que se basa en modelos de lenguaje generativo trastornos con grandes cantidades de datos textuales para poder dar respuestas coherentes y contextualmente relevantes a partir de una pregunta o una instrucción específica.

La herramienta ha demostrado que puede sostener conversaciones de manera natural y generar textos con cierto nivel de complejidad y coherencia, lo que permite su utilización en gran cantidad de aplicaciones.

A través de un análisis de los productos de esta herramienta, el doctor Rodrigo Florencio Da Silva, investigador de la Escuela Superior de Ingeniería y Arquitectura del Instituto Politécnico Nacional, encontró características específicas que permiten sospechar si un texto fue redactado por una inteligencia artificial, y que pueden ser de gran utilidad para las personas al frente de redacciones y docentes frente al aula.

Tras haber analizado un importante volumen de escritos creados con herramientas como Chat GPT de la empresa OpenAI, o Bard de Google, y haber experimentado constantemente por sí mismo, pudo identificar «vicios» o «muletillas» muy específicas utilizadas por estos programas al redactar. Gracias a estas estructuras, es posible sospechar que el texto que se está leyendo fue creado por una máquina.

El interés del investigador politécnico es poder brindar a las personas docentes, editoras y redactoras, una herramienta similar a las que existen actualmente para detectar el plagio en los textos académicos.

Su investigación también plantea la necesidad de generar códigos éticos y reglamentos específicos para poder convivir con estas tecnologías que «llegaron para quedarse» y cuentan ya con más de 200 mil millones de usuarios en el mundo y más de diez millones de consultas diarias.

Recomendado:  12 Bytes por Jeanette Winterson revisión: cómo llegamos aquí y hacia dónde podríamos ir a continuación | Libros de ciencia y naturaleza

Debido a que la explosión de los textos «sintéticos» apenas comienza hace ocho meses, se ha convertido en una necesidad creciente para ciertos usuarios identificar este tipo de textos, sobre todo en ambientes académicos.

Entre otras, algunas de las claves que el doctor Da Silva puntualiza son las siguientes:

1. Los textos tienden a ser repetitivos, ya que el programa toma palabras esenciales y las utiliza constantemente para construir párrafos coherentes. Esto hace que las ideas repita o parafrasee constantemente.

2. Normalmente el último y penúltimo párrafo comienzan con frases como «En resumen», «Para concluir» o «En conclusión».

3. Las citas solo incluyen información hasta el 2021, ya que la IA que utiliza Chat GPT solo fue entrenada con fuentes hasta septiembre de dicho año.

4. Es importante verificar las referencias a autores o citas en fuentes como Google Scholar, Emerald o Springer, ya que el robot las genera de manera muy coherente, en concordancia con varios estilos de los autores mencionados, pero son inexistentes.

5. Además de pasar los textos por Turnitin para detectar plagio, el investigador compartió varias herramientas gratuitas y de pago para la identificación de trabajos generados de manera automática, como:

https://platform.openai.com/ai-text-class

https://app.gptzero.me/app/welcome

https://app.originality.ai/login

AI content detector

AI Content Detector

Para demostrar la importancia de hacer un análisis concienzudo de la escritura académica y periodística, el investigador mostró al público una tesis de grado de licenciatura que él mismo creó utilizando Chat GPT en tan solo 6 horas y cuya falsedad no pudo ser detectada por el programa más utilizado en la academia para identificar plagio.

También mostró artículos en proceso de arbitraje en importantes revistas científicas que surgieron la frase «regenerar respuesta» en lugares aleatorios, la cual se encuentra en uno de los botones de la interfaz de la herramienta de lenguaje generativo, lo cual indica un grave descubierto, no solo por parte de los autores, sino también de editores y revisores.

Recomendado:  'Rareza espacial' (2022). Crítica de la Película: Tecnología con Optimismo… Eí, Es Posible

Da Silva hizo hincapié en que lo fundamental es fomentar la responsabilidad y la ética en la escritura, tanto para estudiantes como para docentes y en medios o redacciones.

Estas herramientas seguramente potenciarán nuestra capacidad de generar conocimiento, pero se deben aprender a usarlas responsablemente y con reglas claras sobre cómo dar crédito y referencia a su uso.

El ejercicio ocurrió en el Museo Tezozómoc de la Dirección de Divulgación de la Ciencia y la Tecnología, organizado por la Dirección de Investigación, ambos dentro de la Secretaría de Investigación y Posgrado del Instituto Politécnico Nacional (IPN).

Fotos: IPN

Top Big Data