El estudio Mass General Brigham encuentra ChatGPT 4 ex

Un nuevo estudio realizado por investigadores de Mass General Brigham descubrió que los modelos de lenguaje de inteligencia artificial (IA) como ChatGPT pueden identificar con precisión los servicios de imágenes apropiados para dos presentaciones clínicas importantes: detección de cáncer de mama y dolor de mama. Sus resultados sugieren que los modelos de lenguaje grande tienen el potencial de ayudar a los médicos de atención primaria y a los proveedores de derivación a tomar decisiones al evaluar a los pacientes y ordenar pruebas de imágenes para el dolor de seno y las pruebas de detección de cáncer de seno. Sus resultados se publican en el Revista del Colegio Americano de Radiología.

«En este escenario, las capacidades de ChatGPT fueron impresionantes», dijo el autor correspondiente Marc D. Succi, MD, presidente asociado de Innovación y Comercialización en Mass General Brigham Radiology y director ejecutivo de MESH Incubator. «Lo veo actuando como un puente entre el profesional de la salud que deriva y el radiólogo experto, interviniendo como un consultor capacitado para recomendar la prueba de imagen correcta en el punto de atención, sin demora. Esto podría reducir el tiempo administrativo tanto en los médicos de derivación como en los de consulta. al tomar estas decisiones respaldadas por evidencia, optimizar el flujo de trabajo, reducir el agotamiento y reducir la confusión del paciente y los tiempos de espera».

ChatGPT es un modelo de lenguaje grande (LLM) basado en datos de Internet para responder preguntas de una manera similar a la humana. Desde que se introdujo ChatGPT en noviembre de 2022, los investigadores de todo el mundo se están sumergiendo en el aprendizaje de cómo se pueden usar estas herramientas de IA en escenarios médicos. Publicado como preimpresión el 7 de febrero de 2023, este estudio es el primero de su tipo en probar las capacidades de toma de decisiones clínicas de ChatGPT y el primero en probar GPT 4 en comparación con iteraciones anteriores.

Cuando un médico de atención primaria ordena pruebas especializadas, por ejemplo, para un paciente que se queja de dolor en los senos, es posible que no sepa cuál es la mejor prueba de imagen para elegir. Puede ser una resonancia magnética, una ecografía, una mamografía u otra prueba de imagen. Los radiólogos generalmente siguen los Criterios de Idoneidad del Colegio Americano de Radiología para tomar estas decisiones. Estas pautas respaldadas por evidencia son bien conocidas por los especialistas, pero menos conocidas por los no especialistas, quienes necesitan elegir la mejor prueba de imagen durante la visita de un paciente. Esto puede causar confusión por parte del paciente y puede llevar a que los pacientes se hagan pruebas que no necesitan o que se hagan las pruebas equivocadas.

Los investigadores le pidieron a ChatGPT 3.5 y 4 de OpenAI que los ayudara a decidir qué pruebas de imágenes usar para 21 escenarios de pacientes inventados que involucran la necesidad de detección de cáncer de mama o el informe de dolor de mama utilizando los criterios de idoneidad.

Le preguntaron a la IA de manera abierta y le dieron a ChatGPT una lista de opciones. Probaron ChatGPT 3.5 y ChatGPT 4, una versión más nueva y avanzada. ChatGPT 4 superó a 3.5, especialmente cuando se le dieron las opciones de imágenes disponibles. Por ejemplo, cuando se le preguntó acerca de las pruebas de detección de cáncer de mama y se le dieron opciones de imágenes de opción múltiple, ChatGPT 3.5 respondió un promedio del 88,9 % de las preguntas correctamente, y ChatGPT 4 acertó aproximadamente el 98,4 %.

«Este estudio no compara ChatGPT con los radiólogos existentes porque el estándar de oro existente es en realidad un conjunto de pautas del Colegio Estadounidense de Radiología, que es la comparación que realizamos», dijo Succi. «Este es un estudio puramente aditivo, por lo que no están argumentando que la IA es mejor que su médico para elegir una prueba de imagen, pero puede ser un complemento excelente para optimizar el tiempo de un médico en tareas no interpretativas».

La integración de la IA en la toma de decisiones médicas podría ocurrir en el punto de atención. Cuando un médico de atención primaria ingresa datos en un registro de salud electrónico, el programa podría alertarlo sobre las mejores opciones de imágenes, brindando una respuesta al paciente sobre qué esperar cuando vaya a hacerse la prueba y sugiriendo al médico la prueba correcta para ordenar. .

Los investigadores agregaron que se podría crear una IA médica más avanzada utilizando conjuntos de datos de hospitales y otras instituciones de investigación para que sea más específica para aplicaciones centradas en la salud.

«Es posible que podamos ajustar ChatGPT con diferentes conjuntos de datos y conocimientos terapéuticos y de pacientes para adaptarlo a poblaciones específicas de pacientes», dijo Succi. «En Mass General Brigham, contamos con centros especializados de excelencia donde atendemos a pacientes con algunas de las enfermedades más raras y complejas. Podemos aprovechar nuestra experiencia y las lecciones aprendidas de la atención de estos casos de pacientes para capacitar a un modelo que brinde apoyo para las enfermedades raras». y diagnósticos complejos y luego poner ese modelo a disposición de los centros de todo el mundo, especialmente los centros que pueden tratar estas afecciones con menos frecuencia».

Pero antes de que cualquier IA se involucre en la toma de decisiones médicas, debería someterse a pruebas exhaustivas de sesgo, preocupaciones de privacidad y aprobarse para su uso en un entorno médico. Las nuevas regulaciones sobre la IA médica también podrían desempeñar un papel importante en lo que se convierte en interacciones de atención al paciente.

Divulgaciones: Los autores declaran que no existen intereses contrapuestos.

Fondos: El proyecto descrito fue apoyado en parte por el premio número T32GM144273 del Instituto Nacional de Ciencias Médicas Generales. El contenido es responsabilidad exclusiva de los autores y no representa necesariamente los puntos de vista oficiales del Instituto Nacional de Ciencias Médicas Generales o los Institutos Nacionales de Salud.

Artículo citado: Arya Rao, et al. “Evaluación de GPT como un complemento para la toma de decisiones radiológicas: GPT4 vs GPT3.5 en un piloto de imágenes de mama” Revista del Colegio Americano de Radiología DOI: 10.1016/j.jacr.2023.05.003

Acerca de Mass General Brigham
Mass General Brigham es un sistema académico integrado de atención médica que une a grandes mentes para resolver los problemas más difíciles de la medicina para nuestras comunidades y el mundo. Mass General Brigham conecta una atención continua completa a través de un sistema de centros médicos académicos, hospitales comunitarios y especializados, un plan de seguro médico, redes de médicos, centros de salud comunitarios, atención domiciliaria y servicios de atención a largo plazo. Mass General Brigham es una organización sin fines de lucro comprometida con la atención al paciente, la investigación, la enseñanza y el servicio a la comunidad. Además, Mass General Brigham es una de las principales organizaciones de investigación biomédica del país con varios hospitales docentes de la Escuela de Medicina de Harvard. Para obtener más información, visite massgeneralbrigham.org.

Diario

Revista del Colegio Americano de Radiología

Método de investigación

Modelado/simulación computacional

Tema de investigación

No aplica

Título del artículo

Evaluación de GPT como complemento para la toma de decisiones radiológicas: GPT-4 frente a GPT-3.5 en un programa piloto de imágenes mamarias

Artículo Fecha de publicación

21-jun-2023

Declaración de COI

Los autores declaran que no existen intereses contrapuestos.

Descargo de responsabilidad: AAAS y Eurek Alert! no son responsables de la precisión de los comunicados de prensa publicados en EurekAlert! por instituciones contribuyentes o para el uso de cualquier información a través del sistema EurekAlert.