Saltar al contenido

El procesamiento del lenguaje natural se combina con la curación de big data

30 de junio de 2021

Especial para Tiempos de Oftalmología®

La inteligencia artificial (IA) está impregnando la sociedad, dirigiendo todo, desde la parte de «productos que pueden gustarle» de un sitio de comercio electrónico hasta un GPS que sugiere una ruta más rápida a su destino.

Una de las áreas de más rápido crecimiento para la IA es la medicina, y la oftalmología está ayudando a liderar el camino en la evolución de la IA.

Por ejemplo, los programas de inteligencia artificial de aprendizaje profundo que interpretan fotografías de fondo de ojo de pacientes con diabetes pueden usarse para mejorar la detección de retinopatía diabética.1

En algunos casos, la IA se basa en el procesamiento del lenguaje natural (PNL) para recopilar e interpretar datos basados ​​en el lenguaje.


Recomendado: ¿Qué es el Big data?.


Relacionado: algoritmo de aprendizaje profundo probado como preciso para la clasificación de AMD

En oftalmología, la PNL puede procesar información de registros de salud electrónicos (EHR) del Registro de Investigación Inteligente en la Vista (IRIS) de la Academia de Oftalmología (AAO), que contiene datos de 367 millones de encuentros de pacientes con más de 65 millones de pacientes únicos.

Verana Health, el socio de análisis y conservación de datos de la academia, organiza los datos del registro para prepararlos para su interpretación a través de la PNL.

Procesamiento natural del lenguaje
Aunque la frase «procesamiento del lenguaje natural» puede ser nueva para algunos lectores, muchas personas interactúan con ella con frecuencia (y quizás sin saberlo).

Un encuentro común con la PNL ocurre cuando se interactúa con la tecnología de escaneo de documentos que convierte texto en datos digitales.

El reconocimiento óptico de caracteres, un método temprano de PNL, identifica letras, palabras y frases de documentos estáticos y los convierte en puntos de datos.


Recomendado: Tipos y ejemplos de bases de datos NoSQL.


Imagine un escenario en el que tiene la tarea de ingresar la información de su pasaporte en un portal. Tiene 2 opciones para ingresar datos como su nombre de pila, apellido y país de origen.

Relacionado: Algoritmos de IA: un trabajo en progreso

Puede ingresar manualmente su información en cada campo o puede usar su teléfono para tomar una foto de las páginas relevantes de su pasaporte y permitir que la PNL complete los campos.

La última opción, que extrae el lenguaje de una fotografía y la coloca en las áreas apropiadas del portal, es más rápida.

El aprendizaje automático aplicado a la PNL tiene usos más amplios que se adaptan a él para analizar datos con mucho texto en el Registro IRIS.

Si se utiliza la PNL para interpretar los cientos de millones de puntos de datos de HCE en el registro, puede producir información sobre los resultados del tratamiento en el mundo real, los datos de prevalencia de la enfermedad y los patrones de tratamiento.

HALLAZGOS CLÍNICOS EN OFTALMOLOGÍA
Dos ejemplos de cómo se podría utilizar la IA para examinar los datos del Registro IRIS ilustran el potencial de extraer información de grandes bases de datos a través del análisis de PNL.

Gravedad de calificación
La PNL podría utilizarse para buscar en los datos del Registro IRIS una serie de palabras o frases en los registros de pacientes. La búsqueda de frases o palabras preespecificadas puede confirmar la precisión de los datos de codificación.

Por el bien de la ilustración, considere el glaucoma.

Relacionado: Vinculación de datos de imágenes del paciente al Registro AAO IRIS

Los médicos utilizan varios puntos de datos cualitativos (p. Ej., Tipos de procedimientos sometidos, historial de medicación, si se ha realizado una cirugía de cataratas) y cuantitativos (p. Ej., Cocientes de copa a disco, mediciones de la PIO, agudeza visual, datos del campo visual) para clasificar el glaucoma de un paciente gravedad.

Ningún punto de datos conduce a un diagnóstico de glaucoma leve, moderado o grave, y los pacientes con perfiles cuantitativos similares pueden clasificarse de manera diferente en función de puntos de datos cualitativos.

La CIE-10 proporciona códigos para varios grados de gravedad del glaucoma. En un mundo perfecto, los médicos codificarían con precisión cada caso durante cada visita.

Sin embargo, debido a muchos factores, es posible que la etapa del glaucoma no se actualice en la HCE para reflejar el estado clínico actual del paciente.

Al utilizar la PNL, los investigadores pueden confirmar que el diagnóstico codificado refleja las medidas cualitativas y cuantitativas de un encuentro con un paciente.

Suponga que los investigadores necesitan determinar el número de pacientes clasificados como con glaucoma severo.

Después de definir el glaucoma severo con una combinación de parámetros cualitativos y cuantitativos, basándose en las definiciones de la AAO y la American Glaucoma Society diseñadas para reducir la subjetividad en los diagnósticos por etapas, los investigadores podrían realizar una búsqueda personalizada de los registros del Registro IRIS utilizando PNL para confirmar que el número de los casos graves codificados en un período de tiempo determinado coinciden con el número de casos graves según lo definido por los detalles del encuentro.

Relacionado: Análisis de los resultados de la replicación de datos de ensayos en el mundo real de los datos del Registro IRIS

Un análisis de datos de PNL hace que los datos del mundo real almacenados en el Registro IRIS sean más precisos. La automatización de estos controles de calidad ahorra tiempo y aumenta la calidad del conjunto general de datos a disposición de los investigadores.

Conciliar datos de codificación con prevalencia en el mundo real
La comprensión de la prevalencia de determinadas enfermedades en oftalmología puede verse limitada por la codificación del comportamiento después de un encuentro con un paciente.

Por ejemplo, un paciente que se presenta a un cirujano de cataratas para una evaluación preoperatoria también puede tener degeneración macular temprana relacionada con la edad (DMAE) además de su catarata.

Es posible que este encuentro se codifique como una catarata para fines de reembolso y no se ingrese el código ICD-10 para AMD.

La DMAE de este paciente no sería detectada por los investigadores que aprovechan los datos de codificación para estimar la prevalencia de la enfermedad.

Sin embargo, un análisis basado en la PNL de los datos del Registro IRIS podría detectar la presencia de enfermedades no notificadas o no notificadas en las historias clínicas de los pacientes, generando así una imagen más sólida de las tasas de enfermedad en el mundo real.

Relacionado: Aplicación del impacto de los datos del mundo real en la práctica diaria

Confiar en el algoritmo
Cuanto más sepan los médicos acerca de cómo los análisis basados ​​en PNL hacen determinaciones, y cuanto más transparentes sean los modelos, más dispuestos estarán a aceptar los resultados de los informes de IA.

Todos los algoritmos de PNL requieren un grado de explicabilidad, lo que permite a los investigadores comprender hasta qué punto un algoritmo valora datos particulares.

Si la PNL determina que, por ejemplo, un cierto porcentaje de pacientes de cierta edad tienen DMAE, los investigadores pueden examinar los métodos del algoritmo para asegurarse de que exista una razón médica legítima para esta conclusión.

Relacionado: La tecnología Blockchain tiene como objetivo impulsar los macrodatos para ‘entrenar’ la IA

Pueden surgir casos en los que la IA detecte una enfermedad que sea imperceptible por la evaluación humana o que esté vinculada a manifestaciones anatómicas hasta ahora desconocidas.

Se ha demostrado que los algoritmos basados ​​en aprendizaje automático, en los que las plataformas de inteligencia artificial aprenden a detectar patrones a partir de conjuntos de datos masivos, estiman con precisión la edad, el sexo, el tabaquismo y la presión arterial sistólica de los pacientes basándose únicamente en fotografías del fondo de ojo.2

Aún no se comprende cómo o por qué esos algoritmos hacen sus determinaciones, pero sus resultados muestran, no obstante, el potencial de la IA para cambiar el panorama de la medicina.

¿QUE SIGUE?
La PNL puede ser una de las herramientas más importantes para extraer información significativa de los datos del mundo real en el Registro IRIS.

Cuanto mejor comprendamos cómo se seleccionan y analizan los datos del Registro IRIS, más podremos adoptar los resultados de los análisis de datos de IA.

Theodore Leng, MD, MS
e: vision.md@gmail.com

Leng es directora de investigación del Byers Eye Institute de la Universidad de Stanford en California y asesora médica de Verana Health.

Referencias
1. Lu L, Ren P, Lu Q, et al. Análisis de imágenes de fondo de ojo para detectar retinopatía diabética (RD) utilizando un sistema de aprendizaje profundo en la región del delta del río Yangtze en China. Ann Transl Med. 2021; 9 (3): 226. doi: 10.21037 / atm-20-3275

2. Poplin R, Varadarajan AV, Blumer K, et al. Predicción de factores de riesgo cardiovascular a partir de fotografías del fondo de ojo de la retina mediante aprendizaje profundo. Nat Biomed Eng. 2018; 2 (3): 158-164. doi: 10.1038 / s41551-018-0195-0