Saltar al contenido

El desarrollo de una canalización automatizada de aprendizaje automático para la detección de la enfermedad de Alzheimer

28 de octubre de 2022

En este estudio de prueba de concepto, demostramos que el análisis cuantitativo de EEG breves (5 minutos) en estado de reposo en el dominio de la frecuencia utilizando un montaje portátil de baja densidad (14 canales) revela diferencias significativas entre pacientes con EA y HC. Además, un enfoque de aprendizaje automático transparente y explicable, guiado por métodos estadísticos convencionales para identificar características de datos relevantes en canales específicos y intervalos de frecuencia basados ​​en valores empíricamente significativos, da como resultado modelos clasificadores que pueden distinguir sujetos en la categoría HC o AD con alta precisión.

La enfermedad de Alzheimer es la causa más común de demencia entre las personas mayores, pero carece de tratamientos capaces de retrasar la progresión de la enfermedad.1. La falta de criterios de valoración fiables de la enfermedad y/o biomarcadores contribuye en parte a la falta de terapias eficaces12. Los estudios de imágenes funcionales pueden proporcionar información, sin embargo, se requiere una evaluación complementaria de la actividad cerebral a la velocidad de la actividad neuronal. Además, un diagnóstico cualitativo, definitivo y más completo de la EA, especialmente en una etapa temprana antes de la muerte de las células neurales, abriría más posibilidades para intervenciones terapéuticas específicas centradas en la neuroprotección, lo que podría retrasar la progresión de la EA antes de que surjan deficiencias importantes.7.

Se han realizado varios estudios de EEG para detectar anomalías en la función cerebral en pacientes con EA13,15,35en particular durante las primeras etapas7,16,17. Mientras que la mayoría de los estudios se han centrado en el análisis de los potenciales relacionados evocados (ERP) en EEG mientras los sujetos realizan diversas tareas cognitivas para identificar las perturbaciones de procesos cognitivos específicosdieciséis, las restricciones experimentales impuestas por estos paradigmas podrían estar más allá de la tolerancia y la capacidad de los sujetos de edad avanzada. Por el contrario, los protocolos de estado de reposo (como en este estudio) son más simples, cortos y fáciles de implementar. Según varias críticas.7,16,18, los hallazgos del EEG en estado de reposo informados con mayor frecuencia son la ralentización generalizada de la actividad cerebral en el dominio de la frecuencia en pacientes con EA. Específicamente, la progresión a AD se caracteriza por un aumento en la potencia de baja frecuencia (bandas delta y theta), acompañado por una disminución en la potencia de frecuencia más alta (alfa, beta y gamma). Nuestros resultados son en gran medida consistentes con estos cambios; Si bien no se observaron cambios significativos entre los pacientes con HC y AD en las bandas delta, sí observamos el aumento esperado en las bandas theta y una disminución en las bandas alfa y beta en los pacientes con AD.

Es importante destacar que la mayoría de las investigaciones de AD que involucran EEG se basan en gran medida en el examen cualitativo de los rastros sin procesar para eliminar los artefactos como primer paso, un procedimiento subjetivo que socava el rigor. Por lo tanto, un análisis cuantitativo automatizado de EEG es fundamental para la objetividad y la reproducibilidad en la evaluación de los datos de EEG. Usando una canalización analítica desarrollada por nuestro equipo basada en ML, nuestro primer paso en el análisis de EEG es cuantitativo, automatizado y eficiente. Además, el desarrollo de técnicas de ML ha permitido un análisis más sofisticado de EEG en los dominios de frecuencia, lo que permite métodos de clasificación, como árboles de decisión, máquinas de vectores de soporte, vecinos más cercanos K y análisis discriminante lineal para identificar con mayor precisión a los pacientes con EA.27,28,29 y distinguir entre AD y sujetos sanos30,31,32., con algunos clasificadores que presumiblemente logran una sensibilidad y especificidad de hasta el 90%35,36.

Recomendado:  Cómo usar la extracción de características en los datos tabulares para el aprendizaje de la máquina

Sin embargo, varios problemas dificultan el uso clínico del EEG en estado de reposo para la detección de la EA, como se describe en nuestro resumen. En este estudio, presentamos un marco completamente automatizado que supera estos problemas simultáneamente por primera vez:

  1. (1)

    una falta de automatización y eliminación imparcial de artefactos, superada mediante la implementación de la eliminación automática de artefactos a través de SVM.

  2. (2)

    una dependencia de un alto nivel de experiencia en el preprocesamiento de datos y ML para procesos no automatizados: nuestra canalización analítica niega la necesidad de un alto nivel de experiencia como se describe en la Fig. 3.

  3. (3)

    la necesidad de tamaños de muestra muy grandes y localización precisa de la fuente de EEG usando sistemas de alta densidad; demostramos buenos resultados con un tamaño de muestra de 41 pacientes usando solo 14 canales.

  4. (4)

    y una confianza en los enfoques de ML de caja negra, como las redes neuronales profundas con una selección de funciones inexplicable: utilizamos PSD guiados por estadísticas para la selección de funciones para una mayor interpretabilidad, que se ingresó en un modelo de regresión logística que ofrece una mayor interpretabilidad que muchos modelos de ML más complejos.

A pesar de los resultados prometedores, este estudio todavía tiene varias limitaciones. El tamaño de nuestra muestra fue relativamente pequeño; Se necesitan datos multicéntricos a gran escala para evaluar aún más la generalización de nuestro modelo. En segundo lugar, la incorporación de datos multimodales en los modelos ML maximiza las posibilidades de descubrir biomarcadores significativos.37. La inclusión de signos vitales, datos genéticos y comorbilidades, junto con EEG, puede conducir a biomarcadores más precisos. En tercer lugar, aunque la edad media de nuestros grupos de estudio fue diferente, las dos poblaciones se superpusieron en edad (controles sanos = 65,5 ± 6,8 años y AD = 75,7 ± 7,5 años); además, es poco probable que esta pequeña diferencia de edad sea suficiente para explicar las diferencias significativas en los EEG de estos pacientes. Finalmente, nuestra canalización no se validó en un conjunto de datos externo e independiente, por lo que aumentaría la generalización de nuestros hallazgos.

Recomendado:  CodeRL de Salesforce logra resultados de generación de código SOTA con sólidas capacidades de transferencia Zero-Shot

Aunque nuestro enfoque de aprendizaje automático podría concebirse como convencional, la novedad de nuestro enfoque es doble: (1) técnicas de aprendizaje automático «transparentes» en lugar de métodos de aprendizaje profundo de caja negra, y (2) preprocesamiento de señales EEG de manera automatizada para elimine artefactos de modo que nuestros resultados sean reproducibles, rigurosos y escalables. Estos dos aspectos novedosos nos permitieron obtener datos de prueba de concepto en un tamaño de muestra relativamente pequeño.

En resumen, exploramos el desarrollo de un proceso de discriminación completamente automatizado para AD basado en épocas breves de EEG en estado de reposo utilizando un montaje de canal de baja densidad, una canalización de análisis automatizado de extremo a extremo para el preprocesamiento de datos y extracción de características guiada estadísticamente, lo que lleva a la clasificación ML explicable con alta precisión. Por lo tanto, este estudio presenta una prueba de concepto para una tecnología escalable que potencialmente podría usarse para diagnosticar la EA en entornos clínicos como complemento de las pruebas neuropsicológicas convencionales, mejorando así la eficiencia, la reproducibilidad y la practicidad del diagnóstico de la EA. Se requiere una mayor evaluación y prueba en conjuntos de datos más grandes para validar aún más nuestros resultados.