Saltar al contenido

Un enfoque de aprendizaje automático para el diagnóstico precoz de la enfermedad de Parkinson

12 de mayo de 2023

Entre todas las enfermedades neurológicas, la incidencia de la enfermedad de Parkinson (EP) ha aumentado significativamente. La EP generalmente se diagnostica sobre la base de los síntomas de los nervios motores, como temblores en reposo, rigidez y bradicinesia. Sin embargo, la detección de síntomas no motores, como estreñimiento, apatía, pérdida del olfato y trastornos del sueño, podría ayudar en el diagnóstico precoz de la EP por varios años o décadas.

En una reciente Ciencias centrales de la ACS estudiar, Científicos de la Universidad de Nueva Gales del Sur (UNSW) analizan una herramienta basada en aprendizaje automático (ML) que puede detectar la EP años antes de la aparición de los primeros síntomas.

Estudiar: El aprendizaje automático interpretable sobre datos metabolómicos revela biomarcadores para la enfermedad de Parkinson. Haber de imagen: SomYuZu/Shutterstock.com

Fondo

En la actualidad, la precisión diagnóstica general de la EP basada en los síntomas motores es del 80 %. Esta precisión podría aumentar si la EP se diagnosticara en función de biomarcadores en lugar de depender principalmente de los síntomas físicos.

Varias enfermedades se detectan en base a biomarcadores asociados con procesos metabólicos. Los biometabolitos de plasma sanguíneo o muestras de suero se evalúan utilizando herramientas analíticas como la espectrometría de masas (MS).

Los métodos de diagnóstico no invasivos que utilizan el sebo de la piel y el aliento han ganado popularidad recientemente. Estudios previos han demostrado que la EM puede proyectar perfiles de metabolitos diferenciales entre candidatos pre-PD e individuos sanos.

Esta diferencia en los perfiles de metabolitos se observó hasta 15 años antes del diagnóstico clínico de la EP. Por lo tanto, los biomarcadores de metabolitos podrían usarse para detectar la enfermedad de Parkinson mucho antes que los enfoques utilizados recientemente.

Recomendado:  Procesos Gaussianos para la clasificación con Python

Los enfoques de ML se utilizan ampliamente para desarrollar modelos de predicción precisos para el diagnóstico de enfermedades utilizando grandes datos de metabolómica. Sin embargo, el desarrollo de modelos de predicción basados ​​en conjuntos completos de datos de metabolómica está asociado con muchas desventajas, incluido el sobreentrenamiento que podría reducir el rendimiento del diagnóstico. La mayoría de los modelos se desarrollan utilizando un subconjunto más pequeño de características, que están predeterminadas por métodos estadísticos tradicionales.

Algunos enfoques de ML, como una máquina de vector de soporte lineal (SVM) y el análisis discriminante de mínimos cuadrados parciales (PLSDA) pueden no tener en cuenta las características clave en los conjuntos de datos de metabolómica. Sin embargo, esta limitación se resolvió mediante métodos avanzados de ML, como las redes neuronales (NN), que han sido especialmente diseñadas para procesar grandes datos.

NN se utiliza para desarrollar modelos que tienen un efecto no lineal. Una desventaja clave de los modelos predictivos basados ​​en NN es la falta de información mecánica y modelos no interpretables.

Las explicaciones aditivas de Shapley (SHAP) se han desarrollado recientemente para interpretar modelos ML. Sin embargo, esta técnica aún no se ha utilizado para analizar conjuntos de datos de metabolómica.

Sobre el estudio

En el estudio actual, los investigadores evaluaron muestras de sangre obtenidas del Estudio Prospectivo Europeo Español sobre Nutrición y Cáncer (EPIC) utilizando diferentes herramientas analíticas como cromatografía de gases-MS (GC-MS), electroforesis-MS capilar (CE-MS) y líquido. cromatografía-MS (LC-MS).

El estudio EPIC proporcionó datos de metabolómica de muestras de plasma sanguíneo obtenidas de candidatos sanos, así como de aquellos que desarrollaron EP más tarde hasta 15 años después de que se recolectó originalmente su muestra.

Recomendado:  Microsoft finaliza el equipo de ética de IA mientras se acerca a OpenAI • The Register

Diane Zhang, investigadora de la UNSW, desarrolló una herramienta de ML llamada Clasificación y análisis de clasificación utilizando redes neuronales que generan conocimiento a partir de la EM (CRANK-MS). Esta herramienta se creó para interpretar el marco basado en NN para analizar el conjunto de datos de metabolómica generado por las herramientas analíticas.

CRANK-MS se compone de varias características, incluidos los parámetros de modelo integrados que ofrecen conjuntos de datos de metabolómica de alta dimensionalidad para ser analizados sin necesidad de preseleccionar características químicas.

CRANK-MS también incluye SHAP para explorar e identificar retrospectivamente las características químicas clave que ayudan en la predicción precisa del modelo. Además, SHAP permite realizar pruebas comparativas con cinco métodos de aprendizaje automático bien conocidos para comparar el rendimiento del diagnóstico y validar las características químicas.

Los datos metabolómicos obtenidos de 39 pacientes que desarrollaron EP hasta 15 años después se investigaron a través de la herramienta basada en ML recientemente desarrollada. El perfil de metabolitos de 39 pacientes con pre-PD se comparó con 39 pacientes de control emparejados, lo que proporcionó una combinación única de metabolitos que podría usarse como una señal de advertencia temprana para la incidencia de PD. En particular, este enfoque de ML exhibió una mayor precisión para predecir la EP antes del diagnóstico clínico.

Cinco metabolitos obtuvieron puntajes consistentemente altos en los seis modelos de ML, lo que indica su utilidad potencial para predecir el desarrollo futuro de la enfermedad de Parkinson. Las clases de estos metabolitos incluían sustancias alquílicas polifluoradas (PFAS), triterpenoides, diacilglicerol, esteroides y colestano esteroides.

Recomendado:  Ajuste el rendimiento de XGBoost con curvas de aprendizaje

Los isómeros del metabolito de diacilglicerol 1,2-diacilglicerol (34:2) detectados son ciertos aceites vegetales como el aceite de oliva, que se consume con frecuencia en la dieta mediterránea. PFAS es una neurotoxina ambiental que puede alterar el procesamiento, la señalización y la función de las células neuronales. Por lo tanto, tanto los factores dietéticos como los ambientales pueden contribuir al desarrollo de la EP.

Conclusiones

CRANK-MS está disponible públicamente para todos los investigadores interesados ​​en el diagnóstico de enfermedades utilizando el enfoque ML basado en datos metabolómicos.

La aplicación de CRANK-MS para detectar la enfermedad de Parkinson es solo un ejemplo de cómo la IA puede mejorar la forma en que diagnosticamos y monitoreamos las enfermedades. Lo emocionante es que CRANK-MS se puede aplicar fácilmente a otras enfermedades para identificar nuevos biomarcadores de interés. Además, afirmó que esta herramienta es fácil de usar y puede generar resultados “en menos de 10 minutos en una computadora portátil convencional”.

Referencia de la revista:

  • Zhang, DJ, Xue, C., Kolachalama, VB y Donald, WA (2023) El aprendizaje automático interpretable sobre datos metabolómicos revela biomarcadores para la enfermedad de Parkinson. Ciencias Centrales de la AEC. doi:10.1021/accentsci.2c01468