¿Puede el análisis de voz impulsado por IA ayudar a identificar los trastornos mentales?

Este artículo es parte de una serie limitada sobre el potencial de la inteligencia artificial para resolver problemas cotidianos.

Imagine una prueba tan rápida y fácil como tomarse la temperatura o medir la presión arterial que podría identificar de manera confiable un trastorno de ansiedad o predecir una recaída depresiva inminente.

Los proveedores de atención médica tienen muchas herramientas para medir la condición física de un paciente, pero no tienen biomarcadores confiables (indicadores objetivos de estados médicos observados desde fuera del paciente) para evaluar la salud mental.

Pero algunos investigadores de inteligencia artificial ahora creen que el sonido de su voz podría ser la clave para comprender su estado mental, y la IA se adapta perfectamente para detectar tales cambios, que son difíciles, si no imposibles, de percibir de otra manera. El resultado es un conjunto de aplicaciones y herramientas en línea diseñadas para rastrear su estado mental, así como programas que brindan evaluaciones de salud mental en tiempo real a proveedores de telesalud y centros de llamadas.

Los psicólogos saben desde hace tiempo que ciertos problemas de salud mental pueden detectarse escuchando no solo a qué una persona dice pero cómo ellos lo dicen, dijo María Espinola, psicóloga y profesora asistente de la Facultad de Medicina de la Universidad de Cincinnati.

Con los pacientes deprimidos, dijo el Dr. Espínola, “su habla es generalmente más monótona, plana y suave. También tienen un rango de tono reducido y un volumen más bajo. Hacen más pausas. Se detienen más a menudo”.

Los pacientes con ansiedad sienten más tensión en sus cuerpos, lo que también puede cambiar la forma en que suena su voz, dijo. “Tienden a hablar más rápido. Tienen más dificultad para respirar”.

Hoy en día, los investigadores de aprendizaje automático están aprovechando este tipo de características vocales para predecir la depresión y la ansiedad, así como otras enfermedades mentales como la esquizofrenia y el trastorno de estrés postraumático. El uso de algoritmos de aprendizaje profundo puede descubrir patrones y características adicionales, tal como se capturan en grabaciones de voz breves, que pueden no ser evidentes ni siquiera para los expertos capacitados.

“La tecnología que estamos usando ahora puede extraer características que pueden ser significativas y que ni siquiera el oído humano puede captar”, dijo Kate Bentley, profesora asistente en la Escuela de Medicina de Harvard y psicóloga clínica en el Hospital General de Massachusetts.

Recomendado: El modelo de transformador

“Hay mucho entusiasmo por encontrar indicadores biológicos o más objetivos de diagnósticos psiquiátricos que vayan más allá de las formas de evaluación más subjetivas que se usan tradicionalmente, como entrevistas calificadas por médicos o medidas de autoinforme”, dijo. Otras pistas que los investigadores están rastreando incluyen cambios en los niveles de actividad, patrones de sueño y datos de redes sociales.

Estos avances tecnológicos llegan en un momento en que la necesidad de atención de salud mental es particularmente aguda: según un informe de la Alianza Nacional sobre Enfermedades Mentales, uno de cada cinco adultos en los Estados Unidos experimentó una enfermedad mental en 2020. Y los números continúan aumentando .

Aunque la tecnología de inteligencia artificial no puede abordar la escasez de proveedores de atención de la salud mental calificados (no hay suficientes para satisfacer las necesidades del país, dijo el Dr. Bentley), existe la esperanza de que pueda reducir las barreras para recibir un diagnóstico correcto, ayudar a los médicos a identificar pacientes que pueden dudar en buscar atención y facilitar el autocontrol entre visitas.

“Pueden pasar muchas cosas entre citas, y la tecnología realmente puede ofrecernos el potencial para mejorar el monitoreo y la evaluación de una manera más continua”, dijo el Dr. Bentley.

Para probar esta nueva tecnología, comencé descargando la aplicación Mental Fitness de Sonde Health, una empresa de tecnología de la salud, para ver si mis sentimientos de malestar eran una señal de algo grave o si simplemente estaba languideciendo. Descrita como “un producto de seguimiento y registro de aptitud mental impulsado por voz”, la aplicación gratuita me invitó a registrar mi primer registro, una entrada de diario verbal de 30 segundos, que clasificaría mi salud mental en una escala de 1 a 100.

Un minuto después obtuve mi puntaje: un no muy bueno 52. “Presta atención”, advirtió la aplicación.

La aplicación marcó que el nivel de vivacidad detectado en mi voz era notablemente bajo. ¿Soné monótono simplemente porque había estado tratando de hablar en voz baja? ¿Debo prestar atención a las sugerencias de la aplicación para mejorar mi estado mental yendo a caminar o despejando mi espacio? (La primera pregunta podría indicar una de las posibles fallas de la aplicación: como consumidor, puede ser difícil saber por qué sus niveles vocales fluctúan.)

Más tarde, sintiéndome nervioso entre entrevistas, probé otro programa de análisis de voz, este se centró en detectar niveles de ansiedad. StressWaves Test es una herramienta en línea gratuita de Cigna, el conglomerado de atención médica y seguros, desarrollada en colaboración con el especialista en inteligencia artificial Ellipsis Health para evaluar los niveles de estrés utilizando muestras de 60 segundos de voz grabada.

«¿Lo que te mantiene despierto en la noche?» fue el aviso del sitio web. Después de pasar un minuto contando mis preocupaciones persistentes, el programa puntuó mi grabación y me envió un comunicado por correo electrónico: “Tu nivel de estrés es moderado”. A diferencia de la aplicación Sonde, el correo electrónico de Cigna no ofrecía consejos útiles para la superación personal.

Otras tecnologías agregan una capa potencialmente útil de interacción humana, como Kintsugi, una empresa con sede en Berkeley, California, que recaudó $ 20 millones en fondos de la Serie A a principios de este mes. Kintsugi lleva el nombre de la práctica japonesa de reparar la cerámica rota con vetas de oro.

Fundada por Grace Chang y Rima Seiilova-Olson, quienes se unieron por la experiencia pasada compartida de luchar para acceder a la atención de salud mental, Kintsugi desarrolla tecnología para proveedores de telesalud y centros de llamadas que pueden ayudarlos a identificar pacientes que podrían beneficiarse de más apoyo.

Mediante el uso del programa de análisis de voz de Kintsugi, se puede pedir a una enfermera, por ejemplo, que se tome un minuto adicional para preguntarle a un padre acosado por un bebé con cólicos sobre su propio bienestar.

Una preocupación con el desarrollo de este tipo de tecnologías de aprendizaje automático es el problema del sesgo: garantizar que los programas funcionen de manera equitativa para todos los pacientes, independientemente de su edad, sexo, etnia, nacionalidad y otros criterios demográficos.

“Para que los modelos de aprendizaje automático funcionen bien, realmente se necesita tener un conjunto de datos muy grande, diverso y sólido”, dijo Chang, y señaló que Kintsugi usó grabaciones de voz de todo el mundo, en muchos idiomas diferentes, para protegerse contra este problema en particular.

Otra preocupación importante en este campo naciente es la privacidad, en particular los datos de voz, que se pueden usar para identificar a las personas, dijo el Dr. Bentley.

E incluso cuando los pacientes aceptan ser grabados, la cuestión del consentimiento a veces tiene dos aspectos. Además de evaluar la salud mental de un paciente, algunos programas de análisis de voz utilizan las grabaciones para desarrollar y refinar sus propios algoritmos.

Otro desafío, dijo el Dr. Bentley, es la posible desconfianza de los consumidores hacia el aprendizaje automático y los llamados algoritmos de caja negra, que funcionan de una manera que incluso los propios desarrolladores no pueden explicar por completo, en particular qué características usan para hacer predicciones.

«Existe la creación del algoritmo y la comprensión del algoritmo», dijo el Dr. Alexander S. Young, director interino del Instituto Semel de Neurociencia y Comportamiento Humano y presidente de psiquiatría de la Universidad de California, Los Ángeles, haciéndose eco de las preocupaciones. que muchos investigadores tienen sobre la IA y el aprendizaje automático en general: esa poca o ninguna supervisión humana está presente durante la fase de capacitación del programa.

Por ahora, el Dr. Young sigue siendo cautelosamente optimista sobre el potencial de las tecnologías de análisis de voz, especialmente como herramientas para que los pacientes se controlen a sí mismos.

“Creo que se puede modelar el estado de salud mental de las personas o aproximarse a su estado de salud mental de manera general”, dijo. “A la gente le gusta poder autocontrolar sus estados, particularmente con enfermedades crónicas”.

Pero antes de que las tecnologías automatizadas de análisis de voz entren en uso generalizado, algunos piden investigaciones rigurosas sobre su precisión.

“Realmente necesitamos más validación no solo de la tecnología de voz, sino también de modelos de aprendizaje automático e inteligencia artificial basados en otros flujos de datos”, dijo el Dr. Bentley. “Y necesitamos lograr esa validación a partir de estudios representativos bien diseñados y a gran escala”.

Hasta entonces, la tecnología de análisis de voz impulsada por IA sigue siendo una herramienta prometedora pero no probada, que eventualmente puede ser un método cotidiano para medir la temperatura de nuestro bienestar mental.