Tal Wenderow sabe lo que se necesita para triunfar con una nueva tecnología. Wenderow es CEO de Vocalis Health, con sede en Newton, MA, que está desarrollando una plataforma basada en inteligencia artificial y aprendizaje automático capaz de discernir cambios en la salud a través de cambios sutiles en la voz de una persona.
Su última empresa, el proveedor de cirugía robótica Corindus Vascular Robotics, fue adquirida por Siemens en 2019 por $ 1.1 mil millones. Pero difícilmente fue una historia de éxito de la noche a la mañana; «Fueron necesarios 17 años», dijo. «La gente olvida el tiempo que se tarda a veces».
Cuando se inscribió en Vocalis Health, dijo, su esposa le preguntó si estaba seguro de que no quería tomarse un respiro. Sin embargo, siguió adelante de todos modos; «Me gustó su naturaleza disruptiva».
Las comunidades clínicas y financieras están comenzando a notar la interrupción. A Vocalis Health le falta aproximadamente un año para recibir $ 9 millones en fondos de riesgo, y pasó el 2020 estableciendo o consolidando relaciones de investigación con la Clínica Mayo y el Sistema de Salud Geisinger en los EE. UU. Su tecnología también fue el eje de un estudio israelí de las características vocales de los síntomas congestivos. insuficiencia cardiaca.
Wenderow no está solo en el posicionamiento de la nueva tecnología analítica basada en voz para una mayor aceptación. En otros lugares, las empresas derivadas académicas y las boutiques se están posicionando para un mercado de diagnóstico remoto cuyas posibilidades se han expandido rápidamente en la dinámica de aislamiento social de la pandemia de COVID-19. Por ejemplo:
- Aural Analytics, una empresa derivada de la Universidad Estatal de Arizona, recibió $ 4.3 millones en fondos de riesgo en septiembre de 2019 para expandir su plataforma de ensayos clínicos, el lanzamiento global de su portal de integración de próxima generación para respaldar la recopilación y el análisis del habla, y varios nuevos grados clínicos Productos móviles y web para servir a lo largo de la atención continua en neurología.
- Sonde Health, con sede en Boston, completó la adquisición de la startup de análisis vocal NeuroLex en agosto de 2020; La fusión combinó las 300.000 muestras de voz de Sonde de 50.000 personas con la plataforma SurveyLex, característica de NeuroLex. SurveyLex permitió a los investigadores crear y distribuir encuestas de voz en menos de un minuto como enlaces URL a través de navegadores web. Contenía un biobanco de más de 500.000 muestras de voz de más de 30.000 personas.
«Las cosas están saliendo de la academia porque el costo es razonable», dijo la investigadora Reza Hosseini Ghomi, M.D., profesora del departamento de neurología de la Universidad de Washington y del Instituto de Neuroingeniería. Hosseini Ghomi era el director médico de NeuroLex antes de la venta a Sonde. Él predice que habrá más proyectos emergentes de este tipo en el futuro cercano.
«Puede tomar entre $ 5,000 y $ 10,000 en capital inicial y realmente ir a alguna parte. Pudimos iniciar NeuroLex porque Google Cloud dijo: ‘Aquí hay $ 100,000 de crédito’, y pudimos comenzar a hacer muchos análisis de voz. En los próximos cinco a 10 años, veremos algo en el mercado que esté orientado al paciente, tal como lo estamos viendo con las tecnologías Apple Watch o el escaneo retiniano automatizado. La voz llegará allí «.
¡Aguanta tu ronquera!
Los pioneros de la investigación de biomarcadores vocales se encuentran entre los más cautelosos cuando se habla de la rapidez con la que la tecnología emergerá de los laboratorios de investigación y las liberaciones limitadas hacia la viabilidad comercial a gran escala. Las macrotendencias, como la mayor disponibilidad de datos y los menores costos asociados con la computación en la nube, han ayudado a los investigadores a escalar proyectos con mayor rapidez; Sin embargo, dicen, existe una gran desconexión entre la percepción del público de lo que puede hacer el análisis de voz (basado en motores de reconocimiento de voz como Siri de Apple y Alexa de Amazon) y las necesidades altamente especializadas de los investigadores clínicos de voz, que dependen de cambios minúsculos en acústica de voz, en lugar de palabras solas.
La comunidad es todavía pequeña y colegiada, y se habla entre ellos con regularidad. Dicha comunicación les ayuda a equilibrar la exageración en torno a la inteligencia artificial (IA) y la realidad de crear un nuevo campo.
«Una de las principales razones por las que me gusta hablar con otras personas en este espacio es que, en cierto sentido, son los únicos que saben lo difícil que es», dijo Visar Berisha, director de análisis y cofundador de Aural Analytics. «Desde el exterior, mirarlo parece tan convincente y fácil; puedes recopilar el habla con tanta facilidad y es cognitivamente agotador de producir, por lo que si hay alteraciones, es de esperar que puedas captar algo. Pero en realidad es muy difícil. «
Por ejemplo, dijo Wenderow de Vocalis Health, los investigadores de la compañía compararon recientemente las señales que produce un paciente con COVID-19 con las de un paciente con enfermedad pulmonar obstructiva crónica (EPOC). Si bien la intuición puede sugerir que las señales serían similares, si no idénticas, Wenderow dijo que no lo eran.
«Si tiene una afección de las vías respiratorias superiores, pensaría que debería ser exactamente lo mismo, y no fue así. Por lo tanto, en lugar de tener un biomarcador vocal general como fiebre, a partir de los datos que hemos recopilado parecen haber otros diferentes para diferentes enfermedades «.
Cuando los investigadores comienzan a diseñar modelos de aprendizaje automático vocal, entonces, necesitan equilibrar la ruta más probable para una adopción más rápida del mercado: la creación de una señal bastante amplia de «luz de verificación del motor» que podría alertar al médico sobre los síntomas de cualquiera de varias afecciones subyacentes. —O una señal más específica de una o unas pocas enfermedades posibles.
Por supuesto, la señal más específica que uno busca, más se ve atrapado en el dilema de modelar para variables cada vez mayores: la maldición de la dimensionalidad, dijo Berisha.
«Esa es probablemente la parte más desafiante», dijo. «Si está midiendo cientos o miles de características del habla, el tamaño de la muestra tiene que crecer exponencialmente. Es difícil porque tiene que averiguar qué variables medir, y luego debe tener suficientes datos para asegurarse de que realmente está midiendo qué crees que estás midiendo «.
Sin embargo, definir y luego encontrar «datos suficientes» es actualmente un problema del huevo y la gallina en la investigación de la voz. En un ensayo de advertencia sobre la exageración que rodea a la inteligencia artificial y la investigación de la voz, Berisha notó un antagonismo continuo entre el enfoque de «mejores prácticas» para crear el modelo de reconocimiento de voz más preciso posible (con una cantidad aparentemente interminable de datos de voz con los que trabajar) y lo que Los investigadores de biomarcadores de voz enfrentan: «Para algunas aplicaciones, particularmente aquellas enfocadas en enfermedades que ocurren raramente, la población de pacientes simplemente no existe para generar datos a esta escala», escribió. «Si existe, no está disponible en un único repositorio, y existen desafíos complejos asociados con la combinación entre fuentes de datos. Más importante aún, incluso si los datos del habla existen, los datos clínicos requeridos para entrenar los modelos son muy costosos y difíciles de generar.»
El director de operaciones y cofundador de Sonde Health, Jim Harper, dijo que las barreras de datos se están abordando en cierta medida mediante fusiones y adquisiciones, como la compra de NeuroLex por parte de su empresa.
«Tenemos más de un millón de archivos de audio de más de 80.000 personas», dijo Harper. «Donde comúnmente verá publicaciones de investigación y literatura revisada por pares, como estudios de prueba de concepto que funcionan con 50 a 200 personas, ahora estamos entrenando modelos con 5,000 a 10,000 personas que hablan varios idiomas. Nuestros mayores obstáculos ahora, honestamente, están en hacer coincidir el caso de uso y la propuesta de valor y comercializar la tecnología «.
Varias formas de avanzar
La gravedad de la pandemia de COVID-19 le dio a la industria de la salud, donde las medidas de seguridad reglamentarias a menudo exigen tiempos de retraso prolongados entre la introducción de un tratamiento o tecnología y su adopción generalizada, y donde la tradición también ralentiza el uso de una solución disruptiva, una rápida lección sobre la monitorización remota de pacientes . Las visitas de atención primaria a través de videollamadas, que ocupaban los márgenes más estrechos de casos de uso antes de la pandemia, se convirtieron en una rutina. Las tecnologías de monitoreo remoto de síntomas y las nuevas aprobaciones de reembolso del gobierno de EE. UU. Han abierto la puerta a plataformas como los biomarcadores vocales.
«La conveniencia y la capacidad de realizar la mayoría de las visitas de atención primaria de forma remota significará que la demanda de lo que estamos construyendo aumentará», dijo Harper, «y las empresas que tengan éxito allí probablemente serán nuestros mejores socios en el futuro».
Harper dijo que una de las razones por las que ve que el análisis vocal gana terreno en los encuentros remotos se debe a la pérdida de pistas adicionales que permite un encuentro en persona: «Estás comprimiendo el audio, no puedes ver todo en el lenguaje corporal. Creo que algo de eso de lo que podemos hacer con nuestra tecnología se pondrá de moda «.
Los pioneros de la analítica vocal parecen haber llegado a un consenso aproximado sobre cómo proceder.
Berisha dijo que el enfoque de Aural Analytics es «primero, gravar a un individuo para que podamos medir un dominio de interés usando el habla. Si estamos interesados en medir la función cognitiva, proporcionamos tareas que provocan el habla que son cognitivamente exigentes. Si estamos interesados en midiendo la función respiratoria, pedimos tareas que graven la función respiratoria.
«Todos estos están al servicio del desarrollo de una plataforma que nos permita a otros ya nosotros mismos construir herramientas clínicas sobre ella. No está al servicio de desarrollar un diagnóstico singular de la enfermedad de Alzheimer, o un marcador de depresión».
Wenderow de Vocalis Health esbozó una filosofía similar: «Estamos construyendo la plataforma para que, a partir de una grabación de voz, tenga múltiples biomarcadores vocales. Piense en los biomarcadores vocales como un servicio personalizable».
Por ejemplo, dijo Wenderow, un cliente podría solicitar un biomarcador COVID-19 para identificar un indicador positivo o negativo: «Un caso de uso es que desea captar los resultados positivos; esa es una configuración. Otro caso de uso es determinar que quien sea indicado como negativo es verdaderamente negativo. Cualquiera de los casos de uso tiene su lugar. Encontrar lo positivo es cómo controlar la enfermedad, y determinar lo negativo es cómo puede volver a abrir negocios «.
Hosseini Ghomi, que ya ha pasado por un ciclo de inicio en el análisis vocal, dijo que prefiere llamar a las tecnologías que se están desarrollando «características vocales» en lugar de biomarcadores; él ve el camino inmediato hacia adelante del concepto como un complemento a las tecnologías clínicas establecidas. Ahora, director médico del proveedor de análisis cognitivo BrainCheck, dijo que un estudio reciente mostró cómo la voz puede contribuir a un verdadero biomarcador.
«Pudimos usar un socio para obtener los escáneres cerebrales y otras pruebas a las que pudimos agregar la plataforma de voz», dijo. «Ese fue el primer paso hacia un verdadero biomarcador, donde podemos decir que esta característica de voz se alinea con esta cosa en su cerebro. Estamos empezando a ver eso. Ese es el trabajo que realmente quiero que suceda».
Gregory Goth es un escritor de Oakville, CT que se especializa en ciencia y tecnología.
entradas no encontradas