Durante años, el profesor de informática de Illinois Sanmi Koyejo centró su investigación en la inteligencia artificial en dos áreas: herramientas de aprendizaje y análisis de imágenes biomédicas. Juntos, cree que estos avances podrían alterar la forma en que las entidades sanitarias reaccionan a más datos.
Las personas adecuadas han notado este trabajo, y el apoyo a la investigación de Koyejo ha crecido mientras su grupo de trabajo trata de ayudar al mundo a reaccionar rápidamente a la pandemia de COVID-19.
Para fomentar este esfuerzo, el grupo de investigación de Koyejo recientemente obtuvo un premio del Instituto de Transformación Digital (DTI) C3.ai para alterar la forma en que las entidades sanitarias toman decisiones basadas en datos.
El objetivo que impulsa el trabajo en el DTI, según Thomas M. Siebel, CEO de C3.ai y ex-alumno de Illinois CS, es unirse a «los principales científicos, investigadores, innovadores y ejecutivos de la academia y la industria» para «acelerar los beneficios sociales y económicos de la transformación digital».
Al impulsar estos proyectos, existe el potencial, según Siebel, de «cambiar el curso de una pandemia mundial».
«Sólo con mirar la lista de proyectos del DTI y entender en qué están trabajando, la inclusión con ese grupo es tan emocionante», dijo Koyejo. «Tenemos un gran equipo, y estoy deseando que el futuro vaya más allá de este trabajo inicial. Es inspirador pensar en cómo la informática puede impactar en el mundo».
Para comenzar este proceso con las entidades sanitarias, el equipo de Koyejo está trabajando en la forma de utilizar los datos. El título de su proyecto otorgado por el DTI es «Aprendizaje Federado Seguro para Informática Clínica con Aplicaciones a la Pandemia COVID-19».
El grupo de trabajo incluye a Koyejo como investigador principal, junto con:
- Co-investigador: Dakshita Khurana, profesor en Illinois CS
- Co-investigador: William Bond, OSF HealthCare y Jump Simulation
- Personal superior: George Heintz, Centro de Sistemas de Ingeniería de la Salud, Universidad de Illinois en Urbana-Champaign
- Personal superior: Roopa Foulger, OSF HealthCare
«Nuestro trabajo está orientado hacia el futuro. Nuestro trabajo espera mejorar algunas de las herramientas al alcance de los responsables de la toma de decisiones para ayudarles ahora, y, quizás aún más importante, en el futuro», dijo Koyejo. «Esto podría afectar a la atención continua, a la preparación, y a cómo será la atención en el futuro». Sabemos, o esperamos, que los brotes de enfermedades contagiosas continuarán, y parte de nuestro objetivo es estar más preparados la próxima vez».
Al entender que el pan y la mantequilla del aprendizaje automático son los datos, el aprendizaje federado entrena los modelos de aprendizaje automático en datos distribuidos y no compartibles.
Como dice Koyejo, «una cosa que hace el aprendizaje federado, es que en lugar de llevar los datos a la computación, lleva la computación a los datos».
Este avance llega al mismo tiempo que la industria ha comenzado a aprovechar más fuentes de datos. Los teléfonos celulares se están volviendo más poderosos. Los dispositivos de borde tienen procesadores incluidos. Incluso los hospitales están recurriendo a fuentes de computación en la nube o a poderosas computaciones internas.
«Si los datos son el pan y la mantequilla del aprendizaje federado, un corolario de esa afirmación es que cuantos más datos tengas, mejor», dijo Koyejo. «Eso es porque más datos significa que tu trabajo es más representativo. Para los hospitales individuales, el beneficio del aprendizaje federado es mejorar los sistemas automatizados de apoyo a las decisiones».
Por supuesto, al ampliar las fuentes de datos y los métodos para analizarlos, la seguridad también se convierte en un problema. Y en el cuidado de la salud, la seguridad es siempre un problema, ya que los sistemas de salud buscan mantener los datos de los pacientes en privado.
Por eso la colaboración con su colega del CS de Illinois es emocionante para Koyejo. La investigación de Khurana enfatiza la criptografía y la privacidad/seguridad. Esto proporcionará nuevos «protocolos para permitir el aprendizaje de la máquina en datos privados distribuidos».
Su proyecto utilizará datos públicos del lago de datos C3.ai, así como datos privados del socio de investigación OSF Healthcare.
«Nuestro objetivo principal es permitir que múltiples instituciones con sus propios datos médicos privados colaboren en la formación de modelos precisos en sus conjuntos de datos combinados», dijo Khurana. «Las regulaciones de privacidad impiden que los proveedores de salud junten sus datos en un solo lugar para realizar una mejor inferencia clínica. La criptografía, a través de una herramienta llamada computación segura multipartita, puede sin embargo permitir a estas instituciones computar funciones arbitrarias de sus datos conjuntos sin tener que compartirlos entre sí o con un tercero».
Las herramientas que este equipo de investigación producirá provienen de una combinación de datos seguros y una mejor calidad de predicción.
«En la medida en que tengamos éxito, esto puede ayudar a los que toman las decisiones a tomar las decisiones difíciles», dijo Koyejo. «Se trata de qué pacientes necesitan más tratamiento en el hospital. Estas herramientas también pueden ayudar con las decisiones sobre el alta de los pacientes o que necesitan el limitado equipo médico en un momento de necesidad.
«Más allá de eso, el alcance de esta subvención se construirá hacia algo más. La democratización de la información de la atención médica se trata de eliminar las barreras a la información y mejorar las disparidades en la calidad de la atención».