La capacidad de examinar datos de manera profunda y reveladora ha cambiado fundamentalmente el mundo. Sin embargo, a pesar de los enormes avances en análisis y aprendizaje automático, los investigadores, las empresas y los gobiernos siguen paralizados por un problema básico pero persistente: muchos datos son confidenciales y compartirlos presenta riesgos de seguridad y privacidad.
Aunque numerosas tecnologías, como la tokenización de datos, el k-anonimato, el cifrado homomórfico y los entornos de ejecución de confianza (TEE) han ayudado a domesticar a la bestia, no abordan el problema fundamental de que los datos confidenciales cruzan fronteras no deseadas. En consecuencia, muchas organizaciones dudan en compartir datos que puedan generar conocimientos notables. El problema es especialmente agudo cuando las organizaciones tienen secretos comerciales, datos de clientes o información de identificación personal (PII) incrustada en los datos.
Un marco emergente llamado aprendizaje de IA federada (inteligencia artificial) podría cambiar todo esto, al tiempo que da lugar a cambios más amplios en la forma en que se utilizan y se poseen los datos. La tecnología tiene importantes repercusiones en el aprendizaje automático, la seguridad y la privacidad. «Representa el futuro del aprendizaje automático seguro», dice Eliano Marques, vicepresidente de datos e inteligencia artificial de la firma de seguridad de datos Protegrity.
Repensar el modelo
La IA federada toma la idea convencional del aprendizaje automático y la pone patas arriba. En lugar de que varios grupos envíen datos a una nube central donde tiene lugar el aprendizaje automático, el algoritmo viaja al dispositivo informático. Todo el entrenamiento se realiza en el cliente o dispositivo, y cuando el algoritmo determina que está terminado, sale del dispositivo y se lleva los resultados. «No se comparten datos», dice Jigar Mody, jefe de servicios de inteligencia artificial de Oracle.
De hecho, una vez que se lleva a cabo el proceso de aprendizaje automático, el resultado es el único activo común. Esto hace posible que un grupo de empresas, institutos de investigación o agencias gubernamentales agrupen datos y extraigan resultados de forma segura. Como resultado, es posible proteger mejor los secretos comerciales y la información de identificación personal (PII). También es posible llevar el aprendizaje automático más allá de los límites convencionales y abrir nuevas oportunidades. Por ejemplo, la tecnología puede realizar cálculos en grandes conjuntos de datos de forma independiente, minimizando los problemas asociados con el ancho de banda y las conexiones lentas.
Aunque el marco tiene solo unos años, fue concebido por un grupo de investigadores en 2017, el aprendizaje de inteligencia artificial federada está avanzando rápidamente. Google ha presentado TensorFlow Federated, un marco de trabajo de código abierto que admite el aprendizaje automático federado. Han surgido varias otras bibliotecas de código abierto, incluidas PySyt, PyTorch y Federated AI Technology Enabler (FATE). Mientras tanto, empresas emergentes como S20.ai, Owkin y Snips han introducido soluciones comerciales para respaldar la IA federada.
La tecnología está ganando terreno, especialmente en el ámbito de la salud. Por ejemplo, los investigadores del Sistema de Salud Mount Sinai, con sede en la ciudad de Nueva York, utilizaron recientemente la técnica para analizar los registros médicos electrónicos y predecir mejor cómo progresarán los pacientes con COVID-19, sin comprometer la privacidad del paciente. En el Reino Unido, King’s College London y el Servicio Nacional de Salud (NHS) están utilizando la tecnología para estudiar datos de pacientes sobre cáncer, enfermedades cardíacas y problemas neurológicos.
El aprendizaje de inteligencia artificial federado es particularmente valioso para los investigadores que intentan estudiar condiciones raras, dice Nicola Rieke, arquitecta senior de soluciones de aprendizaje profundo para Healthcare en NVIDIA. «El aprendizaje federado podría revolucionar la forma en que se entrenan los modelos de IA».
Cuidado con la privacidad
El valor de Federated AI Learning se extiende mucho más allá de la atención médica. Puede ayudar a identificar el fraude y estudiar los agujeros negros en el espacio utilizando datos de varios telescopios. Apple ya lo usa para mejorar Siri.
Federated AI Learning podría cambiar fundamentalmente la aplicación de la ley y abordar áreas como el fraude, la trata de personas y el terrorismo, dice Marques. Al establecer un marco que simplifica la recopilación y el análisis de datos, y al eliminar la necesidad de transmitir datos altamente sensibles, un grupo de organizaciones o agencias podría conectar puntos de datos y resolver delitos. «La tecnología identificaría patrones sospechosos e identificaría a las personas cuando hubiera una señal de alerta», explica.
Mody de Oracle dice que la tecnología podría remodelar fundamentalmente la privacidad del consumidor. Con el software de IA federado correcto que se ejecuta en una PC o un teléfono inteligente, una persona puede dar su consentimiento para compartir datos con una empresa, o no. Además, a medida que las regulaciones de datos como el Reglamento general de protección de datos (GDPR) de Europa y la Ley de privacidad del consumidor de California (CCPA) se expanden a otros países y estados, la tecnología puede proporcionar una forma de simplificar la seguridad de los datos al facilitar que los consumidores posean sus datos.
Por ahora, quedan algunos obstáculos. Los algoritmos de IA federada y los modelos de entrenamiento continúan madurando y mejorando, los modelos y metodologías son algo inconsistentes y las capacidades de procesamiento limitadas en muchos dispositivos de borde pueden limitar las capacidades de entrenamiento e inferencia. Sin embargo, el concepto de descentralización de la inteligencia artificial y el aprendizaje automático está ganando impulso. Mody dice: «Esta es una tecnología extremadamente prometedora que dará forma al futuro de la IA».
Samuel Greengard es un autor y periodista que vive en West Linn, Oregón, EE. UU.
entradas no encontradas