Justo cuando estábamos a punto de lograr poderes divinos con análisis avanzados y aprendizaje automático en grandes grupos de datos, llegaron leyes de privacidad como GDPR y CCPA para matar el rumor. Pero gracias a la aparición del cifrado homomórfico, la fiesta del big data puede continuar, siempre que suficientes personas confíen en él.
El cifrado homomórfico es una tecnología relativamente nueva de la que probablemente oirá más en el futuro. Esto se debe a que hace lo que a primera vista podría parecer imposible: permite a grupos de investigadores utilizar análisis avanzados y técnicas de aprendizaje automático en datos cifrados.
La matemática detrás del cifrado homomórfico se demostró hace más de una década, pero las computadoras eran demasiado lentas para hacer que la tecnología fuera práctica para el uso diario. Eso ha cambiado en los últimos años, y ahora las grandes empresas están adoptando soluciones de cifrado homomórfico, dice Alon Kaufman, director ejecutivo y cofundador de Duality Technologies, que proporciona soluciones de cifrado homomórfico.
«Hay muchas razones por las que las empresas quieren compartir y trabajar juntas», dice Kaufman, uno de los principales expertos del mundo en cifrado homomórfico. “Al mismo tiempo, no están dispuestos a hacerlo por motivos de privacidad, por sus propias preocupaciones comerciales. Así que eso es lo que permite la dualidad «.
Las personas y los grupos tienen una buena razón para no compartir sus datos hoy: pueden perder la privacidad. Este no es un asunto trivial, particularmente a la luz de los abusos de big data de los gigantes tecnológicos, sin mencionar la posibilidad de grandes multas si se descubre que están violando GDPR, CCPA, HIPAA y cualquier otra nueva ley de privacidad que han surgido en los últimos años.
Compartir datos
Si bien es valioso preservar la privacidad, es valioso compartir datos, tanto a nivel de población como a nivel individual, dice el profesor de ciencias de la computación de UC Berkeley, Michael Jordan.
“Una enfermedad como el cáncer es una especie de enfermedad compartida que todos podríamos tener, de diferentes formas pero relacionadas”, dice Jordan, quien es asesor de Duality. «El análisis colaborativo de datos será la forma en que se resuelva».
Actualmente, los hospitales tienen prohibido agrupar sus respectivos datos sobre el cáncer y permitir que los investigadores los utilicen para encontrar patrones y tratamientos potenciales debido al riesgo de violar la privacidad de las personas. HIPAA tiene estrictos requisitos de protección del paciente y los castigos por violarlos pueden ser severos.
“Soy un hospital. Tengo todos estos excelentes datos sobre el cáncer. Me encantaría compartirlo con otros hospitales para que todos tengamos una visión más amplia sobre el cáncer como fenómeno ”, dice Jordan. Datanami. “No puedo porque la profesión legal me dice que no puedo, y la profesión legal realmente no pensó mucho en eso. Simplemente dijeron: ‘Ah, no puedo arriesgarme’.
“Bueno, si pudieras ir a la profesión legal y decir ‘Tenemos esta técnica que realmente garantiza algo aquí, ese miedo que tienes no es real’, podemos deshacernos de ese miedo”, continúa. “Entonces, la profesión legal volverá a examinar el tema y comenzará a decir: ‘Oh, veo que ciertos aspectos de los datos se pueden compartir sin riesgo para las personas. Para que podamos cambiar la ley ‘”.
Las leyes aún no se han modificado en el campo de la salud. Pero los bancos, las compañías de seguros y otras compañías de la industria de servicios financieros están avanzando con el cifrado homomórfico para combatir el fraude y cumplir con los requisitos contra el lavado de dinero (AML), dice Kaufman.
“Los reguladores durante muchos años les dijeron a las empresas que tenían que hacer AML y [fight] fraude de forma colaborativa, pero bueno, un segundo, no se le permite compartir estos datos por motivos de privacidad ”, dice Kaufman. “Estaban contando este tipo de historia conflictiva. Y adoptaron esta tecnología [homomorphic encryption] y ahora están promoviendo este tipo de cosas para permitir el intercambio bajo estas limitaciones «.
Duality está trabajando actualmente con Oracle para implementar el cifrado homomórfico en su software para combatir los delitos financieros. Según Kaufman, Oracle está implementando controles sobre qué análisis colaborativos están permitidos y qué no se pueden compartir.
“Ahora tenemos asociaciones con empresas como Oracle e IBM, que son empresas serias y esto definitivamente ayuda a generar credibilidad”, dice Kaufman. “El otro ángulo es asegurarse de que los reguladores apoyen esto. En finanzas, esto está sucediendo. En otras áreas, todavía no «.
Valoración de datos
Si bien la tecnología básica subyacente del cifrado homomórfico está lista, todavía tenemos que construir los sistemas y la infraestructura a su alrededor que realmente permitan el intercambio de datos de la manera que imagina Jordan. Es probable que se necesiten décadas para generar la confianza y la construcción económica que desencadenan por completo esto en el mundo, dice.
“Creo que la primera ola en este momento es más un modelo económico, un reconocimiento de que tenemos redes de tomadores de decisiones y ellos tienen cosas que compartir”, dice. “Están compitiendo y tienen que tener algún tipo de reglas del juego. Tienen que saber valorar las cosas ”.
Por ejemplo, ¿cuánto valen sus datos? Solo cuando tengamos una forma de valorar los datos estaremos listos para participar en colaboraciones más avanzadas, dice.
«Los datos son algo difícil de valorar», dice Jordan. “Tienes que sondearlo un poco. Si tienes la misma cita que yo, de alguna manera para que nos unamos, no es tan valioso. Si tenemos datos complementarios, es mucho más valioso. Entonces, ¿puede evaluar la complementariedad? ¿Puedes evaluar la relevancia? ¿Puedes evaluar esas cosas? ¿Y puede evaluarlo antes de revelar todo el conjunto de datos? «
“Así que necesitas herramientas, y las empresas homomórficas ciertamente son una de ellas. Es uno que Duality es líder mundial en explotación ”, continúa. “Habiéndolo explotado en algún momento, será posible construir sobre eso. Será una base sólida para hacer otro tipo de cosas «.
En opinión de Jordan, será un proceso incremental fortalecer la confianza de las personas en el cifrado homomórfico y las soluciones de intercambio de datos que se construyen sobre él. La gente se inclinará a compartir un poco de datos a cambio de algún beneficio. Si funciona como se anuncia, harán un poco más, y así sucesivamente.
“Muchos de ellos implicarán compensaciones. Estoy dispuesto a renunciar a un poco de privacidad si obtengo un valor real ”, dice. “Quiero poder establecer una compensación que sea ventajosa para mí en el contexto de un problema particular que estoy tratando de resolver. Bueno, establecer compensaciones nos coloca en el mundo de la economía … Y así, las técnicas basadas en encriptación comienzan a darle una base firme para poder decir cosas como ¿cuánto? ¿Qué tan relevante? ¿Qué util? ¿Cuáles son los parámetros de colaboración? «
Compensación económica
El mundo hasta ahora ha sido negro y mientras se trata de compartir datos, Kaufman dice
“O comparte sus datos y no tiene privacidad, o no hace nada y no obtiene ningún valor”, dice. «Esta [homemorphic encryption] abre un espectro completamente nuevo de, OK, no es un mundo en blanco y negro, hay cosas que puedes compartir. Hay diferentes tipos de garantías que puede obtener. Y es una discusión mucho más rica, diría yo, y mucho más valiosa ”.
No estamos lejos de tener las herramientas y la tecnología que permiten a los científicos e investigadores de datos utilizar de forma colaborativa grandes conjuntos de datos compartidos. Jordan está ayudando a introducir algunas de estas tecnologías en el mundo real a través de RISELab de UC Berkely, que significa Real-time Intelligent Secure Execution.
“Verás una pequeña mini revolución una vez que este tipo de cosas realmente entren en Spark y Ray y todos estos otros tipos de pilas. Habrá un poco de actividad ”, dice Jordan. “La agenda será desde el primer día hacer que sea tan fácil de usar como cualquier otra cosa. En lugar de llamar a la diferencia entre A y B, lo llamará HME [homomorphic encryption] la diferencia entre A y B. Y ahora, una vez que hizo ese código, tiene una garantía sobre algo, y eso puede tratarse como una invariante en su código, y puede ser muy, muy sencillo y fácil «.
Aún necesitará cierto grado de experiencia para adoptar HME, dice Jordan, pero seguirá el camino general en informática, donde las cosas complejas se vuelven más simples con el tiempo.
“Se necesitará una capa de experiencia para implementar realmente estas cosas de una manera seria”, dice. “Y ninguna persona entenderá todo el asunto. Va a haber capas de confianza acumuladas «.
Esa última parte, acerca de la confianza, es crucial si el mundo en general se sentirá cómodo abriendo y compartiendo sus datos.
“Hace cien años, la gente traía electricidad a su hogar por primera vez. Llevaban una lámpara o un calentador o lo que fuera, y decían ‘¿Qué tienes que hacer para convencerme de que esto no va a quemar mi casa?’ «Bueno, créame, soy un buen tecnólogo».
«No. Tenías que desarrollar esta cosa llamada, por ejemplo, el Laboratorio de Suscriptores, que estaba en todas las lámparas. Se escribió que alguien más, un tercero, había probado esta tecnología y podía garantizar que no solo la tecnología general funcionaba bien, sino que miré esta lámpara en particular «.
Jordan prevé que suceda lo mismo con los datos. Habrá terceros de confianza que nos prometen que se mantendrá nuestra privacidad y al mismo tiempo nos permitirán beneficiarnos de compartir nuestros datos.
A largo plazo, a medida que las personas se sientan cómodas compartiendo sus datos a través de terceros, surgirá un sistema que nos brindará los beneficios del intercambio de datos al tiempo que minimiza el riesgo, o al menos, nos permite realizar análisis de riesgo-beneficio y tomar decisiones informadas sobre el intercambio de datos. Esa última pieza es crucial para lograr el tipo de economía de datos que ve Jordan.
“Haces ofertas, las aceptas[yhaceseltrabajoAsíescomofuncionalaeconomíaYdealgunamaneraelaprendizajeautomáticohacrecidoenelmundosineconomíasinlicitacionesprocesosciclosderetroalimentaciónyrecopilacióndedatosdondehaypartesinteresadasytodoeso”diceJordan»Lospróximos20añostendráqueabarcartodasestascosas»[andyoudotheworkThat’skindofhowofeconomicsworksAndsomehowmachinelearninghasgrowingupintheworldwithouteconomicswithoutbidsandprocessandfeedbackloopsandcollectionofdatawherethere’sselfinterestedpartiesandallthat”Jordansays“Thenext20yearsit’sgottobeembracingallthesethings”
Artículos relacionados:
Las leyes estatales de privacidad de datos proliferan a medida que aumentan los pedidos de pautas federales
La ira se acumula por los abusos de Big Data de las grandes tecnologías
Sí, puede hacer IA sin sacrificar la privacidad