TechScape: Clearview AI recibió una multa de 7,5 millones de libras esterlinas por recolectar descaradamente sus datos, ¿le importa?

Tu rostro tiene un defensor: la ICO. El lunes, el regulador de protección de datos del Reino Unido emitió su tercera multa más grande hasta la fecha contra el proveedor de reconocimiento facial Clearview AI. De nuestra historia:

El organismo de control de datos del Reino Unido ha multado a una empresa de reconocimiento facial con 7,5 millones de libras esterlinas por recopilar imágenes de personas de plataformas de redes sociales y la web para agregarlas a una base de datos global.

La Oficina del Comisionado de Información (ICO, por sus siglas en inglés) también ordenó a Clearview AI, con sede en EE. UU., que elimine los datos de los residentes del Reino Unido de sus sistemas. Clearview ha recopilado más de 20.000 millones de imágenes de rostros de personas y datos de Facebook, otras empresas de redes sociales y de la exploración de la web.

Retomando un hilo del boletín de la semana pasada, muchas nuevas empresas se construyen en torno a la idea básica de romper las reglas silenciosamente hasta que seas lo suficientemente grande como para que puedas cumplir (o incluso mejor, hasta que seas lo suficientemente grande como para cambiar las reglas para promover innovación y hacer lo que haces legal de todos modos). Pero es raro que una empresa sea tan beligerante con ese enfoque como Clearview.

Suscríbase a nuestro boletín semanal de tecnología, TechScape.

La empresa irrumpió en la conciencia pública a principios de 2020, después de que una exposición del New York Times la describiera como «la empresa secreta que podría acabar con la privacidad tal como la conocemos». El producto de Clearview era simple: tecnología de reconocimiento facial, comercializada especialmente para las fuerzas del orden público, que podía tomar una fotografía de un sospechoso y arrojar una conjetura sólida sobre su nombre.

Como tecnología, en realidad no era muy novedosa. Por supuesto, ya se había incorporado una tecnología similar en Facebook, y la empresa rusa FindFace ofrecía un servicio similar a nivel nacional desde 2016. La parte impresionante del trabajo de Clearview fue, en cambio, construir la base de datos necesaria para que el sistema funcionara.

Cualquier sistema de reconocimiento facial como ese necesita en su corazón una colección masiva de rostros de personas, vinculados con sus nombres. Y Clearview lo reunió de la manera más descarada posible: simplemente lo tomó todo de las redes sociales. Como escribió Kashmir Hill del New York Times:

El sistema, cuya columna vertebral es una base de datos de más de tres mil millones de imágenes que Clearview afirma haber extraído de Facebook, YouTube, Venmo y millones de otros sitios web, va mucho más allá de cualquier cosa construida por el gobierno de los Estados Unidos o los gigantes de Silicon Valley.

Habría sido imposible obtener esa información con el permiso de Facebook, incluso antes de Cambridge Analytica, por lo que Clearview simplemente no se molestó. En cambio, asumió la apuesta de que, incluso si lo atrapaban, era poco probable que se viera obligado a eliminar los datos que ya había recopilado.

La apuesta valió la pena. En el furor que siguió a la publicación del NYT, Facebook, YouTube, Twitter y LinkedIn exigieron a la empresa que dejara de recopilar imágenes de sus sitios. Pero su capacidad para hacerlo es limitada: extraer datos de sitios públicos es legal según la ley de los EE. UU., y las regulaciones de protección de datos de los EE. UU. son limitadas y, en su mayoría, están vinculadas a la ley contractual, por lo que Clearview no tiene trabas, porque no llegó a ningún acuerdo. con las personas cuyos datos trata. Algunos reguladores estatales han tomado medidas contra Clearview, e Illinois, que tiene la ley de privacidad biométrica más estricta del país, aseguró este mes que la empresa prohibiera trabajar con el sector privado en el estado (ya había cesado voluntariamente tales acuerdos en 2020 , dice Clearview). Pero, aparte de eso, la compañía continúa operando más o menos sin oposición en los EE. UU.

Ese no es el caso, afortunadamente, en el Reino Unido, como demuestra la multa de la ICO. Tiene derechos sobre el uso de sus datos que siguen siendo relevantes incluso si se eliminan, se transmiten, se reforman y se desanonimizan.

Desafortunadamente, eso podría no ayudar mucho. La respuesta de Clearview ha sido vituperativa. Un portavoz de sus abogados sugirió que la empresa simplemente no cumplirá. “Si bien apreciamos el deseo del ICO de reducir su sanción monetaria en Clearview AI, mantenemos nuestra posición de que la decisión de imponer cualquier multa es incorrecta como cuestión de derecho. Clearview AI no está sujeto a la jurisdicción de la ICO, y Clearview AI no hace negocios en el Reino Unido en este momento».

La posición del ICO es que cualquier empresa que maneje datos de ciudadanos del Reino Unido está sujeta a la ley del Reino Unido; Clearview no está de acuerdo. La compañía no es la única que plantea tales preguntas. Tome el conjunto de datos chino lanzado como WebFace260M, creado para entrenar la IA de reconocimiento facial utilizando rostros y nombres extraídos de IMDb y Google Images. El conjunto de datos se rige, o no, por la ley china, pero los rostros que contiene ciertamente no son exclusivamente ciudadanos chinos.

Este precedente importa mucho más allá de la estrecha cuestión del reconocimiento facial. Grandes conjuntos de datos públicos extraídos de Internet son el combustible que impulsa el último estallido de progreso en el sector de la IA. El generador de texto GPT3 se basa en publicaciones y enlaces extraídos de Reddit; Dall-E 2, la innovadora IA visual que analizamos aquí hace unas semanas, se basa en imágenes extraídas de la web. La compañía es muy consciente de que se puede atraer a Dall-E 2 para generar caras de personas reales, hasta el punto de que los probadores beta tienen prohibido publicar caras humanas realistas en público.

Sería un movimiento audaz para el ICO poner su atención en vigilar tales modelos, frente a un gobierno del Reino Unido que ya está discutiendo diluir la ley de protección de datos para convertir a Gran Bretaña en un centro de innovación. Pero, ¿y si lo que distingue a Clearview de la competencia es menos la sustancia de su recopilación de datos y más el estilo con el que los defendió?

Si desea leer la versión completa del boletín, suscríbase para recibir TechScape en su bandeja de entrada todos los miércoles.