Reconocimiento de rostros mediante la Inteligencia Artificial

La tecnología actual sorprende a la gente con sorprendentes innovaciones que no sólo hacen la vida simple sino también soportable. El reconocimiento facial ha demostrado ser la forma menos intrusiva y más rápida de verificación biométrica.

El reconocimiento facial es una categoría de software biométrico que mapea los rasgos faciales de un individuo y almacena los datos como una huella facial. El software utiliza algoritmos de aprendizaje profundo para comparar una imagen capturada en vivo con la huella facial almacenada para verificar la identidad de uno. El procesamiento de imágenes y el aprendizaje por máquina son los pilares de esta tecnología. El reconocimiento facial ha recibido una atención considerable de los investigadores debido a las actividades humanas que se encuentran en diversas aplicaciones de seguridad como un aeropuerto, la detección de delitos, el seguimiento facial, el análisis forense, etc. En comparación con otros rasgos biométricos como la huella de la palma de la mano, el iris, las huellas dactilares, etc., la biometría facial puede ser no intrusiva.

Se pueden tomar incluso sin el conocimiento del usuario y además se pueden utilizar para aplicaciones basadas en la seguridad como la detección de delitos, el seguimiento facial, la seguridad de los aeropuertos y los sistemas de vigilancia forense. El reconocimiento de rostros implica la captura de imágenes de rostros desde un video o una cámara de vigilancia. Se comparan con la base de datos almacenada. El reconocimiento facial implica entrenar imágenes conocidas, clasificarlas con clases conocidas y luego se almacenan en la base de datos. Cuando se da una imagen de prueba al sistema, se clasifica y se compara con la base de datos almacenada.

Procesamiento de imágenes y aprendizaje de la máquina

El procesamiento de imágenes por computadoras involucra el proceso de Visión por Computadora. Se trata de la comprensión de alto nivel de las imágenes digitales o videos. El requisito es automatizar las tareas que los sistemas visuales humanos pueden hacer. Así, una computadora debe ser capaz de reconocer objetos como el rostro de un ser humano o una farola o incluso una estatua.

Lectura de imágenes

El ordenador lee cualquier imagen como un rango de valores entre 0 y 255. Para cualquier imagen en color, hay 3 colores primarios: rojo, verde y azul. Se forma una matriz para cada color primario y luego estas matrices se combinan para proporcionar un valor de Pixel para los colores individuales R, G, B. Cada elemento de las matrices proporciona datos sobre la intensidad del brillo del píxel.

OpenCV es una biblioteca de Python que está diseñada para resolver problemas de visión por ordenador. OpenCV fue originalmente desarrollado en 1999 por Intel pero luego fue apoyado por Willow Garage. OpenCV soporta una variedad de lenguajes de programación como C++, Python, Java, etc. Soporte para múltiples plataformas incluyendo Windows, Linux y macOS. OpenCV Python es una clase de envoltura para la biblioteca original de C++ para ser usada con Python. Usando esto, todas las estructuras de arreglos de OpenCV se convierten a/desde arreglos de NumPy. Esto facilita la integración con otras librerías que usan NumPy. Por ejemplo, bibliotecas como SciPy y Matplotlib.

Aprendizaje automático

Cada algoritmo de aprendizaje automático toma un conjunto de datos como entrada y aprende de los datos que significa básicamente aprender el algoritmo de la entrada y salida proporcionada como datos. Identifica los patrones en los datos y proporciona el algoritmo deseado. Por ejemplo, para identificar de quién es la cara que está presente en una imagen dada, se pueden ver múltiples cosas como un patrón:

Altura/anchura de la cara.

La altura y el ancho pueden no ser fiables ya que la imagen podría ser reescalada a una cara más pequeña o a una cuadrícula. Sin embargo, incluso después de la reescalada, lo que permanece inalterado son las proporciones: la relación entre la altura de la cara y el ancho de la misma no cambiará.
El color de la cara.
El ancho de otras partes de la cara como los labios, la nariz, etc.

Hay un patrón involucrado – diferentes caras tienen diferentes dimensiones como las de arriba. Las caras similares tienen dimensiones similares. Los algoritmos de aprendizaje automático sólo entienden números, así que es bastante difícil. Esta representación numérica de una «cara» (o un elemento del conjunto de entrenamiento) se denomina vector de característica. Un vector de rasgo comprende varios números en un orden específico.

Como un simple ejemplo, podemos mapear una «cara» en un vector de rasgo que puede comprender varios rasgos como:

Altura de la cara (cm)

Anchura de la cara (cm)
Color medio de la cara (R, G, B)
Anchura de los labios (cm)

Altura de la nariz (cm)

Esencialmente, dada una imagen, podemos convertirlas en un vector de características como:

Altura de la cara (cm) Anchura de la cara (cm) Color medio de la cara (RGB) Anchura de los labios (cm) Altura de la nariz (cm)

23.1 15.8 (255, 224, 189) 5.2 4.4

Por lo tanto, la imagen es ahora un vector que podría ser representado como (23.1, 15.8, 255, 224, 189, 5.2, 4.4). Podrían existir otros innumerables rasgos que podrían derivarse de la imagen, por ejemplo, el color del pelo, el vello facial, las gafas, etc.

El Aprendizaje Automático realiza dos funciones principales en la tecnología de reconocimiento facial. Estas se indican a continuación:

Derivación del vector de la característica: es difícil listar manualmente todas las características porque son muchas. Un algoritmo de aprendizaje automático puede etiquetar inteligentemente muchas de esas características. Por ejemplo, una característica compleja podría ser la relación entre la altura de la nariz y el ancho de la frente.
Algoritmos de comparación: Una vez que se han obtenido los vectores de características, un algoritmo de aprendizaje automático necesita hacer coincidir una nueva imagen con el conjunto de vectores de características presentes en el corpus.

Operaciones de reconocimiento facial

Operaciones de reconocimiento facial

El sistema de tecnología puede variar cuando se trata de reconocimiento facial. Diferentes programas informáticos aplican diferentes métodos y medios para lograr el reconocimiento facial. El método por pasos es el siguiente:

Detección de la cara: Para empezar, la cámara detectará y reconocerá una cara. La cara se puede detectar mejor cuando la persona está mirando directamente a la cámara ya que facilita el reconocimiento facial. Con los avances en la tecnología, esto se mejora donde la cara puede ser detectada con una ligera variación en su postura de cara a la cámara.
Análisis de la cara: Luego la foto de la cara es capturada y analizada. La mayoría de los reconocimientos faciales se basan en imágenes 2D en lugar de 3D porque es más conveniente para la base de datos. El software de reconocimiento facial analizará la distancia entre los ojos o la forma de los pómulos.
Conversión de imagen a datos: Ahora se convierte en una fórmula matemática y estos rasgos faciales se convierten en números. Este código numérico se conoce como una huella facial. De la misma manera que cada persona tiene una huella dactilar única, de la misma manera, tienen una huella facial única.

Encontrar la coincidencia: Luego el código se compara con una base de datos de otras huellas faciales. Esta base de datos tiene fotos con identificación que pueden ser comparadas. La tecnología entonces identifica una coincidencia para sus características exactas en la base de datos proporcionada. Vuelve con la coincidencia y la información adjunta como el nombre y las direcciones o depende de la información guardada en la base de datos de un individuo.

Programas de reconocimiento facial

Muchas empresas de renombre están constantemente innovando e improvisando para desarrollar un software de reconocimiento facial que sea infalible y fiable. A continuación se analizan algunos programas destacados:

a. Visión profunda AI

Deep Vision AI es una empresa líder en software de reconocimiento facial. La compañía es propietaria de una avanzada tecnología de visión computarizada que puede entender imágenes y videos automáticamente. Luego convierte el contenido visual en análisis en tiempo real y proporciona conocimientos muy valiosos.

La IA de Visión Profunda proporciona una plataforma plug and play a sus usuarios en todo el mundo. Los usuarios reciben alertas en tiempo real y una respuesta más rápida basada en el análisis de los flujos de cámaras a través de varios módulos basados en la IA. El producto ofrece una tasa de identificación muy precisa de las personas que figuran en una lista de vigilancia mediante la vigilancia continua de las zonas objetivo. El software es muy flexible, ya que puede conectarse a cualquier sistema de cámaras existente o puede desplegarse a través de la nube.

En la actualidad, la IA Deep Vision ofrece la mejor solución de rendimiento del mercado que permite el procesamiento en tiempo real a +15 flujos por GPU.

La recopilación de información comercial se facilita proporcionando datos en tiempo real de los clientes, la frecuencia de sus visitas o la mejora de la seguridad y la protección. Además, los resultados del programa informático pueden proporcionar atributos como el recuento, la edad, el sexo, etc., que pueden mejorar la comprensión del comportamiento de los consumidores, las preferencias cambiantes, los cambios con el tiempo y las condiciones que pueden orientar los futuros esfuerzos y estrategias de comercialización. Los usuarios también combinan las capacidades de reconocimiento facial con otras características basadas en la inteligencia artificial, como el reconocimiento de vehículos, para obtener datos más correlacionados de los consumidores.

La empresa cumple con las leyes internacionales de protección de datos y aplica medidas importantes para un proceso transparente y seguro de los datos generados por sus clientes. Se cuida la privacidad de los datos y la ética.

Los mercados potenciales incluyen ciudades, lugares públicos, transporte público, institutos educativos, grandes minoristas, etc. Deep Vision AI es un socio certificado por NVIDIA para Metropolis, Dell Digital Cities, Amazon AWS, Microsoft, Red Hat y otros.

b. SenseTime

SenseTime es un desarrollador de plataformas líder que ha dedicado sus esfuerzos a crear soluciones utilizando las innovaciones en la IA y el análisis de grandes datos. La tecnología que ofrece SenseTime es multifuncional. Los aspectos de esta tecnología se están expandiendo e incluyen las capacidades de reconocimiento facial, reconocimiento de imágenes, análisis de video inteligente, conducción autónoma y reconocimiento de imágenes médicas. El software SenseTime incluye diferentes subpartes, a saber, SensePortrait-S, SensePortrait-D, y SenseFace.
SensePortrait-S es un servidor de reconocimiento facial estático. Incluye la funcionalidad de la detección de rostros de una fuente de imagen, la extracción de rasgos, la extracción y el análisis de atributos, y la recuperación de objetivos de una vasta base de datos de imágenes faciales.
SensePortrait D es un servidor de reconocimiento facial dinámico. Las capacidades incluidas son la detección de rostros, el seguimiento de un rostro, la extracción de características y la comparación y el análisis de datos de los datos en múltiples secuencias de vídeo de vigilancia.

SenseFace es una plataforma de vigilancia de reconocimiento facial. Esta utilidad es una tecnología de reconocimiento facial que utiliza un algoritmo de aprendizaje profundo. SenseFace es muy eficiente en soluciones integradas para el análisis de video inteligente. Se puede utilizar ampliamente para la vigilancia de objetivos, el análisis de la trayectoria de una persona, la gestión de la población y el análisis de datos asociados, etc.
SenseTime ha prestado sus servicios a muchas empresas y organismos gubernamentales, como Honda, Qualcomm, China Mobile, UnionPay, Huawei, Xiaomi, OPPO, Vivo y Weibo.

c. Reconocimiento del Amazonas

Amazon proporciona una solución de software basada en la nube. Amazon Rekognition es una plataforma de visión por ordenador de servicio. Esta solución permite un método fácil de añadir análisis de imágenes y vídeo a varias aplicaciones. Utiliza una tecnología de aprendizaje profundo altamente escalable y probada. No se requiere que el usuario tenga ninguna experiencia en aprendizaje automático para utilizar este software. La plataforma puede ser utilizada para identificar objetos, textos, personas, actividades y escenas en imágenes y videos. También puede detectar cualquier contenido inapropiado. El usuario obtiene un análisis facial de alta precisión y capacidades de búsqueda facial. Por lo tanto, el software puede ser fácilmente utilizado para la verificación, el conteo de personas y la seguridad pública mediante la detección, el análisis y la comparación de rostros.

Las organizaciones pueden utilizar las etiquetas personalizadas de Amazon Rekognition para generar datos sobre objetos y escenas específicas disponibles en imágenes según sus necesidades comerciales. Por ejemplo, un modelo puede ser construido fácilmente para clasificar partes específicas de una máquina en la línea de montaje o para detectar plantas insalubres. El usuario simplemente proporciona las imágenes de los objetos o escenas que desea identificar, y el servicio se encarga del resto.

d. FaceFirst

El software FaceFirst garantiza la seguridad de las comunidades, las transacciones seguras y las grandes experiencias de los clientes. FaceFirst es un software seguro, preciso, privado, rápido y escalable. También se incluyen soluciones «plug-and-play» para la seguridad física, la autenticación de la identidad, el control de acceso y el análisis de los visitantes. Se puede integrar fácilmente en cualquier sistema. Esta plataforma de visión computarizada ha sido utilizada por muchas organizaciones para el reconocimiento de rostros y el análisis automatizado de video para prevenir el crimen y mejorar el compromiso del cliente.

Como principal proveedor de sistemas eficaces de reconocimiento facial, beneficia a los comercios minoristas, los transportes, la seguridad de los eventos, los casinos y otras industrias y espacios públicos. FaceFirst asegura la integración de la inteligencia artificial con los sistemas de vigilancia existentes para prevenir el robo, el fraude y la violencia.

e. Trueface

TrueFace es un modelo líder de visión por ordenador que ayuda a la gente a comprender los datos de su cámara y a convertirlos en información procesable. TrueFace es una solución de visión por computador in situ que mejora la seguridad de los datos y las velocidades de rendimiento. Las soluciones basadas en la plataforma están específicamente entrenadas según los requisitos del despliegue individual y funcionan eficazmente en una variedad de ecosistemas. El software da la máxima prioridad a la diversidad de los datos de formación. Garantiza un rendimiento equivalente para todos los usuarios, independientemente de sus necesidades ampliamente diferentes.

Trueface ha desarrollado una suite que consiste en SDK’s y una solución de contenedores acoplados basada en las capacidades de aprendizaje de la máquina e inteligencia artificial. La suite puede convertir los datos de la cámara en inteligencia accionable. Puede ayudar a las organizaciones a crear un entorno más seguro e inteligente para sus empleados, clientes y huéspedes mediante el uso de tecnologías de reconocimiento facial, detección de armas y verificación de la edad.

f. Cara++

Face++, es una plataforma abierta habilitada por la empresa china Megvii. Ofrece tecnologías de visión computarizada. Permite a los usuarios integrar fácilmente en sus aplicaciones las tecnologías de reconocimiento de análisis de imágenes basadas en el aprendizaje profundo.
Face++ utiliza la IA y la visión artificial de forma sorprendente para detectar y analizar rostros, y confirmar con precisión la identidad de una persona. Face++ también es amigable para los desarrolladores, ya que es una plataforma abierta, de tal manera que cualquier desarrollador puede crear aplicaciones usando sus algoritmos. Esta característica ha hecho que Face++ sea la plataforma de reconocimiento facial más extensa del mundo, con 300.000 desarrolladores de 150 países que la utilizan.

El uso más significativo de Face++ ha sido su integración en la plataforma City Brain de Alibaba. Esto ha permitido el análisis de la red de CCTV en las ciudades para optimizar los flujos de tráfico y dirigir la atención de los médicos y la policía mediante la observación de los incidentes.

g. Kairos

Kairos es una solución de reconocimiento facial de última generación y ética disponible para los desarrolladores y empresas de todo el mundo. Kairos puede ser usado para el reconocimiento facial a través de la nube de Kairos API, o el usuario puede alojar Kairos en sus servidores. La utilidad puede ser utilizada para el control de datos, seguridad y privacidad. Las organizaciones pueden asegurar una experiencia más segura y de mejor accesibilidad para sus clientes.

Kairos Face Recognition On-Premises tiene la ventaja añadida de controlar la privacidad y seguridad de los datos, manteniendo los datos críticos en la empresa y a salvo de cualquier posible tercero o pirata informático. La velocidad de los productos habilitados para el reconocimiento facial es altamente mejorada porque no se encuentra con el problema de la demora y otros riesgos asociados con el despliegue público de la nube.
Kairos es una arquitectura ultra escalable de tal manera que la búsqueda de 10 millones de caras puede hacerse aproximadamente al mismo tiempo que una cara. Está siendo aceptado por el mercado con las manos abiertas.

h. Cognitec

El motor FaceVACS de Cognitec permite a los usuarios desarrollar nuevas aplicaciones para el reconocimiento facial. El motor es muy versátil ya que permite una API clara y lógica para una fácil integración en otros programas de software. Cognitec permite el uso del motor FaceVACS a través de kits de desarrollo de software personalizados. La plataforma puede ser fácilmente adaptada a través de un conjunto de funciones y módulos específicos para cada caso de uso y plataforma informática. Las capacidades de este software incluyen la comprobación de la calidad de la imagen, la emisión segura de documentos y el control de acceso mediante una verificación precisa.

Las características distintivas incluyen:

Una muy poderosa localización y seguimiento de rostros

Algoritmos eficientes para la inscripción, verificación e identificación
Comprobación precisa de la edad, sexo, edad, exposición, desviación de la postura, gafas, ojos cerrados, detección de luz uniforme, color no natural, imagen y geometría de la cara
Cumple con los requisitos de los pasaportes electrónicos al proporcionar verificaciones de tipo de imagen frontal completa y formato ISO 19794-5

Utilización del reconocimiento facial

Si bien el reconocimiento facial puede parecer futurista, actualmente se utiliza de diversas maneras. He aquí algunas aplicaciones sorprendentes de esta tecnología.

Identificación de trastornos genéticos:

Hay aplicaciones de salud como Face2Gene y software como Deep Gestalt que usa el reconocimiento facial para detectar un desorden genético. Esta cara es luego analizada y comparada con la base de datos de trastornos existentes.
La industria de las aerolíneas:

Algunas aerolíneas utilizan el reconocimiento facial para identificar a los pasajeros. Este escáner facial ayudaría a ahorrar tiempo y a evitar la molestia de tener que llevar el control de un billete.
Seguridad del hospital:

El reconocimiento facial puede utilizarse en los hospitales para llevar un registro de los pacientes que es mucho mejor que llevar registros y encontrar sus nombres y direcciones. Sería fácil para el personal utilizar esta aplicación y reconocer a un paciente y obtener sus detalles en cuestión de segundos. En segundo lugar, puede utilizarse con fines de seguridad, ya que permite detectar si la persona es auténtica o no o si se trata de un paciente.
Detección de emociones y sentimientos:

La detección de emociones en tiempo real es otra valiosa aplicación del reconocimiento de rostros en la atención sanitaria. Se puede utilizar para detectar las emociones que los pacientes muestran durante su estancia en el hospital y analizar los datos para determinar cómo se sienten. Los resultados del análisis pueden ayudar a identificar si los pacientes necesitan más atención en caso de que tengan dolor o estén tristes.

Problemas y desafíos

La tecnología de reconocimiento de rostros se enfrenta a varios retos. En los párrafos siguientes se examinan los problemas y retos comunes que puede tener un sistema de reconocimiento de rostros al detectar y reconocer rostros.

Pose: Un sistema de reconocimiento facial puede tolerar casos con pequeños ángulos de rotación, pero se hace difícil detectar si el ángulo sería grande y si la base de datos no contiene todos los ángulos de la cara entonces puede imponer un problema.
Expresiones: Debido a las emociones, el estado de ánimo humano varía y da lugar a diferentes expresiones. Con estas expresiones faciales, la máquina podría cometer errores para encontrar la identidad correcta de la persona.

Envejecimiento: Wada vez que el tiempo y la edad cambian, es único y no permanece rígido, por lo que puede ser difícil identificar a una persona que ahora tiene 60 años.
Oclusión: Oclusión significa bloqueo. Esto se debe a la presencia de varios objetos oclusores como gafas, barba, bigote, etc. en la cara, y cuando se captura una imagen, la cara carece de algunas partes. Este problema puede afectar gravemente al proceso de clasificación del sistema de reconocimiento.
Iluminación: La iluminación significa variaciones de luz. Los cambios de iluminación pueden variar la magnitud general de la intensidad de la luz reflejada en un objeto, así como el patrón de sombreado y las sombras visibles en una imagen. Se reconoce ampliamente que el problema del reconocimiento de rostros por encima de los cambios de iluminación es difícil para los humanos y los algoritmos. Las dificultades que plantea la condición de la iluminación es un desafío para los sistemas de reconocimiento automático de rostros.

Identificar las caras similares: Diferentes personas pueden tener una apariencia similar que a veces hace imposible distinguirlas.

Desventajas del reconocimiento facial

Peligro de la vigilancia general automatizada

Falta de un marco jurídico o reglamentario claro
Violación de los principios de necesidad y proporcionalidad
Violación del derecho a la privacidad

Efecto en la cultura política democrática

Si te gusta GeeksforGeeks y quieres contribuir, también puedes escribir un artículo usando contribute.geeksforgeeks.org o enviar tu artículo a contribute@geeksforgeeks.org. Mira tu artículo en la página principal de GeeksforGeeks y ayuda a otros Geeks.

Por favor, mejore este artículo si encuentra algo incorrecto haciendo clic en el botón «Mejorar el artículo» de abajo.