Llegamos a ustedes gracias a:



Reportajes y análisis

Reconocimiento facial: Inteligencia artificial para el Gran Hermano

[15/09/2020] ¿Puede el Gran Hermano identificar el rostro de un ciudadano a través de la vigilancia de los CCTV instalados en la calle y distinguir si está feliz, triste o enojado? ¿Se puede arrestar a una persona con una orden pendiente a través de esa identificación? ¿Cuáles son las probabilidades de que la identificación sea incorrecta y en realidad se confunda con otra persona? ¿Hay manera de evadir la vigilancia por completo usando algún truco?

Por otro lado, ¿puede ingresar a una bóveda protegida por una cámara y un software de identificación facial, sosteniendo una impresión del rostro de una persona autorizada? ¿Qué pasa si usa una máscara tridimensional del rostro de una persona autorizada?

Echemos un vistazo al reconocimiento facial y a la suplantación de identidad en el reconocimiento facial.

¿Qué es el reconocimiento facial?

El reconocimiento facial es un método para identificar a una persona desconocida, o autenticar la identidad de una persona específica a partir de su rostro. Es una rama más especializada de la visión artificial, y viene con un bagaje social en algunas aplicaciones, así como con algunas vulnerabilidades a la suplantación de identidad.

¿Cómo funciona el reconocimiento facial?

Los primeros algoritmos de reconocimiento facial -que todavía son utilizados en forma mejorada y más automatizada- se basan en la biometría (como la distancia entre los ojos) para describir los rangos faciales medidos en una imagen bidimensional, como un conjunto de números (vectores de características o plantillas). Luego, el proceso de reconocimiento compara estos vectores con una base de datos de caras conocidas que se han asociado a características de la misma manera. Una complicación en este proceso es ajustar las caras a una vista estandarizada teniendo en cuenta la rotación e inclinación de la cabeza antes de extraer las métricas. Esta clase de algoritmos se llama geometría.

Otro enfoque para el reconocimiento facial es normalizar y comprimir imágenes faciales 2D, y compararlas con una base de datos de imágenes comprimidas y normalizadas de manera similar. Esta clase de algoritmos se llama fotometría.

El reconocimiento facial 3D utiliza sensores tridimensionales para capturar la imagen facial, o reconstruye la imagen tridimensional a partir de tres cámaras de seguimiento bidimensionales que apuntan hacia diferentes ángulos. El reconocimiento facial 3D puede ser considerablemente más preciso que el reconocimiento 2D.

El análisis de la textura de la piel asigna las líneas, patrones y manchas en el rostro de una persona a otros vectores de características. Agregar el análisis de la textura de la piel al reconocimiento facial 2D o 3D puede mejorar la precisión del reconocimiento en un 20% a 25%, especialmente en los casos de personas parecidas y gemelas. Para obtener aún más precisión, puede combinar todos los métodos y agregar imágenes multiespectrales (luz visible e infrarroja).

El reconocimiento facial ha ido mejorando año tras año desde que comenzó el campo en 1964. En promedio, la tasa de error se ha reducido a la mitad cada dos años.

Prueba de proveedores de reconocimiento facial

El Instituto Nacional de Estándares y Tecnología de Estados Unidos (NIST) ha estado realizando pruebas de algoritmos de reconocimiento facial -la Prueba de proveedores de reconocimiento facial (FRVT)- desde el año 2000. Los conjuntos de datos de imágenes utilizados son principalmente fotografías policiales, pero también incluyen imágenes fijas que circulan libremente, como las que se encuentran en Wikimedia, e imágenes de baja resolución de cámaras web.

Los algoritmos FRVT son enviados principalmente por proveedores comerciales. Las comparaciones interanuales muestran importantes avances en rendimiento y precisión; según los proveedores, esto se debe principalmente al uso de redes neuronales convolucionales profundas.

Los programas de pruebas de reconocimiento facial del NIST relacionados han estudiado los efectos demográficos, la detección de la transformación de rostros, la identificación de rostros publicados en las redes sociales y la identificación de rostros en video. Una serie anterior de pruebas se llevó a cabo en la década de 1990 con un nombre diferente, Tecnología de reconocimiento facial (FERET).

Tasas de errores de identificación facial en el rango de falsos positivos, de NIST.IR.8271 (septiembre del 2019). Tenga en cuenta que ambos ejes son logarítmicos.
Reconocimiento facial

Aplicaciones del reconocimiento facial

La mayoría de las aplicaciones del reconocimiento facial se dividen en tres categorías principales: seguridad, salud y marketing/venta minorista. La seguridad incluye las autoridades, donde el uso de reconocimiento facial puede ser tan benigno como hacer coincidir a las personas con sus fotos de pasaporte de manera más rápida y precisa que los humanos, y tan espeluznante como el escenario de "Persona de interés donde se rastrea a las personas a través de los CCTV y se comparan con bases de datos de fotografías. La seguridad no policial incluye aplicaciones comunes como desbloqueo facial para teléfonos móviles y control de acceso para laboratorios y bóvedas.

Las aplicaciones del reconocimiento facial en el sector salud incluyen registros de pacientes, detección de emociones en tiempo real, seguimiento de pacientes dentro de una instalación, evaluación no verbal de los niveles de dolor en pacientes, detección de ciertas enfermedades y afecciones, identificación del personal y seguridad de las instalaciones. Las aplicaciones del reconocimiento facial en el marketing y la venta minorista incluyen la identificación de miembros del programa de lealtad, la identificación y seguimiento de ladrones conocidos en tiendas, y el reconocimiento de personas y sus emociones para sugerencias de productos específicos.

Controversias, prejuicios y prohibiciones del reconocimiento facial

Decir que algunas de estas aplicaciones son controversiales quedaría corto. Como se analiza en un artículo del New York Times del 2019, el reconocimiento facial ha generado controversia, desde su uso para la vigilancia de los estadios hasta el software racista.

¿Vigilancia de estadios? El reconocimiento facial se utilizó en el Super Bowl del 2001: el software identificó a 19 personas que se creía que eran sujetos con órdenes judiciales pendientes, aunque ninguna fue arrestada -y no por no intentarlo.

¿Software racista? Ha habido varios problemas, comenzando con el software de seguimiento facial del 2009 que podía rastrear a los blancos, pero no a los negros; y continuando con el estudio del MIT del 2015 que mostró que el software de reconocimiento facial de aquella época funcionaba mucho mejor en rostros masculinos blancos que en rostros de mujeres y/o negros.

Este tipo de problemas ha llevado a la prohibición absoluta del software de reconocimiento facial en lugares específicos o para usos específicos. En el 2019, San Francisco se convirtió en la primera ciudad estadounidense importante en impedir que la policía y otras autoridades usen software de reconocimiento facial; Microsoft pidió regulaciones federales sobre el reconocimiento facial; y el MIT mostró que Amazon Rekognition tenía más problemas para determinar el género femenino que el masculino a partir de las imágenes faciales, y más complicaciones con el género femenino negro que con el género femenino blanco.

En junio del 2020, Microsoft anunció que no vendió ni venderá a la policía su software de reconocimiento facial; Amazon prohibió a la policía usar Rekognition durante un año; e IBM abandonó su tecnología de reconocimiento facial. Sin embargo, prohibir el reconocimiento facial por completo no será fácil dada su amplia adopción en iPhones (Face ID) y otros dispositivos, software y tecnologías.

No todo el software de reconocimiento facial sufre los mismos sesgos. El estudio de efectos demográficos del 2019 del NIST continuó el trabajo del MIT, y mostró que el sesgo demográfico algorítmico varía ampliamente entre los desarrolladores de software de reconocimiento facial. Sí, existen efectos demográficos en la tasa de coincidencia falsa y la tasa de no coincidencia falsa de los algoritmos de identificación facial, pero pueden variar en varios órdenes de magnitud de un proveedor a otro, y han ido disminuyendo con el tiempo.

Hackeo del reconocimiento facial y técnicas antispoofing

Dada la posible amenaza a la privacidad por parte del reconocimiento facial, y el atractivo de tener acceso a recursos de alto valor protegidos por autenticación facial, se han realizado muchos esfuerzos para hackear o falsificar la tecnología. Puede presentar una imagen impresa de una cara en lugar de una cara en vivo, o una imagen en una pantalla, o una máscara impresa en 3D para pasar la autenticación. Para la vigilancia por CCTV, puede reproducir un video. Para evitar la vigilancia, puede probar las telas y el maquillaje "CV Dazzle, y/o los emisores de luz IR para engañar al software y hacer que no detecte su rostro.

Por supuesto, existen esfuerzos para desarrollar técnicas antispoofing en respuesta a todos estos ataques. Para detectar imágenes impresas, los proveedores utilizan una prueba de vivacidad, como esperar a que el sujeto parpadee o realizar un análisis de movimiento, o utilizar infrarrojos para distinguir un rostro vivo de una imagen impresa. Otro enfoque es realizar análisis de microtexturas, ya que la piel humana es ópticamente diferente de las impresiones y los materiales de las máscaras. Las técnicas antispoofing más recientes se basan principalmente en redes neuronales convolucionales profundas.

Este es un campo en evolución. Se está armando una guerra entre los atacantes y el software antispoofing, así como investigaciones académicas sobre la efectividad de diferentes técnicas de ataque y defensa.

Proveedores de reconocimiento facial

Según la Electronic Frontier Foundation, MorphoTrust, una subsidiaria de Idemia (anteriormente conocido como OT-Morpho o Safran), es uno de los mayores proveedores de reconocimiento facial y otras tecnologías de identificación biométrica en los Estados Unidos. Ha diseñado sistemas para DMVs estatales, autoridades federales y estatales, controles fronterizos y aeropuertos -incluido TSA PreCheck- y el Departamento de Estado. Otros proveedores habituales incluyen a 3M, Cognitec, DataWorks Plus, Dynamic Imaging Systems, FaceFirst, y NEC Global.

La prueba de proveedores de reconocimiento facial del NIST enumera algoritmos de muchos más proveedores de todo el mundo. También hay varios algoritmos de reconocimiento facial de código abierto de calidad variable, y algunos servicios en la nube importantes que ofrecen reconocimiento facial.

Amazon Rekognition es un servicio de análisis de imágenes y video que puede identificar objetos, personas, texto, escenas y actividades, incluido el análisis facial y las etiquetas personalizadas. La API de Google Cloud Vision es un servicio de análisis de imágenes previamente entrenado que puede detectar objetos y rostros, leer texto impreso y escrito a mano, y crear metadatos en catálogos de imágenes. Google AutoML Vision permite entrenar modelos de imágenes personalizados.

Azure Face API realiza una detección de rostros que percibe caras y atributos en una imagen, realiza una identificación de personas que coincide con un individuo en un repositorio privado de hasta un millón de personas, y realiza reconocimiento de emociones percibidas. Face API puede ejecutarse en la nube o en el borde dentro de contenedores.

Conjuntos de datos faciales para entrenamiento de reconocimiento

Hay docenas de conjuntos de datos faciales disponibles para descargar que pueden usarse para entrenamiento de reconocimiento. No todos los conjuntos de datos faciales son iguales: tienden a variar en tamaño de imagen, número de personas representadas, número de imágenes por persona, condiciones de las imágenes e iluminación. Las autoridades también tienen acceso a conjuntos de datos faciales no públicos, como fotografías policiales actuales e imágenes de licencias de conducir.

Algunas de las bases de datos de rostros más grandes son Labeled Faces in the Wild, con ~13K personas únicas; FERET, utilizado para las primeras pruebas del NIST; la base de datos Mugshot, utilizada en el actual FRVT de NIST; la base de datos de cámaras de vigilancia SCFace, también disponible con hitos faciales; y Labeled Wikipedia Faces, con ~1.5K identidades únicas. Muchas de estas bases de datos contienen varias imágenes por identidad. La lista del investigador Ethan Meyers ofrece algunos consejos convincentes sobre cómo elegir un conjunto de datos faciales para un propósito específico.

En resumen, el reconocimiento facial está mejorando y los proveedores están aprendiendo a detectar la mayoría de las falsificaciones, pero algunas aplicaciones de la tecnología siguen siendo controversiales. Según el NIST, la tasa de error del reconocimiento facial se reduce a la mitad cada dos años. Los proveedores han mejorado sus técnicas antispoofing mediante la incorporación de redes neuronales convolucionales.

Mientras tanto, existen iniciativas para prohibir el uso del reconocimiento facial en la vigilancia, especialmente por parte de la policía. Sin embargo, prohibir por completo el reconocimiento facial sería difícil, dada su extensión.