Eigenface

Un Eigenface ( /ˈgənˌfs/ ) (en español cara propia) es el nombre dado a un conjunto de vectores propios cuando se utiliza en el problema de visión artificial del reconocimiento de rostros humanos. [1] Sirovich y Kirby desarrollaron el enfoque de usar caras propias para el reconocimiento y lo usaron Matthew Turk y Alex Pentland en la clasificación de caras. [2] [3] Los vectores propios se derivan de la matriz de covarianza de la distribución de probabilidad sobre el espacio vectorial de alta dimensión de imágenes de rostros. Las caras propias forman un conjunto base de todas las imágenes utilizadas para construir la matriz de covarianza. Esto produce una reducción de la dimensión al permitir que el conjunto más pequeño de imágenes base represente las imágenes de entrenamiento originales. La clasificación se puede lograr comparando cómo se representan las caras por el conjunto base.

Algunas eigenfaces (caras propias) de AT&T Laboratories Cambridge

Historia

El enfoque de caras propias comenzó con la búsqueda de una representación de imágenes faciales de baja dimensión. Sirovich y Kirby demostraron que el análisis de componentes principales podría usarse en una colección de imágenes de rostros para formar un conjunto de características básicas. [4] Estas imágenes base, conocidas como imágenes propias, podrían combinarse linealmente para reconstruir imágenes en el conjunto de entrenamiento original. Si el conjunto de entrenamiento consta de M imágenes, el análisis de componentes principales podría formar un conjunto base de N imágenes, donde N < M. El error de reconstrucción se reduce aumentando el número de imágenes propias; sin embargo, el número necesario siempre se elige menor que M. Por ejemplo, si necesita generar una cantidad de N caras propias para un conjunto de entrenamiento de M imágenes de caras, puede decir que cada imagen de cara puede estar formada por "proporciones" de todas las K "características" o caras propias: Imagen de cara 1 = (23% de E 1 ) + (2 % de E 2 ) + (51 % de E 3 ) + ... + (1 % E n ).

En 1991, M. Turk y A. Pentland ampliaron estos resultados y presentaron el método eigenface de reconocimiento facial. [5] Además de diseñar un sistema para el reconocimiento facial automatizado utilizando caras propias, mostraron una forma de calcular los vectores propios de una matriz de covarianza de modo que las computadoras de la época pudieran realizar una descomposición propia en una gran cantidad de imágenes faciales. Las imágenes de rostros suelen ocupar un espacio de gran dimensión y el análisis convencional de componentes principales era intratable en tales conjuntos de datos. El artículo de Turk y Pentland demostró formas de extraer los vectores propios basados en matrices dimensionadas por el número de imágenes en lugar del número de píxeles.

Una vez establecido, el método de caras propias se amplió para incluir métodos de preprocesamiento para mejorar la precisión. [6] También se utilizaron múltiples enfoques para construir conjuntos de caras propias para diferentes sujetos [7] [8] y diferentes características, como los ojos. [9]

Generación

Se puede generar un conjunto de caras propias mediante la realización de un proceso matemático llamado análisis de componentes principales (PCA) en un gran conjunto de imágenes que representan diferentes rostros humanos. De manera informal, las caras propias pueden considerarse un conjunto de "ingredientes faciales estandarizados", derivados del análisis estadístico de muchas imágenes de rostros. Cualquier rostro humano puede considerarse una combinación de estos rostros estándar. Por ejemplo, la cara de uno podría estar compuesta por la cara promedio más el 10 % de la cara propia 1, el 55 % de la cara propia 2 e incluso el −3 % de la cara propia 3. Sorprendentemente, no se necesitan muchas caras propias combinadas para lograr una aproximación justa de la mayoría de las caras. Además, debido a que la cara de una persona no se registra mediante una fotografía digital, sino simplemente como una lista de valores (un valor para cada cara propia en la base de datos utilizada), se ocupa mucho menos espacio para la cara de cada persona.

Las caras propias que se crean aparecerán como áreas claras y oscuras que se organizan en un patrón específico. Este patrón es cómo se seleccionan las diferentes características de una cara para evaluarlas y puntuarlas. Habrá un patrón para evaluar la simetría, si hay algún estilo de vello facial, dónde está la línea del cabello o una evaluación del tamaño de la nariz o la boca. Otras caras propias tienen patrones que son menos fáciles de identificar, y la imagen de la cara propia puede parecerse muy poco a una cara.

La técnica utilizada en la creación de caras propias y su uso para el reconocimiento también se utiliza fuera del reconocimiento facial: reconocimiento de escritura a mano, lectura de labios, reconocimiento de voz, lenguaje de señas /interpretación de gestos con las manos y análisis de imágenes médicas. Por lo tanto, algunos no usan el término "eigenface", sino que prefieren usar 'eigenimage'.

Uso en reconocimiento facial

El reconocimiento facial fue la motivación para la creación de caras propias. Para este uso, las caras propias tienen ventajas sobre otras técnicas disponibles, como la velocidad y la eficiencia del sistema. Dado que el eigenface es principalmente un método de reducción de dimensiones, un sistema puede representar muchos sujetos con un conjunto de datos relativamente pequeño. Como sistema de reconocimiento facial, también es bastante invariable a grandes reducciones en el tamaño de la imagen; sin embargo, comienza a fallar considerablemente cuando la variación entre las imágenes vistas y la imagen de la sonda es grande.

Para reconocer caras, las imágenes de la galería, las que ve el sistema, se guardan como colecciones de pesos que describen la contribución de cada cara propia a esa imagen. Cuando se presenta una cara nueva al sistema para su clasificación, se encuentran sus propios pesos proyectando la imagen en la colección de caras propias. Esto proporciona un conjunto de pesos que describen la cara de la sonda. Estos pesos se clasifican luego contra todos los pesos en el conjunto de la galería para encontrar la coincidencia más cercana. Un método del vecino más cercano es un enfoque simple para encontrar la distancia euclidiana entre dos vectores, donde el mínimo se puede clasificar como el sujeto más cercano. [3]:590

Intuitivamente, el proceso de reconocimiento con el método de caras propias consiste en proyectar imágenes de consulta en el espacio de caras abarcado por las caras propias calculadas y encontrar la coincidencia más cercana a una clase de caras en ese espacio de caras.

Véase también

Referencias

  1. Navarrete, Pablo; Ruiz-Del-Solar, Javier (November 2002). «Analysis and Comparison of Eigenspace-Based Face Recognition Approaches». International Journal of Pattern Recognition and Artificial Intelligence 16 (7): 817-830. doi:10.1142/S0218001402002003.
  2. L. Sirovich; M. Kirby (1987). «Low-dimensional procedure for the characterization of human faces». Journal of the Optical Society of America A 4 (3): 519-524. Bibcode:1987JOSAA...4..519S. PMID 3572578. doi:10.1364/JOSAA.4.000519.
  3. . 1991. pp. 586-591. ISBN 0-8186-2148-6. doi:10.1109/cvpr.1991.139758. Falta el |título= (ayuda)
  4. L. Sirovich; M. Kirby (1987). «Low-dimensional procedure for the characterization of human faces». Journal of the Optical Society of America A 4 (3): 519-524. Bibcode:1987JOSAA...4..519S. PMID 3572578. doi:10.1364/JOSAA.4.000519.
  5. . 1991. pp. 586-591. ISBN 0-8186-2148-6. doi:10.1109/cvpr.1991.139758. Falta el |título= (ayuda)
  6. Yambor, Wendy S.; Draper, Bruce A.; Beveridge, J. Ross (2002). «Analyzing PCA-based Face Recognition Algorithms: Eigenvector Selection and Distance Measures». Empirical Evaluation Methods in Computer Vision. Series in Machine Perception and Artificial Intelligence 50. WORLD SCIENTIFIC. pp. 39-60. ISBN 978-981-02-4953-3. ISSN 1793-0839. doi:10.1142/9789812777423_0003.
  7. . 1996. pp. 270-277. ISBN 0-8186-7259-5. doi:10.1109/cvpr.1996.517085. Falta el |título= (ayuda)
  8. Burnstone, James; Yin, Hujun (2011). «Eigenlights: Recovering Illumination from Face Images». Intelligent Data Engineering and Automated Learning - IDEAL 2011. Lecture Notes in Computer Science 6936. pp. 490-497. ISBN 978-3-642-23877-2. doi:10.1007/978-3-642-23878-9_58.
  9. . 1998. pp. 30-35. ISBN 0-8186-8344-9. doi:10.1109/afgr.1998.670921. Falta el |título= (ayuda)

Otras lecturas

Enlaces externos

Este artículo ha sido escrito por Wikipedia. El texto está disponible bajo la licencia Creative Commons - Atribución - CompartirIgual. Pueden aplicarse cláusulas adicionales a los archivos multimedia.