单对象人脸识别方案解析

发布时间:2012-02-27 阅读量:1093 来源: 我爱方案网 作者:

中心议题:
    *  单对象人脸识别的特点
    *  人脸的检测和归一化
    *  人脸特征提取及DWT-DCT平均脸
    *  人脸的识别
解决方案:
    *  采用小波变换与DCT相结合的方法提取人脸特征
    *  采用欧氏距离进行分类

1 引 言

随着计算机网络和通信技术的发展,信息安全、知识产权保护和身份认证等问题成了一个重要而紧迫的研究课题。身份认证是保证系统安全的必要前提,在多种不同的安全领域都需要准确的身份认证。传统的身份证、智能卡、密码等身份认证方法存在携带不便、容易遗失、不可读或密码易被破解等诸多问题。基于人脸识别技术的身份认证方法与传统的方法相比,具有更好的安全性、可靠性和有效性,因此正越来越受到人们的重视,并逐渐进入社会生活的各个领域。

人脸识别技术具有广泛的应用前景,可以应用到多种不同的安全领域,因其识别特征的独特性、惟一性和相对稳定性,逐渐成为一非常热门的研究课题。许多典型的人脸识别算法和应用系统都是针对标准或特定的人脸数据库,利用库内人脸进行训练,并在相同的库中实现人脸识别。但在软件保护、计算机安全等特殊应用中,身份认证仅针对单个对象进行人脸识别,现有的人脸识别方法并不能胜任这样的识别任务。为此,本文针对单对象人脸识别的特点,讨论了单对象人脸检测和识别的关键技术,在此基础上提出了一种单对象人脸识别算法,实验结果证明了该方法的有效性。

2 单对象人脸识别的特点

与典型的人脸识别相比,单对象人脸识别有以下4个方面的特点:

应用领域人脸识别的应用领域很广,如刑侦破案、证件核对、保安监控等,而单对象人脸识别主要应用在软件保护、计算机安全锁、特定对象追踪等领域。

识别系统的目标单对象人脸识别的最终目标是系统必须具有高度的安全性和可靠性,即识别错误率趋于0。虽然降低识别错误率的同时识别率也会降低,但可以通过提示用户调整姿态(如注视摄像头等)加以改善。

肤色模型 由于单对象人脸识别仅针对特定的对象,所以人脸检测的肤色模型可采用自适应的方法调整肤色范围。

分类方法单对象人脸识别不存在人脸数据库,常用的最小距离分类法不能够正确识别特定的对象,只能用阈值作为判据。因此,阈值的选取十分重要,阈值过大则容易出现错判,存在安全隐患;而阈值过小又会影响识别效率。

3 人脸的检测和归一化

人脸检测是人脸识别的前提。对于给定的图像,人脸检测的目的在于判断图像中是否存在人脸,如果存在,则返回其位置和空间分布。利用人脸肤色和面部特征,将人脸检测分为两个阶段:外脸检测和内脸定位。外脸检测主要利用人脸肤色进行初步的脸区检测,分割出肤色区域;内脸检测是在外脸区域中利用面部几何特征进行验证和定位。

3.1 外脸检测

外脸检测的任务是将待检图像中可能的人脸区域找出来并加以标记,其步骤如下:

(1)根据人类肤色在色彩空间中存在区域性的特点,将可能为人脸的像素检测出来。为更好地利用肤色特征,同时选用HSI和YcbCr两种色彩空间对图像进行二值化处理,肤色范围限定在H∈[0,46],S∈[0.10,0.72],Cb∈[98,130],Cr∈[128,170]内。将满足条件的像素标记为肤色像素,其余的均为非肤色像素。

(2)去噪处理。在以每一个肤色点为中心的5×5邻域内统计肤色像素的个数,超过半数时中心点保留为肤色,否则认为是非肤色。

(3)将二值图像中的肤色块作区域归并,并对目标区域进行比例、结构分析,过滤掉不可能的人脸区域。目标区域的高度/宽度比例限定在0.8~2.0。

3.2 内脸检测和定位

将包含眼、眉、鼻和嘴的区域称为内脸区域。内脸区域能够很好地表达人脸特征,且不易受背景、头发等因素的干扰,因此内脸区域的检测和定位对后续的特征提取和识别至关重要。

在外脸区域的上半部,对二值图像进行水平方向和垂直方向的投影,确定两个包含黑点的矩形区域作为双眼的大致区域。在确定的两个区域中,对黑点进行区域膨胀,可以得到眼睛的基本轮廓和左石眼角,黑点坐标的平均值作为瞳孔的位置。

设左右瞳孔的坐标分别为(Lx,Ly)和(Rx,Ry),两个瞳孔之间的距离为d,根据人脸的几何特征,我们将内脸区域定义为:宽度=-d×1.6,高度=-d×1.8,左上角坐标为(Lx-d×0.3,(Ly+Ry)/2-(-d)× 0.3)。实验表明,该区域能够很好地表达人脸特征。
 

 


3.3 内脸区域的归一化

由于各待测图像中的人脸大小具有很大的随机性,因此,有必要对内脸区域进行归一化操作。人脸归一化是指对内脸区域的图像进行缩放变换,得到统一大小的标准图像,实验中,我们规定标准图像的大小为128×128。归一化处理,保证了人脸大小的一致性,体现了人脸在图像平面内的尺寸不变性。

图1是一个人脸检测和归一化的例子,其中的原始图像来自实验室现场拍摄。


4 人脸特征提取及DWT-DCT平均脸

对归一化的人脸图像,采用小波变换与DCT相结合的方法提取人脸特征。首先对人脸图像进行3层小波分解,取低频子图像LL3作为人脸特征提取的对象,从而获得每幅训练样本或测试样本的低频子图像;然后对低频子图像进行离散余弦变换(DCT),DCT系数个数与子图像的大小相等(即256),由于图像DCT变换,能量集中在低频部分,因此只取其中的136个低频系数作为特征向量。

为了使测试样本与训练样本具有可比性,提取全部训练样本的特征向量,计算所有训练样本的平均特征,构成DWT-DCT平均脸,即:

其中N为训练样本数,xk,i表示第i个样本的第k个特征向量,mk为平均脸的第k个特征向量,k=1,2,…,136。

5 人脸的识别

完成训练过程并获得待测样本的特征后,即可进行人脸识别,本文采用欧氏距离进行分类。

5.1 计算样本与平均脸的欧氏距离


用m和x表示平均脸和样本的特征向量,则样本与平均脸的欧氏距离为:

其中mk表示平均脸的第k个特征向量,xk表示待测样本的第k个特征向量。身份认证时,计算待测样本与平均脸的欧氏距离,并与特定对象的自适应阈值进行比较,将小于阈值的样本判为该对象的人脸,即认证通过。

5.2 自适应阈值的选取

与典型的人脸识别方法不同,单对象人脸认识没有人脸数据库,不能用距离最小作为判据,只能用阈值作为判别依据。阈值的选取应兼顾识别率和识别的准确性,实验中我们取训练样本与平均脸的欧氏距离平均值作为分类阈值,即:

其中,N为训练样本数,此值不宜太小;di为第i个样本与平均脸之间的欧氏距离。

6 实验结果及分析

本文选用西安交通大学人工智能与机器人研究所东方人脸库(AI&R)的视点子库进行实验,该数据库包括每位被拍摄人在19个不同视点角度下(10°为一个单位)拍摄的中性表情图像。实验包括类内测试和类间测试。类内测试用于考查单对象人脸识别的识别率,而类间测试则用于考查误识率。随机选取5个人,每人用7幅图像(-30°~+30°)作为训练样本,分别计算平均脸和自适应阈值、类内识别率和类内距离,另外再选取50个人,每人一幅正面图像作为类间测试样本,分别对5个对象进行类间测试。从实验数据可以得出如下结果:

(1)类内识别率不高,原因是自适应阈值为训练样本与平均脸的欧氏距离平均值,训练样本中的部分图像不能被识别。在实验室中,我们通过提示被试注视摄像头、适当调整姿态等措施提高图像的拍摄质量,使识别率得到了显著的改善。

 (2)在50人的类间测试中,最小距离均大于阈值,即错误识别率为0。实验室的现场测试中也得到了相同的结果。

(3)文中提出的单对象人脸识别方法能够成功地识别特定对象,并能准确地排除其他对象,可用于软件保护、计算机安全等系统的身份验证。

7 结 语

本文提出的单对象人脸识别方法,针对单对象人脸识别的特点,综合考虑了识别率和认证的准确性,运用平均脸方法有效地缩小类内距离,同时扩大类间距离,取训练样本与平均脸的欧氏距离平均值作为分类阈值。实验结果表明,该方法具有识别有效性和认证可靠性,在单对象人脸识别的实际应用中是一种可行的方法。

相关资讯
美光Q4营收展望107亿美元超预期,AI存储需求引爆股价

美光科技(Micron Technology)于6月25日发布最新财报,其中对2024财年第四季度的业绩展望显著超越市场预期。公司预计第四财季营收将达约107亿美元,远高于华尔街分析师普遍预测的98.9亿美元。受此积极信号影响,美光股价在盘后交易时段应声上涨,凸显市场对其增长前景的强烈信心。

三星引入三星显示为XR头显供应OLEDoS,索尼独供格局生变

三星电子正计划调整其首款Android XR头显Project Moohan(代号“无限”)的屏幕供应链策略,拟将关联企业三星显示纳入OLEDoS(硅基OLED)面板供应商体系,与索尼形成“双供应商”结构。此举旨在打破索尼的独家供应局面,提升供应链韧性及议价能力。尽管三星显示加入,索尼仍将保持第一供应商地位,但三星电子借此强化了长期布局XR市场的战略基础。

先进封装驱动芯片性能革命,台积电产能扩张应对AI浪潮

台积电与苹果共同开发的晶圆级多芯片模块(WMCM)技术标志着先进封装的新高度。作为InFO-PoP的升级版,WMCM融合CoW(Chip on Wafer)与RDL(Redistribution Layer)等尖端工艺。其核心创新在于采用平面封装架构取代传统垂直堆叠逻辑芯片与DRAM,显著提升散热效率与整体性能。这项独家技术将成为苹果下一代iPhone搭载的A20处理器(预计采用2nm制程)的关键性能支柱。同时,苹果自研的AI服务器芯片正稳步导入台积电的3D晶圆堆叠SoIC封装技术,进一步强化计算密度和能效。

算力、智能与控制的融合:英特尔4U工控机、RK3568主板、HPM伺服板的全面对比

在现代工业自动化向智能化、网络化、柔性化加速演进的大背景下,高性能、高可靠、特定场景优化的核心硬件设备构成了系统的“大脑”、“眼睛”和“四肢”。英特尔4U工控机(IPC-615H5)、RK3568高性能监控主板和HPM6400/6300伺服电机控制板分别代表了通用工业计算平台、边缘AI视觉处理平台和高精度运动控制平台的最典型形态。它们在各自的领域拥有独特优势,共同支撑起复杂的工业控制闭环。本文旨在对这三款核心产品进行全方位对比分析,剖析其技术特点、优劣势、应用场景及市场前景,为工业自动化方案选型提供专业参考。

应对AI算力激增:安森美推出全链路数据中心电源解决方案与指南

人工智能技术,特别是生成式AI和大规模机器学习模型的迅猛发展,对全球数据中心的基础设施提出了前所未有的高要求。海量数据的实时处理与复杂模型训练,导致数据中心计算负载激增,随之而来的功耗攀升已成为产业亟待解决的核心瓶颈。这不仅推高了运营成本,也对电网承载能力和可持续发展目标构成严峻挑战。如何在高性能计算需求持续增长的同时,有效控制并降低能源消耗,成为AI数据中心建设与升级的关键命题。