鉴于所有的人脸都是由眼睛、鼻子和嘴巴等器官构成,虽然这些器官的大小和形状会因人脸的不同而有所不同,但它们的形状和分布结构都存在一定的规律性,因此对它们的几何描述可以作为人脸识别的重要特征[48]。基于几何特征的人脸识别算法流程如图4-23所示。其中,图像预处理即图像灰度化、图像滤波、直方图均衡化等系列运算与处理。以下着重阐述人脸定位与特征提取算法。
1.人脸器官定位方法
在人脸识别中,为了寻找人脸上特征较为突出的部位,一般会选取眼、鼻和嘴巴作为识别的主要特征,因此需要对眼、鼻和嘴巴进行定位。其中最主要的是人眼的定位,因为人眼特征相对稳定,不易受光照或表情变化的影响,而且眼睛的精确定位对于鼻子、嘴巴的定位有重要的参照作用。
1)眼睛定位常用方法
一般定位方法有灰度投影法、模板匹配法、Hough变换法、神经网络算法等。
(1)灰度投影法。
灰度投影法通过对人脸图像进行水平方向和竖直方向的投影,根据波峰/波谷的分布信息来定位眼睛。该方法定位速度较快,但对人脸和姿态的变化鲁棒性较差。
图4-23 基于几何特征的人脸识别算法流程
(2)模板匹配法。
采用模板匹配法可以利用数据库中的眼睛图像模板,直接对眼睛进行定位。但是,模板法所需的计算量大,对图像的尺度和光照情况较敏感。
(3)Hough变换法。
Hough变换法是在边缘检测的基础上,通过模板检测眼睑或瞳孔的圆形特征进行眼睛定位。但是,Hough变换法需要大量预处理,计算量较大。Hough变换的基本原理是将影像空间中的曲线(包括直线)变换到参数空间中,通过检测参数空间中的极值点,确定出该曲线的描述参数,从而提取影像中的规则曲线。Hough变换可以用一定函数关系描述的曲线描述检测图像中的直线、圆、抛物线、椭圆等形状,它在影像分析与模式识别等很多领域中得到了成功应用。
(4)神经网络法。
基于神经网络的眼睛定位方法将搜索窗口内的像素作为神经网络的输入。如果该窗口包含眼睛图像,则神经网络的输出较大,因此可以确定眼睛的位置。
2)眼睛定位流程
一般来说,人脸的眉眼区域具有固定的图像角点特征:①眼白边缘较亮,灰度值较高,并且瞳孔与眼白的相交处,眼睛与皮肤之间的灰度都存在明显的突变,即角点信息较为丰富;②瞳孔与眉毛是该区域中灰度值较低的地方,而眉毛区域的灰度的变化频率低,没有明显的突变,即角点信息较为缺少。眼睛定位的一般流程如图4-24所示。
图4-24 人脸图像中眼睛的定位流程
2.角点检测算法
对粗略截取的人眼区域,选定窗口并在图像中不断移动(见图4-25)[24]。
图4-25 人脸检测窗口的移动
设图像的灰度值用I(x,y)表示,图像中窗口的水平、垂直方向位移为[u,v],则窗口移动[u,v]时,产生的相对灰度变化值E(u,v)为
将式(4-150)变换为
其中,Ix、Iy为I(x,y)的一阶方向导数,为I(x,y)的二阶方向导数。
因此,对于较小的偏移量[u,v],可以将窗口设定为2×2大小的矩阵M,那么就可以近似得到表达式:(www.daowen.com)
其中,。
计算获得M的特征值λ1和λ2,因此可以创建一个度量角点函数R,即
式中,k为系数,可取值0.04。
对于图像角点的判断,需要将角点函数值R与设定的阈值进行比较,只有当函数值R大于设定的阈值时,才能判图像角点存在。而对于阈值的选定,时常需要根据实际情况来确定(选择),因为图像角点具有冗余性。
3.眼睛区域粗定位法
采用局部M矩阵,得到最小特征值后,在每个像素点周围的邻域中找出其中最大的特征值,最后与设定的角点之间的最小距离进行比较(即与阈值比较),来判断是否为角点。图4-26所示为角点粗定位的一个实例[24]。
图4-26 人眼检测粗定位例
4.基于积分和差分投影的眼睛精确定位法
假设图像中(x,y)处的像素值用L(x,y)表示,设在图像区域[y1,y2]的水平积分投影和[x1,x2]区域的垂直积分投影分别为H(y)和V(x),则有
显然,水平投影就是将一行所有像素点的灰度值累加后再显示出来,垂直投影就是将一列所有像素点的灰度值累加后显示出来。
由此可见,H(y)和V(x)值的变化分别反映的是图像某一行或某一列像素的灰度值变化情况。因此,可以通过对积分投影函数值的分析提取图像中的特征。在人脸图像中,与周围区域相比,人的眼睛区域较暗,即灰度值较低。利用该特征,常采用积分投影法来定位眼睛,通过对人脸图像做水平和垂直方向的投影,根据波峰、波谷的分布情况来定位眼睛区域。
令L(x,y)在(x,y)点处与邻近像素点的灰度值之差为
并将同一行差值的绝对值进行累加,则其累加值S(y)为
由于眼睛较周围灰度值小,通常情况下,眼睛处的积分投影值较小。一旦眼睛处的积分值大于或等于眉毛处的积分值,此时便无法准确定位眼睛位置,甚至会产生误判。
为此,必须考虑到眼部区域在水平方向的灰度变化规律(由皮肤经过眼白到瞳孔,由瞳孔再经过眼白到皮肤),而眉毛区域的灰度值没有这种规律性分布,相对比较集中,所以只要加入两者水平方向灰度差分进行比较,将会产生大的数值差异。这种差异进而作为定位眼睛的另一个依据:变化率越大,差分累加值越大,即为眼睛,否则为眉毛。即采用积分投影和差分投影相结合的公式:
式中,k1、k2分别为对应H(y)和S(y)的权值,均在(0,1)区间取值;δ为参考阈值,一般可取图像区域灰度均值。当式(4-154)成立时,y的值即为眼睛的纵坐标。
积分投影与差分投影在一定程度上具有互补性,将两者相结合,则P(y)不仅考虑了图像在某个方向上的灰度分布而且也反映了在该方向的灰度变化,将两者综合考虑,具有更强的适应性。如图4-27所示为人眼y坐标的确定位置,用同样的方法也可获得人眼x坐标的确定位置(见图4-28)[25]。
图4-27 人眼y坐标的精确定位
图4-28 人眼x坐标的精确定位
基于几何特征匹配的方法是通过提取人脸图像中的几何特征进行人脸识别的。由于其存在计算量大、识别准确率低等缺点,因此没有得到大规模的推广。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。