表情识别的方法大致可分为以下几种:
1.几何特征
一般说来,表情的变化主要反映在眼眉、额头、嘴等面部区域的形状和相对位置的变化上。所以,最直接的就是提取面部的几何特征来识别表情:它的基本思想是利用人脸的结构特征和先验知识,通过对人脸表情的显著特征,如眼睛、鼻子、眉毛、嘴等的形状和位置变化进行定位和测量,确定其大小、距离、形状和相互比例的特征关系,进行表情识别。这类方法的特点和关键就在于对面部特征点的精确定位上。对面部特征点的定位又可以分为手工标定和计算机自动标定两种。在提取了特征点以后,在通过神经网络等一些方法,对它们进行训练来识别表情。
Maja Pantic和Leon J.M.Rothkrantz先用了多个探测器进行面部器官定位和提取了它们的边缘。然后提取了10个脸部轮廓上的基准点和19个面部器官的基准点。脸部轮廓和面部器官特征点示意图如图4-13所示。在此基础上,分析并记录了32个独立的面部肌肉运动单元的运动,表情识别率达到了86%。
2.频率域特征
常用的一种频率域特征是Gabor小波。它是一组窄带带通滤波器,在空间域和频率域均有较好的分辨能力,有明显的方向选择和频率选择特性。和傅里叶变换相比,表情图像的Gabor小波分解是一种局部变换,因此某一局部测度的范围可以有Gabor小波滤波器的尺度大小来定义。Jingfu Ye等对人脸图像进行表情区的分割和归一化,然后用小波变换提取表情区的特征向量,最后识别了在不同光照下的6种表情。他们的实验证明,小波特征对于光线变化和个体差异是不明显的。
(www.daowen.com)
图4-13 脸部轮廓和面部器官特征点示意图
3.运动特征
上面介绍的特征提取方法是针对静态图像,或者对动态图像序列中的某一帧进行的。然而,表情识别的最大特点是一个动态变化的过程,心理学研究表明,尽管人类可以依据一幅静态图像判别其中的人脸表情,但是大部分实验者在识别动态序列图像的表情时,准确率明显增高。可见提取动态图像序列的运动特征,对于表情识别有着特殊的意义。
光流是指亮度模式引起的表面运动,是景物中可见点的三维速度向量在成像平面上的投影,它表示了景物表面上的点在图像中位置的瞬时变化;同时光流场携带了有关运动和结构的丰富信息。光流模型就是处理运动图像的有效方法,其基本思想是将运动图像函数f(x,y,t)作为基本函数,根据图像强度守恒原理建立光流约束方程,通过求解光流约束方程,计算运动参数。Y.Dai等利用将图像序列中连续两帧的差异及用YIQ表示空间中的I分量相结合,提取出了人脸面部运动和区域信息,在嘴部和眼部的光流投影直方图中,提取了面部表情的运动特征,用以表情识别。
对输入的人脸图像,外界的干扰因素一般是比较多的,采用灰度不守恒的光流场基本方程更显得合适与可靠。实验表明,该方法具有计算精度高、易于实现等优点,有一定的实用价值。而且用光流计算的方法提取其运动特征,一方面反映了表情的变化实质,另一方面特征受光照不均匀性的影响较小,只要保证在同一组图像序列中光照强度基本不变即可,光照条件对各组之间的影响较小。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。