视线追踪技术的基本原理是利用眼球转动时某些不变的结构和特征与变化的特征之间的变化量来计算视线方向的。因此,基于VOG的视线追踪系统包括两部分内容:视线特征参数提取和视线方向计算模型建立。不同的视线追踪系统构成将采用不同的视线方向计算模型。基于瞳孔中心-角膜反射的视线追踪方法按系统构成和采用的视线估计模型大致可分为两类:单摄像机单(多)光源系统和多摄像机多光源系统。
单摄像机单光源系统通过检测普尔钦斑中心到瞳孔中心的平面视线参数,一般采用线性和非线性多项式来建立视线参数到视线屏幕落点的映射模型[1,2]。这种视线落点映射模型只能在头部静止或微动状态下检测视线在屏幕上的落点。为解决单摄像机系统在头动状态下的视线屏幕落点检测问题,参考文献[3,4]中采用了统计模型。通过采集不同样本不同头部姿态的眼部特征参数作为输入,以对应的盯视点坐标作为输出,训练广义回归神经网络(General Regression Neural Network,GRNN)或支持矢量回归机建立视线参数到视线落点之间的统计模型来估计视线落点位置。但这种方法定义的视线落点输出范围为全屏幕,容易在视线检测过程中产生偏离理想落点的粗大误差。单摄像机系统结构简单,使用简便,在人因分析等领域有着普遍的应用价值。
多摄像机多光源系统通过立体视觉检测普尔钦斑中心到瞳孔中心的矢量作为三维视线参数,采用眼球成像几何模型将视线参数换算成视线方向。因此,该系统可检测头部运动状态下的视线方向。但多摄像机系统需精确标定计算机屏幕、光源的相对位置关系[5],其标定程序复杂,成本相对较高。
综上所述,视线追踪系统在空间视线方向计算阶段,主要采用三种数学模型描述视线参数到视线方向的映射模型:
1)针对多摄像机系统,从眼球的生理结构出发,根据摄像头、人眼之间的空间位置关系,建立视线方向估计的空间几何模型[6,7]。这种视线方向计算模型求出的是视线的空间方向。
2)针对单摄像机系统,建立平面视线参数到空间视线方向的线性或非线性多项式模型[8,9]。通过这种模型可以获得视线的屏幕落点坐标。(www.daowen.com)
3)针对单摄像机系统,从视线屏幕落点的效果出发,建立平面视线参数到空间视线方向的统计映射模型[10,11]。这种统计映射模型得到的视线落点精度不高。当采用多人样本训练统计模型时,这种模型可以避免初始标定。
采用第一种和第二种视线方向计算模型时,系统使用前都要进行用户标定,以确定不同个体的模型参数,这样才能进行视线方向计算。
头动情况下的视线检测是视线追踪技术的关键问题。近期文献资料中研究的空间几何模型可以解决较大范围的头动问题,并保持较高的视线精度。但空间几何模型往往对应立体视觉系统或单摄像机多光源系统,系统标定和视线检测的初始校准过程都比较复杂。多项式模型和统计模型一般对应单摄像机系统。多项式模型只能处理头部静止或轻微头动情况下的视线追踪。统计模型采用神经网络或支持矢量机,通过采集不同人不同头部姿态的视线参数可以实现头部运动情况下的视线追踪并免于初始校准。但其视线精度较低且普适性并不理想。
本章从不同系统构成的角度,详细地讨论了单摄像机视线追踪系统的视线方向计算模型和双摄像机视线追踪系统的视线方向计算模型。单摄像机系统的视线方向计算模型主要包括基于非线性多项式和统计方法的视线计算方法,以及基于解析头动补偿的视线估计方法。这两种方法主要是探讨在单摄像机视线追踪系统中如何解决头动状态下的视线方向检测。双摄像机系统的视线方向计算模型主要包括朱志伟等人提出的基于头动补偿的视线方向计算模型,以及基于眼球成像模型的视线方向计算模型。另外,本章还介绍了视线方向估计的five- spot模型。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。