8.2.1 运动视觉的基本物理刺激
静态视觉只需抽取物体的空间信息,即空间位置与空间结构信息。运动视觉则不仅要抽取目标的空间结构与位置,也必须检测它们运动变化的快慢程度。物体空间结构的疏密用空间频率表征,运动变化的快慢程度则由时间频率来描述。运动视觉的目的是感知运动并确定运动的速度与方向,可知其检测信息是多方面的,比静态视觉更复杂,静态视觉只是运动视觉的一个简单特例。为便于理解,这里先对空间与空间频率、时间频率、运动速度、运动方向等基本概念作一介绍。
1.空间与空间频率(Spatial frequency)
视觉感知物体的存在,既要确定物体的空间位置,也要提取它的空间结构。空间位置可由物体影像在视网膜上的位置来确定,空间结构则由空间频率表征。空间频率以每单位长度内有多少条线来表示,表征物体结构的粗细或疏密程度。静止的一维正弦光栅,沿x方向排列,其光强度分布函数为:
C(x)=C0[1+m cos(2πUx)] (8‐1)
其中C0代表光栅平均光强度,m为光栅光强度变化因子,U是光栅的空间频率,它是相邻两个峰值之间的距离即空间周期的倒数。沿y方向分布的正弦光栅,空间频率V同样可由空间周期的倒数给出,任意取向的光栅的空间频率,又都可分解成沿x方向与沿y方向的两个空间频率,或者说等同于后两者的叠加。
显然,空间频率越低光栅条纹越疏,空间频率越高光栅条纹越密。在视觉上可以粗略认为,任何一个物体或一幅光学图像,都是由许多正弦光栅叠加而成,这些光栅具有不同的空间频率和空间取向。其中均匀的背景为零频成分,光分布缓慢变化的成分称为低频,而光强度急剧变化的细节为高频成分。从光学衍射原理可知,所有的光学系统都能较容易地检测零频和低频成分,对高频成分则由于孔径受限而截止。为此,光学系统都具有低通滤波器性质,对空间细节的分辨率都是有限的。眼球光学系统也不例外。作为视觉系统前级的眼球光学系统的空间频率低通特性,又决定了后续的视觉神经网络系统在空间频率上的低通或带通滤波性质。
2.时间频率(Temporal frequency)
时间频率反映的是物理过程运动变化的快慢程度,如我国市用交流电每秒改变50次,时间频率为50Hz。视野中目标的运动,也必将引起视网膜接收到的光信息不断变化,变化的快慢程度也由时间频率来表征。沿x方向分布的一维正弦光栅以速度R在x正方向的运动,其光分布可表示成:
C(x,t)=C0[1+mcos2πU(x-Rt)] (8‐2)
或写作
C(x,t)=C0[1+mcos2π(Ux-Wt)] (8‐3)
与(8‐1)式相比,上两式多出了一个时间项,分别与运动速度R及由运动而造成的光分布变化的时间频率W有关。以速度R进行运动的正弦光栅,与在原地以时间频率W变化的正弦光栅完全等同。可见时间频率与运动速度有着直接联系。物体的空间结构给定时,时间频率越高,说明其运动速度越快,反之亦然。日常的视觉经验显示,人眼只能对以适当大小的速度运动的物体产生运动知觉,速度太大和太小都不能引起运动感。与此相关,运动变化的时间频率太快或太慢的物理过程,在视觉上均不能引起运动知觉。虽然日光灯总以50Hz的时间频率闪烁着,但因为这一频率超过了人眼的临界闪光频率,因而人眼已经无法觉察到这种变化;当然,变化太慢又会被看作静止。这说明,视觉系统在时间频率上也应具有低通与带通滤波的选择特性。
3.运动速度(Speed of motion)
周围世界物体的实际运动是三维的(图8‐7),运动速度可分解成视平面内的二维运动Rx、Ry和深度方向的运动Rz三个速度分量。但由于人眼视网膜是一个二维的平面结构,它能直接检测的运动也必是二维的,即三维运动在视平面上的投影Rx和Ry。这样,基本的运动检测器是用于检测一维和二维运动的,在此基础上完成三维运动直至更复杂运动的检测。因此就二维视网膜而言,目标的运动速度可记为向量R=(Rx,Ry)。
图8‐7 视平面与运动速度及运动方向解析图
上式未将深度方向的运动速度Rz考虑在内,是因为这一速度需借助特定的检测机制,将在专门的章节详细讨论。(www.daowen.com)
人类视觉的速度响应特性非常复杂。首先它对运动速度有选择性,只有速度在一定范围内的运动才能被人眼感知,只有一定范围内的速度,视觉才能准确测量与计算。其次,人眼对运动速度有较好的分辨率,对于不同的运动形式这种分辨率又各不相同。视觉对速度的选择性是由更基本的时间与空间特性决定的。速度分辨率则取决于运动检测器的时空响应信噪比。
4.运动方向(Direction of motion)
由图8‐7可知,目标的二维运动方向由方向角θ决定,即
θ=tan-1(Ry/Rx) (8‐4)
在运动视觉中,运动方向的检测十分重要。除了确定目标的趋向,还有助于发现目标,实现目标与背景的分离。图8‐8(a)中,构成目标与背景的随机点,以同样大小速度沿不同的方向运动,这时人眼无法区分目标与背景。而图8‐8(b)中,目标随机点与背景随机点各自沿同一方向运动,虽然运动速度各不相同,但人眼很容易区分出目标与背景分界的轮廓。人类的视觉具有很高的运动方向分辨率,经实验测定,在双眼视觉时方向分辨率可达0.2°。只要运动方向有0.2°的细微改变,人眼就能够觉察到。在宏观上,视觉系统对投影于视网膜上的任何方向的运动都能良好响应,表现为各相同性。但在细胞水平考察,单个运动检测器是方向选择性的。
图8‐8 运动方向与目标—背景的分离
8.2.2 视觉的空间位移和时间频率响应特征
在表观似动中,若相继呈现的图案空间位移太大或太小,那么不管呈现的时间间隔取何值,都不能引起良好的运动知觉。以某些动画片为例,每秒24幅的帧频,时间上完全符合要求,但由于没能掌握好相邻画幅间动作的空间位移,看起来就显得跳跃不连贯。这一点,美国动画片《米老鼠与唐老鸭》、《功夫熊猫》等做得最为出色。
真实的运动视觉与表观似动,虽然两者原始的物理刺激并不相同,最终却产生了一样的知觉效果,说明它们应有统一的信息处理模式,也说明连续的运动并不是引起运动知觉的基本物理刺激。只要存在相应的空间与时间变化,即使刺激是离散的,也可得到一样的视觉效果。这一点其实不难理解。任何计算机采样接口或是光学探测器件,由于接收列阵在空间上是离散的,时间响应又受到器件时间常数的限制,故对于连续图像的抽样在空间与时间上必定也是离散的,视觉系统也不例外。
真实的运动尽管具有连续运动的网膜影像,但由于视网膜本身的结构以及后续的神经细胞的感受野分布都是离散的,因此所能提取的空间信息也是离散的;同时,复杂的视觉通路中细胞间多以化学突触联结,化学递质的释放与再生需要一定的时间,成千上万的细胞之间的通讯需要足够的时间来完成,使视觉系统在时间上也不可能作连续响应,只能离散地提取信息。为此,物理上的连续刺激,在视觉上仍然是按一定的空间与时间间隔被离散地抽样处理的。实际上,任何连续的运动刺激,都可分解为一幅幅空间间隔无限小的序列图案在极短时间间隔内的相继呈现,如图8‐9(a)所示。而当相邻图案间的空间间隔与时间间隔增大时,就变成了表观似动的情形,见图8‐9(b)。
图8‐9 (a)连续运动的空间—时间解析和(b)表观似动
在计算机上产生图8‐9(a)中依次呈现的线条序列,呈现的时间间隔适当时,可获得平稳的表观似动知觉。时间间隔逐渐减小,频率增加,线条的平滑运动逐渐消失而呈跳跃式;继续减小时间间隔,跳跃运动也不再存在,只觉得一片模糊影子一闪而过,被试者觉察不到线条本身的存在与运动;反之,逐渐增大时间间隔,频率减小,线条运动将减慢以至不再运动,被试者只看到一系列孤立的线条分别在不同位置出现。这进一步表明,当目标运动时,视觉系统对时间频率的响应有选择性。
8.2.3 运动速度与运动方向响应
视觉对时间频率的选择性,造成了它对运动速度的选择性。人眼能感知到运动的目标速度存在一个下限,称为绝对速度阈限。速度太小时,无法觉察它在运动,如钟表时针的走动,日月的运行等。经计算,太阳的运行角速度是0.25′/s,人眼已无法觉察,说明此速度已低于绝对速度阈限。绝对速度阈限的数值也与物体本身的空间尺度有关。空间尺度越大,对应的绝对速度阈限也越高;空间尺度越小,速度阈限越低。通俗地说,要觉察每秒钟仅移动几毫米的一列火车的运动,显然要比觉察以同样速度爬行的一只蚂蚁难得多。实际上,觉察火车的每秒数毫米的运动几乎是不可能的。
能引起平稳视觉的速度还存在一个上限,速度超过上限值的运动,人眼又来不及响应,如从奔驰的列车窗外掠过的树木。不过此时仍可感知到一种失真了的跳跃式运动,只是无法判定速度。
速度继续增大至某一数值时(称为极限速度),人眼就既不能判定目标的速度,也无法感知其存在与运动,如一颗射出的子弹。可见,能引起运动知觉的速度有一较为复杂的范围。现在要解决的问题是,什么机理决定了这一速度范围?
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。