理论教育 人机接口方法的发展趋势探析

人机接口方法的发展趋势探析

时间:2023-06-29 理论教育 版权反馈
【摘要】:以虚拟现实为代表的计算机系统的拟人化,以及以手持电脑、智能手机为代表的计算机的微型化、随身化、嵌入化,是当前计算机的两个重要的发展趋势。

人机接口方法的发展趋势探析

随着计算机技术和人工智能技术的飞速发展,可用于双足步行机器人人机交互技术也会蓬勃地发展。

1.WIMP界面发展

多媒体计算机和虚拟实现(VR)系统的出现,改变了人与计算机通信的方式和要求,使人机交互发生了很大的变化。在多媒体系统中继续采用WIMP界面有其内在的缺陷:随着多媒体软、硬件技术的发展,在人机交互界面中计算机可以使用多种媒体,而用户只能同时用一个交互通道进行交互,因而从计算机到用户的通信带宽要比从用户到计算机的大得多,这是一种不平衡的人机交互。

基于WIMP技术的图形用户界面,从本质上讲,是一种二维交互技术,不具有三维直接操作的能力。要从根本上改变这种不平衡的通信,人机交互技术的发展必须适应从精确交互向非精确交互、从单通道交互向多通道交互以及从二维交互向三维交互的转变,发展用户与计算机之间快速、低耗的多通道界面。

可以看出在计算机系统不同的发展阶段中,人机交互模型的发展过程如图2-1所示。在传统的人机系统中,人被认为是操作员,只是对机器进行操作,而无真正的交互活动。在计算机系统中人还是被称为用户。只有在VR系统中的人才是主动的参与者。

978-7-111-57208-4-Chapter02-1.jpg

图2-1 人机交互模型的发展过程

2.多媒体与虚拟现实系统的交互

与传统用户界面相比,引入了视频和音频之后的多媒体用户界面,最重要的变化就是界面不再是一个静态界面,而是一个与时间有关的时变媒体界面。人类使用语言和其他时变媒体(如姿势)的方式完全不同于其他媒体。从向用户呈现的信息来讲,时变媒体主要是顺序呈现的,而我们熟悉的视觉媒体(文本和图形)通常是同时呈现的。在传统的静止界面中,用户或是从一系列选项中进行选择(明确的界面通信成分),或是用可再认的方式进行交互(隐含的界面通信成分)。在时变媒体的用户界面中,所有选项和文件必须顺序呈现。由于媒体带宽和人的注意力的限制,在时变媒体中,用户不仅要控制呈现信息的内容,也必须控制何时呈现和如何呈现。

目前,许多人把多媒体系统错误地只当作是一种表现装置。这除了对多媒体的错误理解外,没有有效的多媒体交互形式也是目前多媒体存在的一大问题,因而多通道与多媒体用户界面是联系在一起的。

3.VR系统中人机交互

人机交互可以说是VR系统的核心,因而,VR系统中人机交互的特点是所有软、硬件设计的基础。其特点如下:

1)观察点(Viewpoint)是用户做观察的起点。(www.daowen.com)

2)导航(Navigation)是指用户改变观察点的能力。

3)操作(Manipulation)是指用户对其周围对象起作用的能力。

4)临境(Immersion)是指用户身临其境的感觉,这在VR系统中越来越重要。

VR系统中人机交互若要具备这些特点,就需要发展新的交互装置,其中包括三维空间定位装置、语言理解、视觉跟踪、头部跟踪和姿势识别等。多媒体与VR系统的人机交互有着某些共同特点。首先,它们都是使用多个感觉通道,如视觉和听觉;其次,它们都是时变媒体。

4.多通道人机交互方法

人机交互技术是目前用户界面研究中发展得最快的领域之一,对此,各国都十分重视。在美国国防关键技术中,人机界面不仅是软件技术中的重要内容之一,而且是与计算机和软件技术并列的11项关键技术之一。欧盟的欧洲信息技术研究与发展战略计划(ESPRIT)还专门设立了用户界面技术项目,其中包括多通道人机交互界面(MultiModal Interface for Man-Machine Interface)。保持在这一领域中的领先,对整个智能计算机系统是至关重要的。我们可以以发展新的人机界面交互技术为基础,带动和引导相关的软、硬件技术的发展,使更有效地使用计算机的计算处理能力成为可能[15]。

21世纪,人机交互的特点是多通道、多媒体。以虚拟现实为代表的计算机系统的拟人化,以及以手持电脑、智能手机为代表的计算机的微型化、随身化、嵌入化,是当前计算机的两个重要的发展趋势。通俗地讲就是,手机越来越大、电脑越来越小。鼠标和键盘为代表的GUI技术不再是主导,而是利用人的多种感觉和动作通道(如语音、手写、姿势、视线、表情等输入),以并行、非精确的方式与(可见或不可见的)计算机环境进行交互,大大提高了人机交互的自然性和高效性。

5.语音交互方法

让计算机能听、能看、能说、能感觉是未来人机交互的发展方向,其中语音成为未来最被看好的人机交互方式,语音比起其他的交互方式有更多的优势。最早的语音技术因“自动翻译电话”计划而起,包含了语音识别、自然语言理解和语音合成三项非常重要的技术。语音识别的研究工作可以追溯到20世纪50年代AT&T贝尔实验室的Audry系统,此后研究者们逐步突破了大词汇量、连续语音和非特定人这三大障碍。20世纪90年代前期,许多著名的大公司,如IBM、苹果、AT&T和NTT都对语音识别系统的实用化研究投以巨资。让计算机说话需要用到语音合成技术,其核心是文语转换技术(Text to Speech),语音合成甚至已经应用到汽车信息系统上,车主可以将下载到系统计算机中的文本文件、电子邮件、网络新闻小说转换成语音在车内收听。还可以通过特定的服务网站订阅新闻,享受个性化的网络信息服务。2008年是语音技术重要应用的一年,“数字奥运”的目标就是研发“面向奥运多语言信息服务系统”,多语种语音合成产品是构成整个服务网络系统的重要组成部分,这套系统可以提供多语种、多方言、多发言人、多语气语调,并且具备一定自学习能力的个性化语音服务。

6.眼标交互方法

交互基本上都离不开用户的视觉,那么如果用户能用眼睛(直接用大脑思维来控制的“脑标”目前还太遥远)来操控图形界面岂不是更方便?由此,“眼标”应运而生。2002年伦敦帝国学院的科研小组花费数年时间来研究人类眼睛活动与大脑感知之间的关系,最终发明出一种专门用来捕捉眼球细微动作的红外线感应装置,被他们称为“眼标”。“眼标”能鉴别眼睛在显示屏上的移动和注视,如果电脑使用者盯住屏幕上的某个链接图标1s以上,电脑就自动打开该链接;如果使用者盯住打印或者存盘的图标,电脑就会自动进行相应的操作。不过,人们眼球运动时存在的固有抖动以及眼睛眨动所造成的数据中断,就会干扰信号。另外,如果鼠标器光标总是随着用户的视线移动,可能会引起反感,因为用户“随便”看着什么而并非总是“意味着”什么。理想情况是用户希望发出控制时,系统及时地处理其视线输入,而在相反的情况下则忽略其视线的移动。让电脑去理解用户的这一美好愿望还不大可能。不过,科研人员仍认为人类用眼睛搜索和盯住一个目标的准确性远远超过用手移动鼠标。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈