勾勒数字媒体技术的诞生和发展就意味着要从媒介的角度勘察和梳理数字技术。艺术的形成和发展离不开技术和媒体的支持与推动。没有数字技术,艺术只能停留在传统阶段,遑论数字媒体艺术的横空出世。若把数字媒体艺术的创作比作一副坚实的躯干,那么数字媒体技术的迅猛发展所引发的科技革命就为艺术家的思维与创作插上了金色双翼,承载着人类文明的辉煌,在浩瀚的艺海中自由翱翔。数字媒体技术是数字媒体艺术特征得以外显、影响得以扩散、发展得以持续、文化得以形成的基础和前提,因此,要研究数字媒体艺术的相关命题,首先要对数字媒体技术及相关概念进行解析。
(一)数字媒体的含义
国际电信联盟从技术角度对媒体进行了定义和分类:媒体是感知、表达、存储和传输信息的媒介和方法。在计算机世界中,媒体有两层含义:一是存储和传输信息的载体(存储媒体和传输媒体),如磁带、磁盘、光盘、半导体存储器、光缆、微波、电缆和数据线等;另一种类型是信息表示(代表媒体),如文本、声音、图形、图像、动画和视频。从狭义上讲,数字媒体是信息的一种表现形式,或者是上述感官媒体的编码。从广义上讲,数字媒体的传输、呈现(显示)和存储是密切相关的,作为内容托管的数字媒体艺术是上述媒体、显示、传输和存储相结合的结果。数字媒体是当代信息社会媒体存在和传播的主要形式。由计算机记录和传输的这种信息的最重要的特征之一是信息的最小单位是比特。在计算机上存储和传输的任何信息都可以分成一系列0或1的组合。换句话说,依靠计算机和网络的信息是数字化的,我们称之为依靠计算机存储、处理和传输数字媒体的信息媒体。从狭义上讲,数字媒体是信息的一种表现形式,或者是上述感官媒体的编码。广义而言,数字媒体是人类技术在当代 信息社会的延伸。
数字媒体是当今数字信息化社会中的社交媒体、服务媒体、互动媒体、智能推送媒体和数字流行媒介的总称。
(二)数字媒体技术的诞生
“数字技术是一种与计算机相生相伴的信息编码技术,它以数字‘0’ 或‘1’作为信息存储的最小单位——比特(bit)。文字、图形、图像、声音等任何信息都可以通过数字技术转换成为一系列‘0’和‘1’组合排列,供计算机识别,并在数字编码的基础上,通过计算机、光缆、通信卫星等设备进行存储、处理和传播。简言之,数字技术就是将各类信息数字化的技术。”这表明,数字技术是一种渠道和手段,文字、图形、图像及声音等多媒体信息借此可实现数字化、非线性、无损耗的编辑、存储和传播。
数字技术与计算机相伴而生,是计算机诞生的前提条件,计算机的问世则进一步发展了数字技术,使之有了更广阔的用武之地。因此,对于数字技术、数字媒体技术的梳理要从计算机说起。
1.数字计算机的问世
人类文明的演进史,也是人类不断寻找快速有效的计算工具和计算方式的探索史。伽利略说过,大自然的语言是数学。而在我国,从人类祖先最早的“结绳记事”中的“绳”到国学周易中“掐指一算”的“指”,经战国争雄年代“运筹帷幄”中的“筹”,再到公元前600年的算盘,后至电子技术时代更为简便的电子计算器,技术的发展不断催生出新的计算工具。
随着工业革命的兴起,19世纪30年代,英国数学家查尔斯·巴贝奇(Charles Babbage)创造性地提出了关于数字计算机的设想,但因受制于资金及技术水平,他所设想的机器并未被制造成形。19世纪中后期,英国数学家乔治·布尔(George Boole)提出了符号逻辑思想,这一思想后来发展为计算机软件科学的理论基础。1936年,英国数学家阿兰·麦席森·图灵(Alan Mathison Turing,图1-1-1)初步探讨了现代计算机的基本概念,提出著名的“图灵机”(Turing Machine)模型,在理论上证明了研制数字计算机的可能性。
第二次世界大战的爆发间接推动了计算机的研发。1943年,迫于军事需求,第一台“巨人”计算机在英国问世,专门用于破译德军密码。1945年,被誉为“计算机之父”的匈裔美籍数学家冯·诺依曼(John Von Neumann)提出“冯·诺依曼结构”,并按照这一结构建造出“通用计算机”。1946年,美国宾夕法尼亚大学的工程师研制出世界上第一台多用途计算机ENIAC,现代意义上的计算机由此诞生,它标志着计算机时代的到来和数字时代帷幕地掀起。
图1-1-1 阿兰·麦席森·图灵
2.计算机图形学的诞生
进入20世纪50年代,交互式计算机系统得到了初步发展。第一台使用阴极射线管(CRT)显示器作为输出设备的“旋风”计算机已经可以实时显示文字和图形,其历史意义在于奠定了由计算机屏幕表现视觉图像的基础(图1-1-2)。
图1-1-2 冯·诺依曼与第一台电子计算机ENIAC
1962年,被誉为“虚拟现实之父”的美国麻省理工学院伊凡·萨瑟兰(Ivan Sutherland)博士发表了他的博士论文《草图板:一个人机交互通信的图形系统》(Shetchpad,A Man-Machine Graphical Communication System),首次提出“计算机图形学(Computer Graphics)”这一术语,确定了计算机图形学作为崭新的科学分支的独立地位。草图板“可以通过使用手持物体(如光笔)直接在显示屏幕上创建图形图像,可视的图样随即被存入计算机内存”,这些图形图像还可随时调用或修改,其信息由计算机程序自动保存和更新。草图板的问世开创了计算机辅助设计(CAD)这一新兴领域。
时隔三年,萨瑟兰于1965年发表《终极的显示》(The Ulimate Display)一文,提出“虚拟现实(Virtual Reality)系统”的基本思想。至1968年,萨瑟兰奔赴犹他大学担任电子工程专业教授,并与大卫·伊万(David Ivan)联合创立了以开发计算机模型系统和软件为主的“伊万&萨瑟兰公司”,时至今日,该公司已然成为业内的主导设计者和先锋制造商。1983年,萨瑟兰凭借对计算机图形学、计算机辅助设计的开拓性贡献荣获了有着“计算机界诺贝尔奖”之称的图灵奖。
数字计算机的诞生意味着艺术有了更为新颖、更为强大的实现手段和传播载体,宣告着数字媒体时代业已到来。
(三)数字媒体技术的发展
数字媒体技术一经问世便以蓬勃之姿步入了发展的快车道,计算机、手机终端更新迭代频繁,数字编辑技术、虚拟技术革新如日中天,硬件与软件的飞速进步赋予了数字媒体技术强大的发展动力,一时间,数字媒体技术成为现代社会协调运转的神经中枢。
1.计算机及网络技术的进步
(1)计算机技术
数字媒体技术经过几十年的不断发展,在计算机这一物理载体的支撑和依托下,逐渐跳脱出科学计算的单一功用价值,开始进入社会生产、生活的各个应用领域,发展速度可谓一日千里。计算机技术与数字媒体技术已须臾不可分割,通过观察计算机发展简表,数字媒体技术的发展轨迹可见一斑(表1-1-1)。
除了根据计算机软件、硬件功能及应用领域划分计算机代别,单纯从计算机能够处理的数据类型这一维度来看,计算机的发展大致经历了三个阶段:
表1-1-1 数字计算机发展简表
①数值计算阶段
这一阶段始于计算机诞生之日至20世纪50年代前期,可被看作计算机发展的“幼年”时代,主要用于解决科学与工程领域的数学问题,对数值数据进行处理,代表机型为ENIAC。
②数据处理阶段
20世纪50年代后,字符发生器的问世使计算机能够表示和处理除数值外其他类型的数据,如字母或其他符号,代表机型为UNIAC-1。
③多媒体阶段
进入20世纪70年代,数字媒体技术的发展以及各类图形图像设备、语音设备相继投入使用,计算机开始进入多媒体时代。
如今,数字时代的计算机正在朝着微型化、网络化、智能化方向阔步前进,不仅衍生出笔记本电脑(Laptop Computer,Laptop)、平板电脑(Tablet Personal Computer,Tablet PC);更有轻便小巧、可移动性强的掌上电脑(Personal Digital Assistant,PDA)等。
(2)网络技术
①报文分组交换技术
尽管计算机在20世纪40年代即已问世,但计算机网络却姗姗来迟。美国20世纪50年代末成立的国防部高级研究计划署(ARPA)对早期的互联网展开了基础性研究。1961年,麻省理工学院的雷纳德·克兰罗克教授在其发表的一篇论文中提出了报文分组交换理论。之后兰德公司的保罗·巴伦和英国国家物理研究所的唐纳德·戴维斯提出了具体的实施方案。分组交换技术兼具电路交换和报文交换二者的优点,在电路利用率上比电路交换要高,且比报文交换的传输时延小、交互性更好。
②TCP/IP协议
1983年,TCP/IP协议(Transmission Control Protocol/Internet Protocol,传输控制协议/因特网互联协议)取代了之前的网络控制协议——NCP(Network Control Protocol),成为互联网的基石。TCP协议与IP协议各有分工,前者负责对网络中的传输数据进行控制,后者提供寻址和路由服务。采用TCP/IP协议,任何局域网和独立计算机都可以不受地域、身份等因素的限制加入互联网。
③Web技术
Web技术是对开发互联网应用的技术的总称,一般分为Web服务端技术和Web客户端技术两类。Web技术的表现形式主要有三种:超文本(hypertext)、超媒体(hypermedia)以及超文本传输协议(HTTP)。作为一种用户界面范式,超文本技术可以将不同空间的文字信息内容组织在一起,我们日常浏览的网页上面的链接就是一种超文本。目前,超文本的组织管理对象已从纯文字扩展到文字、图像、视频等多媒体领域,为了突出这一变化,超媒体概念应运而生。HTTP主要用于传送万维网数据,通常包括客户机向服务器的请求消息和服务器向客户机的回应消息这两部分信息内容。
1995年,微软(Microsoft)公司购买并重新编写了望远镜(Spyglass)公司开发的Mosaic浏览器,将之命名为Internet Explorer,即IE浏览器。IE浏览器的问世使得互联网真正进入了平面化时代。
在Web技术发展早期,也就是Web1.0时代,超文本标记语言(HTML)应用极为广泛。HTML文本是由各种HTML命令组成的描述性文本,可用于说明文字、图形图像、声音、动画等多媒体信息,并需要浏览路执行。随着网络技术的发展,在HTML基础上,SHTML、AHTMI以及XML等新技术相继出现。这一时期,门户网站、电子邮件、BBS、即时通信等应用已然普及。1999年,腾讯公司开发出腾讯QQ,成为中国近20年来最受欢迎的即时通信工具。
进入Web2.0时代,用户的生产积极性被极大激发,他们不仅是网站内容、数字媒体信息的浏览者、消费者,也是生产者、制造者;他们不仅看和听,还可以写、画、编辑和建设。体现Web2.0思想的应用有博客、微博、微信等社交网络(SNS)以及维基百科(Wikipedia)、基于地理位置的信息服务(LBS)等。
有人认为,如果Web1.0时代的用户是浏览者,Web2.0时代的用户是参与者,那么Web3.0时代的用户就是管理者,能够对自己产出的网络内容进行有效管理和经营。目前来看,Web3.0只是业内人士制造出来的概念,尚未完全成为现实。
2.手机及移动通信技术的发展
(1)手机技术
手机早期俗称“大哥大”,又作移动电话、无线电话,是现代人日常生活中不可或缺的数字通信设备和移动互联设备。
早在20世纪初,人们就已经开始对手机技术进行探索。美国的内森·斯塔布菲尔德(Nathan Stubble Field)于1902年制成了世界上首个无线电话装置。在此基础上,经过70余年的钻研,1973年,世界上第一部推向民用的手机诞生,发明者是被尊为“手机之父”的美国摩托罗拉公司总设计师马丁·库珀(Martin Cooper)。与当下小巧轻便的手机相比,这部重达1公斤且充电时间长、通话时间短的手机极为笨重,但它却开启了无线通信的新纪元。
经过10年的改进和研发,摩托罗拉公司终于在1983年将手机推向市场。作为世界上第一台手机产品,DynaTAC8000X“重794克,长33厘米,通话时间半小时,可以存储30个电话号码,销售价格为3995美元,可称为最昂贵的‘砖头’”(图1-1-3)。这一时期,手机的电池容量和模拟调制技术受到天线和集成电路发展状况的制约。
内置天线的设计可视为手机发展过程中的另一个里程碑。采用该项设计的手机要比之前的手机小巧很多,因此受到了市场的追捧。1999年上市的诺基亚3210就采用了这一设计,从尺寸来看,它大约长12厘米,宽5厘米,高1.6厘米,以其便携性在国内市场站稳了脚跟。
WAP2(Wireless Application Protocol,无线应用协议)手机的出现标志着手机上网时代的来临。WAP手机不但保留了普通手机的一般通信功能;因为内置微型浏览器、缓存及内存,WAP手机还能够收发电子邮件、传真,获取新鲜资讯等,可以说,WAP手机是移动电话和移动电脑的集合体。当然,因WAP手机普遍内存小、屏幕小且无线频带窄,使用这类手机大多只是浏览文字信息和一些存储量较小的图片。
图1-1-3 马丁·库珀和世界上第一台手机产品——DynaTAC8000X
计算机正朝着微型化、网络化和智能化的方向发展,掌上电脑已然流行于世。随着用户对于掌上电脑的依赖以及对于移动通信的需求渐盛,智能手机(Smart Phone)应运而生。智能手机最突出的特点在于具有独立的操作系统,用户可自行安装各种第三方软件和服务(APP),并可通过移动通信网络实现无线网络接入。
早在1993年,南方贝尔公司(Bell south)就推出了世界上第一部智能手机IBM Simon,为后来智能手机的兴起奠定了基础。2002年是智能手机时代的起始年,这一年,加拿大的移动研究公司(RIM)推出了世界首款具备手机通信功能的系统——黑莓(Black berry)系统,Hand spring公司(现已与Palm合并)发布了第一条基于掌上操作系统的treo手机生产线,微软公司紧随其后发行了其掌上电脑的手机版,而像GPRSD这样的移动数据技术应用则开始大幅扩张。
2007年苹果(Apple)公司首席执行官史蒂夫·乔布斯(Steve Jobs)宣布推出iPhone,这一被奉为“偶像”的手机在此后引领了一个时代的风潮。2011年,人工智能助理软件语音助手Siri的应用使得iPhone用户可以通过声控、文字输入等方式搜寻各种生活信息和服务,其强大的服务功能使系统可以根据用户的地理位置来编排和过滤信息。3D-touch(多点触控)技术的引入则使压力触摸屏更为敏感细腻,在轻点、轻扫、双指开合等传统手势的基础上,还可以感知轻按及重按的不同力度(图1-1-4)。除iPhone手机外,目前流行的智能手机品牌有黑莓、三星、LG、Yota Phone、索尼、小米、华为等,主流操作系统主要包括苹果公司的i0S系统、谷歌研发的Android系统以及微软公司推出的Windows Phone系统等。
图1-1-4 iPhone6S中的Touch ID传感器
智能手机时代,数字科技的更新换代愈加迅猛。2013年,俄罗斯电信网络营运商(Yota)。推出自主研发的智能手机Yota Phone(图1-1-5),被认为是“俄罗斯的iPhone”。2014年12月,Yota Phone登台亮相,其最大亮点在于双屏设计,正面为5寸液晶屏,背面为4.7寸的电子墨水屏。电子墨水屏表面附着很多“微胶囊”,封装了带有正电的白色颗粒。通过改变电荷,不同颜色的颗粒将有序排列,呈现出黑白分明的可视化效果。这种屏幕的反射率和对比度较高,在强光下也能看清屏幕内容。将其作为主屏幕,充电一次即可续航两天以上,即使电量耗尽仍可查看通讯录、邮件等重要信息。
图1-1-5 Yota Phone2
当下的智能手机已发展成为一类小巧轻便、功能强大、集多种媒体信息于一体的技术终端,是数字媒体艺术创作、编辑、处理及传播的重要载体。
(2)移动通信技术
广义而言,移动通信是随着无线电的发明而诞生和发展的。但从狭义角度看,移动通信指的是始于20世纪70年代随着手机的应用普及而发展起来的技术。迄今为止,移动通信技术已相继经历了模拟阶段和数字阶段,现已迎来5G时代。
第一代移动通信技术(1G)产生于20世纪70年代末期。1978年,美国贝尔实验室研制成功先进移动电话系统,建成蜂窝状移动通信系统。值得注意的是,这时的移动通信系统是基于模拟传输的,具有质量差、速度低等一系列缺点。1G手机不仅收讯效果不佳且只能进行语音通信,有NMT、AMPSTACS等多种制式。
20世纪90年代中期,2C通信时代到来,这也是数字手机时代来临的初始。不同于1G手机,2G手机(图1-1-6)以数字化方式传输语音,并在语音通话功能外引入了短信功能。不仅如此,出于数据通信的需求,支持彩信业务的CPRS、支持上网业务的WAP服务以及各式各样的Java程序等也在手机上得到支持。此时的手机通话质量已趋于稳定,且待机时长合理。总体而言,2G手机采用的多路复用(Muliplexing)技术可分为两类:一类是在CDMA基础上发展起来的系统,如CDMAONE;一类是在TDMA基础上发展起来的系统,如GSM。
图1-1-6 2G手机代表机型诺基亚1100(2003年上市,内置贪食蛇等小游戏)
3G指的是第三代移动通信技术,又称IMT2000,其最基本的技术特征是智能信号处理技术。基于3G系统的3G手机与前两代手机的区别主要在于声音与数据传输速度的大大提升,它不仅在全球范围内实现无缝漫游;还可以处理包括文字、图像、声音、视频等在内的多种媒体形式,提供多种信息服务。推动3G时代到来的关键技术包括TD-SCDMA技术、智能天线技术、WAP技术、快速无线IP技术以及多用户检测技术等。
4G指的是第四代移动通信技术,它是3G技术的延伸。4G的数据传输速率最大能至100Mb/s,是3G时代的50倍,足以传输高质量的视频图像。除此之外,4G通信还具有一些其他优势,如网络频谱宽、通信灵活、兼容性好并能提供增值服务等。
5G指的是第五代移动通信技术,其峰值理论传输速度可达每秒数1Gb,这比4G网络的传输速度快了近10倍。未来5G网络必须具备在自然灾害、战争、病疫等发生之前能够实时提供准确的应急通信服务。在高速的移动实体,如高铁、飞机等交通工具中,5G网络必须要具有非常好的移动性支持,为用户提供实时网络接入、邮件收发、娱乐等服务。“游牧式” 的移动终端设备对移动性能要求不高,但在网络可靠性等方面有很高的要求。目前,对于能量利用效率与能耗的重视程度越来越高;网络功能的执行不应该过度地消耗能量,5G应能支持更低功耗,成为更加绿色环保的移动通信网络。
(四)数字编辑技术
数字媒体技术催生出一系列新学科、新领域的同时,利用数字媒体技术对文字、声音、图形图像、影像乃至地理位置信息等进行编辑的数字编辑技术也得到了长足发展。计算机技术的最大魅力并不在于作为一种硬件设备的发展,而在于提供了一种软件研发的无限可能。通过数字计算机设计的作品,其艺术表达张力和表现空间是不可估量的。
1.文字的数字化
文字是古人图腾崇拜的重要载体,亦是文化与文明传承的重要媒介。仓颉造字使得“天雨粟”“鬼夜哭”“龙乃潜藏”,足见我国传统文化中“敬天惜字”的习俗与精神。数字化的春风吹向文字,文字在保存其内在意蕴的同时,其形、其质也在发生改变。
(1)文字与编码
在人与计算机的交互过程中,文字发挥着基础性作用,是人们获取信息、传播信息的主要手段。唯有使用二进制代码对文字进行编码,计算机才能准确地识别、处理、存储和传播文字信息。
最早的信息交换代码标准是由美国国家标准学会(American National Standard Institute;ANSI)制定的,它始于20世纪50年代后期,于1967年定案,称作ASCII码(American Standard Code for Information Interchange)。这一标准将英文的大小写字母、标点符号、数字等128个常用字符与数字代号一一对应,使用指定的7位二进制组合来表示。ASCII码最初属美国国家标准,是不同计算机在相互通信时共同遵守的西文字符编码标准,后被国际标准化组织定为国际标准,称为ISO646标准,适用于所有拉丁文字符。
出生于美国的ASCII码存在着一个显见的缺点,那就是它无法全面覆盖其他国家所特有的字符形式,如英国的英镑符号(£)、汉字系统中的中国象形文字以及使用斯拉夫字母表的希腊语、希伯来语、阿拉伯语和俄语等。鉴于此,国际标准化组织于1967年推出了ASCII码的变种,但这显然不是最佳解决方案。人们借鉴ASCII码的思路,以8位二进制来表示扩充的文字,为不同语言系统的文字和符号制定了不同的编码表,ISO8859标准得到了广泛应用。
但问题随之而来,ISO8859虽在不同国家和地区广泛应用,但却常常出现不兼容的情况,例如英语体系国家与汉语体系国家在编码标准上就很难统一;这也是中国GB2312、GBK等编码标准问世的直接原因。在此情形下,Unicode(Universal Multiple Octet Coded Character Set,又作万国码、统一码)于1994年正式问世,Unicode是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符都设定了统一且唯一的二进制编码,以满足跨语言跨平台进行文本转换处理的要求。在Unicode问世的20世纪八九十年代,计算机存储容量已获得大幅提升,iSO开始用两个字节,即16位来统一表示所有字符,并将英语之外的其他语言字符全部重新统一编码。有了Unicode、Windows系统等一系列多语言软件终于不用加装各地本土语言系统就能够完整显示世界各地的语言字符了。互联网的兴起令Unicode如何在网上传输成为一个新课题,于是UTF(Unicode Transfer Format)标准应运而生。当然,从Unicode到UTF还需经过一些运算和转换。
(2)字库与字体
字库是个年代久远的称谓,如今,字库通常指称由外文字体、中文字体及相关字符的电子文字字体组合而成的集合库,广泛用于计算机、手机及其他智能设备上。
字库技术的发展大致经历了点阵字库、矢量字库和曲线字库三个阶段。前两者的缺点在于数据存储量较大,字符显示还会出现锯齿,曲线字库则有效克服了以上缺点,不仅美观、连续性好,且存储量小、变换方便。
按照不同的划分维度,字库可以分为不同类别。按照语言分类,可分为中文字库(一般是中西混合,如简体字库、繁体字库等)、英文字库和图形符号库等;按照品牌分类;有微软字库、方正字库、汉仪字库、长城字库等;按照风格分类,则包括宋体、楷体、黑体、魏碑、隶书、幼圆、篆书等。除此之外,另有一些名人字体,如舒体、姚体、毛泽东字体、叶根友手写体等(图1-1-7)。
图1-1-7 各种风格的中文字体(www.daowen.com)
不论英文还是汉字,不同风格的字体字库总带有特殊的意蕴,人们通过电子设备承载的文字获取信息时,其背后潜藏的文化与诗意亦扑面而来。
(3)文字输入与编辑
目前,文字的输入有多种手段与途径,如键盘、虚拟键盘、语音识别系统等。但在计算机问世之初,对于已经习惯打字机的西方国家而言,使用键盘向计算机输入英文字母是极为便利的,但对于使用方块字且不熟悉键盘操作方式的汉语国家来说,这种输入方式甚至在某种程度上阻碍了彼时计算机的普及。
20世纪70年代末,上海的一位工程师创造了一种输入方法,即“见字识码”。这种方法在字音和字形的基础上,将26个拉丁字母进行编码,用4个字母来表示一个汉字,见字就能识码。尽管这一方法曾得到一定范围的应用,但真正将汉字输入技术大范围推广的当属王永民于1983年发明的“五笔字型输入法”。作为一类形码,五笔字型输入法将汉字分解为不同的字根,以字母表示,使用起来极为便利。1995年,北京大学的朱守涛先生发明了更为简单易学的“智能ABC输入法”,作为一种音形结合输入法,用户既可以通过拼音输入文字,又可以借由文字的第一笔笔画以形检索到所需文字。时至今日,“全拼输入法”“搜狗输入法(图1-1-8)”“紫光拼音输入法”等各类简单易用的输入法已成为首选输入工具,各类输入法的“皮肤”“词库”也成为应用市场的宠儿。
图1-1-8 搜狗输入法的“皮肤”——花花世界
除较为常用的键盘输入外,通过手写方式在手写板或手机等智能设备屏幕、车载屏幕上直接书写输入文字是另外一种较为常见的输入方式。但这种方式存在识别误差,其方便度和适用性远不及虚拟键盘输入方式。近几年语音识别技术发展迅速,在一些装有语音识别系统的智能设备上,通过语音输入可以实现文字输入。不过,这种方式与手写方式同样存在着精确度不足的缺陷。
文字输入计算机后通常需要对其进行编辑处理,这就运用到了文字编辑软件。常见的文字编辑软件有微软Office系列(始于1985年)、金山WPS系列(始于1988年)等。
2.图形图像的数字化
图形图像的数字化指的是数字媒体技术作用于图形图像的创作、编辑、生成、存储及传播的一系列过程,它包括运用数字智能设备绘制图形、摄制图像的数字化,运用软件编辑、处理图形图像的数字化,也包括数字化的存储与传播。
如前所述,计算机图形学、计算机辅助设计的问世是数字媒体技术诞生的显著标志,也是数字媒体技术发展的必然结果,二者相辅相成。数字媒体技术的发展推动了图形图像的全面数字化,具体表现在以下几个方面:
(1)计算机辅助设计(Computer Aided Design,CAD)
早在20世纪50年代初,第一台平板式数控绘图机即已出现,在此基础上,滚筒式数控绘图机紧随其后研发成功。正是在这一时期;阴极射线管的问世使得数据可以以图形显示在荧光屏上。计算机诞生后,随着数字媒体技术的发展及对数字图形的学理探讨和应用实践,计算机图形学逐渐成为一门显学。
进入20世纪60年代,关于CAD的曲面片技术及商品化的计算机绘图设备相继出现;至70年代,相对完整的CAD系统俨然成型;及至80年代,CAD技术开始在中小型企业中普及,并逐渐朝着标准化、智能化的方向阔步前进。时至今日,在网络技术和人工智能的加持下,CAD系统的性能已大有提高,并出现了智能CAD技术。无论建筑设计、机械设计、艺术设计抑或出版业、工厂自动化等领域,CAD都是不可或缺的一大助力。
作为国际知名的二维、三维设计类软件,Auto CAD(图1-1-9)是由美国欧特克公司于1982年推出的用于二维绘图和基本三维设计的计算机辅助设计软件。它用户界面良好、易学易用,有着强大的适用性和兼容性,因此得到了大范围的普及。其应用领域主要包括环境艺术设计等领域的工程制图、服装加工中的服装制版等。
图1-1-9 Auto CAD 2014软件页面
德国西门子公司开发的智能CAD软件Siggraph Design则更为便捷,设计师在设计草图时,一旦结构确定,无须耗时耗力地输入精确的坐标点,只要给出正确的尺寸就能得到令人满意的图纸。
(2)视觉传达设计(Visual Communication Design)
视觉传达设计主要涉及商业海报、宣传册、产品包装及插画等的平面设计工作。尽管从字面意思来看,所有视觉符号都应囊括在视觉传达设计的范畴中,但在我国和世界上很多国家,视觉传达设计几乎等同于平面设计,并不包括动态影像等其他视觉内容。
数字图形图像包括位图和矢量图两类,欲探讨视觉传达设计,首先要了解这两种图像形式。
位图(bitmap),又叫作点阵图,由一个个像素点组成,其最大的优点是色彩丰富而细腻,缺点则是其文件存储量较大,在旋转和缩放过程中容易失真。位图的颜色编码包括RGB和CMYK两种。其中,RCB是应用范围最广的颜色系统之一,它通过红(R)、绿(G)、蓝(B)三种颜色通道之间的相互叠加和各自的变化来获得各种颜色。CMYK作为一种印刷四分色模式则广泛用于印刷领域。常用的位图处理软件有奥多比(Adobe)公司的Photoshop(图1-1-10)以及微软Windows操作系统预装的画图软件。
图1-1-10 通过Photoshop打造的“冰冻的手”效果
矢量图(vectograph),又作向量图,根据几何特性,如点、直线或曲线来绘制图形。其优点在于无论如何旋转和缩放都不会失真,缺点在于难以表现丰富细腻的色彩层次。矢量图的绘画工具主要有奥多比(Adobe)公司的Illustrator(AI)和科亿尔(Corel)公司的Corel DRAW(CDR)。
在明确位图和矢量图各自的优缺点之后,我们可以根据具体的设计要求选择使用适合的数字图形图像编辑工具。现在,计算机不仅可以对图形图像进行编辑和处理;还可以凭空创造各类只存在于想象中的事物;不仅可以制作出二维图像,还可以生成逼真的三维立体图像。这极大地丰富了人们的精神世界。
3.音频的数字化
(1)模拟音频(Analogue Audio)
我们在日常生活中听到的各种声音都称为音频(audio),源于自然界的声音信号和经由传感器获得的声音电信号在时间上与幅度上均具有连续性,这种连续的音频称作模拟音频,其主要载体为磁带、磁盘等。
相较于数字音频,模拟音频的缺点显而易见。在处理过程中,模拟信号的抗干扰能力差,且容易失真。模拟磁带最大的缺点是,在复制与剪接时,一旦编辑点选择不当,就会直接毁坏原始音频素材,造成无法挽回的损失。
(2)数字音频(Digital Audio)
音频的数字化既包括音频信号处理过程中的部分数字化,也包括全过程的数字化。采用数字化手段对模拟音频进行处理的称为音频的部分数字化,从录音到编辑处理和传播皆采用数字化手段的即为音频的全数字化。如我们身边的CD很多都标有ADD、AAD、DDD字样,这三个字母依次代表音频的录入、编辑和成品三个阶段,其中A对应的是模拟,D对应的则是数字。从模拟信号到数字信号需要经过模/数(A/D)转换,即采用数字化的方式对模拟信号进行处理,将在时间上和幅度上都连续的模拟信号通过采样、量化和编码转换为数字信号,而后记录并传播。数字音频信号在时间和幅度上都是离散的,方便了工作者和设计师对音频信号的非线性编辑。因其抗干扰能力极强,音频信号的质量几乎能够无损地进行记录和处理,如图1-1-11。图中的正弦曲线代表原始音频曲线,方格阴影代表采样后的结果,二者越吻合证明采样质量越高。
数字音频技术的发展和计算机技术的突飞猛进促使数字音频工作站(DAW)应运而生。数字音频工作站是以计算机控制的硬磁盘为主要记录载体的数字音频系统,一般都是用专用操作系统来管理所有的软硬件资源,并以图形菜单作为人机交互的界面。DAW的出现改善了广播电台、电视台音频录制和编辑等的工作环境,大大提升了工作效率,实现了广播行业的高质量节目录制和自动化输出。
数字音频技术在一定程度上刺激了广播业的发展,目前,国际流行的几种发展较为成熟的数字广播主要包括数字声音广播(DAB)、数字多媒体广播(DMB)、数字卫星声音广播(DSB)和数字条幅声音广播(DRM)。
图1-1-11 采样的过程即是将模拟电信号转换为“比特”的过程
(3)数字音频编辑软件
常见的音频编辑软件有奥多比(Adobe)公司的Audition(Au)、编码愿景(Codevisions)公司的MP3Splitter以及出品(Genie Soft)公司的Overture等。Audition是一款功能强大的专业音频编辑软件,可提供先进的音频混合与编辑、控制和效果处理等操作。它可以移除不需要的音频源,去除麦克风的爆音等杂音,也可以生成噪声,并对噪声的参数(延迟时间、强度、样式等)进行调整和修改。
(4)数字音频格式
常见的数字音频格式主要有CD格式、WAV格式、MP3格式、MIDI格式、WMA格式等。其中,CD格式的音频质量最高,能够满足音响发烧友的高标准,该类文件的扩展名为.cda;WAV来自微软公司,其声音文件质量与CD相差无几,是PC机上广为流行的声音文件类型;来自德国的MP3格式最为流行,这种格式的音频文件尺寸小、音质好,尽管音频编辑市场不断推陈出新,但目前仍未出现哪一种格式能与之比肩。
4.视频的数字化
进入多媒体阶段,计算机在与文字、图形图像、音频发生碰撞的同时还向视频领域渗透,引发了视频的数字化转向。与音频的数字化过程类似,视频的数字化也经历了从制作过程的部分数字化向全过程数字化的过渡。
(1)模拟视频(Analogue Video)
模拟视频,究其实质,是一种用于传输图像和声音且随时间而连续变化的电信号,是早期视频的普遍形态。我们看到的电视、电影视频图像大多以模拟电信号的方式获取,其每一帧图像都是实时的自然真实图像。尽管模拟视频的成本低廉、还原性好,但多次复制之后仍然会出现明显的画面、声音失真现象。模拟视频的通用标准主要包括NTSC制式、PAL制式和SECAM制式三种。
(2)数字视频(Digital Video)
数字视频,广义而言,指的是完全或部分采用数字化的方式录入、处理和传输的视频形式;狭义而言,则是指视频的采集、处理、编辑和传播全部数字化的视频。
早期对于视频的数字化主要是在笨重的台式计算机上增加简单的视频功能,利用计算机来处理动态画面。当然,这一功能主要面向从事视频编辑工作的专业人士,并未普及开来。PC机的广泛应用令数字视频得到了广泛认可,但彼时计算机有限的硬盘容量制约了数字视频的编辑处理和传播。尽管如此,数字视频的魅力依然无法抵挡,从业者们开始在现实困境与梦想之间寻找折中路径。首先,他们采用计算机对单帧视频画面进行捕捉和存储,继而使用图像处理软件进行加工。这种方法尽管可行,但其过程繁重机械,对于人力、物力要求较高。
当计算机具备了捕捉活动影像的能力:数字视频制作所需的人力和物力大大降低,但问题随之而来——不同计算机所捕获的视频缺乏统一标准,无法交换。这一难题在各种压缩、解压缩技术的成熟过程中迎刃而解,而MOV和AVI等视频文件标准的确立使得数字视频有了更为广阔的应用空间。
在多媒体计算机时代,无论是视频录入阶段的各类数码影像设备、视频编辑处理阶段的各类数字视频编辑软件,还是视频播放环节的各种数字化终端设备,这些都为数字视频的风行起到了推波助澜的作用。一般来说,常见的数字视频形态主要包括互动性和非互动性两类。互动性数字视频包括数字电影电视、IPTV0、网络电影电视、手机电影电视等;非互动性数字视频包括车载移动电视、楼宇电视、城市彩屏等。数字视频在信息编码方式、声像质量、存储控制、频谱资源利用及交互传播等方面均优于传统模拟视频,可以说,数字视频不仅为用户带来了更多声画效果更好的视频内容,还以定制收看、回看、点播、点映等功能赋予了用户更为自由的选择权利,颠覆了传统视频的传播方式。
(3)数字视频编辑软件
常见的视频编辑软件主要包括奥多比(Adobe)公司的Adobe Premiere Pro、Adobe After Effects,美国艺电(Electronic Arts,EA)旗下的科亿尔公司研发的会声会影(绘声绘影)以及日本老人星(Canopus)公司的FEDIUS等。其中,Premiere Pro既是一个独立的产品,也是Adobe Video Collection中的关键组件。Premiere Pro是当前应用最为广泛的非线性视频编辑软件,它为数字视音频编辑工作提供了效果强大的功能,如精准的色彩修正、视音频控制以及多个嵌套的时间轴等。After Effects是电视台、动画制作公司、多媒体工作室和个人后期制作工作室的得力助手,广泛应用于影像合成、特效添加、非线性编辑、动画设计等领域。不仅如此,奥多比(Adobe)公司旗下的软件之间相互兼容,也就是说,将Photoshop或Illustrator的文件导入After Effects中时可以保留图层信息,对不同图层的素材也可进行自由处理。
(4)数字视频格式
以数字视频的获取渠道和存储载体作笼统划分,数字视频格式大致可分为两类:一类为适合本地播放的本地影像视频;一类为适合网络播放的网络流媒体影像视频。总体而言,前者在播放的稳定性和画面的精致程度上或多或少要高于后者,但后者所具有的体量小、易于传播等特点却使其传播速度更快、使用范围更广。
微软公司于1992年发表的AVI格式可被看作资格最老、应用时间最久的视频格式,这一格式对视频文件进行有损压缩,压缩标准可任意选择。因此,尽管画面质量并不出色,但应用范围却相当广泛。
同样在1992年,动态图像专家组(Motion Pictures Experts Group,MPEG)出版MPEG-1标准,编号为ISO/IE11172。可以说,大部分的VCD都是用MPEG-1格式压缩的。使用这一方式,一部120分钟的电影可被压缩至1.2GB大小。1994年,专家组公布了MPEG-2标准,该标准希望囊括包括数字电视、图像通信等在内的各领域的编码标准,它可以将一部120分钟的电影压缩到5~8GB,其声画质量是MPEG-1无法比拟的。1998年,MPEC-4问世,其标准编号为1SO/IEC14496。这一标准更加注重多媒体系统的交互性,普遍应用于视像电话、电子邮件以及家庭摄影录像、网络实时影像播放等领域。总而言之,MPEG系列标准对数字电视(DRTV)、高清晰度数字电视(HDTV)以及多媒体通信等信息产业的发展产生了巨大而深远的影响。
除以上格式外,苹果公司推出了流式视音频格式MOV;它也是Quick Time的文件格式。值得一提的是,该格式是以轨道(Track)形式组织起来的。Real Networks公司制定的RMVB格式以及微软公司推出的ASF格式、WMV格式同样是数字视频的常见格式,而FLV、F4V格式则是适于网络传播的常见流媒体视频格式。
(五)虚拟现实、增强现实与混合现实
1.虚拟现实(Virtual Reality,VR)
虚拟现实技术又称灵境技术,是使用以计算机为核心的数字媒体技术所生成的逼真的,集视觉、听觉、触觉于一体的特定范围内的虚拟环境和仿真系统。用户可以借助一些可穿戴设备与虚拟现实中的角色进行互动。
迄今为止,VR技术的发展大致经历了四个阶段:1963年以前是第一个阶段,这一阶段为VR思想的孕育阶段;第二阶段始于1963年,终于1972年,为虚拟现实技术的萌芽阶段;第三阶段从1973年至1989年,是VR技术概念产生和理论初步形成的阶段;自1990年至今是VR技术发展的第四阶段,这一阶段,VR技术相关理论得以进一步完善,其应用范围不断扩大,技术威力初步彰显。
VR技术(图1-1-12)具有一系列不同于他者的特质:(1)多感知性。除视觉、听觉感知外,还包括触觉、嗅觉乃至味觉。(2)沉浸感。逼真的虚拟现实沉浸感极强,给用户带来强烈的真实感和临场感。(3)交互性。用户可通过可穿戴设备与虚拟现实中的角色、物体互动交流。(4)自主性。虚拟现实中的事物可依照真实世界的物理规律动作、运行。
图1-1-12 通过可穿戴设备沉浸于虚拟现实的参与者
VR的关键技术主要包括语音输入输出技术,视觉及反馈技术,对参与者头、眼、手等的追踪技术,广角立体显示技术以及实时计算机三维图形图像技术等。一般而言,数字编辑技术中的计算机三维图形图像技术已然较为成熟,但应用于VR的关键在于实时,这不仅对图像质量提出了高要求,也对虚拟环境表现或再现的精细程度提出了高要求。
VR技术的应用领域极为广泛。应用于医学领域,可建立虚拟人体模型,让学生借助跟踪球(Trackball)、头戴式可视设备(Head Mount Display,HMD)或感觉手套(Feeling Clove)等来了解人体器官结构。不仅如此,学生还可在虚拟实验室中练习“尸体”解剖和各种手术。
应用于数字游戏领域,可增强游戏情境的真实感和趣味性。应用于艺术领域,可以将静态的艺术转化为动态,从而使艺术变得厚重而立体。应用于室内设计领域,设计者可以运用计算机三维编辑软件按照自己的构思去创作生成虚拟房间,以预览设计效果。2012年,谷歌公司推出了谷歌眼镜(图1-1-13),这一年也被认为是“智能可穿戴设备元年”。谷歌眼镜几乎具有和智能手机一样的功能,不仅可以通过声音控制拍照、视频通话和辨明方向,还能上网搜索、处理信息和电子邮件。在谷歌眼镜之后,苹果等公司纷纷进军智能可穿戴设备领域以开拓市场新大陆,希望在新一轮技术革命中分一杯羹。
图1-1-13 英国维珍航空公司利用谷歌眼镜识别乘客身份
通过近两年问世的智能可穿戴产品能够看出,智能可穿戴设备往往小巧轻便,具备部分计算功能,而且可以连接智能手机及各类数字终端。主流的产品形态包括三类:第一类以手腕为支撑,包括手表和腕带等产品;第二类以脚为支撑,包括鞋袜等;第三类以头部为支撑,包括眼镜、头盔、头带等。除以上三类外,另有智能服装、书包、拐杖、配饰等各类非主流产品形态(图1-1-14)。
图1-1-14 苹果公司于2014年9月推出的智能手表——Apple Watch
美国威斯康辛州Wicab公司开发了一款盲人眼镜产品——Brain Port。这款智能眼镜可以帮助盲人“看见”世界。Brain Port主要由一副眼镜和一块感应片构成,眼镜上配备能够拍摄图像的卫星摄像机,图像被转换成低像素的黑、白、灰图画,通过感应片转换为电脉冲信号。在置于口腔的感应片作用下,电信号传入大脑的视觉反射区,信号被还原为黑、白、灰图画。如此一来,使用者便可以“看到”图像了。Wicab公司还另外研发了适用于Brain Port的App应用,它可以同步Brain Port收集到的图像,结合图像识别技术分析处理图像信息,为盲人提供向导。自2013年开始,Brain Port先后在欧盟和加拿大获批上市,2015年6月又在美国成功拿到上市许可。中国的视力残疾人数已逾千万,Brain Port在中国的落地将成为中国视力残疾人士的福音(图1-1-15)。
图1-1-15 Brain Port由一副置有摄像机的太阳镜、一个控制器和一个感应器构成,失明者在使用时需把感应器含在嘴里
2.增强现实(Augmented Reality,AR)
增强现实技术是通过计算机技术将数字虚拟信息应用于真实世界的一种新兴技术,它可以将真实环境与虚拟物体实时叠加到同一画面或空间。增强现实技术可以应用到多个领域,如医疗、军事、工业维修、旅游、游戏及展览等。
2015年1月,微软公司推出全息眼镜,成为AR技术的代表性设备。Holo Lens(图1-1-16)不仅可以实时投射新闻信息流、收看视频内容、查看天气预报等生活信息,还可以辅助3D建模,对一些虚拟场景(如登陆火星、游戏场景等)进行模拟。
图1-1-16 Holo Lens的虚拟现实游戏
同年4月,宝马公司旗下的迷你汽车推出了一款AR眼镜(图1-1-17),用于辅助驾驶。这款AR眼镜可以将驾驶所需各种信息内容投射到驾驶者眼中,它所具有的“X光视野(X-Ray View)”功能还可以将车身转为“透明”,佩戴AR眼镜的驾驶者可以透过车身直接看到车外的其他机动车、行人和商铺信息。
图1-1-17 AR眼镜可以将环境信息投射到驾驶者眼中
3.混合现实(Mix Reality,MR)
如果说VR技术致力于将虚拟环境真实化,AR技术致力于将现实环境信息化、数字化,那么,MR技术则同时做到了这些。作为VR技术的进一步发展,MR技术将现实和虚拟环境进行合并,进而打造出一个新的可视化环境,在这里,物理对象和数字对象共存,并可进行实时互动。
目前,全球从事MR技术设备研发的团队较少。作为一个高科技企业,Magic Leap(图1-1-18)堪称其中的领头羊。不过,该公司目前推出的多为概念产品,并未有实际存在的产品问世。
图1-1-18 Magic Leap推出的概念产品宣传视频
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。