一个有效的管理信息系统能够及时准确地提供相关信息,而这些信息是存储在计算机文件中的。只有当文件被适当地安排和维护时,用户才能很容易地访问和检索他们所需要的信息。如果在图书馆查找相关资料时曾使用过索引卡片,你就会发现文件管理的重要性。同样,对于组织来说,也需要好的文件组织和管理,否则会导致信息处理混乱、费用大,而且效益也会不好。即使用了优良的硬件和软件,如果没有文件管理,一些机构的信息系统也不会起到相应的作用。
为了保证信息的及时性、准确性、完整性和可靠性,需要用科学的方法和先进的技术来管理信息和数据。怎样把各种数据组织起来,使计算机能有效而方便地处理加工,是数据管理技术要解决的问题。随着计算机硬件技术、软件技术的发展,数据库技术的发展也由低级到高级、由简单到逐步完善。数据管理技术的发展可归纳为三个阶段:人工管理、文件系统和数据库管理系统。
(一)人工管理(20世纪50年代中期以前)
这一阶段计算机主要用于科学计算,数据量不大,一般不需要将数据长期保存,只在输入程序的同时输入数据;外部存储器只有磁带、卡片和纸带等;由于还没有操作系统,也没有数据管理方面的软件,程序员在设计程序时不仅要规定软件的逻辑结构,而且还要设计其物理结构,使得程序与数据相互依赖,一旦数据的存储方式稍有改变,就必须修改相应程序;只有汇编语言的数据处理方式基本是批处理。人工管理阶段的工作原理如图2—8所示。
图2—8 人工管理阶段
这个阶段有如下几个特点:
(1)计算机系统不提供对用户数据的管理功能。用户编制程序时,必须全面考虑好相关的数据,包括数据的定义、存储结构以及存取方法等。程序和数据是一个不可分割的整体,数据无独立性,脱离了程序就无任何存在的价值。
(2)数据不能共享。不同的程序均有各自的数据,这些数据对不同的程序通常是不相同的,不可共享。即使不同的程序使用了相同的一组数据,这些数据也不能共享,程序中仍然需要各自加入这组数据。由于这组数据的不可共享性,必然导致程序与程序之间存在大量的重复数据,浪费了存储空间。
(3)不单独保存数据。由于数据与程序是一个整体,数据只为本程序所使用,数据只有与相应的程序一起保存才有价值,否则就毫无用处,所以,所有程序的数据均不单独保存。
早期的计算机上没有完善的操作系统,数据的一切组织管理完全依靠人工完成,难以处理复杂的数据处理任务。显然,由人工在繁杂的案卷中查找和使用数据是相当费时和麻烦的事,于是很快就被先进的文件系统所代替。
(二)文件系统(20世纪50年代后期到60年代中期)
在这一阶段,计算机不仅用于科学计算,还应用于信息管理方面。随着数据量的增加,数据的存储、检索和维护成为紧迫的需要,数据结构和数据管理技术迅速发展起来。此时,外部存储器已有磁盘、磁鼓等直接存取的存储设备,软件领域也出现了操作系统和高级软件。文件管理系统对文件进行统一管理,它提供各种例行程序对文件进行查询、修改、插入、删除等操作。程序员可以集中精力研究算法,而不必过多地考虑数据存储的物理细节。文件系统的工作原理如图2—9所示。
图2—9 文件系统阶段(www.daowen.com)
通常文件具有逻辑结构和物理结构。文件的逻辑结构描述文件中各记录之间的相互关系,或每个记录在文件中的位置。一个具有逻辑结构的文件,其每个记录在文件中都有确定的位置。文件的物理结构是为体现逻辑结构服务的,从用户的角度看,每个文件的逻辑结构呈现出一定的形式,第一个位置上是什么记录、第二个位置上是什么记录……这些只是虚拟概念,但是任何虚拟最终都要用实体来体现,怎样存储这些记录来体现文件的记录之间的位置关系呢?这就用到了物理结构。当你有了一个逻辑上的文件后,计算机为这个文件分配磁盘,并将其存入磁盘,这种分配方式,要保证从磁盘上将文件读出来后,仍具有逻辑上的一致性。这就是说,文件在外存上存储时,分配方式要保证文件在逻辑上一致。所以物理结构就是指逻辑文件在这些分配方式下所形成的文件结构。
用文件的组织方式管理数据,文件的逻辑结构与物理结构分开,使程序与数据具有一定的独立性,即数据的处理与数据的物理存储无关。但随着数据管理规模的扩大,数据量急剧增加,文件系统也显露出一些缺陷:
(1)数据冗余。文件由记录组成,记录是数据存取的基本单位。一个文件对应一个或几个程序,如果一个程序想用几个文件中的数据产生一个新的报表,则必须重新编写程序。由于各个应用程序各自建立自己的数据文件,因此各个文件之间不可避免地会出现重复项,造成数据冗余。
(2)不一致。这往往是由于数据冗余造成的。在进行更新操作时,稍不谨慎,就可能使同样的数据在不同的文件中不一样。例如,银行中商业贷款、业务交易、存款业务可能会收集同样客户的信息。因为客户信息在不同部门被收集和维护,所以同一个数据项在不同部门组织中有不同的意义。
(3)数据联系弱。由于不同文件中信息在不同部门之间是不能相互联系的,文件之间相互独立,缺乏联系,灵活性差。文件系统经过全面设计后可以提供日常事务的处理,但是对于特别报告或非预期的信息需求,系统则不能及时处理。
文件系统阶段是数据管理技术发展中的一个重要阶段。由于有了直接存取设备,文件类型已经多样化,有了索引文件、链接文件、直接存取文件等,而且能对排序文件进行多码检索。在这一阶段中,数据结构和算法丰富了计算机科学,为数据管理技术的进一步发展打下了基础。
(三)数据库管理系统(20世纪60年代后期至今)
随着计算机在管理中的应用更加广泛,数据量急剧增大,对数据共享的要求越发迫切;大容量磁盘已经出现,联机实时处理业务增多;软件价格在系统中的比重日益上升,硬件价格大幅下降,编制和维护应用软件所需成本相对增加。在这种情况下,为了解决多用户、多应用程序共享数据的需求,使数据为尽可能多的应用程序服务,出现了数据库系统。它把所有应用程序中使用的数据汇集起来,以记录为单位存储,在数据库管理系统的监督和管理下使用。因此,数据库中的数据是集成的,每个用户享用其中的一部分,克服了文件系统的缺陷,提供了对数据更高级、更有效的管理。数据库系统的原理如图2—10所示。
图2—10 数据库系统阶段
概括起来,数据库系统阶段的数据管理具有以下特点:
(1)面向全组织的复杂数据结构。数据库中的数据结构不仅描述了数据本身,而且描述了整个组织数据之间的联系,实现了整个组织数据的结构化。
(2)数据冗余度小,易于扩充。由于数据库从组织的整体来看待数据,数据不再是面向某一特定的应用,而是面向整个系统,减少了数据冗余和数据之间不一致的现象。在数据库系统下,可以根据不同的应用需求,选择相应的数据加以使用,使系统易于扩充。
(3)数据与程序独立。数据库系统不仅提供了数据的存储结构与逻辑结构之间的映射功能,而且提供了数据的总体逻辑结构与局部逻辑结构之间的映射功能,从而使得当数据的存储结构改变时,逻辑结构保持不变,或者当总体逻辑结构改变时,局部逻辑结构可以保持不变,从而实现了数据的物理独立性和逻辑独立性,把数据的定义和描述与应用程序完全分离开。
(4)统一的数据控制功能。数据库系统提供了数据的安全性控制(Security)和完整性控制(Integrity),允许多个用户同时使用数据库资源。数据库的上述特点,使得信息系统的研制从围绕加工数据的以程序为中心转移到围绕共享的数据库来进行,实现了数据的集中管理,提高了数据的利用率和一致性,从而能更好地为决策服务。因此,数据库技术在信息系统应用中正起着越来越重要的作用。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。