[拼音]:wenjian xitong
[外文]:file system
管理文件信息及其所用资源的软件系统,是计算机操作系统的一个组成部分。文件系统为用户提供一种简便的、统一的存取和管理信息的方法。文件是为了某种目的而组织起来的信息的集合。每个文件有一个名称,供系统或用户识别之用。文件可以代表范围很广的对象。一个源程序、一篇文章和一类报表,都可以构成一个文件。为了便于存储、检索或加工相关的信息项目,有时把文件划分成若干个记录,这种文件称为记录式文件;而不分记录的文件称为流式文件或无记录文件。记录(或逻辑记录)由相关数据项组成;而数据项则由一个或多个字符组成。文件系统的主要作用是使用户可以按文件名称使用文件,用户只要提出文件名称,通过文件系统规定的操作,按照信息的逻辑关系就可存取所需要的信息。为了保证文件的安全,文件系统通常采取保护措施,如自动复制副本,以便在文件遭受破坏时能及时复原。文件系统还采取保密措施,使未经文件主许可的任何用户不能使用他的文件,另一方面又使经他许可的用户在规定的权限内方便地使用他的文件,实现文件可享。
文件结构文件中数据的组织方式。对于由记录组成的文件则指文件中记录的组织方式。文件结构可以分为逻辑结构和物理结构。
用户观察到的文件结构称为逻辑结构,分流式和记录式两种。流式文件是一维连续的字符序列或字序列,这种文件不再分成中间的数据单位。记录式文件由数据记录组成,按记录的长度可分为定长记录文件和变长记录文件。记录是记录式文件的最小存取单位。一个记录由若干属性组成。用以标识记录的属性称为关键字。以学生文件为例,每个学生的情况就是一个记录,有学号,姓名,出生日期,性别等属性。学号可以选作该记录的关键字。一般来说,可用来标识一个记录的关键字不只一个,但其中有一个是唯一标识这个记录的,称之为主关键字(如上例中的学号),而其他关键字称为次关键字(如学生的出生日期)。
文件的物理结构指文件存于外存储器的结构关系。外存储器划分成块(或物理记录),计算机在处理的时候以块作为数据的传输单位。文件存在外存储器的块中。对于记录式文件有时一个块可以包含几个逻辑记录,有时几个块才能存放一个逻辑记录。文件的物理结构常见的有三种形式:
(1)连续结构(或称顺序结构),文件的信息存于外存储器的若干连续的块中;
(2)串联结构,即文件信息散布在外存储器的若干不连续的块中,其间由指针连接起来;
(3)索引结构,即文件信息散存于外存储器的若干块中,另外建立一个索引表,表中开列记录的关键字值和该记录在外存储器位置的对应关系。不同的物理结构其存储器利用效率、检索效率和维护效率均不相同。按文件的结构特征文件可分为顺序文件和随机文件。
顺序文件逻辑顺序和物理顺序一致的文件,物理顺序指文件记录在存储器中实际的存储顺序。因此也可说,顺序文件是其记录按照逻辑顺序依次存放在外存储器连续区中的文件。逻辑顺序号为i的记录,其物理顺序号亦为 i。顺序文件是物理结构最简单的一种文件。存于磁带上的文件都是顺序文件;存于磁盘上的文件,可以是顺序的,也可以是随机的。顺序文件只能用顺序扫描的方法存取,要检索第i个记录,必须先逐个检索它前面的i-1个记录。存放在磁盘上的顺序文件,可以用顺序扫描的方法存取,也可以按分块查找的方法存取。顺序文件要插入一个记录,一般只能放在文件末端。修改记录比较难,往往需要重新组织文件。顺序文件适用于对记录的顺序访问,是面向商业的批处理中最常用的文件类型,尤其适用于数据周期性处理的场合,如月帐单等。
随机文件按随机存取方式组织记录的文件,即文件所包含的记录以随机的方式存放在外存储器上,并可随机访问其中任何一个记录。随机文件适用于实时检索系统。有索引表的文件是一种随机文件,称为索引文件。索引表中的索引项按关键字的顺序排列,而文件本身可以按关键字的顺序排列,也可以不按关键字的顺序排列。前者称为索引顺序文件,后者称为索引非顺序文件。对于索引非顺序文件,每个记录必须有一个索引项。索引顺序文件则不同,不必对每个记录设索引项,而是将记录分成组,每组设一个索引项;索引项中给出的是这组记录的最大关键字和这组记录所在外存的地址,这就大大缩减了索引所占的存储空间。当文件很大时,索引项必然很多,这时可设多级索引,例如二级索引。高级索引给出低级索引的位置,低级索引给出记录组的位置。使用索引对文件寻址时,计算机查找的是索引,而不是文件本身,从而节省了查找的时间,但索引表要占用额外的存储空间。索引文件适用于要求随机存取文件中记录的情形。例如回答查询系统、机票预订系统或与终端操作员进行对话的系统。用杂凑(或散列)函数法组织的文件也是一种随机文件。这种文件通过杂凑函数把记录的关键字值转换成一个随机数,并用这个数来确定记录的存放位置。杂凑法往往用于关键字分布范围比较广,而实际记录的个数远比这个范围小的情形。常见的杂凑法有质数除余法、基本转换法、平方取中法、折叠法等。杂凑法的优点是存取速度快,比较节省存储空间。缺点是不易找到一个良好的杂凑函数,而碰撞现象发生过多,则会增加存取时间,此外还不便于顺序处理。
存取方式记录式文件以记录为单位存取;流式文件按信息个数或以特殊字符为界进行存取。对文件的存取有两种方式:顺序方式和随机方式。以记录式文件为例,采用顺序方式时文件中的记录是按照某种次序排列的。文件的使用者总是依上述次序存取一个个记录。因此只需要提出存取要求,而无需指出要存取哪个记录。对于采用随机存取的文件,使用者不但要提出存取要求,而且要指出存取哪个记录。文件系统根据指定的记录来确定该记录在外存储器中的物理地址。