精华内容
下载资源
问答
  • 文件系统 , FAT12 FAT16 FAT32讲解
  • 详细介绍了FAT文件系统(包括FAT12,FAT16,FAT32),不知是哪位牛人写的电子书详细介绍了FAT文件系统(包括FAT12,FAT16,FAT32),不知是哪位牛人写的电子书详细介绍了FAT文件系统(包括FAT12,FAT16,FAT32),不知是哪位牛人写...
  • 与ata结合的fat12 fat16 fat32的文件系统实现,代码完整!-FAT12,FAT16,FAT32 file system with ATA
  • FAT32格式 FAT32格式

    2008-12-07 03:43:52
    FAT32格式FAT32格式FAT32格式FAT32格式FAT32格式FAT32格式FAT32格式FAT32格式FAT32格式FAT32格式FAT32格式FAT32格式FAT32格式FAT32格式FAT32格式
  • FAT12、FAT16、FAT32与NTFS的区别与利弊,讲解详细。
  • FAT12,FAT16,FAT32,NTFS的差异
  • FAT文件系统中文文档(FAT12、FAT16、FAT32) 很详细的介绍了FAT文件系统,这是一份翻译文档。 文件格式:PDF(非扫描版)
  • FAT32中文版 FAT32中文版 FAT32中文版
  • FAT32文件系统原理和FAT32文件系统算法,深入了解。
  • fat16和fat32文件系统学习

    千次阅读 2016-01-06 11:01:43
    fat16和fat32文件系统学习 - 下载频道 - CSDN.NET http://download.csdn.net/detail/guyue35/9392290 FAT文件系统原理(一)---北亚数据恢复服务中心 4006-505-808 http://www.raid-recove


    根据自己电脑的fat,fat32分区来学习fat,fat32文件系统

    fat16和fat32文件系统学习 - 下载频道 - CSDN.NET  

    http://download.csdn.net/detail/guyue35/9392290



    FAT文件系统原理(一)---北亚数据恢复服务中心 4006-505-808  

    http://www.raid-recovery.org/Article/sjhfdoc/200404/1.html


    FAT文件系统原理(一)
     
    更新时间:2004-4-20【字体: 

    一、硬盘的物理结构:


        硬盘存储数据是根据电、磁转换原理实现的。硬盘由一个或几个表面镀有磁性物质的金属或玻璃等物质盘片以及盘片两面所安装的磁头和相应的控制电路组成(图1),其中盘片磁头密封在无尘的金属壳中。
    硬盘工作时,盘片以设计转速高速旋转,设置在盘片表面的磁头则在电路控制下径向移动到指定位置然后将数据存储或读取出来。当系统向硬盘写入数据时,磁头中“写数据”电流产生磁场使盘片表面磁性物质状态发生改变,并在写电流磁场消失后仍能保持,这样数据就存储下来了;当系统从硬盘中读数据时,磁头经过盘片指定区域,盘片表面磁场使磁头产生感应电流或线圈阻抗产生变化,经相关电路处理后还原成数据。因此只要能将盘片表面处理得更平滑、磁头设计得更精密以及尽量提高盘片转速度,就能造出容量更大、读写数据速度更快的硬盘。这是因为盘片表面处理越平、转速越快就能越使磁头盘片表面越近,提高读、写灵敏度和速度;磁头设计越小越精密就能使磁头盘片上占用空间越小,使磁头在一张盘片上建立更多的磁道以存储更多的数据。

    二、硬盘的逻辑结构。
        硬盘由很多盘片(platter)组成,每个盘片的每个面都有一个读写磁头。如果有N个盘片。就有2N个面,对应2N个磁头(Heads),从0、1、2开始编号。每个盘片被划分成若干个同心圆磁道(逻辑上的,是不可见的。)每个盘片的划分规则通常是一样的。这样每个盘片的半径均为固定值R的同心圆再逻辑上形成了一个以电机主轴为轴的柱面(Cylinders),从外至里编号为0、1、2……每个盘片上的每个磁道又被划分为几十个扇区(Sector),通常的容量是512byte,并按照一定规则编号为1、2、3……形成Cylinders×Heads×Sector个扇区。这三个参数即是硬盘的物理参数。我们下面的很多实践需要深刻理解这三个参数的意义。

    三、磁盘引导原理。

    3.1 MBR(master boot record)扇区:
        计算机在按下power键以后,开始执行主板bios程序。进行完一系列检测和配置以后。开始按bios中设定的系统引导顺序引导系统。假定现在是硬盘。Bios执行完自己的程序后如何把执行权交给硬盘呢。交给硬盘后又执行存储在哪里的程序呢。其实,称为mbr的一段代码起着举足轻重的作用。MBR(master boot record),即主引导记录,有时也称主引导扇区。位于整个硬盘的0柱面0磁头1扇区(可以看作是硬盘的第一个扇区),bios在执行自己固有的程序以后就会jump到mbr中的第一条指令。将系统的控制权交由mbr来执行。在总共512byte的主引导记录中,MBR的引导程序占了其中的前446个字节(偏移0H~偏移1BDH),随后的64个字节(偏移1BEH~偏移1FDH)为DPT(Disk PartitionTable,硬盘分区表),最后的两个字节“55 AA”(偏移1FEH~偏移1FFH)是分区有效结束标志。
        MBR不随操作系统的不同而不同,意即不同的操作系统可能会存在相同的MBR,即使不同,MBR也不会夹带操作系统的性质。具有公共引导的特性。
    我们来分析一段mbr。下面是用winhex查看的一块希捷120GB硬盘的mbr。

       你的硬盘MBR引导代码可能并非这样。不过即使不同,所执行的功能大体是一样的。这是wowocock关于磁盘mbr的反编译,已加了详细的注释,感兴趣可以细细研究一下。
        我们看DPT部分。操作系统为了便于用户对磁盘的管理。加入了磁盘分区的概念。即将一块磁盘逻辑划分为几块。磁盘分区数目的多少只受限于C~Z的英文字母的数目,在上图DPT共64个字节中如何表示多个分区的属性呢?microsoft通过链接的方法解决了这个问题。在DPT共64个字节中,以16个字节为分区表项单位描述一个分区的属性。也就是说,第一个分区表项描述一个分区的属性,一般为基本分区。第二个分区表项描述除基本分区外的其余空间,一般而言,就是我们所说的扩展分区。这部分的大体说明见表1。

    表1  图2分区表第一字段
    字节位移字段长度字段名和定义
    0x01BEBYTE0x80   引导指示符(Boot Indicator)   指明该分区是否是活动分区。
    0x01BFBYTE0x01开始磁头(Starting Head)
    0x01C06位0x01开始扇区(Starting Sector) 只用了0~5位。后面的两位(第6位和第7位)被开始柱面字段所使用
    0x01C110位0x00开始柱面(Starting Cylinder)   除了开始扇区字段的最后两位外,还使用了1位来组成该柱面值。开始柱面是一个10位数,最大值为1023
    0x01C2BYTE0x07系统ID(System ID) 定义了分区的类型,详细定义,请参阅图4
    0x01C3BYTE0xFE结束磁头(Ending Head)
    0x01C46位0xFF结束扇区(Ending Sector)     只使用了0~5位。最后两位(第6、7位)被结束柱面字段所使用
    0x01C510位0x7B结束柱面(Ending Cylinder) 除了结束扇区字段最后的两位外,还使用了1位,以组成该柱面值。结束柱面是一个10位的数,最大值为1023
    0x01C6DWORD0x0000003F相对扇区数(Relative Sectors) 从该磁盘的开始到该分区的开始的位移量,以扇区来计算
    0x01CADWORD0x00DAA83D总扇区数(Total Sectors) 该分区中的扇区总数

    注:上表中的超过1字节的数据都以实际数据显示,就是按高位到地位的方式显示。存储时是按低位到高位存储的。两者表现不同,请仔细看清楚。以后出现的表,图均同。

    也可以在winhex中看到这些参数的意义:
        

        说明: 每个分区表项占用16个字节,假定偏移地址从0开始。如图3的分区表项3。分区表项4同分区表项3。
        1、0H偏移为活动分区是否标志,只能选00H和80H。80H为活动,00H为非活动。其余值对microsoft而言为非法值。 
        2、重新说明一下(这个非常重要):大于1个字节的数被以低字节在前的存储格式格式(little endian format)或称反字节顺序保存下来。低字节在前的格式是一种保存数的方法,这样,最低位的字节最先出现在十六进制数符号中。例如,相对扇区数字段的值0x3F000000的低字节在前表示为0x0000003F。这个低字节在前的格式数的十进制数为63。 
        3、系统在分区时,各分区都不允许跨柱面,即均以柱面为单位,这就是通常所说的分区粒度。有时候我们分区是输入分区的大小为7000M,分出来却是6997M,就是这个原因。 偏移2H和偏移6H的扇区和柱面参数中,扇区占6位(bit),柱面占10位(bit),以偏移6H为例,其低6位用作扇区数的二进制表示。其高两位做柱面数10位中的高两位,偏移7H组成的8位做柱面数10位中的低8位。由此可知,实际上用这种方式表示的分区容量是有限的,柱面和磁头从0开始编号,扇区从1开始编号,所以最多只能表示1024个柱面×63个扇区×256个磁头×512byte=8455716864byte。即通常的8.4GB(实际上应该是7.8GB左右)限制。实际上磁头数通常只用到255个(由汇编语言的寻址寄存器决定),即使把这3个字节按线性寻址,依然力不从心。 在后来的操作系统中,超过8.4GB的分区其实已经不通过C/H/S的方式寻址了。而是通过偏移CH~偏移FH共4个字节32位线性扇区地址来表示分区所占用的扇区总数。可知通过4个字节可以表示2^32个扇区,即2TB=2048GB,目前对于大多数计算机而言,这已经是个天文数字了。在未超过8.4GB的分区上,C/H/S的表示方法和线性扇区的表示方法所表示的分区大小是一致的。也就是说,两种表示方法是协调的。即使不协调,也以线性寻址为准。(可能在某些系统中会提示出错)。超过8.4GB的分区结束C/H/S一般填充为FEH FFH FFH。即C/H/S所能表示的最大值。有时候也会用柱面对1024的模来填充。不过这几个字节是什么其实都无关紧要了。 
        虽然现在的系统均采用线性寻址的方式来处理分区的大小。但不可跨柱面的原则依然没变。本分区的扇区总数加上与前一分区之间的保留扇区数目依然必须是柱面容量的整数倍。(保留扇区中的第一个扇区就是存放分区表的MBR或虚拟MBR的扇区,分区的扇区总数在线性表示方式上是不计入保留扇区的。如果是第一个分区,保留扇区是本分区前的所有扇区。
        附:分区表类型标志如图4
        

    3.2 扩展分区:
        扩展分区中的每个逻辑驱动器都存在一个类似于MBR的扩展引导记录( Extended Boot Record, EBR),也有人称之为虚拟mbr或扩展mbr,意思是一样的。扩展引导记录包括一个扩展分区表和该扇区的标签。扩展引导记录将记录只包含扩展分区中每个逻辑驱动器的第一个柱面的第一面的信息。一个逻辑驱动器中的引导扇区一般位于相对扇区32或63。但是,如果磁盘上没有扩展分区,那么就不会有扩展引导记录和逻辑驱动器。第一个逻辑驱动器的扩展分区表中的第一项指向它自身的引导扇区。第二项指向下一个逻辑驱动器的EBR。如果不存在进一步的逻辑驱动器,第二项就不会使用,而且被记录成一系列零。如果有附加的逻辑驱动器,那么第二个逻辑驱动器的扩展分区表的第一项会指向它本身的引导扇区。第二个逻辑驱动器的扩展分区表的第二项指向下一个逻辑驱动器的EBR。扩展分区表的第三项和第四项永远都不会被使用。
        通过一幅4分区的磁盘结构图可以看到磁盘的大致组织形式。如图5:
        

        关于扩展分区,如图6所示,扩展分区中逻辑驱动器的扩展引导记录是一个连接表。该图显示了一个扩展分区上的三个逻辑驱动器,说明了前面的逻辑驱动器和最后一个逻辑驱动器之间在扩展分区表中的差异。

        除了扩展分区上最后一个逻辑驱动器外,表2中所描述的扩展分区表的格式在每个逻辑驱动器中都是重复的:第一个项标识了逻辑驱动器本身的引导扇区,第二个项标识了下一个逻辑驱动器的EBR。最后一个逻辑驱动器的扩展分区表只会列出它本身的分区项。最后一个扩展分区表的第二个项到第四个项被使用。   

       表2  扩展分区表项的内容

    扩展分区表项分区表项的内容
    第一个项包括数据的开始地址在内的与扩展分区中当前逻辑驱动器有关的信息
    第二个项有关扩展分区中的下一个逻辑驱动器的信息,包括包含下一个逻辑驱动器的EBR的扇区的地址。如果不存在进一步的逻辑驱动器的话,该字段不会被使用
    第三个项未用
    第四个项未用

        扩展分区表项中的相对扇区数字段所显示的是从扩展分区开始到逻辑驱动器中第一个扇区的位移的字节数。总扇区数字段中的数是指组成该逻辑驱动器的扇区数目。总扇区数字段的值等于从扩展分区表项所定义的引导扇区到逻辑驱动器末尾的扇区数。

        有时候在磁盘的末尾会有剩余空间,剩余空间是什么呢?我们前面说到,分区是以1柱面的容量为分区粒度的,那么如果磁盘总空间不是整数个柱面的话,不够一个柱面的剩下的空间就是剩余空间了,这部分空间并不参与分区,所以一般无法利用。照道理说,磁盘的物理模式决定了磁盘的总容量就应该是整数个柱面的容量,为什么会有不够一个柱面的空间呢。在我的理解看来,本来现在的磁盘为了更大的利用空间,一般在物理上并不是按照外围的扇区大于里圈的扇区这种管理方式,只是为了与操作系统兼容而抽象出来CHS。可能其实际空间容量不一定正好为整数个柱面的容量吧。关于这点,如有高见,请告知http://www.sjhf.netzymail@vip.sina.comsjhf@sjhf.net。 







    FAT文件系统原理(二)---北亚数据恢复服务中心 4006-505-808  

    http://www.raid-recovery.org/Article/sjhfdoc/200404/2.html



    FAT文件系统原理(二)
     
    更新时间:2004-4-20【字体: 

    四、FAT分区原理。

    先来一幅结构图:
        

        现在我们着重研究FAT格式分区内数据是如何存储的。FAT分区格式是MICROSOFT最早支持的分区格式,依据FAT表中每个簇链的所占位数(有关概念,后面会讲到)分为fat12、fat16、fat32三种格式"变种",但其基本存储方式是相似的。
        仔细研究图7中的fat16和fat32分区的组成结构。下面依次解释DBRFAT1、FAT2、根目录、数据区、剩余扇区的概念。提到的地址如无特别提示均为分区内部偏移。

    4.1 关于DBR.

        DBR区(DOS BOOT RECORD)即操作系统引导记录区的意思,通常占用分区的第0扇区共512个字节(特殊情况也要占用其它保留扇区,我们先说第0扇)。在这512个字节中,其实又是由跳转指令,厂商标志和操作系统版本号,BPB(BIOS Parameter Block),扩展BPB,os引导程序,结束标志几部分组成。 以用的最多的FAT32为例说明分区DBR各字节的含义。见图8。
        

    图8的对应解释见表3    

    单击此处查看PDF版全文

        表3   FAT32分区上DBR中各部分的位置划分   
    字节位移字段长度字段名对应图8颜色
    0x003个字节跳转指令 
    0x038个字节厂商标志和os版本号 
    0x0B53个字节BPB 
    0x4026个字节扩展BPB 
    0x5A420个字节引导程序代码 
    0x01FE2个字节有效结束标志 

    图9给出了winhex对图8 DBR的相关参数解释:
        

        根据上边图例,我们来讨论DBR各字节的参数意义。       
        MBR将CPU执行转移给引导扇区,因此,引导扇区的前三个字节必须是合法的可执行的基于x86的CPU指令。这通常是一条跳转指令,该指令负责跳过接下来的几个不可执行的字节(BPB和扩展BPB),跳到操作系统引导代码部分。
        跳转指令之后是8字节长的OEM ID,它是一个字符串, OEM ID标识了格式化该分区的操作系统的名称和版本号。为了保留与MS-DOS的兼容性,通常Windows 2000格式化该盘是在FAT16和FAT32磁盘上的该字段中记录了“MSDOS 5.0”,在NTFS磁盘上(关于ntfs,另述),Windows 2000记录的是“NTFS”。通常在被Windows 95格式化的磁盘上OEM ID字段出现“MSWIN4.0”,在被Windows 95 OSR2和Windows 98格式化的磁盘上OEM ID字段出现“MSWIN4.1”。
        接下来的从偏移0x0B开始的是一段描述能够使可执行引导代码找到相关参数的信息。通常称之为BPB(BIOS Parameter Block),BPB一般开始于相同的位移量,因此,标准的参数都处于一个已知的位置。磁盘容量和几何结构变量都被封在BPB之中。由于引导扇区的第一部分是一个x86跳转指令。因此,将来通过在BPB末端附加新的信息,可以对BPB进行扩展。只需要对该跳转指令作一个小的调整就可以适应BPB的变化。图9已经列出了项目的名称和取值,为了系统的研究,针对图8,将FAT32分区格式的BPB含义和扩展BPB含义释义为表格,见表4和表5。

    表4  FAT32分区的BPB字段     
    字节位移字段长度(字节)图8对应取值名称和定义
    0x0B20x0200扇区字节数(Bytes Per Sector) 硬件扇区的大小。本字段合法的十进制值有512、1024、2048和4096。对大多数磁盘来说,本字段的值为512
    0x0D10x08每簇扇区数(Sectors Per Cluster),一簇中的扇区数。由于FAT32文件系统只能跟踪有限个簇(最多为4 294 967 296个),因此,通过增加每簇扇区数,可以使FAT32文件系统支持最大分区数。一个分区缺省的簇大小取决于该分区的大小。本字段的合法十进制值有1、2、4、8、16、32、64和128。Windows 2000的FAT32实现只能创建最大为32GB的分区。但是,Windows 2000能够访问由其他操作系统(Windows 95、OSR2及其以后的版本)所创建的更大的分区
    0x0e20x0020保留扇区数(Reserved Sector) 第一个FAT开始之前的扇区数,包括引导扇区。本字段的十进制值一般为32
    0x1010x02FAT数(Number of FAT) 该分区上FAT的副本数。本字段的值一般为2
    0x1120x0000根目录项数(Root Entries)只有FAT12/FAT16使用此字段。对FAT32分区而言,本字段必须设置为 0
    0x1320x0000小扇区数(Small Sector)(只有FAT12/FAT16使用此字段)对FAT32分区而言,本字段必须设置为0
    0x1510xF8媒体描述符( Media Descriptor)提供有关媒体被使用的信息。值0xF8表示硬盘,0xF0表示高密度的3.5寸软盘。媒体描述符要用于MS-DOS FAT16磁盘,在Windows 2000中未被使用
    0x1620x0000FAT扇区数(Sectors Per FAT)只被FAT12/FAT16所使用,对FAT32分区而言,本字段必须设置为0
    0x1820x003F每道扇区数(Sectors Per Track) 包含使用INT13h的磁盘的“每道扇区数”几何结构值。该分区被多个磁头的柱面分成了多个磁道
    0x1A20x00FF磁头数(Number of Head) 本字段包含使用INT 13h的磁盘的“磁头数”几何结构值。例如,在一张1.44MB 3.5英寸的软盘上,本字段的值为 2
    0x1C40x0000003F隐藏扇区数(Hidden Sector) 该分区上引导扇区之前的扇区数。在引导序列计算到根目录的数据区的绝对位移的过程中使用了该值。本字段一般只对那些在中断13h上可见的媒体有意义。在没有分区的媒体上它必须总是为0
    0x2040x007D043F总扇区数(Large Sector) 本字段包含FAT32分区中总的扇区数
    0x2440x00001F32FAT扇区数(Sectors Per FAT)(只被FAT32使用)该分区每个FAT所占的扇区数。计算机利用这个数和 FAT数以及隐藏扇区数(本表中所描述的)来决定根目录从哪里开始。该计算机还可以从目录中的项数决定该分区的用户数据区从哪里开始
    0x2820x00

    扩展标志(Extended Flag)(只被FAT32使用)该两个字节结构中各位的值为:
    位0-3:活动 FAT数(从0开始计数,而不是1).
           只有在不使用镜像时才有效
    位4-6:保留
    位7:0值意味着在运行时FAT被映射到所有的FAT
         1值表示只有一个FAT是活动的
    位8-15:保留

    0x2A20x0000文件系统版本(File ystem Version)只供FAT32使用,高字节是主要的修订号,而低字节是次要的修订号。本字段支持将来对该FAT32媒体类型进行扩展。如果本字段非零,以前的Windows版本将不支持这样的分区
    0x2C40x00000002根目录簇号(Root Cluster Number)(只供FAT32使用) 根目录第一簇的簇号。本字段的值一般为2,但不总是如此
    0x3020x0001文件系统信息扇区号(File System Information SectorNumber)(只供FAT32使用) FAT32分区的保留区中的文件系统信息(File System Information, FSINFO)结构的扇区号。其值一般为1。在备份引导扇区(Backup Boot Sector)中保留了该FSINFO结构的一个副本,但是这个副本不保持更新
    0x3420x0006备份引导扇区(只供FAT32使用) 为一个非零值,这个非零值表示该分区保存引导扇区的副本的保留区中的扇区号。本字段的值一般为6,建议不要使用其他值
    0x361212个字节均为0x00保留(只供FAT32使用)供以后扩充使用的保留空间。本字段的值总为0

     

    表5   FAT32分区的扩展BPB字段           
    字节位移字段长度(字节)图8对应取值字段名称和定义
    0x4010x80物理驱动器号( Physical Drive Number) 与BIOS物理驱动器号有关。软盘驱动器被标识为0x00,物理硬盘被标识为0x80,而与物理磁盘驱动器无关。一般地,在发出一个INT13h BIOS调用之前设置该值,具体指定所访问的设备。只有当该设备是一个引导设备时,这个值才有意义
    0x4110x00保留(Reserved) FAT32分区总是将本字段的值设置为0
    0x4210x29扩展引导标签(Extended Boot Signature) 本字段必须要有能被Windows 2000所识别的值0x28或0x29
    0x4340x33391CFE分区序号(Volume Serial Number) 在格式化磁盘时所产生的一个随机序号,它有助于区分磁盘
    0x4711"NO NAME"卷标(Volume Label) 本字段只能使用一次,它被用来保存卷标号。现在,卷标被作为一个特殊文件保存在根目录中
    0x528"FAT32"系统ID(System ID) FAT32文件系统中一般取为"FAT32"


         DBR的偏移0x5A开始的数据为操作系统引导代码。这是由偏移0x00开始的跳转指令所指向的。在图8所列出的偏移0x00~0x02的跳转指令"EB 58 90"清楚地指明了OS引导代码的偏移位置。jump 58H加上跳转指令所需的位移量,即开始于0x5A。此段指令在不同的操作系统上和不同的引导方式上,其内容也是不同的。大多数的资料上都说win98,构建于fat基本分区上的win2000,winxp所使用的DBR只占用基本分区的第0扇区。他们提到,对于fat32,一般的32个基本分区保留扇区只有第0扇区是有用的。实际上,以FAT32构建的操作系统如果是win98,系统会使用基本分区的第0扇区和第2扇区存储os引导代码;以FAT32构建的操作系统如果是win2000或winxp,系统会使用基本分区的第0扇区和第0xC扇区(win2000或winxp,其第0xC的位置由第0扇区的0xAB偏移指出)存储os引导代码。所以,在fat32分区格式上,如果DBR一扇区的内容正确而缺少第2扇区(win98系统)或第0xC扇区(win2000或winxp系统),系统也是无法启动的。如果自己手动设置NTLDR双系统,必须知道这一点。
         DBR扇区的最后两个字节一般存储值为0x55AA的DBR有效标志,对于其他的取值,系统将不会执行DBR相关指令。上面提到的其他几个参与os引导的扇区也需以0x55AA为合法结束标志。

    FAT16 DBR
         FAT32中DBR的含义大致如此,对于FAT12和FAT16其基本意义类似,只是相关偏移量和参数意义有小的差异,FAT格式的区别和来因,以后会说到,此处不在多说FAT12与FAT16。我将FAT16的扇区参数意义列表。感兴趣的朋友自己研究一下,和FAT32大同小异的。

     

    表6  一个FAT16分区上的引导扇区段
    字节位移字段长度(字节)字段名称
    0x003跳转指令(Jump Instruction)
    0x038OEM ID
    0x0B25BPB
    0x2426扩展BPB
    0x3E448引导程序代码(Bootstrap Code)
    0x01FE4扇区结束标识符(0x55AA)

     

    表7  FAT16分区的BPB字段     
    字节位移字段长度(字节)例值名称和定义
    0x0B20x0200扇区字节数(Bytes Per Sector) 硬件扇区的大小。本字段合法的十进制值有512、1024、2048和4096。对大多数磁盘来说,本字段的值为512
    0x0D10x40每簇扇区数(Sectors Per Cluster) 一个簇中的扇区数。由于FAT16文件系统只能跟踪有限个簇(最多为65536个)。因此,通过增加每簇的扇区数可以支持最大分区数。分区的缺省的簇的大小取决于该 分区的大小。本字段合法的十进制值有 1、2、4、8、16、32、64和128。导致簇大于32KB(每扇区字节数*每簇扇区数)的值会引起磁盘错误和软件错误
    0x0e20x0001保留扇区数(Reserved Sector) 第一个FAT开始之前的扇区数,包括引导扇区。本字段的十进制值一般为1
    0x1010x02FAT数(Number of FAT)该分区上FAT的副本数。本字段的值一般为2
    0x1120x0200根目录项数(Root Entries) 能够保存在该分区的根目录文件夹中的32个字节长的文件和文件夹名称项的总数。在一个典型的硬盘上,本字段的值为512。其中一个项常常被用作卷标号(Volume Label),长名称的文件和文件夹每个文件使用多个项。文件和文件夹项的最大数一般为511,但是如果使用的长文件名,往往都达不到这个数
    0x1320x0000小扇区数(Small Sector) 该分区上的扇区数,表示为16位(<65536)。对大于65536个扇区的分区来说,本字段的值为0,而使用大扇区数来取代它
    0x1510xF8媒体描述符( Media Descriptor)提供有关媒体被使用的信息。值0xF8表示硬盘,0xF0表示高密度的3.5寸软盘。媒体描述符要用于MS-DOS FAT16磁盘,在Windows 2000中未被使用
    0x1620x00FCFAT扇区数(Sectors Per FAT) 该分区上每个FAT所占用的扇区数。计算机利用这个数和FAT数以及隐藏扇区数来决定根目录在哪里开始。计算机还可以根据根目录中的项数(512)决定该 分区的用户数据区从哪里开始
    0x1820x003F每道扇区数(Sectors Per Trark)
    0x1A20x0040磁头数(Number of head)
    0x1C40x0000003F隐藏扇区数(Hidden Sector) 该分区上引导扇区之前的扇区数。在引导序列计算到根目录和数据区的绝对位移的过程中使用了该值
    0x2040x003EF001大扇区数(Large Sector) 如果小扇区数字段的值为0,本字段就包含该FAT16分区中的总扇区数。如果小扇区数字段的值不为0,那么本字段的值为0

     

    表8   FAT16分区的扩展BPB字段           
    字节位移字段长度(字节)图8对应取值字段名称和定义
    0x2410x80物理驱动器号( Physical Drive Number) 与BIOS物理驱动器号有关。软盘驱动器被标识为0x00,物理硬盘被标识为0x80,而与物理磁盘驱动器无关。一般地,在发出一个INT13h BIOS调用之前设置该值,具体指定所访问的设备。只有当该设备是一个引导设备时,这个值才有意义
    0x2510x00保留(Reserved) FAT16分区一般将本字段的值设置为0
    0x2610x29扩展引导标签(Extended Boot Signature) 本字段必须要有能被Windows 2000所识别的值0x28或0x29
    0x2720x52368BA8卷序号(Volume Serial Number) 在格式化磁盘时所产生的一个随机序号,它有助于区分磁盘
    0x2B11"NO NAME"卷标(Volume Label) 本字段只能使用一次,它被用来保存卷标号。现在,卷标被作为一个特殊文件保存在根目录中
    0x368"FAT16"文件系统类型(File System Type) 根据该磁盘格式,该字段的值可以为FATFAT12或FAT16

    4.2  关于保留扇区

         在上述FAT文件系统DBR的偏移0x0E处,用2个字节存储保留扇区的数目。所谓保留扇区(有时候会叫系统扇区,隐藏扇区),是指从分区DBR扇区开始的仅为系统所有的扇区,包括DBR扇区。在FAT16文件系统中,保留扇区的数据通常设置为1,即仅仅DBR扇区。而在FAT32中,保留扇区的数据通常取为32,有时候用Partition Magic分过的FAT32分区会设置36个保留扇区,有的工具可能会设置63个保留扇区。
         FAT32中的保留扇区除了磁盘总第0扇区用作DBR,总第2扇区(win98系统)或总第0xC扇区(win2000,winxp)用作OS引导代码扩展部分外,其余扇区都不参与操作系统管理与磁盘数据管理,通常情况下是没作用的。操作系统之所以在FAT32中设置保留扇区,是为了对DBR作备份或留待以后升级时用。FAT32中,DBR偏移0x34占2字节的数据指明了DBR备份扇区所在,一般为0x06,即第6扇区。当FAT32分区DBR扇区被破坏导致分区无法访问时。可以用第6扇区的原备份替换第0扇区来找回数据。

    单击此处查看PDF版全文




    FAT文件系统原理(三)---北亚数据恢复服务中心 4006-505-808  

    http://www.raid-recovery.org/Article/sjhfdoc/200404/3.html


    FAT文件系统原理(三)
     
    更新时间:2004-4-20【字体: 

    4.3  FAT表和数据的存储原则。

           FAT表(File Allocation Table 文件分配表),是Microsoft在FAT文件系统中用于磁盘数据(文件)索引和定位引进的一种链式结构。假如把磁盘比作一本书,FAT表可以认为相当于书中的目录,而文件就是各个章节的内容。但FAT表的表示方法却与目录有很大的不同。
          在FAT文件系统中,文件的存储依照FAT表制定的簇链式数据结构来进行。同时,FAT文件系统将组织数据时使用的目录也抽象为文件,以简化对数据的管理。

    单击此处查看PDF版全文
     ★存储过程假想:
          我们模拟对一个分区存储数据的过程来说明FAT文件系统中数据的存储原则。
          假定现在有一个空的完全没有存放数据的磁盘,大小为100KB,我们将其想象为线形的空间地址。为了存储管理上的便利,我们人为的将这100KB的空间均分成100份,每份1KB。我们来依次存储这样几个文件:A.TXT(大小10KB),B.TXT(大小53.6KB),C.TXT(大小20.5KB)。
          最起码能够想到,我们可以顺序的在这100KB空间中存放这3个文件。同时不要忘了,我们还要记下他们的大小和开始的位置,这样下次要用时才能找的到,这就像是目录。为了便于查找,我们假定用第1K的空间来存储他们的特征(属性)。还有,我们设计的存储单位是1KB,所以,A.TXT我们需要10个存储单位(为了说明方便,我们把存储单位叫做“簇”吧。也能少打点字,呵呵。),B.TXT需要54个簇,C.TXT需要21个簇。可能有人会说B.TXT和C.TXT不是各自浪费了不到1簇的空间吗?干嘛不让他们紧挨着,不是省地方吗?我的回答是,如果按照这样的方式存储,目录中原本只需要记下簇号,现在还需要记下簇内的偏移,这样会增加目录的存储量,而且存取没有了规则,读取也不太方便,是得不偿失的。
        根据上面所说的思想,我们设计了这样的图4.3.1所示的存储方式。

          我们再考虑如何来写这三个文件的目录。对于每个文件而言,一定要记录的有:文件名,开始簇,大小,创建日期、时间,修改日期、时间,文件的读写属性等。这里大小能不能用结束簇来计算呢?一定不能,因为文件的大小不一定就是整数个簇的大小,否则的话像B.TXT的内容就是54KB的内容了,少了固然不行,可多了也是不行的。那么我们怎么记录呢?可以想象一下。为了管理上的方便,我们用数据库的管理方式来管理我们的目录。于是我把1KB再分成10份,假定开始簇号为0,定义每份100B的各个位置的代表含义如图4.3.2

          这样设计的结构绝对可以对文件进行正确的读写了。接着让我们设计的文件系统工作吧。先改动个文件,比如A.TXT,增加点内容吧!咦?增加后往哪里放呀,虽然存储块的后面有很多空间,但紧随其后B.TXT的数据还顶着呢?要是把A.TXT移到后边太浪费处理资源,而且也不一定解决问题。这个问题看来暂时解决不了。
        那我们换个操作,把B.txt删了,b.txt的空间随之释放。这时候空间如图4.3.3,目录如图4.3.4

          这个操作看来还可以,我们接着做,在存入一个文件D.txt(大小为60.3KB),总共100簇的空间只用了31簇,还有68簇剩余,按说能放下。可是?往那里放呢?没有61个连续的空间了,目录行没办法写了,看来无连续块存储暂时也不行。
        你一定能够想到我们可以在连续空间不够或增加文件长度的时候转移影响我们操作的其他文件,从而腾出空间来,但我要问你,那不是成天啥也不要干了,就是倒腾东西了吗?

        看来我们设计的文件系统有致命的漏洞,怎么解决呢?。。。。
    。。。。。。

        其实可以这样解决:
        首先我们允许文件的不连续存储。目录中依然只记录开始簇和文件的大小。那么我们怎么记录文件占用那些簇呢,以文件映射簇不太方便,因为文件名是不固定的。我们换个思想,可以用簇来映射文件,在整个存储空间的前部留下几簇来记录数据区中数据与簇号的关系。对于上例因为总空间也不大,所以用前部的1Kb的空间来记录这种对应,假设3个文件都存储,空间分配如图4.3.5,同时修改一下目录,如图4.3.6

          第一簇用来记录数据区中每一簇的被占用情况,暂时称其为文件分配表。结合文件分配表和文件目录就可以达到完全的文件读取了。我们想到,把文件分配表做成一个数据表,以图4.3.7的形式记录簇与数据的对应。
        用图4.3.7的组织方式是完全可以实现对文件占有簇的记录的。但还不够效率。比如文件名在文件分配表中记录太多,浪费空间,而实际上在目录中已经记录了文件的开始簇了。所以可以改良一下,用链的方式来存放占有簇的关系,变成图4.3.8的组织方式。

          参照图4.3.8来理解一下文件分配表的意义。如文件a.txt我们根据目录项中指定的a.txt的首簇为2,然后找到文件分配表的第2簇记录,上面登记的是3,我们就能确定下一簇是3。找到文件分配表的第3簇记录,上面登记的是4,我们就能确定下一簇是4......直到指到第11簇,发现下一个指向是FF,就是结束。文件便丝毫无误读取完毕。

        我们再看上面提到的第三种情况,就是将b.txt删除以后,存入一个大小为60.3KB的d.txt。利用簇链可以很容易的实现。实现后的磁盘如图4.3.9  4.3.10  4.3.11

         上面是我们对文件存储的一种假设,也该揭开谜底的时候了。上面的思想其实就是fat文件系统的思想的精髓(但并不是,尤其像具体的参数的意义与我们所举的例子是完全不同的。请忘掉上边细节,努力记忆下边)。

    单击此处查看PDF版全文









    FAT文件系统原理(四)---北亚数据恢复服务中心 4006-505-808  

    http://www.raid-recovery.org/Article/sjhfdoc/200404/4.html


    FAT文件系统原理(四)
     
    更新时间:2004-4-20【字体: 

    FAT16存储原理:   

        当把一部分磁盘空间格式化为fat文件系统时,fat文件系统就将这个分区当成整块可分配的区域进行规划,以便于数据的存储。一般来讲,其划分形式如图7所示。我们把FAT16部分提取出来,详细描述一下:
        FAT16是Microsoft较早推出的文件系统,具有高度兼容性,目前仍然广泛应用于个人电脑尤其是移动存储设备中,FAT16简单来讲由图4.3.11所示的6部分组成(主要是前5部分)。引导扇区(DBR)我们已经说过,FAT16在DBR之后没有留有任何保留扇区,其后紧随的便是FAT表。FAT表是FAT16用来记录磁盘数据区簇链结构的。像前面我们说过的例子一样,FAT将磁盘空间按一定数目的扇区为单位进行划分,这样的单位称为簇。通常情况下,每扇区512字节的原则是不变的。簇的大小一般是2n (n为整数)个扇区的大小,像512B,1K,2K,4K,8K,16K,32K,64K。实际中通常不超过32K。 之所以簇为单位而不以扇区为单位进行磁盘的分配,是因为当分区容量较大时,采用大小为512b的扇区管理会增加fat表的项数,对大文件存取增加消耗,文件系统效率不高。分区的大小和簇的取值是有关系的,见表9  (单击此处查看PDF版全文)

    图4.3.11 Fat16的组织形式
    引导扇区 FAT1 FAT2(重复的) 根文件夹 其他文件夹及所有文件 剩余扇区
    1扇区实际情况取大小FAT132个扇区开始簇编号(从2开始)不足一簇

     

    表9  FAT16分区大小与对因簇大小
    分区空间大小每个簇的扇区簇空间大小
    0MB-32MB1512个字节
    33MB-64MB21k
    65MB-128MB42k
    129MB-225MB84k
    256MB-511MB168k
    512MB-1023MB3216k
    1024MB-2047MB6432k
    2048MB-4095MB12864k


        注意:少于32680个扇区的分区中,簇空间大小可最多达到每个簇8个扇区。不管用户是使用磁盘管理器来格式化分区,还是使用命令提示行键入format命令格式化,格式化程序都创建一个12位的FAT。少于16MB的分区,系统通常会将其格式化成12位的FATFAT12是FAT的初始实现形式,是针对小型介质的。FAT12文件分配表要比FAT16和FAT32的文件分配表小,因为它对每个条目使用的空间较少。这就给数据留下较多的空间。所有用FAT12格式化的5.25英寸软盘以及1.44MB的3.5英寸软盘都是由FAT12格式化的。除了FAT表中记录每簇链结的二进制位数与FAT16不同外,其余原理与FAT16均相同,不再单独解释。。。

        格式化FAT16分区时,格式化程序根据分区的大小确定簇的大小,然后根据保留扇区的数目、根目录的扇区数目、数据区可分的簇数与FAT表本身所占空间 来确定FAT表所需的扇区数目,然后将计算后的结果写入DBR的相关位置。
        FAT16 DBR参数的偏移0x11处记录了根目录所占扇区的数目。偏移0x16记录了FAT表所占扇区的数据。偏移0x10记录了FAT表的副本数目。系统在得到这几项参数以后,就可以确定数据区的开始扇区偏移了。
        FAT16文件系统从根目录所占的32个扇区之后的第一个扇区开始以簇为单位进行数据的处理,这之前仍以扇区为单位。对于根目录之后的第一个簇,系统并不编号为第0簇或第1簇 (可能是留作关键字的原因吧),而是编号为第2簇,也就是说数据区顺序上的第1个簇也是编号上的第2簇。
        FAT文件系统之所以有12,16,32不同的版本之分,其根本在于FAT表用来记录任意一簇链接的二进制位数。以FAT16为例,每一簇在FAT表中占据2字节(二进制16位)。所以,FAT16最大可以表示的簇号为0xFFFF(十进制的65535),以32K为簇的大小的话,FAT32可以管理的最大磁盘空间为:32KB×65535=2048MB,这就是为什么FAT16不支持超过2GB分区的原因。
        FAT表实际上是一个数据表,以2个字节为单位,我们暂将这个单位称为FAT记录项,通常情况其第1、2个记录项(前4个字节)用作介质描述。从第三个记录项开始记录除根目录外的其他文件及文件夹的簇链情况。根据簇的表现情况FAT用相应的取值来描述,见表10

    表10 FAT16记录项的取值含义(16进制)
    FAT16记录项的取值对应簇的表现情况
    0000未分配的簇
    0002~FFEF已分配的簇
    FFF0~FFF6系统保留
    FFF7坏簇
    FFF8~FFFF文件结束簇

         看一幅在winhex所截FAT16的文件分配表,图10:

       

       如图,FAT表以"F8 FF FF FF" 开头,此2字节为介质描述单元,并不参与FAT表簇链关系。小红字标出的是FAT扇区每2字节对应的簇号。
       相对偏移0x4~0x5偏移为第2簇(顺序上第1簇),此处为FF,表示存储在第2簇上的文件(目录)是个小文件,只占用1个簇便结束了。
       第3簇中存放的数据是0x0005,这是一个文件或文件夹的首簇。其内容为第5簇,就是说接下来的簇位于第5簇——〉FAT表指引我们到达FAT表的第5簇指向,上面写的数据是"FF FF",意即此文件已至尾簇。
       第4簇中存放的数据是0x0006,这又是一个文件或文件夹的首簇。其内容为第6簇,就是说接下来的簇位于第6簇——〉FAT表指引我们到达FAT表的第6簇指向,上面写的数据是0x0007,就是说接下来的簇位于第7簇——〉FAT表指引我们到达FAT表的第7簇指向……直到根据FAT链读取到扇区相对偏移0x1A~0x1B,也就是第13簇,上面写的数据是0x000E,也就是指向第14簇——〉14簇的内容为"FF FF",意即此文件已至尾簇。
        后面的FAT表数据与上面的道理相同。不再分析。

        FAT表记录了磁盘数据文件的存储链表,对于数据的读取而言是极其重要的,以至于Microsoft为其开发的FAT文件系统中的FAT表创建了一份备份,就是我们看到的FAT2。FAT2与FAT1的内容通常是即时同步的,也就是说如果通过正常的系统读写对FAT1做了更改,那么FAT2也同样被更新。如果从这个角度来看,系统的这个功能在数据恢复时是个天灾。

        FAT文件系统的目录结构其实是一颗有向的从根到叶的树,这里提到的有向是指对于FAT分区内的任一文件(包括文件夹),均需从根目录寻址来找到。可以这样认为:目录存储结构的入口就是根目录。
        FAT文件系统根据根目录来寻址其他文件(包括文件夹),故而根目录的位置必须在磁盘存取数据之前得以确定。FAT文件系统就是根据分区的相关DBR参数与DBR中存放的已经计算好的FAT表(2份)的大小来确定的。格式化以后,跟目录的大小和位置其实都已经确定下来了:位置紧随FAT2之后,大小通常为32个扇区。根目录之后便是数据区第2簇。
        FAT文件系统的一个重要思想是把目录(文件夹)当作一个特殊的文件来处理,FAT32甚至将根目录当作文件处理(旁:NTFS将分区参数、安全权限等好多东西抽象为文件更是这个思想的升华),在FAT16中,虽然根目录地位并不等同于普通的文件或者说是目录,但其组织形式和普通的目录(文件夹)并没有不同。FAT分区中所有的文件夹(目录)文件,实际上可以看作是一个存放其他文件(文件夹)入口参数的数据表。所以目录的占用空间的大小并不等同于其下所有数据的大小,但也不等同于0。通常是占很小的空间的,可以看作目录文件是一个简单的二维表文件。其具体存储原理是:
        不管目录文件所占空间为多少簇,一簇为多少字节。系统都会以32个字节为单位进行目录文件所占簇的分配。这32个字节以确定的偏移来定义本目录下的一个文件(或文件夹)的属性,实际上是一个简单的二维表。
        这32个字节的各字节偏移定义如表11:

    表11   FAT16目录项32个字节的表示定义
    字节偏移(16进制)字节数定义
    0x0~0x78文件名
    0x8~0xA3扩展名
    0xB1属性字节00000000(读写)
    00000001(只读)
    00000010(隐藏)
    00000100(系统)
    00001000(卷标)
      00010000(子目录)
    00100000(归档)
    0xC~0x1510系统保留
    0x16~0x172文件的最近修改时间
    0x18~0x192文件的最近修改日期
    0x1A~0x1B2表示文件的首簇号
    0x1C~0x1F4表示文件的长度

        对图10中的一些取值进行说明:
        (1)、对于短文件名,系统将文件名分成两部分进行存储,即主文件名+扩展名。0x0~0x7字节记录文件的主文件名,0x8~0xA记录文件的扩展名,取文件名中的ASCII码值。不记录主文件名与扩展名之间的"."  主文件名不足8个字符以空白符(20H)填充,扩展名不足3个字符同样以空白符(20H)填充。0x0偏移处的取值若为00H,表明目录项为空;若为E5H,表明目录项曾被使用,但对应的文件或文件夹已被删除。(这也是误删除后恢复的理论依据)。文件名中的第一个字符若为“.”或“..”表示这个簇记录的是一个子目录的目录项。“.”代表当前目录;“..”代表上级目录(和我们在dos或windows中的使用意思是一样的,如果磁盘数据被破坏,就可以通过这两个目录项的具体参数推算磁盘的数据区的起始位置,猜测簇的大小等等,故而是比较重要的)
        (2)、0xB的属性字段:可以看作系统将0xB的一个字节分成8位,用其中的一位代表某种属性的有或无。这样,一个字节中的8位每位取不同的值就能反映各个属性的不同取值了。如00000101就表示这是个文件,属性是只读、系统。
        (3)、0xC~0x15在原FAT16的定义中是保留未用的。在高版本的WINDOWS系统中有时也用它来记录修改时间和最近访问时间。那样其字段的意义和FAT32的定义是相同的,见后边FAT32。
        (4)、0x16~0x17中的时间=小时*2048+分钟*32+秒/2。得出的结果换算成16进制填入即可。也就是:0x16字节的0~4位是以2秒为单位的量值;0x16字节的5~7位和0x17字节的0~2位是分钟;0x17字节的3~7位是小时。
        (5)、0x18~0x19中的
    日期=(年份-1980)*512+月份*32+日。得出的结果换算成16进制填入即可。也就是:0x18字节0~4位是日期数;0x18字节5~7位和0x19字节0位是月份;0x19字节的1~7位为年号,原定义中0~119分别代表1980~2099,目前高版本的Windows允许取0~127,即年号最大可以到2107年。
        (6)、0x1A~0x1B存放文件或目录的表示文件的首簇号,系统根据掌握的首簇号在FAT表中找到入口,然后再跟踪簇链直至簇尾,同时用0x1C~0x1F处字节判定有效性。就可以完全无误的读取文件(目录)了。
        (7)、普通子目录的寻址过程也是通过其父目录中的目录项来指定的,与数据文件(指非目录文件)不同的是目录项偏移0xB的第4位置1,而数据文件为0。

        对于整个FAT分区而言,簇的分配并不完全总是分配干净的。如一个数据区为99个扇区的FAT系统,如果簇的大小设定为2扇区,就会有1个扇区无法分配给任何一个簇。这就是分区的剩余扇区,位于分区的末尾。有的系统用最后一个剩余扇区备份本分区的DBR,这也是一种好的备份方法。
        早的FAT16系统并没有长文件名一说,Windows操作系统已经完全支持在FAT16上的长文件名了。
    FAT16的长文件名与FAT32长文件名的定义是相同的,关于长文件名,在FAT32部分再详细作解释

    FAT32存储原理:
        FAT32是个非常有功劳的文件系统,Microsoft成功地设计并运用了它,直到今天NTFS铺天盖地袭来的时候,FAT32依然占据着Microsoft Windows文件系统中重要的地位。FAT32最早是出于FAT16不支持大分区、单位簇容量大以致空间急剧浪费等缺点设计的。实际应用中,FAT32还是成功的。
        FAT32与FAT16的原理基本上是相同的,图4.3.12标出了FAT32分区的基本构成。

    图4.3.12 Fat32的组织形式
    引导扇区 其余保留扇区 FAT1 FAT2(重复的) 根文件夹首簇 其他文件夹及所有文件 剩余扇区
    1扇区31个扇区实际情况取大小FAT1第2簇 不足一簇
    保留扇区  ┗━━━━━━━━数据区━━━━━━━━┛

        FAT32在格式化的过程中就根据分区的特点构建好了它的DBR,其中BPB参数是很重要的,可以回过头来看一下表4和表5。首先FAT32保留扇区的数目默认为32个,而不是FAT16的仅仅一个。这样的好处是有助于磁盘DBR指令的长度扩展,而且可以为DBR扇区留有备份空间。上面我们已经提到,构建在FAT32上的win98或win2000、winXP,其操作系统引导代码并非只占一个扇区了。留有多余的保留扇区就可以很好的拓展OS引导代码。在BPB中也记录了DBR扇区的备份扇区编号。备份扇区可以让我们在磁盘遭到意外破坏时恢复DBR
        FAT32的文件分配表的数据结构依然和FAT16相同,所不同的是,FAT32将记录簇链的二进制位数扩展到了32位,故而这种文件系统称为FAT32。32位二进制位的簇链决定了FAT表最大可以寻址2T个簇。这样即使簇的大小为1扇区,理论上仍然能够寻址1TB范围内的分区。但实际中FAT32是不能寻址这样大的空间的,随着分区空间大小的增加,FAT表的记录数会变得臃肿不堪,严重影响系统的性能。所以在实际中通常不格式化超过32GB的FAT32分区。WIN2000及之上的OS已经不直接支持对超过32GB的分区格式化成FAT32,但WIN98依然可以格式化大到127GB的FAT32分区,但这样没必要也不推荐。同时FAT32也有小的限制,FAT32卷必须至少有65527个簇,所以对于小的分区,仍然需要使用FAT16或FAT12。
        分区变大时,如果簇很小,文件分配表也随之变大。仍然会有上面的效率问题存在。既要有效地读写大文件,又要最大可能的减少空间的浪费。FAT32同样规定了相应的分区空间对应的簇的大小,见表12:

     

    表12  FAT32分区大小与对因簇大小
    分区空间大小每个簇的扇区簇空间大小
    <8GB84k
    >=8GB且<16GB168k
    >=16GB且<32GB3216k
    >=32GB6432k

        簇的取值意义和FAT16类似,不过是位数长了点罢了,比较见表13:

    表13 FAT各系统记录项的取值含义(16进制)
    FAT12记录项的取值FAT16记录项的取值FAT32记录项的取值对应簇的表现情况
    000000000000000未分配的簇
    002~FFF0002~FFEF00000002~FFFFFFEF已分配的簇
    FF0~FF6FFF0~FFF6FFFFFFF0~FFFFFFF6系统保留
    FF7FFF7FFFFFFF7坏簇
    FF8~FFFFFF8~FFFFFFFFFFF8~FFFFFFFF文件结束簇


        FAT32的另一项重大改革是根目录的文件化,即将根目录等同于普通的文件。这样根目录便没有了FAT16中512个目录项的限制,不够用的时候增加簇链,分配空簇即可。而且,根目录的位置也不再硬性地固定了,可以存储在分区内可寻址的任意簇内,不过通常根目录是最早建立的(格式化就生成了)目录表。所以,我们看到的情况基本上都是根目录首簇占簇区顺序上的第1个簇。在图4.3.12中也是按这种情况制作的画的。
        FAT32对簇的编号依然同FAT16。顺序上第1个簇仍然编号为第2簇,通常为根目录所用(这和FAT16是不同的,FAT16的根目录并不占簇区空间,32个扇区的根目录以后才是簇区第1个簇)  
        FAT32的文件寻址方法与FAT16相同,但目录项的各字节参数意义却与FAT16有所不同,一方面它启用了FAT16中的目录项保留字段,同时又完全支持长文件名了。
        对于短文件格式的目录项。其参数意义见表14:

    表14   FAT32短文件目录项32个字节的表示定义
    字节偏移(16进制)字节数定义
    0x0~0x78文件名
    0x8~0xA3扩展名
    0xB*1属性字节00000000(读写)
    00000001(只读)
    00000010(隐藏)
    00000100(系统)
    00001000(卷标)
      00010000(子目录)
    00100000(归档)
    0xC1系统保留
    0xD1创建时间的10毫秒位
    0xE~0xF2文件创建时间
    0x10~0x112文件创建日期
    0x12~0x132文件最后访问日期
    0x14~0x152文件起始簇号的高16位
    0x16~0x172文件的最近修改时间
    0x18~0x192文件的最近修改日期
    0x1A~0x1B2文件起始簇号的低16位
    0x1C~0x1F4表示文件的长度

          * 此字段在短文件目录项中不可取值0FH,如果设值为0FH,目录段为长文件名目录段

    说明:
        (1)、这是FAT32短文件格式目录项的意义。其中文件名、扩展名、时间、日期的算法和FAT16时相同的。
        (2)、由于FAT32可寻址的簇号到了32位二进制数。所以系统在记录文件(文件夹)开始簇地址的时候也需要32位来记录,FAT32启用目录项偏移0x12~0x13来表示起始簇号的高16位。
        (3)、文件长度依然用4个字节表示,这说明FAT32依然只支持小于4GB的文件(目录),超过4GB的文件(目录),系统会截断处理。

        FAT32的一个重要的特点是完全支持长文件名。长文件名依然是记录在目录项中的。为了低版本的OS或程序能正确读取长文件名文件,系统自动为所有长文件名文件创建了一个对应的短文件名,使对应数据既可以用长文件名寻址,也可以用短文件名寻址。不支持长文件名的OS或程序会忽略它认为不合法的长文件名字段,而支持长文件名的OS或程序则会以长文件名为显式项来记录和编辑,并隐藏起短文件名。
        当创建一个长文件名文件时,系统会自动加上对应的短文件名,其一般有的原则:
        (1)、取长文件名的前6个字符加上"~1"形成短文件名,扩展名不变。
        (2)、如果已存在这个文件名,则符号"~"后的数字递增,直到5。
        (3)、如果文件名中"~"后面的数字达到5,则短文件名只使用长文件名的前两个字母。通过数学操纵长文件名的剩余字母生成短文件名的后四个字母,然后加后缀"~1"直到最后(如果有必要,或是其他数字以避免重复的文件名)。
        (4)、如果存在老OS或程序无法读取的字符,换以"_"

        长文件名的实现有赖于目录项偏移为0xB的属性字节,当此字节的属性为:只读、隐藏、系统、卷标,即其值为0FH时,DOS和WIN32会认为其不合法而忽略其存在。这正是长文件名存在的依据。将目录项的0xB置为0F,其他就任由系统定义了,Windows9x或Windows 2000、XP通常支持不超过255个字符的长文件名。系统将长文件名以13个字符为单位进行切割,每一组占据一个目录项。所以可能一个文件需要多个目录项,这时长文件名的各个目录项按倒序排列在目录表中,以防与其他文件名混淆。
        长文件名中的字符采用unicode形式编码(一个巨大的进步哦),每个字符占据2字节的空间。其目录项定义如表15。

    表15   FAT32长文件目录项32个字节的表示定义
    字节偏移
    (16进制)
    字节数定义
    0x01属性字节位意义7保留未用
    61表示长文件最后一个目录项
    5保留未用
    4顺序号数值
    3
    2
    1
    0
    0x1~0xA10长文件名unicode码①
    0xB1长文件名目录项标志,取值0FH
    0xC1系统保留
    0xD1校验值(根据短文件名计算得出)
    0xE~0x1912长文件名unicode码②
    0x1A~0x1B2文件起始簇号(目前常置0)
    0x1C~0x1F4长文件名unicode码③

        系统在存储长文件名时,总是先按倒序填充长文件名目录项,然后紧跟其对应的短文件名。从表15可以看出,长文件名中并不存储对应文件的文件开始簇、文件大小、各种时间和日期属性。文件的这些属性还是存放在短文件名目录项中,一个长文件名总是和其相应的短文件名一一对应,短文件名没有了长文件名还可以读,但长文件名如果没有对应的短文件名,不管什么系统都将忽略其存在。所以短文件名是至关重要的。在不支持长文件名的环境中对短文件名中的文件名和扩展名字段作更改(包括删除,因为删除是对首字符改写E5H),都会使长文件名形同虚设。长文件名和短文件名之间的联系光靠他们之间的位置关系维系显然远远不够。其实,长文件名的0xD字节的校验和起很重要的作用,此校验和是用短文件名的11个字符通过一种运算方式来得到的。系统根据相应的算法来确定相应的长文件名和短文件名是否匹配。这个算法不太容易用公式说明,我们用一段c程序来加以说明。
        假设文件名11个字符组成字符串shortname[],校验和用chknum表示。得到过程如下:

        int i,j,chknum=0;
        for (i=11; i>0; i--)
            chksum = ((chksum & 1) ? 0x80 : 0) + (chksum >> 1) + shortname[j++];

        如果通过短文件名计算出来的校验和与长文件名中的0xD偏移处数据不相等。系统无论如何都不会将它们配对的。
        依据长文件名和短文件名对目录项的定义,加上对簇的编号和链接,FAT32上数据的读取便游刃有余了。

    五、结束。

    本文出自数据恢复网(www.sjhf.net),疏漏在所难免,希望指正。若需转载请保留此信息;若需修改,请用以下方式与作者取得联系
        1、http://www.sjhf.net
        2、zymail@vip.sina.com
        3、sjhf@sjhf.net

    单击此处查看PDF版全文








    FAT32文件系统的存储组织结构(一)-曾德标-ChinaUnix博客  

    http://blog.chinaunix.net/uid-26913704-id-3213948.html


    分类: WINDOWS

         对磁盘的物理结构,逻辑结构和存储结构有了比较深入的了解后,我们来仔细探讨FAT32文件系统的存储组织结构。说到文件系统的组织结构,我们应该马上意识到,这指的是文件系统在同一个分区内的组织结构,在这个话题上,我们完全可以不管分区之外的所有事情。

         为了分析FAT32文件系统的存储组织结构,我们来建立一个实实在在的文件系统:将U盘插入电脑,将U盘格式化成FAT32分区格式:

    格式化U盘

    以建好的U盘FAT32文件系统为基础,下面从文件系统的各个组成来分别加以介绍。

    分区引导扇区DBR

    用winhex打开U盘显示如下:

    分区引导DBR

    这是FAT32分区引导记录 ,定义如下:

    偏移00H: 3字节的 跳转指令  EB 58 90,跳过下面的BPB和扩展BPB部分

    偏移03H:8字节的硬盘分区类型文本字符名:4D 53 44 4F 53 35 2E 30 即: MSDOS5.0

    偏移0BH: 25字节的分区参数块(BPB),细分如下:

    偏移0BH:扇区字节数     00 02 即0X0200,512字节

    偏移0DH:每簇扇区数    08即每簇包括8个扇区

    偏移0EH:保留扇区数    24 00即保留36个扇区

    偏移10H:FAT表份数    02即两个FAT表

    偏移11H:未用         00 00

    偏移13H:未用         00 00

    偏移15H:介质类型  F8即本地硬盘

    偏移16H:未用         00 00

    偏移18H:每磁道扇区数   3F 00 即每磁道63扇区 

    偏移1AH:磁头数     FF 00即255个磁头

    偏移1CH:隐藏扇区数    80 1F即8064个隐藏扇区

    偏移20H:磁盘总扇区数 80 F0 77 00即总共7860352个扇区(7860352*512=4024500224,因为我的U盘是4G)

    偏移24H:52字节的扩展分区参数块(扩展BPB),细分如下:

    偏移24H:FAT表占用扇区数  EE 1D  00 00即FAT表占7662个扇区

    偏移28H:未用  00 00 00 00

    偏移2CH:根目录入口簇号 02 00 00 00即根目录从02号簇开始

    偏移30H:文件系统信息扇区号  01 00即扇区1

    偏移32H:备份引导扇区的位置 06 00即6号扇区(第7个扇区),从WINHEX中我们也可以看到,6号扇区的内容和0号引导扇区内容     是 一样的

    偏移34H:未用         00 00 00 00 00 00 00 00 00 00 00 00

    偏移40H:物理磁盘号  00

    偏移41H:未用  00

    偏移42H:扩展引导标志 29即0X29

    偏移43H:磁盘序列号F1 2A 27 04通常为一随机数

    偏移47H:卷标ASCII 4E 4F 20 4E 41 4D 45 20 20 20 20 即NO NAME

    偏移52H:文件系统格式ASCII  46 41 54 33 32 20 20 20即FAT32

    偏移5AH:分区引导代码 420字节:

                          33C98ED1BCF47B8EC18ED9BD007C884E028A5640B408CD137305B9FFFF8AF166

                          0FB6C640660FB6D180E23FF7E286CDC0ED0641660FB7C966F7E1668946F8837E1

                          6007538837E2A007732668B461C6683C00CBB0080B90100E82B00E94803A0FA7DB

                          47D8BF0AC84C074173CFF7409B40EBB0700CD10EBEEA0FB7DEBE5A0F97DEBE0

                          98CD16CD196660663B46F80F824A00666A0066500653666810000100807E02000F8

                          52000B441BBAA558A5640CD130F821C0081FB55AA0F851400F6C1010F840D00FE4

                          602B4428A56408BF4CD13B0F96658665866586658EB2A6633D2660FB74E1866F7F1

                          FEC28ACA668BD066C1EA10F7761A86D68A56408AE8C0E4060ACCB80102CD13666

                          10F8254FF81C300026640490F8571FFC34E544C445220202020202000000000000000

                          00000000000000000000000000000000000000000000000000000000000000000000000

                          00000000000000D0A52656D6F7665206469736B73206F72206F74686572206D656469

                          612EFF0D0A4469736B206572726F72FF0D0A507265737320616E79206B657920746F2

                          0726573746172740D0A0000000000ACCBD80000

    偏移1FEH:有效扇区结束标志 55 AA

    到此分区引导扇区介绍结束。

    文件分配表FAT

    简介:

         FAT表(文件分配表),是FAT文件系统中用于磁盘数据索引和定位而引进的一种链式结构。在FAT文件系统中,文件的存储依照FAT表制定的簇链式数据结构来进行。同时,FAT文件系统将组织数据时使用的目录也抽象为文件,以简化对数据的管理。

    FAT1表位置的定位:

         在我们前面介绍分区引导记录的时候提到,在偏移0EH处存储了保留扇区的个数,这个保留扇区数指的就是当前分区内DBR到FAT表之间的所有扇区的个数(包括DBR但不包括FAT表)。因此,我们可以定位FAT表所在的起始偏移位置了,即24H*200H=4800H。我们贴出4800H处得部分内容如下:

    FAT1

         显然没有错,这就是我们FAT1所存储的位置,只是当前没有存储文件,所以FAT比较简单罢了。

    FAT2表位置的定位:

         在我们前面介绍分区引导记录的时候提到,在偏移24H处存储了FAT表所占用的扇区个数,我们又知道FAT2是紧邻FAT1的,所以可以很容易得到FAT2的存储位置的偏移地址:FAT1的起始偏移地址+FAT1的大小=4800H+1DEEH*200H=3C2400H,我们贴出3C2400H处的部分内容如下:

    FAT2

          显然没有错,这就是我们FAT2所存储的位置,内容与FAT1相同。

    FAT表的特性:

         FAT表由一系列大小相等的FAT表项组成,它有如下特性: 
         FAT32中每个簇的簇地址,使用32bit(4个字节)记录在FAT表中。FAT表中的所有字节位置以4个字节为单位进行划分,并对所有划分后的位置由0进行地址编号。0 号地址与1号地址被系统保留并存储特殊标志内容。从2号地址开始,每个地址对应于数据区的簇号,FAT表中的地址编号与数据区中的簇号相同。我们称FAT中的这些地址为FAT表项,FAT表项中记录的值称为FAT表项值。 
         当文件系统被创建,也就是进行格式化操作时,分配给FAT区域的空间将会被清空,在FAT1与FAT2的0号表项与1号表项写入特定值。由于创建文件系统的同时也会创建根目录,也就是为根目录分配了一个簇空间,通常为2号簇,所以2号簇所对应的2号FAT表项也会被写入一个结束标记。 
         如果某个簇未被分配使用,它所对应的FAT表项内的FAT表项值即用0进行填充,表示该FAT表项所对应的簇未分配使用。 
         当某个簇已被分配使用时,则它对应的FAT表项值也就是该文件的下一个存储位置的簇号。如果该文件结束于该簇,则在它的FAT表项中记录的是一个文件结束标记,对于FAT32而言,代表文件结束的FAT表项值为0x0FFFFFFF。 (guyue:实际测试文件结束符是FF FF FF 0F)
         如果某个簇存在坏扇区,则整个簇会用FAT表项值0x0FFFFFF7标记为坏簇,不再使用,这个坏簇标记就记录在它所对应的FAT表项中。 
         由于簇号起始于2,所以FAT表的0号表项与1号表项不与任何簇对应。FAT32的0号表项值总是“F8FFFF0F”。1号表项可能被用于记录脏标志,以说明文件系统没有被正常卸载或者磁盘表面存在错误。不过此值似乎并不重要,因此我们只要了解就可以。正常情况下,1号表项值为“FFFFFFFF”或“FFFFFF0F"。 
         在文件系统中新建文件时,如果新建的文件只占用一个簇,为其分配的簇所对应的FAT表项将会被写入结束标记。如果新建的文件不只占用一个簇,则在其所占用的每个簇对应的FAT表项中写入为其分配的下一簇的簇号,在最后一个簇对应的FAT表项中写入结束标记。 
         新建目录时,只为其分配一个簇的空间,对应的FAT表项中写入结束标记。当目录增大超出一个簇的大小时,将会在空闲空间中继续为其分配一个簇,并在FAT表中为其建立FAT表链以描述它所占用的簇情况。 
         对文件或目录进行删除操作时,它们所对应的FAT表项将会被清空,设置为0以表示其所对应的簇处于未分配状态。

    根目录区

    简介:

          在FAT32文件系统中,根目录的位置不再硬性地固定,可以存储在分区内可寻址的任意簇内,不过通常根目录是最早建立的(格式化就生成了)目录表。所以,我们看到的情况基本上都是根目录首簇紧邻FAT2,占簇区顺序上的第1个簇(即2号簇)。同时,FAT32文件系统将根目录当做普通的数据文件来看,所有没有了目录项数的限制,在需要的时候可以分配空簇,存储更多的目录项。

    起始偏移地址定位:

         根目录起始扇区=保留扇区数+FAT×2+(起始簇-2)x每簇的扇区数,在我们前面介绍分区引导记录的时候提到,偏移2CH处保存了根目录起始簇号是2,所以求得根目录起始扇区是24H+1DEEH*2H+(2-2)*8H=3C00H,即求得偏移地址3C00H*200H=780000H,我们贴出780000H处的部分内容如下:

    780000H

         目录区的一个目录项占用32个字节,可以是长文件名目录项、文件目录项、子目录项等。

                                              短文件名格式的目录项  

       对于短文件名格式的目录项。其参数意义如下:

    短文件名

       根据参数定义,我们来分析一下上图的目录项 54 45 53 54 5F 46 41 54 33 32 20 08 00 00 00 00 00 00 00 00 00 00 19 95 10 3F 00 00 00 00 00 00。其中起始11字节54 45 53 54 5F 46 41 54 33 32 20 是卷标TEST_FAT32;第12字节08指示当前目录项保存的是卷标;第23-24字节19 95即9519H,是最近修改时间:19点40分50秒;第25-26字节10 3F即3F10H,是最近修改日期:2011年8月16日;

                                                   长文件名格式的目录项

    FAT32的一个重要的特点是完全支持长文件名。长文件名依然是记录在目录项中的。为了低版本的OS或程序能正确读取长文件名文件,系统自动为所有长文件名文件创建了一个对应的短文件名,使对应数据既可以用长文件名寻址,也可以用短文件名寻址。不支持长文件名的OS或程序会忽略它认为不合法的长文件名字段,而支持长文件名的OS或程序则会以长文件名为显式项来记录和编辑,并隐藏起短文件名。

       当创建一个长文件名文件时,系统会自动加上对应的短文件名,其原则如下: 
         (1)、取长文件名的前6个字符加上"~1"形成短文件名,扩展名不变。 
         (2)、如果已存在这个文件名,则符号"~"后的数字递增,直到5。 
    长文件名的实现有赖于目录项第12字节属性字节,当此字节的值为0FH时,支持长文件名的系统会将其当做长文件名的依据,而只支持短文件名的系统会认为是异常而忽略掉。系统将长文件名以13个字符为单位进行切割,每一组占据一个目录项。所以可能一个文件需要多个目录项,这时长文件名的各个目录项按倒序排列在目录表中,以防与其他文件名混淆。 
    长文件名中的字符采用unicode形式编码,每个字符占据2字节的空间。其目录项定义如:

    长文件名

    下面是我建立的长文件名文件夹abcdefghijklmnopqrstuvwxyz1234567890的目录项:

    长目录名







    FAT32文件系统的存储组织结构(二)-曾德标-ChinaUnix博客  

    http://blog.chinaunix.net/uid-26913704-id-3213951.html



    分类: WINDOWS

           前面已经基于一个格式化的空U盘分析了一下FAT32文件系统存储的组织结构,下面我们从文件操作的角度来分析一下文件系统的运作机制。由于换了个U盘,所以仍然贴出刚格式化的空U盘的几个重要的数据区如下:

    DBR FDT_DN

    根目录_DN

    我们可以看出,在分区格式化的时候,系统将卷标TEST_FAT32存储在2号簇,即跟目录区,如上面根目录贴图所示。同时,在FDT区2号簇标记位置写入了文件结束符FF FF FF 0F。显然,FAT32文件系统将目录当做普通文件来处理的。

    下面我们在根目录下新建一个文件夹TEST1,看会有什么变化:

    建立了TEST1文件夹后,FDT变成如下:

    FDT_TEST1

    根目录变成如下:

    根目录2

    重新分配了3号簇:

    3号簇_NEW

    从上面的变化可以直观的看出,系统在新建文件夹时完成了如下动作:

         a.在父目录所在簇上建立新的目录项,存储当前所建文件夹信息。

         b.分配一个新簇,给新建的文件夹建立两个目录项:父目录和当前目录。

         c.在FDT表中新分配的簇对应的位置上写下文件结束符。

         d.建立各部分的链路关系:新建文件夹所对应的目录项的文件起始簇号字段写上新分配簇的簇号,新簇上的两个目录项的文件起始簇号字段分配写上父目录所在簇号(此处是0,本来我以为是2,即根目录所在簇,不知道为什么,可能特地用0指示根目录吧)和当前簇号(此处是3)。

    为了验证我们上面分析的正确性,我们再在TEST1文件夹下建立新文件夹TEST11,看是否做了如下操作:

          a.在父目录(即TEST1)所在簇(即3号簇)上建立新的目录项,存储TEST11文件夹信息。

         b.分配一个新簇(应该是4号簇),给新建的文件夹(即TEST11)建立两个目录项:父目录和当前目录。

         c.在FDT表中新分配的簇(应该是4号簇)对应的位置上写下文件结束符。

         d.建立各部分的链路关系:新建文件夹(即TEST11)所对应的目录项的文件起始簇号字段写上新分配簇的簇号(应该是4号簇),,新簇上的两个目录项的文件起始簇号字段分配写上父目录所在簇号(3号簇)和当前簇号(应该是4号簇)。

    新建TEST11文件夹后FDT变成:

    FDT_TEST11

    根目录没有变化:

    根目录2

    3号簇变成:

    3号簇

    新分配4号簇:

    4号簇

    显然我们的估计没有错的,也进一步证明我们前面的分析是正确的。

    下面我们再分析建立文件的情况

    我们先建立一个100字节的文件TEST.TXT,然后把这个文件拷贝到U盘的根目录下,FDT变成如下:

    FDT

    根目录变成:

    根目录

    新分配5号簇保存文件内容:

    5号簇

    从上面的变化可以直观的看出,系统新建文件和新建文件夹所完成的操作是一样一样的:

         a.在父目录所在簇上建立新的目录项,存储当前所建文件信息。

         b.分配一个新簇,存储新建的文件的内容。

         c.在FDT表中新分配的簇对应的位置上写下文件结束符。

         d.建立链路关系:新建文件所对应的目录项的文件起始簇号字段写上新分配簇的簇号。

    结束总结:

          1.在FAT32文件系统中,目录和文件的存储采用统一的方式。

          2.文件系统的操作的单位是簇,每新建立一个文件或文件夹,至少会重新分配一个簇号。

          3.如果一个文件或目录的内容要多个簇才能存储得下,则系统会分配多个簇来存储文件或目录的内容

          4.当需要多个簇时,这些簇可能连续也可能不连续,但无论是连续或是不连续,系统都是采用FDT链表的形式来组织的。






    /


    文件系统基础知识之磁盘-曾德标-ChinaUnix博客  

    http://blog.chinaunix.net/uid-26913704-id-3213957.html


    文件系统基础知识之磁盘  2012-05-19 16:33:50

    分类: WINDOWS

                               磁盘的物理结构

        一个磁盘驱动器两个主要的移动部件;一个是磁盘片组合(disk assembly) ,另一个是磁头组合(head assembly)。磁盘片组合由一个或多个圆盘(platter)组成,它们围绕着一根中心主轴旋转。圆盘的上表面和下表面涂覆了一薄层磁性材料,二进制位被存储在这些磁性材料上。其中,0和1在磁材料中表现为不同的模式。       
        磁盘被组织成磁道(track),磁道是单个盘片上的同心圆。所有盘面上半径相同的磁道构成了柱面(cylinder),从磁盘的顶视图可以看到,磁道占据大部分盘面,最靠近主轴的区域除外。沿着磁道的数据密度大于沿着半径的数据密度。在2008年,一个典型的磁盘上每英寸有大约100 000个磁道,但是沿着磁道每英寸能够存储100万个二进制位。 

    磁盘结构   
        磁道被组织成扇区(sector)。扇区是被间隙(gap)分割的圆的片段,间隙未被磁化为0或1 
        虽然图片中显示每一个磁道有相同的扇区数,但实际上,每个磁道的扇区数通常是不同的,靠外圈磁道的扇区数比靠内圈磁道的扇区数多。就读写磁盘而论,扇区是不可分割的单位;就磁盘错误而论,它也是一个不可分割的单位。倘若一部分磁化层被以某种方式损坏,以至于它不再能存储信息,那么那些包含这个部分的整个扇区也不能再使用。间隙大约占整个磁道的10%,用于帮助标识扇区的起点。通常,在磁盘与主存之间所传输数据的逻辑单元称为块,其由一个或多个扇区所组成。 
        第二个可移动部件是磁头组合,它承载着磁头。每一个盘面有一个磁头,它极其贴近地悬浮在盘面上,但是绝对不与盘面接触(否则就要发生“头损毁”,盘片被破坏)。磁头读出经过它下面的盘面的磁方向,也能改变其磁方向,以便在磁盘上写信息。每个磁头被固定在一个磁头臂上,所有盘面的磁头随着磁头臂一同移进移出,磁头臂是固定的磁头组合的一部分。 
        很显然,计算整个磁盘的容量的算法是:盘面数X磁道数X扇区数X扇区字节数

                                    磁盘的逻辑结构

    要组织磁盘上存储的数据,使得可以方便的存储和访问,就要实现数据的定位。数据的定位主要有两种方式:CHS地址LBA线性地址

    CHS地址

        早期硬盘存储空间采用3维地址结构描述:

        C=Cylinder(柱面。若干盘体重叠,相同的磁道(track上)构成的一个立面体)

        H=Head(磁头。一张盘有两面(side),每面一个磁头)

        S=Sector(扇区。盘体上的圆形轨迹为磁道,把磁道等分为若干存储区域)

        磁盘的容量=柱面总数×磁头总数×每道扇区总数×每扇区容量(512byte)

    LBA地址

        LBA是逻辑块地址的简称,它是一种线性地址结构,它其实是由CHS计算的扇区编号顺序编址,即0柱0面1扇区为LBA 0扇区。现在的硬盘厂家为了保持兼容性,仍然提供了虚拟的CHS参数,可在BIOS设置中看到。对硬盘的数据访问是靠系统调用INT 13H中断程序实现的,它将欲访问的数据地址传递给硬盘接口电路(ATA接口)完成读写操作。

    528MB的限制:早期的硬盘的CHS参数被限制为:磁头数最大16,柱面数最大1024,扇区最大63,每扇区字节数为512字节。因此1024×16×63×512B≈528MB。

    8GB容量限制:将柱面数增加到16384,其他不变,共计24bit,则硬盘容量最大为:16384×16×63×512B≈8.4GB。

    32GB容量限制:硬盘采用了虚拟CHS值,使得柱面数为65535,其他不变,共计26bit,这样,磁盘的总容量最大为: 65535×16×63×512B≈32GB。  
    137G  容量限制:由于普遍使用了LBA寻址模式和虚拟CHS参数,将扇区数进一步增加为255,共计28位,将其乘积作为LBA值。这样系统使用28位的LBA参数,约计137GB。

                                       磁盘的存储结构

        刚刚从厂商处购来的新硬盘既无任何数据,也不能写入任何数据,必须先进行低级格式化,FDISK 分区,FORMAT 高级格式化后方可使用。对硬盘的这一系列初始化工作,称之为硬盘准备。过程如下:低级格式化---------------FDISK 分区-------------------FORMAT 高级格式化。 
    (1)低级格式化:磁盘为了达到随机存取的目的,需要在磁盘上划分出磁道,然后又在磁道划分出扇区,每个扇区以扇区间隙、同步引导字节和扇区编号作为扇区的起始,然后才是扇区的内容,后面还有校验标记。计算机就是凭借这些标记信息来识别扇区的。低级格式化就是在磁道上标上这些标记而已。所以低级格式化的操作实际上仅仅是一个简单的写过程,写的不是数据而是标记。同时低级格式化还会剔出坏磁道。 
    (2)FDISK分区:允许整个物理硬盘在逻辑上划分成最多4个主分区(其中可以有一个扩展分区),以实现多个操作系统共享硬盘空间。在建立了扩展分区的前提下,可以将扩展分区划分成一个或多个逻辑分区。在硬盘上建立分区表的同时,FDISK 会把主引导记录MBR 写到硬盘的主引导记录(柱面0,磁头0,扇区1),并激活一个用户指定的主分区。下面要特别介绍一下主引导记录MBR :  
         MBR 称为硬盘主引导记录。它是在分区时由FDISK 建立在硬盘柱面0,磁头0,扇区1 上的,总共占用512 个字节,包括一小段执行代码(主引导代码)、磁盘特征和硬盘分区表。主引导记录(以及后面介绍的引导扇区)结束的两个字节必须是引导自举标记0x55AA。磁盘特征位于0x01B8, 指定磁盘操作系统。  
         主引导代码实现下列功能:   a. 扫描分区表查找活动分区;  b. 寻找活动分区的起始扇区; c. 将活动分区的引导扇区读到内存; d. 执行引导扇区的运行代码。 如果主引导代码未完成这些功能, 系统会显示下列的错误信息之一: Invalid partition table, Error loading operating system, Missing operating system.  
         主引导记录MBR 由4 个部分组成:a.主引导程序(偏移地址0000H~0088H),它负责从活动分区中装载并运行系统引导程序;b.出错信息数据区(偏移地址0089~00E1 为出错信息,10E2H~10BD 全为0 字节); c.分区表(DPT,Disk Partition Table,含4 个分区项,偏移地址01BEH~01FDH,每个分区表项长16 个字节,共64 字节),即主分区和扩展分区的信息;d.结束标志(偏移地址01EFH~01FFH ),这两个字节值为结束标志55AA,如果该标志错误系统就不能启动.  
         注意:硬盘的引导记录是不属于任何一个操作系统的,它先于所有的操作系统而被调入内存并发挥作用,然后才将控制权交给主分区内的操作系统,并让主分区信息表来管理硬盘。

    BOOTSECTOR

    (3)高级格式化:  
         这一步之前的所有操作,都是与具体的文件系统没有任何关系的,从现在开始,才涉及到具体的文件系统,换句话说,高级格式化是与我们要建立的文件系统相关的,因此我们调用高级格式化命令时,文件类型是必须提供的参数之一。

         在DOS/WINDOWS系统中,用FORMAT对指定分区进行高级格式化,将分区空间划分逻辑扇区,生成DOS 引导扇区(即逻辑0 扇区)DBR,文件分配表FAT 和根文件目录表FDT。        
           在LINUX系统中,需要使用mkfs命令将分区进行格式化,建立想要的文件系统,如EXT2,EXT3,等。

    经过以上三步后,磁盘的存储结构看起来如下图所示:

    磁盘存储结构


    展开全文
  • FAT12 FAT16 FAT32 学习

    2007-02-09 11:11:00
    Currently there are three FAT file system types: FAT12, FAT16 and FAT32. The basic difference in these FATsub types, and the reason for the names, is the size, in bits, of the entries in the actual FA

    Currently there are three FAT file system types: FAT12, FAT16 and FAT32. The basic difference in these FAT
    sub types, and the reason for the names, is the size, in bits, of the entries in the actual FAT
    structure on the disk. There are 12 bits in a FAT12 FAT entry, 16 bits in a FAT16 FAT entry
    and 32 bits in a FAT32 FAT entry. 

    Contents
    Notational Conventions in this Document................................................................................. 6
    General Comments (Applicable to FAT File System All Types)............................................... 6
    Boot Sector and BPB ................................................................................................................ 6
    FAT Data Structure ................................................................................................................. 12
    FAT Type Determination......................................................................................................... 13
    FAT Volume Initialization ........................................................................................................ 18
    FAT32 FSInfo Sector Structure and Backup Boot Sector ...................................................... 20
    FAT Directory Structure .......................................................................................................... 21
    Other Notes Relating to FAT Directories ................................................................................ 24
    Specification Compliance........................................................................................................ 25

    Notational Conventions in this Document


    Numbers that have the characters “0x” at the beginning of them are hexadecimal (base 16) numbers.
    Any numbers that do not have the characters “0x” at the beginning are decimal (base 10) numbers.
    The code fragments in this document are written in the ‘C’ programming language. Strict typing and
    syntax are not adhered to.
    There are several code fragments in this document that freely mix 32-bit and 16-bit data elements. It is
    assumed that you are a programmer who understands how to properly type such operations so that
    data is not lost due to truncation of 32-bit values to 16-bit values. Also take note that all data types are
    UNSIGNED. Do not do FAT computations with signed integer types, because the computations will
    be wrong on some FAT volumes.


    General Comments (Applicable to FAT File System All Types)
    All of the FAT file systems were originally developed for the IBM PC machine architecture. The
    importance of this is that FAT file system on disk data structure is all “little endian.” If we look at one
    32-bit FAT entry stored on disk as a series of four 8-bit bytes—the first being byte[0] and the last
    being byte[4]—here is where the 32 bits numbered 00 through 31 are (00 being the least significant
    bit):
    byte[3] 3 3 2 2 2 2 2 2
    1 0 9 8 7 6 5 4
    byte[2] 2 2 2 2 1 1 1 1
    3 2 1 0 9 8 7 6
    byte[1] 1 1 1 1 1 1 0 0
    5 4 3 2 1 0 9 8
    byte[0] 0 0 0 0 0 0 0 0
    7 6 5 4 3 2 1 0
    This is important if your machine is a “big endian” machine, because you will have to translate
    between big and little endian as you move data to and from the disk.
    A FAT file system volume is composed of four basic regions, which are laid out in this order on the
    volume:
    0 – Reserved Region
    1 – FAT Region
    2 – Root Directory Region (doesn’t exist on FAT32 volumes)
    3 – File and Directory Data Region


    Boot Sector and BPB
    The first important data structure on a FAT volume is called the BPB (BIOS Parameter Block), which
    is located in the first sector of the volume in the Reserved Region. This sector is sometimes called the
    “boot sector” or the “reserved sector” or the “0th sector,” but the important fact is simply that it is the
    first sector of the volume.
    This is the first thing about the FAT file system that sometimes causes confusion. In MS-DOS version
    1.x, there was not a BPB in the boot sector. In this first version of the FAT file system, there were
    only two different formats, the one for single-sided and the one for double-sided 360K 5.25-inchfloppy disks. The determination of which type was on the disk was done by looking at the first byte of
    the FAT (the low 8 bits of FAT[0]).
    This type of media determination was superseded in MS-DOS version 2.x by putting a BPB in the
    boot sector, and the old style of media determination (done by looking at the first byte of the FAT)
    was no longer supported. All FAT volumes must have a BPB in the boot sector.
    This brings us to the second point of confusion relating to FAT volume determination: What exactly
    does a BPB look like? The BPB in the boot sector defined for MS-DOS 2.x only allowed for a FAT
    volume with strictly less than 65,536 sectors (32 MB worth of 512-byte sectors). This limitation was
    due to the fact that the “total sectors” field was only a 16-bit field. This limitation was addressed by
    MS-DOS 3.x, where the BPB was modified to include a new 32-bit field for the total sectors value.
    The next BPB change occurred with the Microsoft Windows 95 operating system, where the FAT32
    type was introduced. FAT16 was limited by the maximum size of the FAT and the maximum valid
    cluster size to no more than a 2 GB volume if the disk had 512-byte sectors. FAT32 addressed this
    limitation on the amount of disk space that one FAT volume could occupy so that disks larger than
    2 GB only had to have one partition defined.
    The FAT32 BPB exactly matches the FAT12/FAT16 BPB up to and including the BPB_TotSec32
    field. They differ starting at offset 36, depending on whether the media type is FAT12/FAT16 or
    FAT32 (see discussion below for determining FAT type). The relevant point here is that the BPB in
    the boot sector of a FAT volume should always be one that has all of the new BPB fields for either the
    FAT12/FAT16 or FAT32 BPB type. Doing it this way ensures the maximum compatibility of the FAT
    volume and ensures that all FAT file system drivers will understand and support the volume properly,
    because it always contains all of the currently defined fields.
    NOTE: In the following description, all the fields whose names start with BPB_ are part of the BPB.
    All the fields whose names start with BS_ are part of the boot sector and not really part of the BPB.
    The following shows the start of sector 0 of a FAT volume, which contains the BPB

     

    展开全文
  • FAT32

    千次阅读 2019-04-01 11:05:29
    FAT32 DBR及保留扇区 FAT1 FAT2 数据区 DBR及保留扇区:DBR的含义是DOS引导记录,也称为操作...

    FAT32

     

     

     

    DBR及保留扇区

     

     

     

     

    FAT1

     

     

     

    FAT2

     

     

     

    数据区

     

     

    • DBR及保留扇区:DBR的含义是DOS引导记录,也称为操作系统引导记录,在DBR之后往往会有一些保留扇区。
    • FAT1FAT的含义是文件分配表,FAT32一般有两份FATFAT1是第一份,也是主FAT
    • FAT2FAT2FAT32的第二份文件分配表,也是FAT1的备份。
    • DATA:数据区,是FAT32文件系统的主要区域,其中包含目录区域。

     

    FAT32文件系统的DBR分析

    1:跳转指令

    EB 58 90 共3个字节,跳转指令本身占用2字节,它将程序执行流程跳转到引导程序处。例如,当前DBR中的“EB 58”,就是代表汇编语言中的“JMP 58”。需要注意该指令本身占用2个字节,计算跳转目标地址时该指令的下一个字节为基准,所以实际上执行的下一条指令应该位于 5A。紧接着跳转是一条空的指令NOP(90H)

    2:OEM代号

            4d 53 44 4f 53 35 2e 30(MSDOG5.0)占用8个字节,这个说明了微软不同的操作系统版本。修改这个值不影响文件系统的使用。

    3:BPB(BIOSParameter Block,BIOS参数块)

             BPB从DBR的第12个字节开始,占用79个字节,其又分为25字节的分区参数块(BPB)和52字节的扩展分区参数块(扩展BPB),记录了有关该文件系统的重要信息,其中各个参数的含义见下表

     

    偏移

    长度(B)

    字段名与定义

    说明

    BPB

    0X0B

    2

    每扇区字节数

    记录每个逻辑扇区的大小,其常见的值为512,但是并不是固定的值。该值可以由程序定义,合法值包括512、1024、2048、4096。

    0X0D

    1

    每簇扇区数

    记录着文件系统的簇大小,即由多少个扇区组成一个簇。簇是FAT12,FAT16及FAT32文件系统下数据的最小存储单元,一个簇由一组连续的扇区组成,簇所含的扇区数必须是2的整数次幂,如1,2,4,8,16,32,64,128.在Windows 2000以前族最大值为64扇区,之后最大值为128。在FAT文件系统中,所有的簇是从2开始编号,每个簇都有一个自己的地址编号,但是所有的簇都位于数据区,在数据区之前没有簇。

    0X0E

    2

    DOS保留扇区数

    DBR到FAT1表之间的扇区数,或者说是FAT1的开始扇区号,对于FAT32文件系统来说,该值的范围是32扇区到38扇区之间。

    0X10

    1

    FAT个数

    一般为2

    0X11

    2

    未用

    FAT32必须等于0FAT12/FAT16为根目录中目录的个数

    0X13

    2

    未用

    FAT32必须等于0,FAT12/FAT16为扇区总数

    0X15

    1

    介质描述符

    描述磁盘介质的参数,根据磁盘性质的不同,取不同的值。0xF8标准值,可移动存储介质,常用 0xF0

    0X16

    2

    未用

    FAT32必须为0,FAT12/FAT16为一个FAT 表所占的扇区数。

    0X18

    2

    每磁道扇区数

    一般其值为63

    0X1A

    2

    磁头数

    一般为255

    0X1C

    4

    隐藏扇区数

    是MBR到DBR之间的扇区数,对于扩展分区中逻辑驱动顺来说,是其EBR到DBR。可以为0。

    0X20

    4

    分区扇区总数

    分区的总扇区数,也就是FAT32分区的大小

    扩展BPB

    0X24

    4

    每FAT扇区数

    FAT表占用扇区数

    0X28

    2

    标记

    FAT2是否可用,2为可用,此域FAT32 特有

    0X2A

    2

    版本

    FAT32版本号0.0,FAT32特有

    0X2C

    4

    根目录首簇号

    分区在格式化的时候,格式化程序会在数据区中指派一个簇作为FAT32的根目录的开始,并把该簇号记录在BPB中。通常都是把数据区中的第一簇分配给根目录使用,也就是2号簇。

    0X30

    2

    文件系统信息扇区号

     FAT32文件系统在DBR的保留扇区中安排了一个文件系统信息扇区,用以记录数据区中空闲簇的数量及下一个可用的空闲簇的簇号,该扇区一般在分区的1号扇区,也就是紧跟在DBR之后的一个扇区。FSINFO(文件系统信息扇区)扇区号1,该扇区为操作系统提供关于空簇总数及下一可用簇的信息

    0X32

    2

    DBR备份扇区号

    FAT32文件系统在DBR的保留扇区中安排了一个DBR的备份,一般在6号扇区,也就是分区的第7个扇区,该备份扇区与原DBR扇区的内容完全一样,如果原DBR遭到破坏,可以用备份扇区号修复。

    0X34

    12

    保留

     

    0X40

    1

    BIOS驱动器号

    这是BIOS的INT 13H所描述的设备号码,一般硬盘为80H,一般软盘为00H等

    0X41

    1

    未用

     

    0X42

    1

    扩展引导标记

    用来确认后面的三个参数是否有效,FAT为29H

    0X43

    4

    卷序列号

    磁盘序列号,通常为一随机数

    0X47

    11

    卷标

    用户设置的卷标ASCII,如果没有则4E 4F 20 4E 41 4D 45 20 20 20 20 即NO NAME。如果建立文件系统的时候指定了卷标,会保存在此

    0X52

    8

    文件系统类型

    使用ASCII码记录当前分区的文件系统类型,46 41 54 33 32 20 20 20即FAT32

     

    4:引导程序

            Fat32的DBR引导程序占用420个字节,在98 之前的系统之下,这段代码负责完成DOS三个系统文件的装入; 2000之后的系统中,其负责完成将系统文件NTLDR装入。对于一个没有操作系统的分区来讲,这段代码是没有作用的。

    0x5A~0x1FD:90~509共410字节,未使用。该部分没有明确的用途。

     

    系统启动步骤:

    在系统启动过程中, 磁盘的主引导记录MBR 中的引导记录 找到可引导扇区引导代码并将控制权交给它 由它找到适当的操作系统文件并进行加载。

    注意: 一个FAT 卷即使不是可引导文件系统,也存在引导代码。

     

    5:结束标志

    签名标志0xAA55

     

     

     

    FSINFO 扇区解析

    1、 FSINSO 信息扇区( 保留区的1号扇区)

    位置:一般位于文件系统的 1 扇区。

    作用:简言之就是记录文件系统的当前信息, FAT32 在保留扇区中添加了一个FSINFO扇区, 用以记录文件系统中的空闲簇的数量以及下一个可用簇的簇号等信息,一共操作系统作为参考。

    2、 FSINFO 信息扇区结构

    偏移

    字节数

    说明

    00

    4

    扩展引导标志 52 52 61 41

    04

    480

    未使用

    1E4

    4

    FSINFO签名72 72 41 61

    1E8

    4

    空闲簇数

    1EC

    4

    下一个可用簇号

    1F0

    14

    未使用

    1EE

    2

    55 AA 结束标志

     

    提示: 通常情况下,文件系统的2号扇区结尾也会被设置“55AA”标识 6号扇区会有一个引导扇区的备份 7号扇区应该是一个备份FSINFO 信息扇区,但很多时候与1号扇区的内容不完全相同;8号扇区可以看做是2号扇区的备份,他的结尾也会有一个“55AA” 标识。

     

     

    FAT表解析

    1、 FAT 表概述

    位置: 紧跟在文件系统的“保留区”之后 ; 有两个数据结构完全相同的FAT(FAT,File Allocation Tbale 文件分配表)组成。

     

    作用: FAT表项,描述文件系统内的簇分配状态,说明文件系统内数据所分配的连续簇的顺序关系(即表明文件或目录的下一簇的序号)。

     

    数量: 通常情况下一个FAT 文件系统会有两个FAT 表, 但有时候也会允许只有一个FAT 表, FAT 表的具体个数记录在引导扇区的偏移 0x10 字节处。

    位置: 因为FAT区位于文件系统的保留区之后,所以FAT1在文件系统中的位置可以通过引导记录中偏移0x0E~0x0F 字节处的“保留扇区”数得到。

     

    FAT1表偏移 = 保留扇区数 * 每扇区字节数

     

    FAT2 紧跟在FAT1之后, 它的位置可以通过FAT1的位置加上每个FAT 表的大小扇区数获得。

     

    FAT2表的偏移 = FAT1表偏移+FAT表的大小

    = (保留扇区数 + FAT表扇区数) * 每扇区字节数

     

    FAT 表中记录了每个文件的簇链结构;

    FAT 表中记录的与数据区簇对应的表项,从0号标记开始至当前数据区所分配的簇的最大数值,记录簇信息到FAT 项;但是注意:其中 0号~1号簇的值都是操作系统预先不留设定的特殊标记,而数据区的起始簇是2号簇。

     

    2、FAT 表的特性

     

    表项数值

    对应含义

    0x00000000

    空闲簇,即表示可用

    0x00000001

    保留簇

    0x00000002 - 0x0FFFFFEF

    被占用的簇,其值指向下一个簇号

    0x0FFFFFF0 - 0x0FFFFFF6

    保留值

    0x0FFFFFF7

    坏簇

    0x0FFFFFF8 - 0x0FFFFFFF

    文件最后一个簇

    表项数值含义

     

    FAT 表由一些列大小相等的表项组成,有如下特性:

     

    FAT32 中每个簇的状态,使用32bit(4字节)记录在FAT表中。 FAT 表中的所有字节位置以 4个字节为单位进行划分;并以所有划分后的位置由0进行地址编号。“0号 和 1号”地址被系统保留并存储特殊标识内容。从 2号 地址开始, 每个地址对应于数据区的簇号, FAT 表中的地址编号与数据区中的簇号相同。 称FAT 中的这些四字节一组划分的项的地址为 FAT 表项, FAT表项中记录的值为FAT 表项值。

     

    当文件系统创建时(就是格式化操作时), 分配给FAT 区域的空间将会被清空, 在FAT1与FAT2 的0号和1号表项写入特定值。 由于创建文件系统的同时,也会创建根目录, 也就是为根目录分配了一个簇空间,通常为2号簇,所以2号簇所对应的“2号FAT表项”也会被写入一个结束标记

     

    如果某个簇未被使用,他所对应的FAT 表项内的FAT 表项值即用0进行填充,表示该FAT 表项所对应的簇未被分配使用

     

    当某个簇被分配使用时,那么他所对应的FAT表项的值为文件的下一个存储文件的簇号。 如果该文件结束于该簇,则在它的FAT表项中记录的是一个文件结束标记,对于FAT32 而言,代表文件结束的FAT表项值为0x0FFFFFFF

     

    如果某个簇存在坏扇区,则整个簇会用FAT表项值 0x0FFFFFF7 标记为坏簇,不再使用,这个坏簇标记就记录在它所对应的FAT表项中。

     

    ·由于簇号起始于2, 所以FAT表的0号表项与1号表项不予任何簇对应。 FAT32 的0号表项值总是“F8FFFF0F”

    注意: 可以搜索扇区偏移0字节处的该值(F8FFF0F)以查找FAT表。

     

    1号表项可能被用于记录“脏标志”, 以说明文件系统没有被正常卸载或者磁盘表面存在错误。 不过此值似乎不重要,正常情况下,1号表项值“FFFFFFFF”或“FFFFFF0F”。

     

    项内容填写规则:

     

          在文件系统中新建文件时,如果新建的文件只有一个簇,为其分配的簇所对应的FAT表项将会被写入结束标记。如果新建的文件不只占用一个簇,则在其所占用的每个簇对应的FAT表项中写入为其分配的下一个簇的簇号,在最后一个簇对应的FAT 表项中写入结束标记。

     

    新建目录时,只为其分配一个簇的空间,对应的FAT 表项中写入结束标记。当目录增大超过一个簇的大小时,将会在空闲空间中继续为其分配一个簇,并在FAT 表中为其建立FAT 表链以描述它所占用的簇的情况。

     

    对文件或目录进行删除操作时,他们所对应的FAT 表项将会被清空,设置为0以表示其所对应的簇处于未分配的状态。

     

    3、 FAT表的使用

     

    一个文件的"起始簇号"记录在它的目录项中, 该文件的 "其他簇" 则用一个簇连结构记录在FAT 表中。

     

          如果一个簇所对应的FAT表项的表项值为非零, 则表明该簇已经被分配使用了,但是这时表项值可能为两种情况,一个是一个文件的下一个簇号值,也有可能是一个文件的结束标记0x0FFFFFFF,或者是一个坏簇标记0x0FFFFFF7 。

    如果要寻找一个文件的下一个簇,只需要查看该文件的目录项中描述的起始簇号所对应的FAT项,如果该文件只有一个簇,则此处的值为一个结束标记0x0FFFFFFF;如果该文件不只一个簇,则此处的值是它的下一个簇的簇号。

     

    查询簇连接结构模拟步骤:

     

    当我们要寻找某个文件时, 首先从该文件的“目录项”中获取该文件的第一“簇”的簇号,然后根据“第一簇”的“簇号 N”,然后根据N 从FAT区的FAT表找出N簇号所对应的FAT 表项,查看FAT 表项的内容:

    若是文件结束,该表项值为 0x0FFFFFFF; 若是没有结束,而该文件的大小超出一个簇,则N所对应的FAT表项的表项值为该文件下一个簇的簇号,然后再找到下一个簇号N+1 所对应的FAT表项,查看其表项值,依次类推,就推出了一个文件在FAT表中的 簇链连接结构; 也或者表项值为 0xFFFFFFF7 坏簇标识。

     

    其他

    查找FAT 表项: 要找到一个簇的FAT 表项,只要用他的 簇号乘以每个FAT 表项的字节数即可 。对于FAT32而言,每个FAT 表项占用4个四字节, 如果我们寻找9号簇的表项位置,则用 4*9=36,也就是说位于FAT 表内偏移36(0x24)字节处。

     

    注意:

    WinHex 提供了直接跳转到某个指定FAT 表项的功能。

     

    文件系统大小的上限值却绝育FAT 项的大小。 簇链中的每个FAT 项记录着下一个簇的簇地址,FAT 项所能表示的数字有一个上限,这个上限也就是文件系统中的最大簇号。 FAT 32文件系统的FAT 项只使用了32bit 中的28bit ,因此只能描述 268435456个簇(实际上还要考略小于这个值,因为这其中还包含了结束标志及坏簇标志的保留值)。

     

    操作系统通过检测FAT 表中的表项来确定文件系统中的各个簇是否被分配使用。当我们在Windows 下右击某个FAT 分区查看其属性时,显示的已用空间和未用空间就是根据FAT 表统计而来的。

     

     

     

    数据区分析

     

    作用: FAT32 的“数据区域”是真正用来存储用户数据的区域。 数据区域紧跟在FAT 区域之后,数据区域被划分为一个个的簇,所有的簇从2号开始编码,也就是说2号簇就是数据区域的起始位置。数据区的内容主要由三部分组成:根目录,子目录和文件内容。在数据区中是以“簇”为单位进行存储的,2号簇被分配给根目录使用。

     

    1、根目录

     

    虽然原则上FAT32 允许根目录位于数据区中的任何位置,但是“通常情况”下位于“2号簇”。也就是说根目录位于数据区域的起始位置。

     

    定位根目录

    首先要明确: 在FAT文件系统中,寻找第一簇(即2号簇)的位置是也就是寻找数据区的开始位置,并不是件简单的事情,因为它不是位于文件系统的起始处,而是位于数据区域的起始处。数据区域之前有保留区域和FAT 区域, 这两个区域都不使用FAT 表进行管理。因此,数据区以前的区域只能使用扇区地址(逻辑扇区地址),而无法使用簇地址。所以说,并不是每个逻辑卷地址都相应的有一个“逻辑文件系统地(内部以簇为单位)址”,FAT 系统就是个特别的例子。数据区的偏移如下计算可得:

     

    数据区偏移 = (保留扇区数 +  FAT表扇区数 * FAT表个数(通常为2)

    + (起始簇号-2) * 每簇扇区数) * 每扇区字节数

     

           所以一般情况下,数据区的开始为根目录。

    根目录分析

    作用: 根目录在文件系统创建时即已被创建,其目的就是存储“子目录”(也称为文件夹)或 文件的“目录项”。

     

    目录项大小:每个目录项的大小为 “32个字节”。

     

    在文件系统刚刚创建,还没有存储任何数据时,根目录下没有任何内容,文件系统只是为根目录分配了一个簇的空间(通常为2号簇),将结束标记0x0FFFFFFF 写入该簇对应的FAT 表项,表示该簇已经被分配使用。这时候根目录分配的空间没有任何内容。 但是如果创建文件系统时指定卷标,则会在根目录下为其建立一个卷标目录项,该目录项占用“根目录”中的第一个目录项位置。

     

    在根目录下新建目录或文件时,其实就是在为根目录分配的簇中为其建立目录项,如果需要则在未分配空间为其分配空间已存储数据内容。

     

    目录项的基本特性

     

    不管是根目录下还是子目录下的目录项,都有以下基本特性:

     

    1. 为文件或子目录分配的第一个簇的簇号,记录在它的目录项中,其他后续簇则由“FAT 表”中的“FAT表链”进行跟踪。

     

    1. 目录项中除了记录文件或子目录的第一个簇(起始簇号)外,还记录它的名字、大小(子目录没有大小)、时间等元数据信息。

     

    1. 每个子目录或文件除了有一个短文件名目录项外,还会有一个长文件名目录项。

     

    1. 短文件名目录项固定占用32个字节,长文件名目录项根据需要占用1个或若干个32字节。

     

    1. 对于同一个子目录或文件,它的长文件名目录放在他的短文件名目录项之前,如果长文件名目录项占用多个32字节,则按照倒序存放于短文件名目录项之前。

     

    2、子目录

     

    定义: 所有除根目录以外的目录度都称为子目录,不管是根目录的子目录,还是根目录的子目录的子目录。

     

    过程: 子目录是在存储过程中根据用户需要建立的,随着目录建立的同时,会在为其分配的簇空间开始处建立“两个目录项”来描述 “子目录本身和其父目录” 的信息,以使父子目录间建立起联系。

     

    FAT32文件系统中,在创建文件系统时就创建了根目录并且分配存储空间之外,其他所有目录只有在使用过程中根据需要建立。新建一个子目录时,在其父目录建立目录项,在空闲空间中为其分配一个簇,并对簇清零操作,同时将这个簇号记录在它的目录项。

     

    创建子目录时在为其父目录分配的簇中建立目录项,目录项描述了该子目录的起始簇号; 在为子目录建立目录项的同时,也在为子目录分配的簇中,使用前两个目录项描述他与父目录的关系。

     

    提示: 子目录的目录项中并不描述子目录的大小,要想知道子目录所占用的空间大小,可以从他的目录项中获得他的起始簇号并跟踪它的FAT 表链直到遇到结束标记为止。

     

    3、总结:

     

    目录项: 32字节长(短名称目录项32字节,长名称目录项1个或多个32字节;长名称目录项在前;若是长名称目录项长度为多个32字节则倒序排列,依然位于读文件名目录项前) 、 每个目录或者文件(文件夹)都有与其对应的目录项 、 作用(记住目录或文件夹的起始簇号)以及一些文件大小,文件名 等信息

     

    根目录

     

    位置:FAT32 文件系统的根目录位于文件系统的数据区的第一簇(2号簇,也就是数据区的起始簇)

     

    根目录创建时期: 当创建文件系统过程中,自动创建根目录(若当下根目录中未创建文件以及目录,则2号簇所对应的FAT 表项值为 0x0fffffff结束标记)

     

    根目录作用:存储根文件系统中子目录以及文件的目录项。

     

    文件系统中除去根目录以外,其他目录是子目录;目录与在其下创建的目录为父子关系;

     

    根目录创建子目录或文件的意义: 在根目录中创建文件或子目录实质含义是在为根目录分配的簇中创建子目录/文件的目录项。

     

    根目录创建子目录过程:  除根目录是是在创建文件系统时便创建完成外,(其他非根目录的均为)子目录,所有的子目录都是要在使用时才创建,子目录创建时同时在其为根目录中分配的簇中创建了子目录的目录项,并且同时在为该子目录分配的簇中创建目录项(使用前两个目录项描述该子目录与其父目录之间的关系);在子目录中创建下一级子目录或文件时,在为该子目录分配的簇中创建目录项,便需从“第三个目录项” 向后排序了。

     

     

    短文件名目录项

    1. 短文件名目录项参数

           目录区是由一个个目录项构成,类似于FAT表。其中每一个目录项占用32个字节,可以是代表长文件名目录项、文件目录项、子目录项等。对于短文件名格式的目录项,其参数的含义如下所示:

    https://images0.cnblogs.com/i/545535/201408/082122503812500.jpg

    FAT32短文件名目录项参数表

     

    1. 参数解释

    时间格式:占2byte  

    5位:代表小时 

    6位:代表分钟

    5位:代表秒的1/2

    日期格式:占2byte

    7:代表从1980年开始的年数

    4:代表月份

    5:代表日期

     

    文件起始地址偏移

     

    文件起始地址   =   (保留扇区数 + FAT表扇区数 * FAT表个数+

       (文件起始簇号-2)*每簇扇区数)*每扇区字节数

     

    文件名大小写:

    FAT32根据文件目录项判断文件名大小写的方法(仅限8.3命名规则):

    文件目录项0CH字节的值:

    1. 此值为18H时,文件名和扩展名都小写。

    2. 此值为10H时,文件名大写而扩展名小写。

    3. 此值为08H时,文件名小写而扩展名大写。

    4. 此值为00H时,文件名和扩展名都大写。

     

    长文件名目录项

    1. 长文件名目录项参数     

       支持支持长文件名是 FAT32的一个很重要的特性。长文件名也是记录在目录项当中的,区别与短目录项的是,前者可能会占据好几个目录项。为了兼容低版本的OS或程序能正确读取长文件名文件,系统自动为所有长文件名文件创建了一个对应的短文件名,使对应数据既可以用长文件名寻址,也可以用短文件名寻址。不支持长文件名的OS或程序会忽略它认为不合法的短文件名字,而支持长文件名的OS或程序则会以长文件名为显式项来记录和编辑,并隐藏起短文件名。

    当创建一个长文件名文件时,系统会自动加上对应的短文件名,其原则如下:

        (1)、取长文件名的前6个字符加上"~1"形成短文件名,扩展名不变。

        (2)、如果已存在这个文件名,则符号"~"后的数字递增,直到5。

    那么系统是如何判断当前目录项是短文件名目录项呢还是长文件名目录项,这里关键是看目录项的第12个字节的值,如果为0x0F时则系统认为是长目录项。而如果是旧版本的系统看到第12个字节是0x0F则认为是异常而忽略掉。这里可以回过头去看一下短文件名目录项,第12个字节是文件属性字节,0x0F即为全1是无效的,所以系统认为是异常。系统将长文件名以13个字符为单位进行切割,每一组占据一个目录项。所以可能一个文件需要多个目录项,这时长文件名的各个目录项按倒序排列在目录表中,以防与其他文件名混淆。

     

    注意:长文件名都是以unicode码存储。即每个字符占两个字节。每个长目录项可以最多存储长文件名的13个字符。文件名的位置也是不连续的。

     

    https://images0.cnblogs.com/i/545535/201408/082156054751714.jpg

    u盘的根目录为JING,有两个文件第一个0123456789ABCDEFGHIJK.txt 第二个

    abcdefg.txt 都是空文件。

    由于长文件名长度为25(包括扩展名),所以需要2个长目录项。包括它本身的短目录项,共3个目录项。

    注意:长文件名需要有结束字符0000,之后没有用的都置FFFF。否则会出现错误。如果刚好是13的倍数,则不可以用结束符0000

     

    校验值计算:

    unsigned char ChkSum (unsigned char *pFcbName)

    {

    short FcbNameLen;

    unsigned char Sum;  //必须为无符号型.

    Sum = 0;

    for (FcbNameLen=11; FcbNameLen!=0; FcbNameLen--)

    {

    Sum = ((Sum & 1) ? 0x80 : 0) + (Sum >> 1) + *pFcbName++;

    }

    return (Sum);

    }

    校验值在同一个文件名的每个长文件目录项都是一样的,因为都是计算该长文件名的校验值。校验的都是其短文件名目录中的内容,即校验其文件名的前6个字符加上~1和扩展名共11个字符长度。如上图为3a,其校验的内容为“012345~1TXT”共11个字符。

     

    FAT32删除文件

    FAT32文件系统在删除文件的时候,仅仅是对其文件名进行处理,对于内容是不做任何处理的。对文件名的处理,就是把其所相关的所有Directory Entry的第一个byte都置为0xE5,此时就认为该文件已经被删除了。

    展开全文
  • RFAT 得名于需要健壮的 FAT 实现。 手头的原始问题是在具有有限 RAM 的嵌入式系统上实现低延迟日志记录。 虽然有许多可用的替代方案,但似乎没有一个特别适合 SDCARD,或者处理 SPI/SDIO 总线连接可能容易出错的事实...
  • SD卡和FAT32的一些资料

    2018-03-17 23:49:27
    收集的SD卡和FAT32的一些资料,收集的SD卡和FAT32的一些资料
  • FAT12:用C语言实现FAT 12系统仿真的实现
  • FAT16和FAT32从原理上看是同一类技术,放在一起分析,有助于了解其细节差异; 先回归一下FAT16、FAT32分区的大致结构如下: 从分区结构上看,FAT16和FAT32目录结构比较不一样的地方在于: FAT16多了一个根目录...

    一、前言

    FAT16和FAT32从原理上看是同一类技术,放在一起分析,有助于了解其细节差异;

    先回归一下FAT16、FAT32 分区的大致结构如下:

    从分区结构上看,FAT16和FAT32目录结构比较不一样的地方在于:

    FAT16 多了一个根目录区,根目录区由FDT目标表项组成,每一个分区表项占32字节;由于根目录区大小在格式化的时候就固定下来了,所以根目录下的文件夹和文件的个数是固定了,取决于DBR中根目录项个数的配置,最多只能是512个

    那么子目录存放在哪里?    存放在数据区中

    FAT32的根目录存放在哪里? 一般在数据区的起始簇中;

    那目录项呢?  请看接下来描述

     

    二、FAT16的目录项

    FAT 文件系统的一个重要思想是把目录(文件夹)当作一个特殊的文件来处理。

    2.1 目录项分类

    • 短文件名目录项
    • 长文件名目录项
    • “.”目录项和
    • “..”目录项
    • 卷标目录项

    说明: 虽然根目录不同于其他目录或文件,但根目录组织形式和普通的目录(文件夹)并没有不同。

    系统以32字节为单位分配给目录项的,最基本的描述如下:

    0x0~0x7 定义的8字节为文件名, 只有八个字节? 我们平时一个文件通常可不止这么长。

    答: 早期的FAT16 系统并没有长文件名一说,Windows操作系统已经完全支持在FAT16 上的长文件名了。关于对长文件名的支持;

     长文件名的支持:

    如果文件名超过8字节,系统根据文件名的长度,分配多个32字节的目录项用于保存长文件名,格式如下(图片来源网络):

    在这里插入图片描述

     为了兼容DOS与Winddows 3.x在Winddows 95以上的系统中,超过8.3格式的文件或目录实际存储着两个名字,一个短文件名和一个长文件名。当创建一个长文件名时,其对应的短文件名的处理有以下三个原则:

    A:系统取长文件名的前6个字符加上“~1”,形成短文件名,其扩展名保持不变

    B:如果已经存在这个名字的文件,数字自动加1,“~2”

    C:如果有DOS与Winddows 3.x的非法字符,以“­_”替代。

    例如,一个长文件名为 child_12345678abcd.txt, 实际存放如下(图片来源网络,由高地址往低地址):

    在这里插入图片描述

     

    ".",".."目录:

    在子目录所在的文件目录项区域中,总有两个特殊的目录,“.”目录项和“..”目录项可以用DOS命令的DIR查看到。

    说明

    A:“.”目录项所描述的起始簇号,是子目录本身所在簇号,

    B:“..”目录项所描述的起始簇号,是上一级目录的起始簇号,如果上级目录为根目录,则起始簇号被设置为0.

    C:这两个目录都大小被设置0,同其他的文件夹目录项一样。

    系统利用“.”目录项(当前目录)和“..”目录项实现目录之间的双向联系,从而把整个文件系统联系在一起。

     

    卷标目录项

             卷标可以被随时修改,存放在FDT中,

    A:卷标属于短文件名,最大支持11个字符。

    B:不记录起始簇号与大小

    C:不记录创建时间和最后访问时间,只记录修改时间

     

    三、删除文件或目录


    (i)短文件名的占的目录项第1个字节被改写成E5H。
    (ii)长文件名占的目录项第1个字节也被改写成E5H。
    (iii)子目录的中的文件:短文件名和长文件名的第1字节被改写为E5。
    (iv)子目录的中的文件的起始簇号的高2字节也被清0,此时此刻,子目录也不容易恢复。

     

     

     

     

     

    展开全文
  • FAT32格式算法

    2008-12-19 23:46:06
    介绍FAT32格式算法,英文版的pdf。 FAT32实际上是文件分区表采取的一种形式,它是相对于FAT16而言的
  • fat16和fat32.rar

    2008-07-18 23:33:02
    适用于usb,含有fat16和fat32.rar
  • FAT16和FAT32文件定位

    2018-12-21 22:46:40
    FAT文件系统的数据结构中有两个重要的结构:文件分配表目录项。 FAT16整体结构由DBR扇区、FAT表、根目录数据区组成。下面将详细介绍。 DBR扇区结构 其也称为引导扇区,由跳转指令JUMP,OEM厂商标志,BPB扩展...
  • FAT32文件系统

    2018-10-06 21:23:26
    FAT32文件系统FAT32文件系统FAT32是个非常有功劳的文件系统,Microsoft成功地设计并运用了它,直到今天NTFS铺天盖地袭来的时候,FAT32依然占据着Microsoft Windows文件系统中重要的地位。FAT32最早是出于FAT16不支持...
  • Iomega.FAT32.Formatter快速格盘FAT32

    热门讨论 2011-05-12 17:27:12
    Iomega.FAT32.Formatter快速格盘FAT32
  • FAT32文件系统结构

    2020-04-22 16:20:26
    FAT32文件系统详解,FAT(File Allocation Table,文件分配表)文件系统是 windows 操作系统所使用的一种文件系统,它的发展过程经历了 FAT12、FAT16、FAT32 三个阶段。本文详细介绍了FAT32文件系统数据结构。
  • FAT32文件系统程序说明,包含FAT32的系统设计结构及具体设计方案。
  • NTFS和FAT32的区别.doc

    2009-04-10 00:01:50
    NTFS和FAT32的区别.docNTFS和FAT32的区别.doc
  • fat32文件系统

    2017-05-09 15:56:23
    fat32文件系统
  • 万字透视FAT32系统 万字透视FAT32系统
  • FAT及FATFS资料合集FAT32简单教材文件系统详解FATFS浅谈FAT32中文版: FAT32中文版.pdf FAT32文件系统详解.pdf FAT32简单教材.pdf FatFs使用说明—基于SmartARMCortexM3-1700.pdf fatfs官方源码及学习网址.txt FATFS...
  • FAT32转NTFS方法

    2017-11-10 15:04:03
    FAT32转NTFS方法FAT32转NTFS方法FAT32转NTFS方法FAT32转NTFS方法

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 117,346
精华内容 46,938
关键字:

fat12和fat32