YAFFS2文件系统分析(转)

时间 2019-11-06

标签 yaffs2 yaffs 文件系统分析繁體版

原文原文链接

http://blog.chinaunix.net/uid-25314474-id-343665.htmlcss

1.前言
略。

2.yaffs 文件系统简介
按理说这里应该出现一些诸如“yaffs 是一种适合于 NAND Flash 的文件系统 XXXXX”之类
的字眼,不过考虑到网络上关于 yaffs/yaffs2 的介绍已经多如牛毛,因此同上,略。
3.本文内容组织

本文将模仿《linux 内核源代码情景分析》一书,以情景分析的方式对 yaffs2 文件系统的
源代码进行分析。首先将分析几组底层函数,如存储空间的分配和释放等;其次分析文件
逻辑地址映射;而后是垃圾收集机制;接下来......Sorry,本人还没想好。:-)

4.说明
由于 yaffs2 貌似还在持续更新中,因此本文所列代码可能和读者手中的代码不彻底一致。
另外,本文读者应熟悉 C 语言,熟悉 NAND Flash 的基本概念(如 block 和 page)。
Ok,步入正题。首先分析存储空间的分配。

5.NAND Flash 存储空间分配和释放
咱们知道,NAND Flash 的基本擦除单位是 Block,而基本写入单位是 page。yaffs2 在分配
存储空间的时候是以 page 为单位的,不过在 yaffs2 中把基本存储单位称为 chunk,和
page 是同样的大小,在大多数状况下和 page 是一个意思。在下文中咱们使用 chunk 这个
词,以保持和 yaffs2 的源代码一致。
咱们先看存储空间的分配(在 yaffs_guts.c 中。这个文件也是 yaffs2 文件系统的核心部分):
static int yaffs_AllocateChunk(yaffs_Device * dev, int useReserve,
yaffs_BlockInfo **blockUsedPtr)
{
int retVal;
yaffs_BlockInfo *bi;
if (dev->allocationBlock < 0) {
/* Get next block to allocate off */
dev->allocationBlock = yaffs_FindBlockForAllocation(dev);
dev->allocationPage = 0;
}
函数有三个参数,dev 是 yaffs_Device 结构的指针,yaffs2 用这个结构来记录一个 NAND
器件的属性(如 block 和 page 的大小)和系统运行过程当中的一些统计值(如器件中可用
chunk 的总数),还用这个结构维护着一组 NAND 操做函数(如读、写、删除)的指针。
整个结构体比较大,我们会按情景的不一样分别分析。useReserve 表示是否使用保留空间。
yaffs2 文件系统并不会将全部的存储空间所有用于存储文件系统数据,而要空出部分
block 用于垃圾收集时使用。通常状况下这个参数都是 0,只有在垃圾收集时须要分配存
储空间的状况下将该参数置 1。yaffs_BlockInfo 是描述 block 属性的结构,主要由一些统
计变量组成,好比该 block 内还剩多少空闲 page 等。咱们一样在具体情景中再分析这个结
构中的字段含义。
函数首先判断 dev->allocationBlock 的值是否小于 0。yaffs_Device 结构内的
allocationBlock 字段用于记录当前从中分配 chunk(page)的那个 block 的序号。当一
个 block 内的全部 page 所有分配完毕时,就将这个字段置为-1,下次进入该函数时就会
从新挑选空闲的 block。这里咱们假定须要从新挑选空闲 block,所以进入
yaffs_FindBlockForAllocation 函数:
[yaffs_AllocateChunk() => yaffs_FindBlockForAllocation()]
static int yaffs_FindBlockForAllocation(yaffs_Device * dev)
{
int i;
yaffs_BlockInfo *bi;
if (dev->nErasedBlocks < 1) {
/* Hoosterman we've got a problem.
* Can't get space to gc
*/
T(YAFFS_TRACE_ERROR,
(TSTR("yaffs tragedy: no more eraased blocks" TENDSTR)));
return -1;
}
dev->nErasedBlocks 记录着器件内全部可供分配的 block 的数量。若是该值小于 1,那显
然是有问题了。不但正常的分配请求没法完成,就连垃圾收集都办不到了。
for (i = dev->internalStartBlock; i <= dev->internalEndBlock; i++) {
dev->allocationBlockFinder++;
if (dev->allocationBlockFinder < dev->internalStartBlock
|| dev->allocationBlockFinder > dev->internalEndBlock) {
dev->allocationBlockFinder = dev->internalStartBlock;
internalStartBlock 和 internalEndBlock 分别是 yaffs2 使用的 block 的起始序号和结束
序号。也就是说 yaffs2 文件系统不必定要占据整个 Flash,能够只占用其中的一部分。
dev->allocationBlockFinder 记录着上次分配的块的序号。若是已经分配到系统尾部,就
从头从新开始搜索可用块。
bi = yaffs_GetBlockInfo(dev, dev->allocationBlockFinder);
if (bi->blockState == YAFFS_BLOCK_STATE_EMPTY) {
bi->blockState = YAFFS_BLOCK_STATE_ALLOCATING;
dev->sequenceNumber++;
bi->sequenceNumber = dev->sequenceNumber;
dev->nErasedBlocks--;
T(YAFFS_TRACE_ALLOCATE,
(TSTR("Allocated block %d, seq %d, %d left" TENDSTR),
dev->allocationBlockFinder, dev->sequenceNumber,
dev->nErasedBlocks));
return dev->allocationBlockFinder;
}
yaffs_GetBlockInfo 函数获取指向 block 信息结构的指针,该函数比较简单,就不详细介
绍了。yaffs_BlockInfo 结构中的 blockState 成员描述该 block 的状态,好比空,满,已
损坏,当前分配中,等等。由于是要分配空闲块,因此块状态必须是
YAFFS_BLOCK_STATE_EMPTY,若是不是,就继续测试下一个 block。找到之后将 block 状
态修改成 YAFFS_BLOCK_STATE_ALLOCATING,表示当前正从该 block 中分配存储空间。正
常状况下,系统中只会有一个 block 处于该状态。另外还要更新统计量 ErasedBlocks 和
sequenceNumber。这个 sequenceNumber 记录着各 block 被分配出去的前后顺序,之后在
垃圾收集的时候会以此做为判断该 block 是否适合回收的依据。
如今让咱们返回到函数 yaffs_AllocateChunk 中。yaffs_CheckSpaceForAllocation()函数
检查 Flash 上是否有足够的可用空间,经过检查后,就从当前供分配的 block 上切下一个
chunk:
if (dev->allocationBlock >= 0) {
bi = yaffs_GetBlockInfo(dev, dev->allocationBlock);
retVal = (dev->allocationBlock * dev->nChunksPerBlock) +
dev->allocationPage;
bi->pagesInUse++;
yaffs_SetChunkBit(dev, dev->allocationBlock,
dev->allocationPage);
dev->allocationPage++;
dev->nFreeChunks--;
/* If the block is full set the state to full */
if (dev->allocationPage >= dev->nChunksPerBlock) {
bi->blockState = YAFFS_BLOCK_STATE_FULL;
dev->allocationBlock = -1;
}
if(blockUsedPtr)
*blockUsedPtr = bi;
return retVal;
}
dev->allocationPage 记录着上次分配的 chunk 在 block 中的序号,每分配一次加 1。从这
里咱们能够看出,系统在分配 chunk 的时候是从 block 的开头到结尾按序分配的,直到一
个 block 内的全部 chunk 所有分配完毕为止。retVal 是该 chunk 在整个 device 内的总序
号。PagesInUse 记录着该 block 中已分配使用的 page 的数量。
系统在设备描述结构 yaffs_Device 中维护着一张位图,该位图的每一位都表明着 Flash
上的一个 chunk 的状态。yaffs_SetChunkBit()将刚分配获得的 chunk 在位图中的对应位置
1,代表该块已被使用。更新一些统计量后,就能够返回了。
看过 chunk 分配之后,咱们再来 chunk 的释放。和 chunk 分配不一样的是,chunk 的
释放在大多数状况下并不释放对应的物理介质,这是由于 NAND 虽然能够按 page 写,但
只能按 block 擦除,因此物理介质的释放要留到垃圾收集或一个 block 上的全部 page 所有
变成空闲的时候才进行。根据应用场合的不一样,chunk 的释放方式并不惟一,分别由
yaffs_DeleteChunk 函数和 yaffs_SoftDeleteChunk 函数完成。咱们先看
yaffs_DeleteChunk:
void yaffs_DeleteChunk(yaffs_Device * dev, int chunkId, int markNAND, int lyn)
chunkId 就是要删除的 chunk 的序号,markNand 参数用于 yaffs 一代的代码中,yaffs2 不
使用该参数。
参数 lyn 在调用该函数时置成当前行号(__LINE__),用于调试。
首先经过 yaffs_GetBlockInfo 得到 chunk 所在 block 的信息描述结构指针,而后就跑到
else 里面去了。if 语句的判断条件中有一条!dev->isYaffs2,因此对于 yaffs2 而言是不
会执行 if 分支的。在 else 分支里面只是递增一下统计计数就出来了,咱们接着往下看。
if (bi->blockState == YAFFS_BLOCK_STATE_ALLOCATING ||
bi->blockState == YAFFS_BLOCK_STATE_FULL ||
bi->blockState == YAFFS_BLOCK_STATE_NEEDS_SCANNING ||
bi->blockState == YAFFS_BLOCK_STATE_COLLECTING) {
dev->nFreeChunks++;
yaffs_ClearChunkBit(dev, block, page);
bi->pagesInUse--;
if (bi->pagesInUse == 0 &&
!bi->hasShrinkHeader &&
bi->blockState != YAFFS_BLOCK_STATE_ALLOCATING &&
bi->blockState != YAFFS_BLOCK_STATE_NEEDS_SCANNING) {
yaffs_BlockBecameDirty(dev, block);
}
} else {
/* T(("Bad news deleting chunk %d\n",chunkId)); */
}
首先要判断一下该 block 上是否确实存在着可释放的 chunk。block 不能为空,不能是坏块。
YAFFS_BLOCK_STATE_NEEDS_SCANNING 代表正对该块进行垃圾回收,咱们后面会分析;
YAFFS_BLOCK_STATE_NEEDS_SCANNING 在我手上的源代码中彷佛没有用到。
经过判断之后,所作的工做和 chunk 分配函数相似,只是一个递增统计值,一个递减。递
减统计值之后还要判断该 block 上的 page 是否已所有释放,如果已所有释放,而且不是
当前分配块,就经过 yaffs_BlockBecameDirty 函数删除该 block,只要能经过删除操做
(不是坏块),该 block 就又能够用于分配了。
相比较来讲,yaffs_SoftDeleteChunk 所作的工做就简单多了。关键的代码只有两行:
static void yaffs_SoftDeleteChunk(yaffs_Device * dev, int chunk)
{
......
theBlock->softDeletions++;
dev->nFreeChunks++;
......
}
这里递增的是 yaffs_blockInfo 结构中的另外一个统计量 softDeletions,而没有修改
pagesInUse 成员,也没有修改 chunk 状态位图。那么,这两个函数的应用场合有什么区别
呢?
通常来讲,yaffs_DeleteChunk 用于文件内容的更新。好比咱们要修改文件中的部份内容,
这时候 yaffs2 会分配新的 chunk,将更改后的内容写入新 chunk 中,原 chunk 的内容天然
就没有用了,因此要将 pageInUse 减 1,并修改位图;
yaffs_SoftDeleteChunk 用于文件的删除。yaffs2 在删除文件的时候只是删除该文件在内
存中的一些描述结构,而被删除的文件所占用的 chunk 不会当即释放,也就是不会删除
文件内容,在后续的文件系统操做中通常也不会把这些 chunk 分配出去,直到系统进行垃
圾收集的时候才有选择地释放这些 chunk。熟悉 DOS 的朋友可能还记得,DOS 在删除的文
件的时候也不会当即删除文件内容,只是将文件名的第一个字符修改成 0xA5,过后还可
以恢复文件内容。yaffs2 在这点上是相似的。

6.文件地址映射
上面说到,yaffs 文件系统在更新文件数据的时候,会分配一块新的 chunk,也就是说,
一样的文件偏移地址,在该地址上的数据更新前和更新后,其对应的 flash 上的存储地
址是不同的。那么,如何根据文件内偏移地址肯定 flash 存储地址呢?最容易想到的办
法,就是在内存中维护一张映射表。因为 flash 基本存储单位是 chunk,所以,只要将以
chunk 描述的文件偏移量做为表索引,将 flash chunk 序号做为表内容,就能够解决该问
题了。可是这个方法有几个问题,首先就是在作 seek 操做的时候,要从表项 0 开始按序搜
索,对于大文件会消耗很多时间;其次是在创建映射表的时候,没法预计文件大小的变
化,因而就可能在后来的操做中频繁释放分配内存以改变表长,形成内存碎片。yaffs 的
解决方法是将这张大的映射表拆分红若干个等长的小表,并将这些小表组织成树的结构,
方便管理。咱们先看小表的定义:
union yaffs_Tnode_union {
union yaffs_Tnode_union *internal[YAFFS_NTNODES_INTERNAL];
}
YAFFS_NTNODES_INTERNAL 定义为(YAFFS_NTNODES_LEVEL0 / 2),而
YAFFS_NTNODES_LEVEL0 定义为 16,因此这其实是一个长度为 8 的指针数组。无论是叶
子节点仍是非叶节点,都是这个结构。当节点为非叶节点时,数组中的每一个元素都指向
下一层子节点;当节点为叶子节点时,该数组拆分为 16 个 16 位长的短整数(也有例外,后
面会说到),该短整数就是文件内容在 flash 上的存储位置(即 chunk 序号)。至于如何
经过文件内偏移找到对应的 flash 存储位置,源代码所附文档
(Development/yaffs/Documentation/yaffs-notes2.html)已经有说明,俺就不在此处饶
舌了。下面看具体函数。
为了行文方便,后文中将 yaffs_Tnode 这个指针数组称为“一组”Tnode,而将数组
中的每一个元素称为“一个”Tnode。树中的每一个节点,都是“一组”Tnode。
先看映射树的节点的分配。
static yaffs_Tnode *yaffs_GetTnode(yaffs_Device * dev)
{
yaffs_Tnode *tn = yaffs_GetTnodeRaw(dev);
if(tn)
memset(tn, 0, (dev->tnodeWidth * YAFFS_NTNODES_LEVEL0)/8);
return tn;
}
调用 yaffs_GetTnodeRaw 分配节点,而后将获得的节点初始化为零。
static yaffs_Tnode *yaffs_GetTnodeRaw(yaffs_Device * dev)
{
yaffs_Tnode *tn = NULL;
/* If there are none left make more */
if (!dev->freeTnodes) {
yaffs_CreateTnodes(dev, YAFFS_ALLOCATION_NTNODES);
}
当前全部空闲节点组成一个链表,dev->freeTnodes 是这个链表的表头。咱们假定已经没
有空闲节点可用,需经过 yaffs_CreateTnodes 建立一批新的节点。
static int yaffs_CreateTnodes(yaffs_Device * dev, int nTnodes)
{
......
tnodeSize = (dev->tnodeWidth * YAFFS_NTNODES_LEVEL0)/8;
newTnodes = YMALLOC(nTnodes * tnodeSize);
mem = (__u8 *)newTnodes;
上面说过,叶节点中一个 Tnode 的位宽默认为 16 位,也就是能够表示 65536 个 chunk。对
于时下的大容量 flash,chunk 的大小为 2K,因此在默认状况下 yaffs2 所能寻址的最大
flash 空间就是 128M。为了能将 yaffs2 用于大容量 flash 上,代码做者试图经过两种手段
解决这个问题。第一种手段就是这里的 dev->tnodeWidth,经过增长单个 Tnode 的位宽,
就能够增长其所能表示的最大 chunk Id;另外一种手段是咱们后面将看到的 chunk group,
经过将若干个 chunk 合成一组用同一个 id 来表示,也能够增长系统所能寻址的 chunk 范围。
俺为了简单,分析的时候不考虑这两种状况,因此 tnodeWidth 取默认值 16,也不考虑将
多个 chunk 合成一组的状况,只在遇到跟这两种状况有关的代码时做简单说明。
在 32 位的系统中,指针的宽度为 32 位,而 chunk id 的宽度为 16 位,所以相同大小的
Tnode 组,能够用来表示 N 个非叶 Tnode(做为指针使用),也能够用来表示 N * 2 个叶子
Tnode(做为 chunk id 使用)。代码中分别用 YAFFS_NTNODES_INTERNAL 和
YAFFS_NTNODES_LEVEL0 来表示。前者取值为 8,后者取值为 16。从这里咱们也能够看出
若将 yaffs2 用于 64 位系统须要做哪些修改。针对上一段叙述的问题,俺觉得在内存不紧
张的状况下,不如将叶节点 Tnode 和非叶节点 Tnode 都设为一个指针的长度。
分配获得所需的内存后,就将这些空闲空间组成 Tnode 链表:
for(i = 0; i < nTnodes -1; i++) {
curr = (yaffs_Tnode *) &mem[i * tnodeSize];
next = (yaffs_Tnode *) &mem[(i+1) * tnodeSize];
curr->internal[0] = next;
}
每组 Tnode 的第一个元素做为指针指向下一组 Tnode。完成链表构造后,还要递增统计量,
并将新获得的 Tnodes 挂入一个全局管理链表 yaffs_TnodeList:
dev->nFreeTnodes += nTnodes;
dev->nTnodesCreated += nTnodes;
tnl = YMALLOC(sizeof(yaffs_TnodeList));
if (!tnl) {
T(YAFFS_TRACE_ERROR,
(TSTR
("yaffs: Could not add tnodes to management list" TENDSTR)));
} else {
tnl->tnodes = newTnodes;
tnl->next = dev->allocatedTnodeList;
dev->allocatedTnodeList = tnl;
}
回到 yaffs_GetTnodeRaw,建立了若干组新的 Tnode 之后,从中切下所需的 Tnode,并修
改空闲链表表头指针:
if (dev->freeTnodes) {
tn = dev->freeTnodes;
dev->freeTnodes = dev->freeTnodes->internal[0];
dev->nFreeTnodes--;
}
至此,分配工做就完成了。相比较来讲,释放 Tnodes 的工做就简单多了,简单的链表和
统计值操做:
static void yaffs_FreeTnode(yaffs_Device * dev, yaffs_Tnode * tn)
{
if (tn) {
tn->internal[0] = dev->freeTnodes;
dev->freeTnodes = tn;
dev->nFreeTnodes++;
}
}
看过 Tnode 的分配和释放,咱们再来看看这些 Tnode 是如何使用的。在后文中,我
们把以 chunk 为单位的文件内偏移称做逻辑 chunk id,文件内容在 flash 上的实际存储位
置称做物理 chunk id。先看一个比较简单的函数。
void yaffs_PutLevel0Tnode(yaffs_Device *dev, yaffs_Tnode *tn, unsigned pos,
unsigned val)
这个函数将某个 Tnode 设置为指定的值。tn 是指向一组 Tnode 的指针;pos 是所要设置的
那个 Tnode 在该组 Tnode 中的索引;val 就是所要设置的值,也就是物理 chunk id。函数
名中的 Level0 指映射树的叶节点。函数开头几行以下:
pos &= YAFFS_TNODES_LEVEL0_MASK;
val >>= dev->chunkGroupBits;
bitInMap = pos * dev->tnodeWidth;
wordInMap = bitInMap /32;
bitInWord = bitInMap & (32 -1);
mask = dev->tnodeMask << bitInWord;
上面说过,一组 Tnode 中的 8 个指针在叶节点这一层转换成 16 个 16 位宽的 chunk Id,因
此须要 4 位二进制码对其进行索引,这就是 YAFFS_TNODES_LEVEL0_MASK 的值。咱们还说
过这个 16 位值就是 chunk 在 flash 上的序号,当 flash 容量比较大, chunk 数量多时,16
位可能没法给 flash 上的全部 chunk 编号,这种状况下能够增长 chunk id 的位宽,具体位
宽的值记录在 dev->tnodeWidth 中。yaffs2 容许使用非字节对齐的 tnodeWidth,所以可
能出现某个 chunk id 跨 32 位边界存储的状况。因此在下面的代码中,须要分边界前和边
界后两部分处理:
map[wordInMap] &= ~mask;
map[wordInMap] |= (mask & (val << bitInWord));
if(dev->tnodeWidth > (32-bitInWord)) {
bitInWord = (32 - bitInWord);
wordInMap++;;
mask = dev->tnodeMask >> (/*dev->tnodeWidth -*/ bitInWord);
map[wordInMap] &= ~mask;
map[wordInMap] |= (mask & (val >> bitInWord));
}
if 语句判断当前 chunk 序号是否跨越当前 32 位边界。整个代码初看起来比较难理解,其
实只要将 dev->tnodeWidth 以 16 或 32 代入, 就很好懂了。还有一个相似的函数
yaffs_GetChunkGroupBase,返回由 tn 和 pos 肯定的一组 chunk 的起始序号,就不详细分
析了。
如今咱们假设有这样一个情景:已知文件偏移地址,要找到 flash 上对应的存储地址,该
怎么作呢?这项工做的主体是由函数 yaffs_FindLevel0Tnode 完成的。
static yaffs_Tnode *yaffs_FindLevel0Tnode(yaffs_Device * dev,
yaffs_FileStructure * fStruct,
__u32 chunkId)
{
yaffs_Tnode *tn = fStruct->top;
__u32 i;
int requiredTallness;
int level = fStruct->topLevel;
函数参数中,fStruct 是指向文件描述结构的指针,该结构保存着文件大小、映射树层高、
映射树顶层节点指针等信息。chunkId 是逻辑 chunk id。
fStruct->top 是映射树顶层节点指针,fStruct->topLevel 是映射树层高。注意:当只有
一层时,层高为 0。
/* First check we're tall enough (ie enough topLevel) */
i = chunkId >> YAFFS_TNODES_LEVEL0_BITS;
requiredTallness = 0;
while (i) {
i >>= YAFFS_TNODES_INTERNAL_BITS;
requiredTallness++;
}
if (requiredTallness > fStruct->topLevel) {
/* Not tall enough, so we can't find it, return NULL. */
return NULL;
}
在看这段代码以前,咱们先用一个例子来回顾一下映射树的组成。假定咱们有一个大小
为 128K 的文件,flash 的 page 大小为 2K,那么咱们就须要 64 个 page(或者说 chunk)来
存储该文件。一组 Tnode 的 size 是 8 个指针,或者 16 个 16 位整数,因此咱们须要 64 / 16
= 4 组 Tnode 来存储物理 chunk 序号。这 4 组 Tnode 就是映射树的叶节点,也就是 Level0
节点。因为这 4 组 Tnode 在内存中不必定连续,因此咱们须要另一组 Tnode,将其做为
指针数组使用,这个指针数组的前 4 个元素分别指向 4 组 Level0 节点,而 fStruct->top
就指向这组做为指针数组使用的 Tnode。随着文件长度的增大,所需的叶节点越多,非叶
节点也越多,树也就越长越高。
回过头来看代码,首先是检查函数参数 chunkId 是否超过文件长度。做为非叶节点使用的
Tnode 每组有 8 个指针,须要 3 位二进制码对其进行索引,所以树每长高一层,逻辑
chunkId 就多出 3 位。相反,每 3 位非零 chunkId 就表明一层非叶节点。while 循环根据这
个原则计算参数 chunkId 所对应的树高。若是树高超过了文件结构中保存的树高,那就
说明该逻辑 chunkId 已经超出文件长度了。经过文件长度检查以后,一样根据上面的原则,
就能够找到逻辑 chunkId 对应的物理 chunkId 了。具体的操做经过一个 while 循环完成:
/* Traverse down to level 0 */
while (level > 0 && tn) {
tn = tn->
internal[(chunkId >>
( YAFFS_TNODES_LEVEL0_BITS +
(level - 1) *
YAFFS_TNODES_INTERNAL_BITS)
) &
YAFFS_TNODES_INTERNAL_MASK];
level--;
}
return tn;
将返回值和逻辑 chunk id 做为参数调用 yaffs_GetChunkGroupBase,就能够获得物理
chunk id 了。
下面咱们看另外一个情景,看看当文件长度增长的时候,映射树是如何扩展的。主要
函数为
static yaffs_Tnode *yaffs_AddOrFindLevel0Tnode(yaffs_Device * dev,
yaffs_FileStructure * fStruct,
__u32 chunkId,
yaffs_Tnode *passedTn)
函数的前几行和 yaffs_FindLevel0Tnode 同样,对函数参数做一些检查。经过检查以后,
首先看原映射树是否有足够的高度,若是高度不够,就先将其“拔高”:
if (requiredTallness > fStruct->topLevel) {
/* Not tall enough,gotta make the tree taller */
for (i = fStruct->topLevel; i < requiredTallness; i++) {
tn = yaffs_GetTnode(dev);
if (tn) {
tn->internal[0] = fStruct->top;
fStruct->top = tn;
} else {
T(YAFFS_TRACE_ERROR,
(TSTR("yaffs: no more tnodes" TENDSTR)));
}
}
fStruct->topLevel = requiredTallness;
}
for 循环完成增长新层的功能。新增的每一层都只有一个节点(即一组
Tnode),fStruct->top 始终指向最新分配的节点。将映射树扩展到所需的高度以后,再
根据须要将其“增肥”,扩展其“宽度”:
l = fStruct->topLevel;
tn = fStruct->top;
if(l > 0) {
while (l > 0 && tn) {
x = (chunkId >>
( YAFFS_TNODES_LEVEL0_BITS +
(l - 1) * YAFFS_TNODES_INTERNAL_BITS)) &
YAFFS_TNODES_INTERNAL_MASK;
if((l>1) && !tn->internal[x]){
/* Add missing non-level-zero tnode */
tn->internal[x] = yaffs_GetTnode(dev);
} else if(l == 1) {
/* Looking from level 1 at level 0 */
if (passedTn) {
/* If we already have one, then release it.*/
if(tn->internal[x])
yaffs_FreeTnode(dev,tn->internal[x]);
tn->internal[x] = passedTn;
} else if(!tn->internal[x]) {
/* Don't have one, none passed in */
tn->internal[x] = yaffs_GetTnode(dev);
}
}
tn = tn->internal[x];
l--;
}
}
上面“拔高”的时候是从下往上“盖楼”,这里“增肥”的时候是从上往下“扩展”。
tn->internal[x]为空表示下层节点还没有建立,须要经过 yaffs_GetTnode 分配之,就是“
增肥”了。若是函数参数 passedTn 有效,就用该组 Tnode 代替 level0 上原先的那组
Tnode;不然按需分配新的 Tnode 组。因此这里的函数名彷佛应该取做
yaffs_AddOrFindOrReplaceLevel0Tnode 更加恰当。不过这个新名字也太长了些......
树的建立、搜索和扩展说完了,下面该说什么?......对了,收缩和删除。不过看过建立搜
索扩展以后,收缩和删除已经没什么味道了。主要函数有:
yaffs_DeleteWorker()
yaffs_SoftDeleteWorker()
yaffs_PruneWorker()
前二者用于删除,第三个用于收缩。都是从 level0 开始,以递归的方式从叶节点向上删,
并释放被删除 Tnode 所对应的物理 chunk。递归,伟大的递归啊......俺不想把这篇文章作
成递归算法教程,除了递归这三个函数也就不剩啥了,因此一律从略。惟一要说的就是
yaffs_DeleteWorker 和 yaffs_SoftDeleteWorker 的区别,这两个函数很是相似,只是在
释放物理 chunk 的时候分别调用 yaffs_DeleteChunk 和 yaffs_SoftDeleteChunk。其中函
数 yaffs_DeleteWorker 在 yaffs2 中彷佛是不用的,而 yaffs_SoftDeleteWorker 主要用于
在删除文件时资源的释放。

7.文件系统对象
在 yaffs2 中,无论是文件仍是目录或者是连接,在内存都用一个结构体
yaffs_ObjectStruct 来描述。咱们先简要介绍一下这个结构体中的几个关键字段,而后
再来看代码。在后文中提到“文件”或“文件对象”,若不加特别说明,都指广义的“文
件”,既能够是文件,也能够是目录。
__u8 deleted:1; /* This should only apply to unlinked files. */
__u8 softDeleted:1; /* it has also been soft deleted */
__u8 unlinked:1; /* An unlinked file. The file should be in the unlinked
directory.*/
这三个字段用于描述该文件对象在删除过程当中所处的阶段。在删除文件时,首先要将文件
从原目录移至一个特殊的系统目录/unlinked,以此拒绝应用程序对该文件的访问,此时
将 unlinked 置 1;而后判断该文件长度是否为 0,若是为 0,该文件就能够直接删除,此时
将 deleted 置 1;若是不为 0,就将 deleted 和 softDelted 都置 1,代表该文件数据所占据
的 chunk 尚未释放,要留待后继处理。
struct yaffs_ObjectStruct *parent;
看名字就知道,该指针指向上层目录。
int chunkId;
每一个文件在 flash 上都有一个文件头,存储着该文件的大小、全部者、建立修改时间等信
息。chunkId 就是该文件头在 flash 上的 chunk 序号。
__u32 objectId; /* the object id value */
每个文件系统对象都被赋予一个惟一的编号,做为对象标识,也用于将该对象挂入一个
散列表,加快对象的搜索速度。
yaffs_ObjectType variantType;
yaffs_ObjectVariant variant;
前者表示该对象的类型,是目录、普通文件仍是连接文件。后者是一个联合体,根据对象
类型的不一样有不一样的解释。
其他的成员变量,咱们在后面结合函数一块儿分析。
下面咱们来看相关的函数。先看一个简单的:
static yaffs_Object *yaffs_CreateFakeDirectory(yaffs_Device * dev, int number,
__u32 mode)
所谓 Fake Directory,就是仅存在于内存中,用于管理目的的目录对象,好比咱们上面提
到的 unlinked 目录。这种类型的目录有一些特别的地方,如禁止改名、禁止删除等。由
于对象仅存在于内存中,所以不涉及对硬件的操做,因此函数体很简单。首先经过
yaffs_CreateNewObject 得到一个新对象,而后对其中的一些字段初始化。先把字段初始
化看一下,顺便再介绍一些字段:
renameAllowed 表示是否容许更名,对于 fake 对象为 0;
unlinkAllowed 表示是否容许删除,对于 fake 对象一样为 0;
yst_mode 就是 linux 中的访问权限位;
chunkId 是对象头所在 chunk,因为 fake 对象不占 flash 存储空间,因此置 0。
回过头来看 yaffs_CreateNewObject:
[yaffs_CreateFakeDirectory --> yaffs_CreateNewObject]
yaffs_Object *yaffs_CreateNewObject(yaffs_Device * dev, int number,
yaffs_ObjectType type)
{
yaffs_Object *theObject;
if (number < 0) {
number = yaffs_CreateNewObjectNumber(dev);
}
theObject = yaffs_AllocateEmptyObject(dev);
前面说过,每一个 yaffs_Object 都有一个惟一的序列号,这个序号既能够在建立对象的时
候由上层函数指定,也能够由系统分配。若是 number < 0,那就表示由系统分配。序列号
分配函数是 yaffs_CreateNewObjectNumber。咱们就不深刻到这个函数内部了,只说明一
下该函数作了些什么:
系统为了方便根据对象 id 找到对象自己,将每一个对象都经过指针 hashLink 挂入了一个散
列表,散列函数是 number % 256,因此这个散列表有 256 个表项。
yaffs_CreateNewObjectNumber 函数每次搜索 10 个表项,从中选取挂接链表长度最短的那
一项,再根据表索引试图计算出一个和该索引上挂接对象的 id 号不重复的 id。
分配到了 id 号和空闲对象后,再根据对象类型的不一样做不一样的处理。咱们主要关心两种
状况,就是对象类型分别为文件和目录的时候:
case YAFFS_OBJECT_TYPE_FILE:
theObject->variant.fileVariant.fileSize = 0;
theObject->variant.fileVariant.scannedFileSize = 0;
theObject->variant.fileVariant.shrinkSize = 0xFFFFFFFF; /* max __u32 */
theObject->variant.fileVariant.topLevel = 0;
theObject->variant.fileVariant.top = yaffs_GetTnode(dev);
break;
case YAFFS_OBJECT_TYPE_DIRECTORY:
INIT_LIST_HEAD(&theObject->variant.directoryVariant.children);
break;
fileSize 很好理解;topLevel 就是映射树层高,新建的文件层高为 0。还要预先分配一组
Tnode 供该对象使用。 scannedFileSize 和 shrinkSize 用于 yaffs2 初始化时的 flash 扫描
阶段,这里先跳过。若是该对象是目录,那么所作的工做只是初始化子对象(就是该目
录下的文件或子目录)双向链表指针,先后指针都指向链表头自身。
看过 Fake 对象建立,咱们再看看普通对象的建立。按对象类型的不一样,有四个函数分别
用于建立普通文件、目录、设备文件、符号连接和硬连接,它们分别是:
yaffs_MknodFile;
yaffs_MknodDirectory;
yaffs_MknodSpecial;
yaffs_MknodSymLink;
yaffs_Link
这四个函数最终都调用 yaffs_MknodObject 来完成建立对象的工做,只是调用参数不同。
static yaffs_Object *yaffs_MknodObject(yaffs_ObjectType type,
yaffs_Object * parent,
const YCHAR * name,
__u32 mode,
__u32 uid,
__u32 gid,
yaffs_Object * equivalentObject,
const YCHAR * aliasString, __u32 rdev)
函数参数中,前面几个都很好理解,分别是对象类型,上级目录对象,文件名,访问权限,
文件所属 user id 和 group id; equivalentObject 是建立硬连接时的原始文件对象;
aliasString 是 symLink 名称;rdev 是设备文件的设备号。
函数首先检查在父目录中是否已存在同名文件,而后一样调用 yaffs_CreateNewObject 创
建新对象。参数-1 表示由系统自行选择对象 id。
if (in) {
in->chunkId = -1;
in->valid = 1;
in->variantType = type;
in->yst_mode = mode;
in->yst_atime = in->yst_mtime = in->yst_ctime = Y_CURRENT_TIME;
in->yst_rdev = rdev;
in->yst_uid = uid;
in->yst_gid = gid;
in->nDataChunks = 0;
yaffs_SetObjectName(in, name);
in->dirty = 1;
yaffs_AddObjectToDirectory(parent, in);
in->myDev = parent->myDev;
这里列出的代码省略了和 wince 相关的条件编译部分。chunkId 是对象头所在 chunk,如今
尚未将对象写入 flash,因此置为-1;该新对象暂时尚未数据,因此 nDataChunks 是
0。in->dirty = 1 表示该新对象信息尚未写入 flash。而后经过
yaffs_AddObjectToDirectory 将新对象挂入父对象的子对象链表。接下来根据对象类型
做不一样处理:
switch (type) {
case YAFFS_OBJECT_TYPE_SYMLINK:
in->variant.symLinkVariant.alias =
yaffs_CloneString(aliasString);
break;
case YAFFS_OBJECT_TYPE_HARDLINK:
in->variant.hardLinkVariant.equivalentObject =
equivalentObject;
in->variant.hardLinkVariant.equivalentObjectId =
equivalentObject->objectId;
list_add(&in->hardLinks, &equivalentObject->hardLinks);
break;
case YAFFS_OBJECT_TYPE_FILE:
case YAFFS_OBJECT_TYPE_DIRECTORY:
case YAFFS_OBJECT_TYPE_SPECIAL:
case YAFFS_OBJECT_TYPE_UNKNOWN:
/* do nothing */
break;
}
对于最经常使用的文件对象和目录对象不作任何处理;若是是 hardlink,就将新对象挂入原对
象的 hardLinks 链表。从这里咱们能够看出,yaffs2 在内存中是以链表的形式处理
hardlink 的。在将 hardlink 存储到 flash 上的时候,则是经过 objectId 将二者关联起来。
Hardlink 自己占用一个 chunk 存储对象头。
最后,经过 yaffs_UpdateObjectHeader 将新对象头写入 flash。

8. Yaffs2的垃圾收集机制
yaffs2的垃圾收集过程实际上包括两个方面：
·一是对那些再也不使用的page做物理上的删除。咱们在前面介绍chunk释放函数的时候曾经看到，yaffs2在删除chunk的时候仅仅是修改内存中的统计量，而真正的删除工做要留到垃圾收集的时候作。
·二是处理坏块。在对flash进行写操做的时候，咱们也许要使用过一个block上的若干page以后才发现这是一个坏块，此时该块上已经有部分有用数据了，在垃圾收集的时候要对这种状况进行处理。
flash在使用过一段时间以后，知足以上两种状况的block也许不止一个，那么，yaffs2按照什么样的原则挑选合适的块进行回收呢？咱们看下面的函数：
static int yaffs_BlockNotDisqualifiedFromGC(yaffs_Device * dev,
yaffs_BlockInfo * bi)
这个函数用来断定给定的块bi是否能够回收。
if (!dev->isYaffs2)
return 1; /* disqualification only applies to yaffs2. */
if (!bi->hasShrinkHeader)
return 1; /* can gc */
咱们主要关心yaffs2。首先介绍一下什么是 hasShrinkHeader。
仍是要提到yaffs2的“软”删除机制。假定咱们如今须要减少一个文件的长度，好比从128K缩减到64K，在执行close()系统调用之后，yaffs2会将新的大小写入文件头，而这个文件头是会当即写入flash的，可是因为yaffs2使用软删除机制，原先那后面64K数据仍然残留在 flash上，也就是说，出现了文件头和文件内容不一致的状况。此时就将文件头所在block的描述信息中的一个字段hasShrinkHeader置 1，代表在垃圾回收时须要特别的处理。若是hasShrinkHeader＝0，那么该块是不须要特别的处理，是能够回收的；可是若是 hasShrinkHeader＝1，那就须要注意了：若是咱们所作的不只仅是文件尺寸的收缩，而是文件的删除，而且在物理删除文件内容以前经过垃圾收集机制将文件头删掉了，那么残留的文件内容就成了“没娘要的孩子”，难以处理了。因此，咱们必须先处理文件的残留内容，而后处理文件头。下面咱们来看看yaffs2是如何实现处理这个目标的： html

/* Find the oldest dirty sequence number if we don't know it and save it
* so we don't have to keep recomputing it.
*/
if (!dev->oldestDirtySequence) {
seq = dev->sequenceNumber;
for (i = dev->internalStartBlock; i <= dev->internalEndBlock; i++) {
b = yaffs_GetBlockInfo(dev, i);
if (b->blockState == YAFFS_BLOCK_STATE_FULL && (b->pagesInUse - b->softDeletions) <
dev->nChunksPerBlock && b->sequenceNumber < seq) {
seq = b->sequenceNumber;
}
}
dev->oldestDirtySequence = seq;
}
/* Can't do gc of this block if there are any blocks older than this one that have
* discarded pages.
*/
return (bi->sequenceNumber <= dev->oldestDirtySequence);

在分析这段代码以前，咱们再来回顾一下yaffs2的chunk分配过程和特色。如前文所述，yaffs2在分配chunk的时候遵循两个原则：一是在block内部严格从低地址的chunk向高地址的chunk按次序分配，二是必定要将一个block内的page所有分配完毕后才另行选择 block进行分配。并且在分配的时候每挑选一个block就会递增一个序号。这样咱们从block的序号就能够推断出该block的分配顺序。
除此以外，yaffs2会在应用程序做clsoe()系统调用的时候将新的文件头写入flash。所以，咱们能够做出这样的结论：文件头所在block的序号，必定大于等于文件内容所在block的序号。这样，若是一个block信息结构内的hasShrinkHeader字段为1，而且该block的序号在系统中最小，咱们就能够认为该block上的所有文件头对应的文件已经没有残余信息留在flash上了——这些残余信息若是存在，它们所在block的序号必定更小。有了这个结论，上面的代码就不难理解了，因此就不做解释了。
这个函数返回以后，咱们就知道函数参数所指向的block是否能够回收了。node