教学工作的资源分享

文件级和数据块级重复数据删除技术的优缺点

学校教务系统

学校教务系统

文件级和数据块级重复数据删除技术的优缺点

http://www.sina.com.cn 2008年12月12日11:23 IT168.com作者:技术中国

重复数据删除技术大大改进了基于磁盘的数据保护战略、基于广域网的远程办公室备份整合战略和灾难恢复战略的价值主张。 该技术可以识别重复数据,消除冗余,减少需要传输和存储的数据的总体容量。一些重复数据删除技术在文件级执行,而另一些技术则更详细地检查子文件和数据块。 尽管在结果上存在差异,但它将确定文件或块是否能带来唯一的好处。 两者的区别在于减少的数据容量不同,判断重复数据所需的时间也不同。文件级重复数据删除技术文件级重复数据删除技术通常根据单实例存储(SIS、索引)检查需要备份或归档的文件的属性,并将其与存储的文件进行比较。 如果没有相同的文件,则保存并更新索引; 否则,只保存到指针,指向现有文件。 因此,同一文件只存储了一个实例,所有后续副本都将由“存根”替换,“存根”指向原始文件。数据块级重复数据删除技术块级重复数据删除技术在子文件级别执行。 顾名思义,文件通常被分割为几个部分:条带或块,然后将这些部分与以前存储的信息进行比较以检查是否存在冗馀。

职教二十条

职教二十条

例如,使用散列算法生成唯一的ID或“足迹”来标识数据块。 然后将生成的ID与集中索引进行比较。 如果ID已经存在,则表示之前处理并保存了数据块。 因此,只要放入指针,指向以前保存的数据即可。 如果ID不存在,则表示数据块是唯一的。 此时,将ID添加到索引中,并将数据块保存到磁盘中。

每个供应商检查的数据块的大小不同。 有些提供程序固定了数据块的大小,而有些提供程序使用了不同大小的块。 有些最终用户可以更改固定块的大小,这使其更加混乱。 固定块的大小可能为8 KB或64 KB。 不同的是,块越小,被判断为冗馀性越高的概率越高。 这意味着不再存在冗馀,存储的数据也越来越少。 固定块只有一个问题:如果:个文件发生了更改,但重复数据删除产品使用的是上次检查的固定块,则剩下的比较可能没有意义,因为文件中的数据块将被更改或删除,使用的固定块仍处于更改前各种规模的块可以提高常见冗馀的监视概率,尤其是在文件更改后。

人力资源属于什么学科门类

人力资源属于什么学科门类

通过此方法,即使文件发生更改并传输了数据块,也可以找到重复的数据。 不足的地方是? 此方法可以改变块大小,并且会影响规模的增长和计算时间的增加,因为提供商需要跟踪和比较多个身份。文件级技术和块级技术不仅在运行上有差异。 两种方法各有优缺点。文件级删除技术的效率不及块级技术时:

如果文件内部发生更改,则必须重新保存整个文件。 文件(如PowerPoint报告)可能需要修改其简单的内容,例如更改主页以显示新的报告作者和日期。 结果,需要重新保存整个文档。 块级重复数据删除技术仅存储一个版本和下一个版本之间更改的文件部分。 文件级技术的压缩率通常小于5:1,而块级技术需要存储的数据量压缩20:1至50:1。文件级删除技术的效率高于块级技术:

文件级重复数据删除技术的索引非常小,确定重复数据所需的计算时间很少。 因此,删除过程对备份性能的影响很小。 对恢复时间的影响很小。 块级删除技术要求使用主索引将数据块的指针与其数据块的指针相匹配,然后“重新组装”数据块。 文件级技术存储唯一的文件和指向该文件的指针,因此很少需要进行重组。

随机看看

NEW ARTICLE

标签

Tag