1 引言 一直以来,数据保护都是IT 行业和工业中(4)
2013-06-12 01:03
导读:4.2 实验建立 所有的实验都在2.66GHz 的英特尔双核Xeon 节点下进行的。一个作为主站点,另一个作为备份站点。每台机器有2GB 的内存和由6 个37GB 的SAS 硬盘组
4.2 实验建立
所有的实验都在2.66GHz 的英特尔双核Xeon 节点下进行的。一个作为主站点,另一个作为备份站点。每台机器有2GB 的内存和由6 个37GB 的SAS 硬盘组成的RAID-5 硬件。
两个节点由千兆以太网相连。为了测试三种并行的模型,我们将备份站点的日志机制关闭来让CPU 承受更多的负载。α 和β 均被置成0.5。组间间隔初始化为30 毫秒。我们用Iometer[16]
来产生负载。由于写请求触发了远程复制模型,我们仅需要测试写负载。不像其他专门的状态,顺序写负载也被使用。为了评估异步模式在性能上的影响,我们记录经过一段时间Iometer 显示的性能曲线趋于稳定时的实验结果。每个数据点都是三个样本的平均值。
4.3 实验结果
我们首先进行基准线测试。显示出了结果。“pri”主站点中的RAID-5 设备,“back”代表备份站点中的RAID-5 设备。“LVM”代表主站点的源卷,“Async”代表没有自适应成组算法的异步远程复制系统。“simple batch”代表有自适应成组算法但是没有数据压缩和加密。
我们可以看出,自适应成组算法的性能很好,尽管和纯磁盘操作还有一定差距。
显示了数据压缩和加密在性能上的影响。“compression”表示仅进行压缩,不进行加密;“encryption”表示仅加密不压缩;“batch”表示既压缩又加密。和我们预期的一样,引入压缩很大程度上提高了性能,因为网络传输压力减少;而由于复杂的计算度使加密严重影响了性能。而最终版本的性能在这两者之间。
显示出3 种并行模型很大程度上提高了性能。我们可以看到三种模型均明显加速了流水线。细粒度流水线和多线程流水线显示出几乎相同的性能。混合流水线提供了更好的性能。因为CPU 没有过载——在混合流水线测试中CPU 只有87%的占用率。
(科教范文网http://fw.NSEAC.com编辑发布) 我们也跟踪了组间间隔(组大小)。结果显示在中。组间间隔分别被初始化为30毫秒和15 毫秒。请求大小是4KB。我们记录了前20 个时间段的组大小。可以看出自适应成组算法确实是主从站点协作很好。组间间隔迅速趋向稳定。
我们还测试了随机写的性能。所示,与顺序写相比,随机写性能在串行和并行版本之间的差距在减小。原因是I/O 部分在整个运行时间中的比例增加了,而且三种并行模型仅加速了计算部分。
5 结论和进一步工作
本文中,我们展示了一种新型的远程复制系统的协同流水线模型。不同于传统的流水线模型,这种新的模型充分利用了处理器的计算能力。为了解决主从阶段的不平衡性,我们提出了自适应成组算法。为了减轻由于压缩,加密和TCP/IP 协议栈造成的CPU 高负载的情况,我们设计了三种并行的模型:细粒度流水线,多线程流水线和混合流水线。在我们的原型中实现了这些技术。实验结果表明,自适应协同流水线模型有效地平衡了主从阶段,三种并行方式提供了更好的性能。
我们所有的实验都是基于局域网环境。在广域网环境下测试我们的模型是下一步我们要进行的重要工作。用有效的纠删码进行进一步容错(Error Correcting)也是我们的下一步计划研究的内容。
中国网提供大量免费硕士,如有业务需求请咨询网站客服人员!
参考文献
[1] Patterson, R.H., Manley, S., Federwisch, M., Hitz, D., Kleiman, S., Owara, S.: SnapMirror:
File-System-Based Asynchronous Mirroring for Disaster Recovery. In:Proceedings of the 1st USENIX Conference
on File and Storage Technologies, FAST 2002, Monterey, California, USA (Jan 2002) 117–129
[2] Weatherspoon, H., Ganesh, L., Marian, T., Balakrishnan, M., Birman, K.: Smoke and Mirrors: Reflecting