深圳市龙华区振华时代广场10整层
18165737729

分布式存储到底需不需要备份?

  对备份的需求是基于数据的重要性和系统的稳定性。通常需要备份,即使分布式存储有多个副本,以确保一定数量的数据恢复。但为了安全期,要防止整个系统停机,还是要备份。备份的选择主要从两个方面考虑。一是分布式存储系统本身所支持的备份和恢复,这是对应用系统的保障。

  是否需要备份建议保存数据业务系统的重要性级别,如业务系统需要地方、城市或超出了备份数据,然后建议应用程序备份数据备份,不进行备份存储,这样可以保持统一整体备份架构,避免了备份造成的大量无用数据的浪费,备份设备容量大。应用端备份可以使用统一的备份软件,如NBU、TSM等。

  在分布式存储系统中,系统可用性是最重要的指标之一,需要保证在机器发生故障时,系统可用性不受影响,为了做到这点,数据就需要保存多个副本,并且多个副本要分布在不同的机器上,只要多个副本的数据是一致的,在机器故障引起某些副本失效时,其它副本仍然能提供服务。同时,分布式存储还支持纠删码技术,具体技术实现可以参考相关的技术文档,纠删码技术相对副本技术而言,极大地节省了存储空间,一般1:1.5左右甚至更低的空间即可,但是会消耗部分的CPU资源来进行数据冗余/恢复的计算。

  依然需要备份,分布式存储的副本或纠删码是防止存储部件损坏造成数据丢失或业务暂停,哪怕分布式存储启用快照功能,也是无法防止物理故障。备份的意义在于使用与存储完全隔离的故障域来保护数据,分离的存储操作系统,不同的物理设备,不同的物理区域,以防止物理故障,逻辑故障。

  方式的话有

  1.备份软件+硬盘设备或磁带设备;

  2.存储之间的复制;

  3.以及现在新的存储至对象存储方式,其本质是存储自带备份小软件将属于备份到硬盘设备的方式