首页 > 数据备份方案

时间:2023-02-02

数据云端长期保留及趋势分析

云备份也称为在线备份或云中备份,是指将数据备份到远程的基于云的存储服务平台。它是一种支持将数据存储和连接在多个分布式存储系统和存储资源中的方法,这些资源包括用于通过公共云传输与存储数据的云,带宽和存储费用消耗较少。它通过收集,压缩,加密数据并将数据传输到指定的云端存储,而不会消耗太多的时间和带宽。

因为越来越多的用户更加青睐用云备份进行数据保护,云备份的安全,高效,节省成本与虚拟化驱动,帮助了更多用户实现了使数据更加安全的混合云备份解决方案。近日ESG 在2018 数据保护现状报告(Oct, 2018)中指出,有74%的受访者已经将云端做为他们数据备份的目标,至2020年,将有23%的用户将数据放置在云端。

Cloud Tier 云分层 与 SOBR 扩展式备份存储库介绍

Cloud Tier 介绍

Cloud Tier,是一种将本地存储与云存储进行自动化分层管理的能力,用户借助云端的对象存储集成的能力,可以节省多达10倍的长期数据保留花费。它是通过扩展式备份存储库 (Scale-Out Backup Repository™),将本地存储与云端存储连接起来,以实现性能与容量的平衡。

扩展式备份存储库 SOBR 有三个层,性能层、容量层与归档层,在这三个层之间移动数据的规则称之为数据放置规则 Placement Policy, 它可以自动或是手动来进行。它的活动过程分为4步:

  1.  识别不再活跃的备份链。简单说明一下,这个动作基于在您的备份链中有没有新的全备份,有新的数据就会替代老的数据,从而触发数据修剪。
  2.  识别元数据与数据块。众所周知,备份的数据的存放是分为元数据Metadata 与 数据块 Data Blocks的,而且在存储时分别存放的,这保证了我们能及时的找到数据块和提高存储效率。
  3.  去重传输。这部分动作过程中, Veeam会将数据块去重上传,上传时先上传Metadata,再将数据块上传,重复的数据块将不会被上传到云, 本地则留下Metadata,以方便今后的数据浏览和云上数据取回本地。
  4.  分别放置。数据在云上存储时,不是直接写在存储桶上,而是在指定的存储桶和一串文件夹下放置数据块,如上图所示 将会在VeeamArchive<repositery_folder_name><buckup_id ><objects_in_bakcup_id>下分别建立 Storages 和 blocks文件夹用于分别放置元数据与数据块.

Copy 模式和 Move 模式

Veeam 的 Copy 模式与 Move 模式不同,Copy 模式会在本地备份任务结束后立即发起一次Offload,而不用等待4个小时。这大大提高了云端数据的可用性和减少了 RPO。

扩展的对象存储支持-冷对象存储支持

使用对象存储存放备份数据,可以将长期数据存档和保留的成本降低20倍,从而替换手动磁带管理并实现端到端备份生命周期管理,Veeam全新的对象存储支持功能从热对象存储扩展到了冷对象存储的支持。

对于容量层和NAS文件版本归档,除了现有的多种对象存储选择之外,Veeam还可以使用Google云存储(GCS)作为对象存储库。使用专有的GCS对象存储API,但由于缺少对象数据锁定能力,目前还不支持不可变模式。

对于归档层,Veeam提供了基于Amazon S3 Glacier(包括deep archive)和Microsoft Azure Blob新的SOBR归档层支持存储归档层。与热对象存储不同,这些对象存储分层的经济性针对“只写一次不读”场景进行了调整,因此最适合于GFS备份的长期存档。它们的API和检索成本以及检索时间都显著增加,以小时为单位衡量,由此推动了专用归档层的创建,以确保实现经济高效而又无缝的备份生命周期管理。

以下是存档层的主要功能:

  • 不可变备份,为了帮助满足法规遵从性要求,在Amazon S3 Glacier中,归档备份可以选择使其在整个保留策略期间保持不变。
  • 基于策略的卸载—就像容量层一样,没有要管理的卸载作业,把存档窗口调的足够高,以确保不太可能再次访问的还原点(外部)在特殊情况下,进行存档。作为智能、软件定义的存储,SOBR将负责数据自行跨所有层移动。只要关注一下SOBR的每日状态报告就可以了
  • 成本优化的归档,由于冷对象存储层的高API成本,数据块卸载使用自动配置的辅助设备重新打包为大对象(大小高达512MB)在存档会话期间在公共云中。另外,为了避免提前删除,我们会自动跳过还原点的存档,剩余保留时间低于最小值所用存储类的所需数据存储持续时间。
  • 灵活的存储方法—为降低成本,默认情况下,归档层卸载使用Forver Incremental方法,每次卸载只上载和存储以前还原点的增量已存档还原点。但是,对于非常长的保留策略,Veeam还提供了存储每个GFS完全备份功能。这可以避免单个增量备份链太长的问题,通过利用Amazon S3这样的存储类,使总体成本仍然是合理的
  • 自动的存档,存档备份是自动的,不依赖于任何外部元数据,即使本地备份服务器丢失,也允许导入它们。此外,不会带来“供应商锁定”,因为存档的备份可以从对象存储中导入并在将来进行恢复使用。
  • 无需额外成本,不像备份存储设备供应商那样,他们显然不愿意看到数据离开他们昂贵的内部硬件,Veeam不收取每TB的订阅费来将数据存档到对象存储。

云备份的安全性考虑

1. 对象存储库的不可更改特性

在利用云端对象存储替换磁带备份的方案时,经常会有安全性考虑。比如,磁带介质是离线的,所以不会有被更改的风险。而对象存储则是在线的。Veeam创新的使用AWS S3 服务特有版本控制功能,可以让用户轻松的控制。不被更改的新范围,方便客户达到合规与审计要求。

2. 存储库的封存模式 Sealed Mode

“封存”存储库的概念很简单,它是在您的环境中成功使用容量层功能的基础。密封是存储库指在未来没有任何正在进行的备份活动操作,也没有需要需求后的一种存储库运维模式。经过封存的存储库将不会再被修改,您可以在您需要的任何时候取消封存模式。

从对象存储直接导入数据集

在本地利用云端对象存储将数据备份到云端后,如果想利用云存储库中的数据,只需要将这个存储库加到VBR的管理器中,就可以埋备份数据的导入。这可以方便我们的用户,进行数据库利用,无论在云上还是云下。

数据导入后,可以进行任何对数据集的基础操作,包括:即时虚拟机恢复、细粒度数据恢复,导出另一格式的磁盘和即时恢复到云,这可以帮助用户在云迁移的场景中节省大量的时间。

Cloud Tier 更广泛的支持与容量层的兼容性

Veeam在2016年就推出了扩展式备份存储库 (Scale-Out Backup Repository™) 并且体现了容量层的功能,该功能支持将旧备份文件迁移至价格更低的存储,如云端或内部对象存储。以下是经过测试的对象存储列表。

  • AWS China S3
  • Microsoft Azure China BLOB
  • Google GCP Cloud Storage
  • 阿里云 OSS
  • 腾讯云 COS
  • 天翼云 OOS
  • 华为云 OBS
  • OpenStack Swift S3 (Rocky 2018 or later)
  • Red Hat Ceph (3.1 or later)

Cloud Tier 支持的归档层

Veeam在2021年推出的 V11 中,将存档层添加到 SOBR 中以进一步实践完整的数据生命周期管理的全过程。客户可以通过添加 Amazon S3 Glacier,包括 Glacier Deep Archive 和 Azure Blob Archive Tier Storage 到归档层,实现将数据从热对象存储层自动转移到冷对象存储层的能力。

  • Amazon S3 Glacier,包括 Glacier Deep Archive
  • Azure Blob Archive Tier Storage