亚马逊云科技 存储合作伙伴如何利用 Amazon S3 Glacier 即时检索来满足客户的数据存档需求

作者:亨利·阿克塞尔罗德 | 2022

去年,在re: Invent 2021 上, 亚马逊简单存储服务(Amazon S3) 发布了一款名为Ama zon S3 Glacier即时检索 的新存储类别 ,并对Ama zon S3 Glacier产品进行了更多改进。 许多 亚马逊云科技 存储合作伙伴 对新的存储类别 感到兴奋,详见博客 “ 使用 亚马逊云科技 合作伙伴解决方案和 Amazon S3 Glacier 即时检索 存储数据 ”。S3 Glacier 即时检索使合作伙伴能够利用低成本存储来存储需要毫秒检索的长寿命、很少访问的数据。这为需要更快地访问存档数据的客户提供了新的选项和功能。如今,亚马逊云科技 有许多存储合作伙伴增加了对 S3 Glacier 即时检索的支持,还有更多合作伙伴计划在未来几个月内增加支持。

在这篇博客中,我将探讨合作伙伴如何向客户提供 Amazon S3 Glacier 即时检索,这使客户能够将使用合作伙伴解决方案的所有好处结合起来,同时获得对低成本档案存储的无缝访问。我还将深入探讨一些常见的 S3 Glacier 即时检索用例,例如从主存储中经济实惠地进行存储分层和长期保留备份。

数据存档客户需求

客户将 Amazon S3 用于各种用例,包括数据湖、虚拟主机、备份、存档等。Amazon S3 提供的存储类别可满足不同用例以及数据生命周期不同阶段的数据的业务和技术要求。客户可以根据工作负载的数据访问权限、灵活性和成本要求来确定哪种存储类别适合他们。在 S3 Glacier 即时检索推出之前,S3 标准用于频繁访问的数据,S3 标准不频繁访问用于不经常访问的数据,对于很少访问的数据,亚马逊 S3 提供了 Amazon S3 Glacier 灵活检索(以前称为 “Amazon S3 Glacier”)和亚马逊 S3 Glacier 深度存档存储类别(图 1)。除了图 1 中的存储类别外,Amazon S3 还提供诸如 Am azon S3 智能分 层之类的存储类别,当访问模式发生变化时,通过自动将数据移至最具成本效益的访问层来降低存储成本。有关 亚马逊 S3 存储类 的完整范围,请参阅 Amazon S3 存储类网页

Amazon S3 storage classes

图 1:亚马逊 S3 存储类别

借助 Amazon S3 Glacier 灵活检索和 Amazon S3 Glacier 深度存档,客户可以在几分钟到几小时内以非常低的成本访问他们的数据。这些存储类别满足了对访问时间要求不高的罕见数据的需求。在某些情况下,客户需要存储很少访问的数据,但在需要时,需要以毫秒为单位访问数据。这可能使一些客户无法使用 S3 Glacier 灵活检索或 S3 Glacier 深度存档来存储时效性强、很少访问的数据。

在 Amazon S3 Glacier 即时检索之前,如果客户需要快速访问不常访问的数据,他们会将数据存储在不经常访问的存储类中,而不是成本较低、很少访问的 S3 Glacier 灵活检索和 S3 Glacier 深度存档存储类中。客户还在寻找存储需要几毫秒访问的存档数据的地方,例如医疗图像、新闻媒体资产或基因组学数据。

以亚马逊 S3 Glacier 即时检索作为解决方案

Amazon S3 Glacier 即时检索允许客户经济高效地存储存档数据,同时可以立即访问这些数据,从而满足客户的存档需求。

现在,让我们快速了解一下使用新的 Amazon S3 Glacier 即时检索存储类有多容易。

首先,我们使用 亚马逊云科技 CLI V2 将文件上传到 S3 Glacier 即时检索。存储类也可以通过 S3 控制台 、S3 API 或 亚马逊云科技 开发工具包获得。以下命令 “aws s3 cp” 传递了 “—storage-class” 选项,以指定我们要将此对象直接上传到 S3 Glacier 即时检索。如果您不确定要与存储类选项一起使用的名称,可以使用 “aws s3 cp help” 来查看可能值的列表。

aws s3 cp myfile.mov s3://aws-s3-storageclass-bucket/ --storage-class=GLACIER_IR

upload: ./myfile.mov to s3://aws-s3-storageclass-bucket/myfile.mov

如您所见,上传到 S3 Glacier 即时检索就像上传到任何其他 Amazon S3 存储类一样简单。现在我们已经上传了文件,我们可以执行头对象操作来获取对象元数据。下面我使用的是 “查询” 选项,这是 亚马逊云科技 CLI 中的一个标准选项,用于指定我想要返回 StorageClass 属性。如你所见,存储类以 GLACI ER_IR 的形式返 回。

aws s3api head-object --bucket aws-s3-storageclass-bucket --key myfile.mov --query StorageClass

"GLACIER_IR"

如果我们查看 S 3 控制台 ,我们也可以看到同样的东西 。

Figure 2: Amazon S3 Bucket with uploaded object

图 2:带有上传对象的 Amazon S3 存储桶

使用 S3 Glacier 即时检索最重要的方面是能够随时随地即时访问您的存档数据。使用 S3 Glacier 即时检索,您可以在几毫秒内访问您的数据。我再次使用带有 “aws s3 cp” 的 亚马逊云科技 CLI 并将该对象复制到我的本地计算机上。S3 Glacier 即时检索是一个同步存储类,这意味着当您发出访问或下载对象的命令时,操作将在几毫秒内发生。使用 S3 Glacier 即时检索,该命令会立即开始下载文件。

aws s3 cp s3://aws-s3-storageclass-bucket/myfile.mov myfile.mov

download: s3://aws-s3-storageclass-bucket/myfile.mov to ./myfile.mov

亚马逊 S3 Glacier 即时检索存储合作伙伴用例

对于合作伙伴而言,Amazon S3 Glacier 即时检索允许他们提供满足客户存档需求的解决方案,无论他们需要如何访问数据。借助 Amazon S3 Glacier 即时检索,合作伙伴能够为需要存档功能和即时访问的现有解决方案添加支持。这可以通过使用 S3 API 或 亚马逊云科技 开发工具包指定存储类别来完成。让我们来看看其中的一些用例,例如对主存储系统的存储进行分层、备份数据以进行长期保留,以及维护大型存储存档。

首先,让我们来谈谈主存储分层用例。 主要存储合作伙伴 提供提供文件、块或对象存储的解决方案,或处理主数据的工具。多年来,许多主存储合作伙伴一直支持从其主存储解决方案到 Amazon S3 的某种分层。除了内置功能外, 亚马逊云科技 Storage Par tners 还 提供可帮助对来自多个存储系统的数据进行分层的软件,从而以统一、经济的方式管理数据生命周期。尽管其中许多解决方案都支持提供快速访问的 Amazon S3 存储类别,但添加对存档存储类的支持仍存在一些挑战。

挑战之一是这些数据通常通过 SMB 和 NFS 等标准协议呈现给客户。合作伙伴必须确保可以在协议超时限制内检索数据,或者提供特殊的客户端来访问数据。此外,合作伙伴必须建立检索数据的工作流程。借助 S3 Glacier 即时检索,主要存储合作伙伴现在可以将需要分层的数据发送到档案存储类并满足其所有其他要求。例如, Komprise 是 亚马逊云科技 存储合作伙伴,它让客户能够将来自不同存储系统的网络连接存储 (NAS) 数据分层到 亚马逊云科技。 Komprise 在 S3 Glacier 即时检索发布后 不久就宣布了支持该计划的计划 。如今,客户可以利用 S3 Glacier 即时检索将很少访问的数据从其主存储系统移动到 Amazon S3,并在需要访问时立即取回这些数据。除了 Komprise 之外, CTERA 、N asuni NetApp Weka 还增加了 对 S3 Glacier 即时检索的支持。其中一些合作伙伴提供本地与 亚马逊云科技 之间以及 AW S 区域 之间的复制功能 。S3 Glacier 即时检索允许以经济实惠的方式存储复制的副本,但在需要故障转移时仍可立即使用。

Amazon S3 Glacier 即时检索存储备份、恢复和存档用例

接下来,让我们深入探讨备份和恢复用例。这看似显而易见,但 备份和恢复是 齐头并进 的。通常,数据被备份的频率比恢复的频率高。随着时间的推移,数据会老化,尤其如此。但是,客户通常需要长时间存储备份数据,这可能是出于特定业务策略或合规性要求。这些数据不同于操作备份,后者的保留期通常为 30 到 90 天。还可能需要操作备份来更频繁地进行恢复,尤其是在备份之后的初期。另一方面,长期保留备份可能从几个月到多年不等。尽管这些备份很少被访问,但在某些情况下,客户还希望能够快速恢复这些备份。C lumio Cohesity、C ommvault Druva MSP360 Rubrik 和V eritas等合作伙伴增加了 对亚马逊S3 Glacier 即时检索的支持,这是他们现有的亚马逊S3支持的一部分,以满足这一客户需求。当客户创建与 Amazon S3 存储桶的连接时,他们只需将 Amazon S3 Glacier 即时检索指定为存储类即可。每当他们需要恢复数据时,无论是单个文件、完整的虚拟机还是整个 NAS 共享,他们都能轻松完成。

我们将在本博客中探讨的最后一个用例是 数据存档 。归档可以与主存储分层以及备份和恢复类似,但总体上不同之处在于,与主存储分层不同,主存储系统通常不再需要数据。它通常与备份和恢复的区别在于,数据通常不是存储在其他地方的数据的副本,而是唯一的权威数据副本。就其本质而言,存档数据很少被访问,但这并不意味着在被请求时不会立即需要存档数据。例如,在 媒体和娱乐行业 , 客户经常存储称为活动存档的大型媒体档案。尽管这些数据的大小可能为千兆字节,但在任何给定时间都只需要一小部分数据,可能是该存档中的任何随机文件。尽管它是存档数据,但在某些情况下,需要立即访问这些数据。借助 Amazon S3 Glacier 即时检索,客户现在可以经济高效地存储该数据并访问任何媒体对象,其性能与为更频繁访问的数据而构建的任何其他 Amazon S3 存储类相似。

摘要

在这篇博客中,我们探讨了客户和合作伙伴的 Amazon S3 Glacier 即时检索地址的用例。我们还审查了合作伙伴目前为 S3 Glacier 即时检索提供支持的最新情况。尽管不应将此博客视为合作伙伴支持的完整列表,但它可以很好地了解合作伙伴帮助客户使用 S3 Glacier 即时检索的一些方式。

下一步,您应该确定您的需求是否符合这些用例中的任何一个,或者您的组织中是否还有其他使用 S3 Glacier 即时检索的用例。许多 亚马逊云科技 合作伙伴,尤其是存储能力合作伙伴,都增加了支持。您的解决方案提供商可以为您提供有关在其解决方案中使用 S3 Glacier 即时检索的详细信息。您 的 亚马逊云科技 账户团队 还可以帮助确定 Amazon S3 Glacier 即时检索是否适合您的用例,并帮助您设置概念验证。

感谢您阅读这篇博客文章,如果您有任何意见或问题,请将其留在评论部分。