问:什么是 AWS Snowball?

AWS Snowball 是一种数据传输解决方案,使用能够以物理方式安全传输的存储设备来加快 TB 到 PB 级数据传入或传出 AWS 服务的速度。使用 Snowball 有助于传输大规模数据时经常遇到的难题,包括网络费用高、传输时间长和安全问题。

问:Snowball 的工作原理是什么?

AWS Snowball 使用安全设备和 Snowball 客户端来加快 PB 级数据传入或传出 AWS 服务的速度。首先,您要使用 AWS 管理控制台创建一项或多项任务,以便申请一台或多台 Snowball 设备(具体取决于您需要传输的数据量),然后下载并安装 Snowball 客户端。当设备抵达后,将其连接到您的本地网络,手动或使用 DHCP 设置 IP 地址,然后使用客户端确定要复制的目录。客户端将自动加密数据并将其复制到设备,然后在传输任务完成时通知您。当传输完成并准备返还该设备时,E Ink 运输标签将自动更新,指明要运送到的正确 AWS 合作伙伴位置,您可以通过 Amazon Simple Notification Service (SNS)、短信或直接在控制台中跟踪任务状态。

问:Snowball 适合什么样的用户使用?

如果您需要将数 TB 到数 PB 的数据安全快速地传输到 AWS 服务,那么 Snowball 是合适的数据传输选择。如果您不希望对网络基础设施进行昂贵的升级、频繁经历大量数据积压、处于物理上隔绝的环境,或者所在区域没有高带宽 Internet 连接或其成本高昂,Snowball 同样是合适的选择。

问:使用 Snowball 可以传输多少数据?

使用 Snowball 几乎可以传输任意数量的数据,从几 TB 到几十 PB 都可以。通常情况下,每台 Snowball 设备可传输数 TB 的数据。您可以使用多台 Snowball 逐一传输或并行传输大型数据集。例如,您可以使用两台 Snowball 并行传输 100TB 的数据,也可以使用两台 Snowball 逐一传输这些数据。

问:什么是 Snowball 客户端?

Snowball 客户端是您安装在本地主计算机上的软件,用于高效识别、压缩、加密您指定目录中的数据并将其传输到 Snowball。

问:传输数据需要多长时间?

您可以使用 Snowball 客户端估算传输数据所需的时间(有关更多详细信息,请参阅用户指南)。数据传输速度受很多因素影响,其中包括本地网络速度、文件大小以及从本地服务器读取数据的速度。

Snowball 客户端会以条件允许的最快速度将数据复制到 Snowball(一天至少可以复制 48TB 的数据,具体取决于您的本地环境)。将数据传输到 AWS 服务的端到端时间约为一周,包括常规的运送时间和在 AWS 服务数据中心的处理时间。您可以并行使用两台 Snowball 在同样的时间内复制两倍的数据,也可以使用一台 80TB 的 Snowball 在两天半的时间里复制 70TB 的数据,如果采用后面这种方式,端到端时间会增加到一周半左右。

问:Snowball 设备有哪些规格?

请参阅下文查看完整的硬件规格列表,其中包括接口、散热和电源要求以及输出分贝和尺寸。 

项目 规格
存储容量 80TB 的 Snowball 具有 72TB 的可用空间。
板载 I/O 10 Gb 接口 每台 Snowball 均支持 RJ45 (Cat6)、SFP+ 铜缆和 SFP+ 光纤。
电缆 每台 Snowball 均配有 RJ45 和 SFP+ 铜缆。对于 SFP+ 光纤,您必须使用自己的电缆,连接到其中一个 SFP+ 端口的 SFP+ 光纤适配器。
终端要求

Snowball 针对办公室操作而设计,最适合数据中心运营。

输出分贝 平均而言,Snowball 产生 68 分贝的声音,通常比真空吸尘器或室内音乐要安静一些。
重量 21 千克
高度 50.16 厘米
宽度 32.15 厘米
长度 54.66 厘米
功耗 200 瓦

问:我在执行特定任务时可以持有 Snowball 多长时间?

出于安全考虑,在 AWS 管理控制台中创建 Snowball 任务后,您必须在 90 天内完成数据传输。

问:Snowball 支持哪些网络接口?

Snowball 拥有 10Gbps 的网络接口,配有 RJ45、SFP+ 铜缆和 SFP+ 光纤网络端口。

问:Snowball 的默认运送方式是什么?

我可以选择加急运送吗?
Snowball 默认使用两到五天的标准运送方式。您目前不能选择加急运送。

问:在哪些区域可以使用 Snowball?

AWS Snowball 现已在全球推出。您可以在 AWS 全球站点查看可用性。

问:能否将 Snowball 运送到其他 AWS 区域?

不可以。您只能在一个 AWS 服务区域中申请和使用 Snowball。不能从一个区域提出申请,然后将 Snowball 送到另一个区域。

问:何时应考虑使用 Snowball 而不是 Internet?

如果您需要将数 TB 到数 PB 的数据安全快速地传输到 AWS 服务,那么 Snowball 是强有力的数据传输选择。如果您不希望对网络基础设施进行昂贵的升级、频繁经历大量数据积压、处于物理上隔绝的环境,或者所在区域没有高速 Internet 连接或其成本高昂,Snowball 同样是合适的选择。

根据以往的经验,如果使用现有 Internet 连接的空闲容量将数据上传到 AWS 服务需时超过一周,则您应考虑使用 Snowball。例如,根据下表中的指南,如果您有 100Mb 的连接可完全用于传输数据,并且有 100TB 的数据需要传输,那么使用该连接完成数据传输所需的时间会超过 100 天。而使用多台 Snowball 进行同样的传输,仅需一周左右。

可用的 Internet 连接 理论最小值在 80% 网络使用率时传输 100TB 数据所需的天数

何时考虑使用 AWS Snowball?

T3 (44.736Mbps)

269 天 2TB 或以上
100Mbps 120 天 5TB 或以上
1000Mbps 12 天 60TB 或以上

问:何时应考虑使用 Snowball 而不是 AWS Direct Connect?

AWS Direct Connect 提供从本地到 AWS 服务网络的专用高速连接。如果您需要持续向 AWS 服务传输大量的数据,AWS Direct Connect 也许是合适的选择。

如果您需要大批量地传输数据或进行一次性传输(有可能从多个分散位置传输),则用 Snowball 来替代 Direct Connect 会是比较好的选择。对于此类工作负载,相比设置新的 Direct Connect 连接来传输数据并在完成后终止连接,Snowball 可能是更简单、更经济高效的选择。

问:是否可以使用 Snowball 将数据从一个 AWS 区域迁移到另一个 AWS 区域?

不可以。Snowball 是一种将大量数据传入和传出指定 AWS 服务区域的数据传输解决方案。

问:Snowball 会加密我的数据吗?

Snowball 使用 256 位加密算法加密所有数据。您的密钥绝不会发送到存储在设备上。

问:有没有办法判断设备在途中是否遭到篡改?

Snowball 使用防篡改外壳,并采用行业标准的可信平台模块 (TPM),后者使用专用处理器,旨在检测对硬件、固件或软件进行的任何未经授权的修改。我们将检查每台设备是否有任何拆封痕迹,并确认 TPM 未检测到任何更改。

问:设备上的数据成功传输到 AWS 服务后会如何?

处理并验证完数据传输任务后,我们将按照受到高度认可的介质清理标准对 Snowball 设备执行软件擦除。

问:有没有办法轻松跟踪我的数据传输任务?

Snowball 使用创新型 E Ink 运输标签,用于确保设备会被自动运送到正确的 AWS 服务机构,并且还会在跟踪过程中提供帮助。当您完成数据传输任务后,可以通过 Amazon SNS、短信或控制台对其进行跟踪。

问:如何将我的数据传输到 Snowball 设备?

将 Snowball 设备连接到网络并使用 E Ink 显示屏设置 IP 地址后,您需要从 AWS 管理控制台下载三个文件:

1. Snowball 客户端:用于将数据从您的本地存储传输到 Snowball 设备的软件工具。有关 Snowball 客户端的更多信息,请联系您当地的 AWS 代表。
2. 任务清单文件:一个加密的元数据文件,用于唯一地标识您的数据传输任务。
3. 任务清单解锁代码:由 25 个字符组成的代码,用于解锁任务清单文件。

下载完上述文件后,请启动 Snowball 客户端,并提供 Snowball 设备的 IP 地址、清单文件路径和解锁代码。启动命令示例如下:

snowball start -i {Snowball IP} -m path/to/the/job/manifest} -u {unlock code}

在您启动客户端并提供该信息后,客户端即可连接至 Snowball 设备,并可投入使用。接下来,您需要确定要传输到设备的文件目录,并等待传输完成。复制命令示例如下:

snowball cp /path/to/data/on/source/storage/device/directories Snowball/bucketname

注意:请联系您当地的 AWS 代表获取 Snowball 工具和文档。

 

问:当数据传输到 Snowball 设备之后,我需要做什么?

数据传输任务完成后,请发送电子邮件至 snowball-shipping-cn@sinnnet.com.cn,以便将设备退还给 AWS 服务机构。请将主题行命名为“Snowball Pickup Request”并提供以下信息:a) 任务 ID b) AWS 账户 ID c) 电子邮件地址 d) 最早上门取货时间 e) 最迟上门取货时间。收到电子邮件后,我们的运输合作伙伴将跟进安排预约,然后从您所在的位置取走设备。他们还将向您发送信息,以便您跟踪运送中的设备。

问:是否可以将数据从 Hadoop 分布式文件系统导入 Snowball?

可以。您可以使用 Snowball CLI 将数据从 HDFS 群集复制到 Snowball。要了解更多信息,请联系您当地的 AWS 代表获取 Snowball 文档

问:什么是 Snowball 的导出功能?

导出是 Snowball 的一项功能,它支持客户将数 TB 到数 PB 数据从 Amazon Simple Storage Service (S3) 导出到本地存储。

问:如何使用导出功能从 AWS 导出数据?

要使用 Snowball 的导出功能,只需登录 AWS 管理控制台,选择 Snowball,然后创建导出任务即可。与导入任务一样,您需要指定要使用的区域和存储桶。如果您不希望从特定存储桶中导出所有数据,您可以指定一个按照 UTF-8 二进制顺序排序的 S3 密钥开始和结束范围,用以标明应该导出的数据。您所选择的密钥范围以及位于其中的所有密钥都将被导出。有关使用控制台的详细信息,请参阅 AWS Snowball 文档

问:我最快多久能够访问导出的数据?

我们通常会在收到请求之后的 24 小时内开始导出数据,导出数据可能需时一周。任务完成且设备就绪后,我们将使用您在创建任务时所选的运送方式将其发送给您。

问:我能否直接从您的数据中心取走 Snowball,以免去等待送货的过程?

不可以。您可以选择一日送达的方式,而我们必须将 Snowball 运送到您提供的地址。我们不提供直接从数据中心提取 Snowball 这种方式。

问:在您为我准备 Snowball 的同时,我是否可以跟踪导出数据写入的进展情况?

可以。您可以看到我们何时开始预置 Snowball,并在向设备写入数据时获得实时更新。与导入任务一样,您会在预置完成时和设备发货时收到通知。

问:在将数据复制到 Snowball 之前,AWS 会加密我的数据吗?

会。所有写入数据均会经过加密,且这些数据的加密密钥绝不会显示在 Snowball 上。

问:收到 Snowball 后,如何从该设备上读取数据?

您可以使用 Snowball 客户端将数据从 Snowball 复制到本地存储。客户端从 Snowball 读取数据时会将其解密,并以数据存储到 Amazon S3 的相同格式将其写入您的本地存储。

问:我可以导出多少数据?

该设备对于您能导出的数据量几乎没有任何限制。如果您要导出的数据量超出一台设备的容纳量,则系统将自动创建额外的导出任务,以便能够导出您选择的所有数据。

问:是否可以从多个存储桶检索数据?

可以。您可以根据需要选择用于导出的存储桶数目。

问:将 Amazon S3 对象复制到本地存储时,如何将其映射到文件中?

每个密钥都会复制到设备中以存储桶名称开头的一个目录树中。例如,如果密钥是“images/orange.jpg”且存储桶是“fruit”,则对象将保存至 /fruit/images/orange.jpg。与各个对象关联的元数据不会复制到您的存储设备中。

问:是否可以导出 Amazon Glacier 存储类数据?

不可以。需要先使用 S3 生命周期还原功能将 Amazon Glacier 数据重新存储到 Amazon S3 中,才能将其导出。

问:是否有记录导出内容的日志?

有。对于每项导入或导出任务,Snowball 控制台都会针对被复制和未被复制的文件生成并提供一份日志。

问:导出数据的费用是多少?

除了上述定价部分详述的 Snowball 导出费用之外,您还需要支付从 Amazon S3 和 Amazon Glacier 服务中检索数据所产生的所有费用。

问:使用 Snowball 传输数据的费用是多少?

每项 Snowball 数据传输任务均需要针对设备处理和在 AWS 服务数据中心进行的导入/导出操作支付固定费用。您可以在自己的站点免费使用 Snowball 10 天。这 10 天不包括收到设备和寄送设备的日子。如果超过 10 天,Snowball 设备将按每超一天 140 CNY 的价格收费。将数据传入 AWS 服务不收取任何费用。

以下示例说明了型号为 80TB 的 Snowball 的定价。

示例
假定您使用一台 Snowball 将 60TB 的数据传入到了 AWS 服务,并且您使用 Snowball 14 天(在第 1 天收到承运商送到的 Snowball,在第 14 天将 Snowball 返回给承运商)。

该项任务的服务费如下:
该项任务的服务费为 2000 CNY。

超出后每天的费用
您可以在自己的站点免费使用 Snowball 10 天。这 10 天不包括收到设备和寄送设备的日子,也就是说在本例中,第 1 天和第 14 天不收费。第 1 天和第 14 天之间共有 12 天,其中有 10 天不收费。其余两天是用于传输数据所超出的两天。超出天数的总费用为:

2 天 x 140 CNY/天 = 280 CNY

数据传输
在本示例中,您是将数据传入 AWS 服务,因此数据传输费用为零。

运费
对于标准 2-5 天交货,每种方式收取 170 CNY 的固定运费。

 

问:Amazon S3 是如何收费的?

Snowball 代您将数据从 Snowball 设备传输到 AWS 产品(如 Amazon S3),而您需要支付标准的 AWS 服务费用。传入 AWS 的数据不产生任何数据传输费用,S3 中存储的数据按照标准 Amazon S3 定价计费。

问:我可以购买 Snowball 设备吗?

Snowball 只针对任务按实际使用量收费,不可购买。

问:Snowball 服务是否支持 API 访问?

可以。Snowball 任务管理 API 提供对 Snowball 任务创建和管理功能的编程式访问。这是一种基于标准的简单 REST Web 服务接口,旨在与任何 Internet 开发环境配合使用。

问:Snowball 任务管理 API 有何用途?

借助 API,合作伙伴和客户可以构建自定义集成,用以管理申请 Snowball 和传递任务状态的流程。该 API 提供了一种简单的 Web 服务接口,可用于从 Web 上的任意位置创建、列出、更新和取消任务。使用此 Web 服务,开发人员可以轻松构建管理 Snowball 任务工作流的应用程序。要了解更多信息,请参阅 Snowball 文档

问:什么是 S3 Adapter?

S3 Adapter 为 Snowball 客户端提供兼容 S3 的接口,以便在 Snowball 上读取和写入数据。

问:S3 Adapter 有何用途?

S3 Adapter 提供可与 Snowball 进行通信的功能,从而允许客户构建用于从文件以及非文件源复制数据的工具。它包括将数据复制到 Snowball 的接口,所采用的加密方法与通过我们的 Snowball 命令行工具所使用的加密方法相同。要了解更多信息,请参阅 Snowball 文档

问:为什么要使用 S3 Adapter 而不是 Snowball 客户端?

Snowball 客户端是一种一站式工具,能够将基于文件的数据轻松复制到 Snowball。偏爱紧密集成的客户可以使用 S3 Adapter 轻松扩展其现有应用程序和工作流以与 Snowball 无缝集成。

问:使用 S3 Adapter 时,如何保障数据安全?

S3 Adapter 写入数据时所用的加密机制与 Snowball 客户端提供的高级加密机制相同。

问:Snowball S3 Adapter 支持哪些编程语言?

S3 Adapter 通过与语言无关的 REST 进行通信。