请注意:Amazon S3 在面向中国发布时会略有不同。完整详细信息请参阅 Amazon S3 开发人员指南


问:什么是 Amazon S3?
Amazon S3 是一种面向 Internet 的存储服务。它是一种简单存储服务,以很低的成本为软件开发人员提供高度可扩展的、可靠的、低延迟的存储基础设施。

问:Amazon S3 可以用来做什么?
Amazon S3 提供一个简单的 Web 服务接口,可用于存储和提取任意数量的数据,这些操作可从 Web 上的任何位置随时执行。使用此种 Web 服务,开发人员可以轻松地构建利用互联网存储的应用程序。由于 Amazon S3 具有很高的可扩展性,而且您只需按实际用量付费,因此开发人员可以从较小用量起步,根据需要扩展应用程序,而不影响性能或可靠性。其设计具有很高灵活性:存储您需要的任意类型和任意数量的数据;读取相同数据一百万次,或者仅在紧急灾难恢复时读取;构建简单的 FTP 应用程序或复杂的 Web 应用程序,例如 Amazon.com 零售网站。Amazon S3 可以将开发人员解放出来,让他们专注于创新,而不是考虑如何存储数据。

问:Amazon S3 有哪些技术优势?
Amazon S3 经过精心设计,可以满足 Amazon 内部开发人员必须达到的可扩展性、可靠性、速度、低成本和简易性要求。Amazon S3 可为任何外部开发人员提供这些相同优势。有关 Amazon S3 设计要求的更多信息,请参阅 Amazon S3 详细信息页面

问:开发人员可以实现哪些以前无法实现的功能?
小规模的开发商以前一直无法获得类似于 Amazon 的先进、可扩展的数据存储基础设施。Amazon S3 可以让任何开发人员利用亚马逊自有的大规模优势,不需要预先投入,也无需牺牲性能。开发人员现在可以解放出来,专注于创新,因为他们知道无论他们的业务做成多大,数据都可以快速访问,随时保持可用性和安全性,不仅成本低,而且非常简单。

问:我可以存储多少数据?
您可以存储的总数据容量和数据对象数量不受限制。各个 Amazon S3 数据对象的大小可在 1 字节至 5 TB 之间。可在单个 PUT 中上传的最大数据对象为 5 GB。对于大于 100MB 的数据对象,客户应该考虑使用分段上传功能。

问:如何删除大量数据对象?
您可以使用多数据对象删除,将大量数据对象从 Amazon S3 删除。借助此功能,您可以通过单个请求发送多个数据对象键,以加快删除速度。Amazon 不会因为使用多数据对象删除而向您收取费用。

问:Amazon 是否将自身数据存储在 Amazon S3 中?
是。Amazon 内部的开发人员也将 Amazon S3 用于众多项目。其中很多项目使用 Amazon S3 作为授权数据存储,并依赖它执行业务关键型操作。

问:Amazon S3 数据是如何组织的?
Amazon S3 是基于键的简单数据对象存储。存储数据时,您应分配唯一数据对象键,此后可使用该键来提取数据。键可以是任何字符串,可以模仿分层结构属性。

问:我如何与 Amazon S3 连接?
Amazon S3 提供基于标准的简单 REST Web 服务接口,该接口可用于任何互联网开发工具包。我们特意对这些操作进行了简化,以便轻松添加新的分发协议和功能层。

问:Amazon S3 的可靠性如何?
Amazon S3 让所有开发人员能够访问同一个高度可扩展、快速可靠、低成本的数据存储基础设施,Amazon 使用该基础设施来运行自身的全球网站网络。S3 Standard 的设计可实现 99.99% 的可用性,Standard – IA 的设计可实现 99.9% 的可用性。两者都有 Amazon S3 服务等级协议的支持。

问:如果来自我的应用程序的流量突然达到峰值,会出现什么情况?
Amazon S3 从一开始就将处理来自任何互联网应用程序的高流量作为设计目标。按用量付费的定价以及无限制的容量,可以确保您的递增费用不会变化,而且您的服务也不会中断。Amazon S3 的庞大规模使得我们能够均衡地分布负载,任何应用程序都不会受到流量峰值的影响。


问:Amazon S3 是否提供服务等级协议 (SLA)?

是。如果客户的月度正常运行时间百分比在任何账单周期内低于我们的服务承诺,Amazon S3 SLA 将提供服务补偿。可在此处找到更多信息。


问:Amazon S3 的费用是多少?

使用 Amazon S3,您只需可以按实际用量付费。没有最低消费。

当我们的成本较低时,我们的收费也比较低。对于通过 COPY 请求在 Amazon S3 AWS中国(北京)区域内部传输的数据,或者在AWS中国(宁夏)内部传输的数据,不收取数据传输费用。在AWS中国(北京)区域的 Amazon EC2 和 Amazon S3 之间传输数据,或者在AWS中国(宁夏)区域的 Amazon EC2 和 Amazon S3 之间传输数据,不收取数据传输费。在 Amazon EC2 与其他 AWS 区域的 Amazon S3 之间传输的数据(即在AWS中国(北京)区域的 Amazon EC2 和AWS中国(宁夏)区域的 Amazon S3 之间传输),将按照在Internet 传输费率收费。详细信息请前往计费控制台

问:如何对我使用 Amazon S3 收费和记账
开始使用服务时,没有安装费,用户无需对服务的使用签订任何长期使用期限合约。我们将在月底向您收取当月的使用费. 您可以随时在 AWS 管理控制台上查看当前账单期的费用,只需登录您的亚马逊 AWS 账户,并单击 “Your Web Services Account” 下的 “Account Activity”。

问:通过 AWS 管理控制台访问 Amazon S3 要如何收费?
通过 AWS 管理控制台访问 Amazon S3 时,适用该服务的正常定价。为提供优化的体验,AWS 管理控制台可以主动执行请求。此外,某些交互操作可能导致对服务的多个请求。

问:定价中包含税金了吗?
我们的定价不包括适用的税金和关税(包括增值税和适用的营业税)。


问:我的数据的安全性如何?
Amazon S3 本身是非常安全的。只有存储桶和数据对象的拥有者能够访问他们创建的 Amazon S3 资源。Amazon S3 支持用户身份验证,以控制对数据的访问。您可以使用各种访问控制机制,例如存储桶策略和访问控制列表 (ACL),选择性地向用户和用户组授予权限。您可以使用 HTTPS 协议,通过 SSL 终端节点,安全地向 Amazon S3 上传数据或从 Amazon S3 下载数据。

问:如何控制对我存储在 Amazon S3 上的数据的访问?
客户可以使用四种机制来控制对 Amazon S3 资源的访问:Identity and Access Management (IAM) 策略、存储桶策略、访问控制列表 (ACL) 和查询字符串身份验证。IAM 让拥有多名员工的组织能够在一个 AWS 账户下创建和管理多个用户。通过 IAM 策略,公司可为 IAM 用户授予对 Amazon S3 存储桶或数据对象的细化控制权限,同时保留对用户执行的所有操作的完全控制。通过存储桶策略,公司可以定义广泛适用于所有 Amazon S3 资源请求的规则,例如授予对一部分 Amazon S3 资源的写入权限。客户还可以基于请求的某种特征(例如 HTTP 引用站点和 IP 地址)来限制访问。通过 ACL,客户可为特定用户授予对单个存储桶或数据对象的特定权限(例如读取、写入、完全控制)。通过查询字符串身份验证,客户可创建指向某个 Amazon S3 数据对象的 URL,仅在限定时间内有效。有关 Amazon S3 中的各种可用访问控制策略的更多信息,请参阅 Amazon S3 开发人员指南中的访问控制主题。

问:Amazon S3 是否支持数据访问审核?
是的。客户可以选择配置 Amazon S3 存储桶,为针对它的所有请求创建访问日志记录。这些访问日志记录可用于审核用途,包含有关请求的详细信息,例如请求类型、在请求中指定的资源、处理请求的时间和日期。

问:对存储在 Amazon S3 上的数据加密时,可以使用哪些选项?
您可以选择使用服务器端加密 (SSE),或者使用 Amazon S3 加密客户端等 客户端库,加密您在 Amazon S3 中的数据。两种方法都可以保护存储在 Amazon S3 上的敏感数据。如果使用客户端库,您可以保持对用于加密的密钥的控制。有些客户希望获得对密钥的更多控制;而其他客户则不希望产生管理和保护这些密钥所需 的开销。如果使用 SSE,AWS 将为您处理密钥管理和密钥保护。如果您希望 AWS 管理密钥,应该选择使用 SSE。SSE 使用了一种最强大的分组加密技术:256 位高级加密标准 (AES-256)。256 位是为 AES 定义的最大密钥大小。对于存储在标准存储和低冗余存储 (RRS) 中的数据对象,可以同时支持客户端加密和服务器端加密。有关使用 Amazon S3 服务器端加密的更多信息,请参阅 Amazon S3 开发人员指南中的使用服务器端加密上的主题。

问:Amazon S3 的耐用性如何?
Amazon S3 可在一年内提供 99.999999999% 的数据对象耐久性。这种耐久性级别相当于每年平均有 0.000000001% 的数据对象丢失。例如,如果您使用 Amazon S3 存储 10000 个数据对象,则平均每 10000000 年会发生一次单个数据对象丢失。

问:Amazon S3 的设计如何达到 99.999999999% 的持久性?
Amazon S3 将您的数据对象冗余存储在分布于您所指定的 Amazon S3 地区多个设施的多台设备上。该服务可以快速检测和修复任何丢失冗余,从而抵御同时发生的设备故障。在处理对存储数据的请求时,该服务会在返回 SUCCESS 之前,将您的数据对象冗余存储于多个设施。Amazon S3 还定期使用校验和来验证您的数据完整性。

问:Amazon S3 使用哪些校验和来检测数据损坏?
Amazon S3 结合使用内容-MD5 校验和及循环冗余检验 (CRC) 来检测数据损坏。Amazon S3 在空闲时对数据执行这些检验和检测,并使用冗余数据修复任何损坏。此外,在存储或提取数据时,该服务还对所有网络流量计算校验,以检测数据包损坏。

问:什么是版本控制?
通过版本控制,您可以保留、提取和恢复存储在 Amazon S3 存储桶中的每个数据对象的每个版本。一旦您为存储桶启用版本控制,Amazon S3 将在您每次执行 PUT、POST、COPY 或 DELETE 操作时保留现有数据对象。默认情况下,GET 请求将提取最近写入的版本。可通过在请求中指定版本,提取已覆盖数据对象或已删除数据对象的旧版本。

问:为什么应该使用版本控制?
Amazon S3 为客户提供具有很高耐久性的存储基础设施。版本控制可在客户意外覆盖或删除数据对象的情况下提供一种恢复手段,从而提供另一层保护。这使您能够从无意用户操作或应用程序故障中轻松恢复。您还可将版本控制用于数据保留和存档。

问:如何开始使用版本控制?
您可以通过在 Amazon S3 存储桶上启用相应设置,来开始使用版本控制。有关如何启用版本控制的更多信息,请参阅 Amazon S3 技术文档

问:版本控制如何防止数据对象意外删除?
当用户对某个数据对象执行 DELETE 操作时,后续默认请求将不再提取该数据对象。但是,该数据对象的所有版本将继续保留在您的 Amazon S3 存储桶中,可以提取或恢复。只有 Amazon S3 存储桶的拥有者才能永久删除某个版本。

问:如何对我使用版本控制收费?
正常 Amazon S3 费率适用于存储或请求的数据对象的每个版本。


问:什么是 S3 Standard – Infrequent Access?

Amazon S3 Standard – Infrequent Access (Standard – IA) 是一种 Amazon S3 存储类别,用于非频繁访问但在需要时要求能够快速访问的数据。Standard – IA 提供较高的耐用性、吞吐量和较低的 Amazon S3 Standard 延迟,并且每 GB 的存储价格和检索费用都较低。成本较低且性能出色使得 Standard – IA 成为长期存储和备份的理想选择,也是非常适用于灾难恢复的数据存储。Standard – IA 存储类别在对象级别进行设置,并可存储在 Standard 所在的存储桶中,从而让您可以使用生命周期策略在存储类别间自动转移对象,而无需更改任何应用程序。

问:为什么要选择使用 Standard – IA?

Standard – IA 非常适合用于非频繁访问,但在需要时也要求能够快速访问的数据。Standard – IA 非常适合用于长期文件存储、来自同步和分享的较旧数据、备份数据以及灾难恢复文件。

问:S3 Standard – IA 能提供什么样的性能?

S3 Standard – Infrequent Access 提供的性能与 S3 Standard 存储相同。

问:Standard – IA 的耐用性和可用性如何?

S3 Standard – IA 的设计可提供 99.999999999% 的耐用性,与 Standard 和 Amazon Glacier 相同。Standard – IA 的设计可提供 99.9% 的可用性,并附带服务等级协议,当在任意账单周期内可用性低于我们的服务承诺时,还可提供服务积分。

问:如何将我的数据导入 Standard – IA?

将数据导入 Standard – IA 有以下两种方法:您可以在 x-amz-storage-class 标头中指定 STANDARD_IA,通过 PUT 操作直接将数据导入到 Standard – IA。您也可以使用生命周期策略,将对象从 Standard 转移到 Standard – IA。

问:我的 Standard – IA 对象是否享有 Amazon S3 服务等级协议的保障?

是的,Standard – IA 由 Amazon S3 服务等级协议提供保障,当在任意账单周期内可用性低于我们的服务承诺时,客户还可获得服务积分。

问:使用 Standard – IA 后,将会对我的延迟和吞吐量性能产生什么样的影响?

当使用 Standard – IA 时,延迟和吞吐量性能将与 Amazon S3 Standard 相同。

问:Standard – IA 是否有最低持续时间?

Standard – IA 的设计适用于长期存储但非频繁访问的数据(已保留了数月或数年)。30 天内从 Standard – IA 删除的数据将按照完整的 30 天收费。

问:Standard – IA 是否有最小对象大小?

Standard – IA 的设计适用于较大对象,最小对象大小为 128 KB。小于 128 KB 的对象将产生存储费用,并按 128 KB 计费。比如,S3 Standard – IA 中 6 KB 的对象将产生 6KB 的 S3 Standard – IA 存储费用,而剩下的最小对象大小(等于 122 KB)将按照 S3 Standard – IA 存储费用收取。

问:我能否将 Standard – IA 的对象捆绑到 Amazon Glacier?

能。除了可使用生命周期策略将对象从 Standard 迁移到 Standard – IA,您还可设置生命周期策略来将 Standard – IA 中的对象捆绑到 Amazon Glacier。

问:什么是 S3 One Zone-IA 存储类?

S3 One Zone-IA 存储类是客户可以选择将对象存储在单个可用区中的 Amazon S3 存储类。S3 One Zone-IA 存储以冗余方式将数据存储在单个可用区内,这种存储的成本比地理上冗余的 S3 Standard-IA 存储的成本低 20%,而后者是以冗余方式将数据存储在多个地理上分离的可用区内。

S3 One Zone-IA 提供 99% 的可用性 SLA,并且在可用区内的持久性还能够达到 99.999999999%。但是,与 S3 Standard 存储类不同的是,S3 One Zone-IA 存储类不能灵活应对由地震或洪水等重大事件造成的可用区物理损失。

S3 One Zone-IA 存储提供与 S3 Standard 和 S3 Standard-IA 存储相同的 Amazon S3 功能,用户可以通过 Amazon S3 API、CLI 和控制台使用这种存储类。S3 One Zone-IA 存储类是在对象级别进行设置的,并且可以和 S3 Standard 与 S3 Standard-IA 存储类存在于同一个存储桶中。您可以使用 S3 生命周期策略在存储类之间自动转移对象,而无需更改任何应用程序。

问:S3 One Zone-IA 存储类最适合用于哪些使用案例?

客户可以将 S3 One Zone-IA 存储用于访问频率较低的存储,如备份副本、灾难恢复副本或其他易于重新创建的数据。

问:S3 One Zone-IA 存储可提供什么样的性能?

S3 One Zone-IA 存储类可提供与 S3 Standard 和 S3 Standard-Infrequent Access 存储的性能相似的性能。

问:S3 One Zone-IA 存储类的持久性如何?

S3 One Zone-IA 存储类在一个可用区内的持久性可达到 99.999999999%。但是,S3 One Zone-IA 存储不能承受住可用性下降或可用区完全毁坏的情况。相比之下,S3 Standard 和 S3 Standard-Infrequent Access 存储能够承受住可用性下降或可用区毁坏的情况。S3 One Zone-IA 存储可以提供与大多数现代物理数据中心相当或更高的持久性和可用性,同时还提供存储弹性和 Amazon S3 功能集的额外优势。

问:S3 One Zone-IA 存储类的可用性 SLA 如何?

S3 One Zone-IA 可以提供 99% 的可用性 SLA。相比而言,S3 Standard 提供 99.9% 的可用性 SLA,而 S3 Standard-IA 提供 99% 的可用性 SLA。与所有 S3 存储类一样,S3 One Zone-IA 存储类附带服务等级协议,当在任意账单周期内的可用性低于我们的服务承诺时,还可提供服务积分。请参阅 Amazon S3 服务等级协议

问:使用 S3 One Zone-IA 存储会对我的延迟和吞吐量产生什么影响?

使用 S3 One Zone-IA 存储类时,您应该会具有与使用 Amazon S3 Standard 和 S3 Standard-IA 存储类时近似的延迟和吞吐量。

问:使用 S3 One Zone-IA 存储类时,如何付费?

与 S3 Standard-IA,S3 One Zone-IA 会根据每月存储量、带宽、请求数量收费,同时还会收取提早删除费和较小对象存储费以及数据检索费。与 Amazon S3 Standard-IA 存储相比,Amazon S3 One Zone-IA 存储的每月存储费用比其低 20%,而带宽和请求的定价、提早删除费和较小对象存储费以及数据检索费与之相同。

与 S3 Standard-IA 一样,如果您在创建 S3 One Zone-IA 访问对象之后的 30 天内将其删除,则需要支付提早删除费。例如,如果您对某个对象执行了 PUT 操作,然后在 10 天后将其删除了,您仍需要支付 30 天的存储费用。

与 S3 Standard-IA 一样,S3 One Zone-IA 存储类的最小对象大小为 128 KB。小于 128 KB 的对象将产生存储费用,并按 128 KB 计费。比如,S3 One Zone-IA 存储类中 6 KB 的对象将产生 6 KB 的存储费用,而剩下的最小对象大小(等于 122 KB)将按照 S3 One Zone-IA 存储费用收取。请参阅定价页面,了解有关 S3 One Zone-IA 定价的信息。

问:S3 One Zone-IA 中的“区域”与 AWS 可用区是否一样?

是。每个 AWS 区域都是一个独立的地理区域。每个区域都有多个相互隔离的位置,称为可用区。Amazon S3 One Zone-IA 存储类使用区域内的单个 AWS 可用区。

问:Amazon EC2 和 Amazon S3 使用特定于可用区的资源的方式有差异吗?

有。Amazon EC2 让您能够在区域内选择可用区来放置资源,例如计算实例。当您使用 S3 One Zone-IA 时,它会根据可用容量分配区域内的一个 AWS 可用区。

问:我是否可以拥有在不同存储类和可用区具有不同对象的存储桶?

可以,您可以拥有包含存储在 S3 Standard、S3 Standard-IA 和 S3 One Zone-IA 中的不同对象的存储桶。

问:S3 One Zone-IA 是否在 S3 运行的所有 AWS 区域都可用?

是。

问:通过使用 S3 One Zone-IA,我将放弃多少灾难恢复保护能力?

每个可用区均使用冗余电源和联网。在 AWS 区域内,可用区位于不同的冲积平原和地震断裂带,并且在地理位置上是分离的,以避免受到火灾的影响。S3 Standard 和 S3 Standard-IA 存储类通过以冗余方式将数据存储在多个可用区来避免受到这类灾难的影响。S3 One Zone-IA 可以保护用户免受可用区内设备故障的影响,但无法抵御可用区丢失的影响。借助 S3 One Zone-IA、S3 Standard 和 S3 Standard-IA 选项,您可以选择最符合您的存储持久性和可用性要求的存储类。


问:Amazon S3 是否能将数据元归档到成本更低廉的存储选项?
可以,Amazon S3 让您能够将价格低廉的 Amazon Glacier 存储服务作为您数据存档时的存储选项。Amazon Glacier 是优化给不经常访问的数据,通常数小时的检索时间是可被接受的。此类应用示例包括了数字媒体归档、财务和健康记录、原始基因组序列数据、长期数据库备份,以及法律规定必须保留的数据。

问:如何在 Amazon Glacier 中存储数据?
您可以根据数据对象的生命周期,利用生命周期策略自动将 Amazon S3 数据对象集存档到 Amazon Glacier。使用 Amazon S3 管理控制台、AWS 开发工具包或 Amazon S3 API 来定义存档规则。规则将指定前缀和时间期限。前缀(如:“logs/”)识别服从此规格的数据对象。时间期限可指定在该数据对象创建多少天(如 180 天)或在某个日期后应将该数据对象存档。名称以指定前缀开头和在超过指定时间期限老化的任何 Amazon S3 Standard 存储和 S3 Standard-IA 存储数据对象都将存档到 Amazon Glacier。要检索存储在 Amazon Glacier 中的 Amazon S3 数据,您需要通过 Amazon S3 API 或管理控制台启动恢复任务。恢复任务通常会在 3 到 5 小时内完成。任务完成后,您就可以通过 Amazon S3 GET 数据对象查询访问这些数据了。

问:是否可以使用 Amazon S3 API 或管理控制台来列出已存档到 Amazon Glacier 的数据对象?
可以,与其他 Amazon S3 存储选项(Standard 或 Standard-IA)类似,使用 Amazon S3 API 或管理控制台存储在 Amazon Glacier 中的对象也有相关联的用户定义名称。您可以使用 Amazon S3 LIST API 实时获得所有 Amazon S3 数据对象名称的列表,包括那些使用 Amazon Glacier 选项进行存储的数据对象。

问:是否可以使用 Amazon Glacier API 来访问已归档到 Amazon Glacier 的数据元?
由于 Amazon S3 维护着用户定义数据对象名称和 Amazon Glacier 系统定义标识符之间的映射,所以使用 Amazon Glacier 选项存储的 Amazon S3 数据对象只能通过 Amazon S3 API 或 Amazon S3 管理控制台来访问。

问:如何恢复存档在 Amazon Glacier 中的数据对象?
要恢复存储在 Amazon Glacier 中的 Amazon S3 数据,您需要使用 Amazon S3 API 或 Amazon S3 管理控制台提出恢复请求。恢复请求常会在 3 到 5 小时内完成。恢复请求会在 RRS 中创建临时数据副本,同时在 Amazon Glacier 中完整保留已存档数据。您可以以天为单位指定将临时副本存储在 RRS 上的时间。然后,可以通过 Amazon S3 GET 从 RRS 请求访问已存档数据对象的临时副本。

问:恢复存储在 Amazon Glacier 中的数据对象需要多长时间?
处理恢复任务时,Amazon S3 首先从 Amazon Glacier 检索请求的数据(通常需要 3-5 小时),然后在 RRS 中创建请求数据的临时副本(通常需要数分钟)。您可以认为大部分通过 Amazon S3 API 或管理控制台启动的恢复任务可在 3-5 小时内完成。

问: 可以免费恢复多少数据?
您每月最多可以免费恢复存储在 Amazon Glacier 中的 Amazon S3 数据的 5%。一般而言,这足以满足您备份和存档需要。每月 5% 的最高免费恢复限额是按日比例计量的。例如,您在某一天,将 12 TB 的 Amazon S3 数据归档到 Amazon Glacier,那么这一天您可以免费恢复 20.5 GB 数据(假定该月为 30 天,则为:12 TB x 5% / 30 天 = 20.5 GB)。

问:删除存储在 Amazon Glacier 中不到 3 个月的数据对象时,如何收费?
Amazon Glacier 是专为需要长久保留数据的使用案例设计的。如果要删除的数据对象已存档在 Amazon Glacier 中不少于 3 个月,则可以免费删除。如果要在存档后三个月内删除或覆盖存档在 Amazon Glacier 中的数据对象,则需要交纳提早删除费。该项费用是按比例收取的。如果您在上传 1 个月后删除 1 GB 数据,将需要支付提早删除费,用于支付后面 2 个月的 Amazon Glacier 存储费。如果您 2 个月后删除 1 GB ,则需要支付 1 个月的 Amazon Glacier 存储费。


问题 1:什么是 Amazon S3 事件通知?

Amazon S3 事件通知可在响应 Amazon S3 中的操作(如 PUT、POST、COPY 或 DELETE)时发送。通知消息可通过 Amazon SNS 或 Amazon SQS 发送。

问题 2:Amazon S3 事件通知有哪些用途?

Amazon S3 事件通知可使您运行工作流、发送警报或执行为响应存储在 Amazon S3 中的对象的更改而作的其他操作。您可以使用 Amazon S3 事件通知来设置触发器以执行各种操作,包括在上传媒体文件时转码,在数据文件可用时进行处理以及将 Amazon S3 对象与其他数据存储进行同步。您还可以根据对象名前缀和后缀来设置事件通知。例如,您可以选择接收以“images/”开头的对象名的通知。

问题 3:Amazon S3 事件通知中包含什么内容?

有关 Amazon S3 事件通知消息中所包含信息的详细描述,请参阅 Amazon S3 开发人员指南中的“配置 Amazon S3 事件通知”主题。

问题 4:如何设置 Amazon S3 事件通知?

关于如何配置事件通知的详细描述,请参阅 Amazon S3 开发人员指南中的配置 Amazon S3 事件通知主题。

问题 5:使用 Amazon S3 事件通知的成本是多少?

使用 Amazon S3 事件通知,无需支付额外费用。发送事件通知时,您只需为 Amazon SNS 或 Amazon SQS 的使用付费。要查看这些服务的定价详情,请访问 Amazon SNS 或 Amazon SQS 定价页面。


问:什么是 S3 分析 – 存储类分析?
借助存储类分析,您可以分析存储访问模式并将相应数据转移到合适的存储类。这一新的 S3 分析功能可自动识别何时为不频繁使用模式,以帮助您将存储转换为 S3 Standard-IA、S3 One Zone-IA 或 Amazon Glacier。您可以配置存储类分析策略来监控整个存储桶、前缀或对象标签。对低频率访问模式进行观察后,您可以基于结果轻松创建一个新的生命周期策略。存储类分析还以可视化方式在 AWS 管理控制台上提供您每天的存储使用情况,您可将这些分析结果导出至 S3 存储桶,使用您所选的商业智能工具进行分析。

问:如何开始使用 S3 Analytics – Storage Class Analysis?
您可以使用 AWS 管理控制台或 S3 PUT Bucket Analytics API 配置 Storage Class Analysis 策略,使之标识可转换为 Standard-IA 或存档到 Glacier 的低频率访问存储。您可以导航至“S3 控制台”中的“管理”选项卡来管理 S3 Analytics、S3 Inventory 和 S3 CloudWatch 指标。

问:使用 S3 Analytics – Storage Class Analysis 时,如何付费?
有关 S3 Analytics – Storage Class Analysis 定价的更多信息,欢迎致电咨询。

问:Storage Class Analysis 多久更新一次?
Storage Class Analysis 每日将在 S3 管理控制台上进行更新。此外,您可以将 S3 Analytics 配置为将您的每日存储类分析导出到您选择的 S3 存储桶。

问:什么是 S3 Inventory?
S3 清单可为 Amazon S3 的同步列表 API 提供预定的替代方案。您可以通过配置 S3 清单,针对 S3 存储桶或前缀每日或每周提供一次您的对象及其对应元数据的 CSV 或 ORC 文件输出。您可以使用 S3 清单简化并加快业务工作流和大数据作业。您可以使用 S3 清单验证对象的加密和复制状态是否符合业务、合规性和法规要求。

问:如何开始使用 S3 Inventory?
您可以使用 AWS 管理控制台或 PUT Bucket Inventory API,为您 S3 存储桶中的所有对象或某个共享前缀下的对象子集配置每日或每周库存。在配置过程中,您可以指定清单的目标 S3 存储桶、输出文件的输出格式(CSV 或 ORC)以及您的业务应用程序所需的具体对象元数据,例如:对象名称、大小、上次修改日期、存储类型、版本 ID、删除标记、非当前版本标记、分段上传标记、复制状态或加密状态。

问:S3 Inventory 会改善我的大数据作业和业务流程应用程序的性能吗?
会的,S3 Inventory 可用作大数据作业或工作流程应用程序的现成输入,而不是同步的 S3 LIST API,从而节约了它在调用和处理 LIST API 响应方面所用的时间和计算资源。

问:可以对使用 S3 清单编写的文件进行加密吗?

可以,您可以通过配置,对使用 S3 清单编写的所有文件进行 SSE-S3 加密。有关更多信息,请参阅用户指南。

问:如何使用 S3 清单?

您可以将 S3 清单用作应用程序工作流或大数据作业的直接输入。您也可以借助 Presto、Hive 和 Spark 等工具使用标准 SQL 语言查询 S3 清单。

问:使用 S3 Inventory 时,如何收费?
请查看 Amazon S3 定价页面,获取有关 S3 Inventory 定价的一般信息。

问:如何开始使用 S3 CloudWatch 指标?
使用 AWS 管理控制台,可在 1 分钟内为您的 S3 存储桶生成 CloudWatch 指标,或使用前缀或对象标签配置指标的筛选条件。此外,还可以通过调用 S3 PUT Bucket Metrics API 来启用 S3 存储指标的发布并对其进行配置。存储指标在启用后的 15 分钟内即可在 CloudWatch 中使用。

问:我能否使存储指标符合我的应用程序或企业组织的需求?
能,您可以配置 S3 CloudWatch 指标,使之生成有关您 S3 存储桶的指标,或使用前缀或对象标签配置指标的筛选条件。例如,您可以将前缀“/Bucket01/BigData/SparkCluster”用作指标筛选条件 1,对访问数据的 spark 应用程序进行监控,并将标签“Dept, 1234”定义为指标筛选条件 2 (第二个指标筛选条件)。一个对象可以是多个筛选条件中的成员,例如,前缀“/Bucket01/BigData/SparkCluster”中的一个对象和带标签“Dept,1234”的对象都可以同时出现在指标筛选条件 1 和 2 中。这样,指标筛选条件便可符合业务应用程序、团队结构或组织预算需求,从而可在同一个 S3 存储桶中对多个工作负载进行分别监控和提醒。

问:我可以对我的存储指标设置哪些警报?

您可以使用 CloudWatch 对任何存储指标数量、计数器或等级设置阈值,当值达到此阈值时,就触发相应操作。例如,您对 4xx 错误响应的百分比设置一个阈值,当值超出此阈值至少 3 个数据点时,就触发 CloudWatch 警报以提醒 Dev Ops 工程师。

问:使用 S3 CloudWatch 指标时,如何收费?
S3 CloudWatch 指标是依据 Amazon CloudWatch 的自定义指标定价的。请查看 Amazon CloudWatch 定价页面,获取有关 S3 CloudWatch 指标定价的一般信息。

问:什么是对象标签?
S3 对象标签是适用于 S3 对象的键值对,在对象的生命周期内,可随时创建、更新或删除这些标签。借助这些标签,您将能够创建 Identity and Access Management (IAM) 策略,设置 S3 生命周期策略以及自定义存储指标。然后,可以使用这些对象级标签管理后台中存储类别与过期对象之间的转换。

问:我如何对我的对象应用对象标签?
上传新对象时,您可以向其添加标签,也可以向现有对象添加标签。每个 S3 对象最多可添加 10 个标签,您可以使用 AWS 管理控制台、REST API、AWS CLI 或 AWS SDK 添加对象标签。

问:我为何应使用对象标签?
借助对象标签这一新工具,您可以简化 S3 存储的管理。使用此工具能够在对象的生命周期内随时创建、更新和删除标签,从而使您的存储能够满足您业务的需求。借助这些标签,您可以控制对标记有特殊键值对的对象的访问,从而可以进一步保护机密数据,使之仅供精选组或用户访问。对象标签还可用于为属于特定项目或业务单位的对象添加标签,这可以与生命周期策略结合使用来管理向 S3 Standard – Infrequent Access 和 Glacier 存储级的转换。

问:我如何更新对象上的对象标签?
在 S3 对象的生命周期内,您可以随时更改对象标签,您可以使用 AWS 管理控制台、REST API、AWS CLI 或 AWS SDK 更改对象标签。请注意,在 AWS 管理控制台之外进行的所有更改均是对整个标签集合进行的更改。如果某个特定对象关联了 5 个标签,您要为其添加第 6 个标签,那么您需要在该请求中包括最初的 5 个标签。

问:如果我使用跨地区复制,我的对象标签也会复制吗?
使用跨地区复制可以跨地区复制对象标签。有关设置跨地区复制的更多信息,请访问《Amazon S3 开发人员指南》中的如何设置跨地区复制。

对于已启用跨地区复制的用户,需要具有新的权限才能复制标签。有关所需策略的更多信息,请访问《Amazon S3 开发人员指南》中的如何设置跨地区复制。 

问:对象标签的费用是多少?
有关更多信息,请访问 S3 定价页面。

问:什么是生命周期管理?

借助 S3 生命周期管理,您可以通过预定义的策略定义对象的生命周期并降低存储成本。基于数据的使用年限,您可以设置生命周期转移策略,将 Amazon S3 对象自动迁移到 Standard – Infrequent Access (Standard – IA) 或 Amazon Glacier。此外,您还可以设置生命周期过期策略,以便基于对象的使用年限自动删除过期对象。您可以设置分段上传过期策略,以便基于上传时间终止尚未完成的分段上传。

问:如何设置生命周期管理策略?

您可以在 S3 控制台、S3 REST API、AWS 开发工具包或 AWS 命令行界面 (CLI) 中制定和管理生命周期策略。您可以在前缀或存储桶级别指定策略。

问:使用生命周期管理如何收费?

设置和应用生命周期策略无需额外付费。根据生命周期规则,当对象符合转移条件时,每个对象的转移请求都需付费。

问:生命周期管理策略有哪些用途?

随着时间推移,数据可能会不再那么重要而有价值,或是不再受合规性要求的约束。Amazon S3 中包含各种各样的策略库,可帮助您自动执行数据迁移流程。例如,您可以将非频繁访问的对象设置为在一段时间后移动到成本较低的存储层级(例如 Standard – Infrequent Access)。再过一段时间,它可能会移动到 Amazon Glacier 中进行归档和实现合规性,并且最终会被删除。这些规则会在您不知觉的情况下降低存储成本并简化管理工作,还可用于 Amazon 系列存储服务。此外,这些策略还包含效果出色的管理实践,指导如何删除不再需要的对象和属性,从而管理成本并优化性能。

问:如何利用 Amazon S3 的生命周期策略来降低 Amazon S3 存储成本?

借助 Amazon S3 生命周期策略,您可以配置在特定时间期限后是将对象迁移到 Standard – Infrequent Access (Standard – IA),归档到 Amazon Glacier,还是将其删除。您可以利用此策略驱动的自动化操作来轻松快速地降低存储成本和节省时间。在每个规则中,您都可以指定前缀、时间期限、转移到 Standard – IA 或 Amazon Glacier 和/或过期。例如,您可以创建一个规则,规定将带有常见前缀“logs/”且创建后已有 30 天的所有对象归档到 Amazon Glacier,并且这些对象将于自创建之日起的 365 天后失效。您还可以创建单独的规则,规定仅带有前缀 “backups/” 且自创建后已有 90 天的所有数据对象开始失效。生命周期策略对现有数据对象和新的 S3 数据对象都适用,从而确保您能够针对所有当前数据和 S3 中存储的任何新数据优化存储、最大限度地节省成本,而无需耗时的手动数据检查和迁移。在生命周期规则内,前缀字段用于识别服从该规则的数据对象。要将规则应用于单个数据对象,请指定键名称。要将规则应用于一组数据对象,请指定它们的共同前缀(例如 “logs/”)。您可以指定迁移操作和过期操作以存档或删除数据对象。关于时间期限,您可以指定一个创建日期(如 2015 年 1 月 31 日)或自创建之日算起的天数(如 30 天),以便在此日期或超过此天数后将对象归档或删除。您可为不同前缀创建多条规则。最后,您可以使用生命周期策略使未完成上载自动过期,从而防止部分文件上载的计费。

问:如何将数据对象配置为在特定时间段之后删除?

您可以设置生命周期过期策略,在指定天数之后将数据对象从您的存储桶中删除。您可以通过应用于存储桶的生命周期配置策略,为位于您的存储桶中的一组数据对象定义过期规则。通过每条数据对象过期规则,您可以指定前缀和过期时段。前缀字段标识了要遵守规则的数据对象。要将规则应用于单个数据对象,请指定键名称。要将规则应用于一组数据对象,请指定它们的共同前缀(例如 “logs/”)。对于过期时段,请指定从创建日期之日开始的天数(即寿命),超过这个天数之后,该数据对象将被删除。您可为不同前缀创建多条规则。例如,您可以创建一条规则,将具有前缀 “logs/” 的所有数据对象在创建 30 天之后删除,另外创建一条单独规则,将具有前缀 “backups/” 的所有数据对象在创建 90 天之后删除。

添加数据对象过期规则之后,该规则被应用于已存在于存储桶中的数据对象,以及添加到存储桶中的新数据对象。一旦数据对象超过它们的过期日期,将对它们进行标识,并排队进行删除。如果数据对象的存储时间到期或者过期,我们不会向您收取费用,而且当对象在排队等候删除之时,您仍可以访问它们。对于标准删除请求,Amazon S3 不会因为使用数据对象过期功能来删除数据对象而向您收取费用。您也可以为版本控制已启用或已挂起的存储桶设置过期规则。

问:为什么要使用生命周期策略让未完成的分段上传过期?

使用生命周期策略让未完成的分段上传过期,可通过限制未完成的分段上传的存储时间,帮助您节省成本。例如,如果您的应用程序上传了若干分段对象部分,但从未提交,那么您仍然需要为其存储付费。此策略可在预定义的天数后自动移除未完成的分段上传及其相关存储,从而降低您的 S3 存储费用。

 

问:Amazon S3 跨区域复制 (CRR) 是什么?

CRR 是 Amazon S3 的一项功能,可跨您选择的 AWS 区域自动复制数据。通过 CRR,每个上传到 S3 存储桶的对象都会自动复制到您选择的不同 AWS 区域中的目标存储桶中。您可以使用 CRR 在不同的地理区域中提供低延迟的数据访问。如果您需要遵循将数据副本在相距数百公里的不同地点储存的合规性要求,CRR 还可以帮助您达成这一目标。中国区域和中国境外的 AWS 区域之间不支持 CRR。

问:如何启用 CRR?

CRR 是存储桶级的配置。在不同区域中指定目标存储桶用于复制,这样就可以对来源存储桶启用 CRR 配置。您还可以使用 AWS 管理控制台、REST API、AWS CLI 或 AWS 软件开发工具包来启用 CRR。要启用 CRR,必须对来源存储桶和目标存储桶都打开版本控制功能。要了解更多信息,请访问 Amazon S3 开发人员指南中的“How to Set Up Cross-Region Replication”部分。

问:CRR 会向目标存储桶复制哪些内容?

CRR 会将您对来源存储桶直接进行的每一个对象级上传进行复制。元数据和与对象关联的 ACL 也是复制的一部分。对对象的底层数据、元数据或 ACL 进行的任何改动都会触发向目标存储桶的新复制活动。您可以选择复制上传到来源存储桶的全部对象,也可以通过指定前缀来选择上传对象的子集。启用 CRR 前已经存在的数据不会复制。您可以使用 S3 的 COPY API 将现有数据复制到目标存储桶。要了解有关 CRR 的更多信息,请访问 Amazon S3 开发人员指南中的“How to Set Up Cross-Region Replication”部分。

问:能否对 CRR 使用生命周期规则?

可以,您可以对来源存储桶和目标存储桶配置单独的生命周期规则。比如,您可以配置一个生命周期规则,从而在目标存储桶将数据从 S3 Standard 迁移到 Standard-IA,或者配置一个生命周期规则来将数据归档到 Amazon Glacier。

问:在整个复制过程中,对象是否可以安全传输和加密?

是的,在整个 CRR 过程中,对象都保持加密状态。加密对象通过 SSL 从来源区域安全地传输到目标区域。

问:我可以跨账户使用 CRR 吗?

可以,您可以跨账户设置 CRR,以将复制的数据存储在目标区域的不同账户中。您可以在复制配置中使用所有权覆盖来维护来源和目标之间的不同所有权堆栈,并将目标账户所有权授予复制的存储。

问:CRR 如何定价?

您需要为 Amazon S3 服务的存储、复制请求,以及复制数据的跨区域数据传输而支付通常会产生的费用。复制请求和跨区域数据传输的费用根据来源区域而定。复制数据存储的费用根据目标区域而定。

如果源对象是通过分段上传功能上传的,则使用相同数量的段和段大小进行复制。例如,通过分段上传功能上传的 100GB 对象(800 个段,每段 128MB)在复制时会产生与 802 个请求(800 个上传段请求 + 1 个初始分段上传请求 + 1 个完成分段上传请求)关联的请求成本。复制后,该 100GB 数据会产生基于目标区域的存储费用。请访问 S3 定价页面了解定价相关信息。

问:什么是 S3 Select?

S3 Select 是一种 Amazon S3 功能,可使用简单的 SQL 表达式轻松检索对象内容中的具体数据,而无需检索整个对象。您可以利用 S3 Select,在 Amazon S3 中使用 SQL 语句(例如 SELECT 和 WHERE)检索带分隔符的文本文件和 JSON 对象内的数据子集。

问:S3 可以用来做什么?

您可以使用 S3 Select 通过简单的 SQL 语句检索对象内较小且具有针对性的数据集。您可以结合使用 S3 Select 与 AWS Lambda 来构建无服务器应用程序,此类应用程序可使用 S3 Select 有效且轻松地检索 Amazon S3 中的数据,而不是检索和处理整个对象。您也可以结合使用 S3 Select 与大数据框架(例如 Presto、Apache Hive 和 Apache Spark)来扫描和筛选 Amazon S3 中的数据。

问:为什么应使用 S3 Select?

S3 Select 提供了一种使用 SQL 语句检索 Amazon S3 存储对象内容中的具体数据的新方法,无需检索整个对象。S3 Select 简化了扫描对象内容并将其筛选成更小且具有针对性的数据集的流程,将这一性能提升高达 400%。借助 S3 Select,您还可以对 Amazon S3 中的日志文件执行操作调查,无需操作或管理计算群集。