发布于: Mar 22, 2022

Amazon Redshift 节点类型将直接决定节点中配备的 CPU、内存、存储容量以及存储驱动器类型。RA3 节点类型允许您独立扩展计算与存储资源,大家也需要为实际使用的计算量与 Amazon Redshift 托管存储(RMS)单独付费。DS2 节点类型则经过优化,能够存储大量数据并使用磁盘驱动器(HDD)存储形式。如果您目前正在使用 DS2 节点,请考虑升级至 RA3 集群,从而以相同的成本获得 2 倍的性能与存储资源。密集型计算(DC)节点类型则针对计算类工作负载进行优化。由于 DC2 节点类型使用固态存储(SSD)驱动器,因此相当于对性能密集型工作负载进行了优化。
Amazon Redshift 节点类型还提供不同的节点大小选项。节点大小与节点数量决定了集群中的总体存储容量。我们建议:1)如果压缩后的数据大小小于 1 TB,则应选择 DC2 节点类型;2)如果压缩后的数据大小超过 1 TB,请选择 RA3 节点类型(RA3.4xlarge 或者 RA3.16xlarge)。关于更多详细信息,请参阅 Amazon Redshift 中的集群与节点。

您在节点类型的选择当中,应考虑以下几项影响因素:

  • 下游系统为了满足服务水平协议(SLA)所提出的实际计算资源需求。
  • 您需要在数据库中支持的查询与并发操作复杂度。
  • 在实现工作负载最佳性能与保障预算之间做出权衡。
  • 您希望存储在集群中的数据量。

关于 Amazon Redshift 集群节点类型与集群大小的更多详细信息,请参阅 Amazon Redshift 中的集群与节点。

随着数据与性能需求的不断变化,您还可以轻松调整集群大小,以充分利用 Amazon Redshift 提供的计算与存储选项。您可以使用 Elastic Resize 在几分钟之内实现对 Amazon Redshift 集群的规模伸缩调整,处理可预测的峰值工作负载,并通过自动并发扩展功能提高即席查询工作负载的性能表现。

除了将传统 MPP 数据仓库内的数据迁移至 Amazon Redshift 托管存储中之外,将这类数据迁移至其他目的地的场景也相当常见。您可以将冷数据或历史数据发送至 Amazon S3 数据湖以节约成本,也可以将温数据或热数据发送至 Amazon Redshift 集群以实现最佳性能。Amazon Redshift Spectrum 可帮助您轻松查询并联接各 Amazon Redshift 数据仓库与 Amazon S3 数据湖之间的数据。使用 Amazon Glue Amazon Lambda 函数带来的强大无服务器数据湖架构以及“湖边小屋”架构功能,您可以进一步简化ETL数据管道并将 Amazon S3 数据湖中的数据与云端数据仓库相结合,最大限度减少需要加载至 Amazon Redshift 的数据量。关于更多详细信息,请参阅使用 Amazon Redshift 时的湖边小屋架构 ETETL 设计:第一部分,以及使用 Amazon Glue 触发器为数据目录及 ETL 作业构建并自动化操作无服务器数据湖。

相关文章