跳至主要内容

Amazon ElastiCache 新增了 13 项 Amazon CloudWatch 指标,用于网络容量规划和引擎诊断

发布于: 2026年5月7日

Amazon ElastiCache 客户现在能够通过使用针对节点式集群的十三项新的 Amazon CloudWatch 指标来检测网络节流、内存碎片化以及连接耗尽等问题。您可以直接从 Amazon CloudWatch 监控这些主机级和引擎级诊断,而无需在单个节点上运行 INFO 命令或根据原始字节计数器计算基准值。

·       网络容量:NetworkBaselineUsageInPercentage、NetworkBaselineUsageOutPercentage、NetworkBaselineMaxUsageInPercentage 和 NetworkBaselineMaxUsageOutPercentage 报告与实例基线相对应的网络使用情况,以实现可移植的警报功能,这些警报在实例类型变更时仍能保持有效。值高于 100% 表明主机正在使用突发服务抵扣金,这是持续工作负载将最终导致服务抵扣金耗尽并触发限制的一个重要指标。捕捉每秒最大报告峰值(即平均指标)的变体可能会隐藏起来

·       内存运行状况:UsedMemoryDataset 显示实际存储数据所占用的内存,不包括引擎的开销部分。AllocatorFragmentationBytes 和 AllocatorFragmentationRatio 隔离 activedefrag 参数可以解决的碎片化问题。MajorPageFaults 捕获的是操作系统层面的页面错误情况,这类错误表明内存压力已超出引擎所能承受的范围。

·       连接运行状况:BlockedConnections 和 RejectedConnections 分别指代的是那些因执行阻塞命令而处于等待状态的连接,以及当达到最大客户端数限制时被拒绝的连接。当 RejectedConnections 不为零时,增加最大客户端数值或者诊断客户端连接池的泄漏问题。

·       发布/订阅工作负载:PubSubChannels 和 PubSubShardChannels 公开每个节点上活跃的经典通道和分片通道。当经典通道数量随着使用量的增加而增多时,可以考虑切换到分片式发布/订阅模式以实现横向扩展。

·       命令吞吐量:ProcessedCommands 提供所有命令类型的总命令吞吐量。

基于节点的集群的这些指标信息已在支持 Amazon ElastiCache 的由光环新网运营的亚马逊云科技中国(北京)区域和由西云数据运营的亚马逊云科技中国(宁夏)区域免费提供。

首先,请在 Amazon ElastiCache 控制台监控选项卡或 Amazon CloudWatch 控制台的 Amazon/ElastiCache 命名空间中查看新指标。要了解更多信息,请参阅主机级指标Valkey 和 Redis OSS 的指标