发布于: Mar 11, 2022

Amazon CloudWatch 代理现在支持从运行 Linux 的 Amazon Elastic Compute Cloud (Amazon EC2) 加速计算实例中收集 NVIDIA GPU 性能指标。基于 GPU 的实例提供了通过数千个计算内核访问 NVIDIA GPU 的权限。您可以使用这些实例加速科学、工程和渲染应用程序。客户可以安装和配置 CloudWatch 代理,以从 Amazon EC2、本地主机和容器化应用程序收集系统和应用程序指标,然后将其发送给 CloudWatch。CloudWatch 为您提供数据和可指导行动的洞察,以监控您的应用程序和优化资源使用率。GPU 指标适用于想要监控其 EC2 加速实例中的 GPU 协处理器使用率的用户。

使用 CloudWatch 代理,您现在可以收集 NVIDIA GPU 指标并将它们发送给 CloudWatch。GPU 指标可以帮助您确保高效、经济地使用 GPU 加速器。通过在 CloudWatch 控制面板上监控 GPU 使用率和可用内存之类的指标,您可以识别加速器何时使用过度或使用不足,从而使您能够适当调整实例的大小或预置其他主机。您可以通过使用 CloudWatch 异常检测来发现异常,并通过 CloudWatch 告警接收通知。

Amazon CloudWatch 代理功能现已在由光环新网运营的亚马逊云科技中国(北京)区域和由西云数据运营的亚马逊云科技中国(宁夏)区域开放。

有关如何开始使用的说明,请参阅 Amazon CloudWatch 用户指南中的创建或编辑 CloudWatch 代理配置文件。要了解加速计算实例的更多信息,请参阅 Amazon EC2 用户指南中的 Linux 实例用户指南。有关 CloudWatch 功能的更多信息,请参阅 CloudWatch 用户指南