使用亚马逊 CloudWatch 和亚马逊云科技 X-Ray 降低 MTTR

在无服务器环境中运行基于微服务的工作负载的客户经常会遇到故障排除问题，因为他们需要的数据可以分布在成百上千个组件上。在这篇博客文章中，我将演示如何使用 Am azon CloudWatch ServiceLens 和亚马逊云科技 X-Ray 缩短无服务器工作负载的平均解决时间（MTTR，或修复或减轻故障影响所需的平均时间）。成功的监控策略依赖于可观测性的所有三个支柱（指标、日志和跟踪），并且可以在单个视图中显示所有这些支柱的见解。

了解你的依赖关系

CloudWatch ServiceLens 可帮助您可视化分布式环境并了解服务之间的依赖关系。它将指标、日志和跟踪汇总到服务地图中，因此您可以专注于组件之间的集成，并在问题发生时查明问题。您的资源和仪表化应用程序在有向图上显示为节点，节点之间的边缘代表它们之间发生的交易。遇到问题的节点将根据错误类型使用彩色轮廓，可以帮助突出架构中遇到故障或当前处于警报状态的点。

Screenshot of the ServiceLens Map showing multiple services from the PetAdoptions application used by the AWS One Observability workshop.

图 1：CloudWatch 服务镜头地图

默认情况下，每个节点的大小及其之间的边缘代表它们正在接收的请求数。可以通过选择齿轮图标加载 “ 首选项 ” 对话框并选择其他衡量标准（例如延迟）来更改此设置。选择节点将打开一个面板，其中包含更多指标，显示一段时间内的延迟、请求和故障，并提供指向您的日志、跟踪和更详细的仪表板的链接。

Screenshot of metrics shown when the node representing a DynamoDB table is selected from the ServiceLens Map.

图 2：DynamoDB 表指标

该面板还将显示与资源相关的所有警报。在上图中，您可以看到 DynamoDB 表的两个警报当前处于警报状态。

Screenshot of active alarms shown when the node representing a DynamoDB table is selected from the ServiceLens Map.

图 3：DynamoDB 表警报

回到服务地图，让我们看一下其中一个出现故障的节点，然后选择 “ 查看连接 ”，重点关注该特定资源的所有传入和传出请求。或者，您可以使用 X-Ray 群组将重点放在服务图中的节点子集上。要进一步深入了解，请查看之前关于群组及其用例的博客文章。

Screenshot of incoming and outgoing traffic for a single node from the ServiceLens Map. Incoming traffic from one client has a 24% error rate.

图 4：PetSearch 微服务的传入和传出请求

从前面的图片中，你可以看到有三个节点向后端 PetSearch 微服务发出请求，其中只有两个节点遇到了问题。选择其中一条边会出现一个面板，该面板上有一个 响应时间分布图 ，汇总了该路径上的流量。如果要排除延迟故障，可以突出显示图表中显示响应时间较慢的部分，然后打开 “ 查看筛选的跟踪 ” 按钮以获取所选时间窗口内的跟踪列表。 在这种情况下，我更关心来自前端 PetSite 服务的 24% 错误率，因此我选中 24% 故障 (5xx) 旁边的复选框并打开 “查看筛选的跟踪记录”。

Screenshot of response time distribution shown when an edge between two nodes on the ServiceLens Map is selected.

图 5：响应时间分布

这将加载一个新页面，如果需要，你可以在其中进一步细化查询。从表中选择第一条追踪信息，您将进入 跟踪详细信息 页面。

Screenshot of details for a single trace showing the segment timeline and the stack trace associated to the exception raised in one of the subsegments.

图 6：追踪详情

使用 区段时间表 ，您可以清楚地了解分布式系统中发生的事情，并可以清楚地看到每个响应的状态以及请求需要多长时间才能得到答复。从时间轴中选择一个区段会加载一个包含其他详细信息的面板，这样您就可以在 “ 异常 ” 选项卡上看到失败的根本原因是导致授权错误的权限问题。该页面还显示与跟踪相关的所有服务的关联日志消息列表，使您可以在一个地方查看来自不同日志组的日志。

与亚马逊云科技 X-Ray 集成

ServiceLens 使用来自 X-Ray 的跟踪来构建其服务地图，以了解服务之间的依赖关系。虽然您想要捕获的某些互动需要对工作负载进行检测，但许多亚马逊云科技服务开箱即用地支持 X-Ray 集成，只需要您选择加入。有关完整列表，请参阅将亚马逊云科技 X-Ray 与其他亚马逊云科技服务集成。

为您的亚马逊云科技 Lambda 函数启用 X-Ray

打开亚马逊云科技 Lambda 控制台
从列表中选择您的函数函数
选择 “ 配置 ” 选项卡，然后选择 “ 监控和操作工具 ”
选择 “ 编辑” ，然后在 亚马逊云科技 X- Ray 下切换 “ 活动跟踪 ”

Screenshot showing which monitoring tools are enabled for a Lambda function.

图 7：亚马逊云科技 Lambda 配置工具

Screenshot of toggle used to enable AWS X-Ray with a single click for a Lambda function.

图 8：启用亚马逊云科技 X-Ray

在为您的 Lambda 函数启用主动跟踪的页面上，您还将在增强监控标题下看到启用 CloudWatch Lambda Insig hts 的选项。 此功能用于收集、汇总和汇总系统级指标；有关更多信息，请参阅之前详细介绍如何监控亚马逊云科技 Lambda 错误的博客文章。

结论

在这篇文章中，我回顾了一些可以使用 CloudWatch ServiceLens 和亚马逊云科技 X-Ray 来监控和观察分布式工作负载的方法，重点是服务之间的集成。收到问题警报后，ServiceLens可以帮助您深入研究相关痕迹，以便您可以诊断故障并开始制定恢复正常业务运营的计划。

有兴趣进一步了解监控和可观测性吗？查看使用亚马逊云科技原生工具监控您的 Lambda 工作负载的亚马逊云科技可观测性最佳实践和指南。要获得使用亚马逊云科技原生或托管开源工具的指导性动手体验，请查看 O ne 可观测性研讨会。

作者简介

快速注册账号　享用免费套餐

跟随注册步骤详解，三分钟快速创建账号，领取免费权益 立即注册 »

1 进入注册页面
1. 打开中国区

账号注册页面

输入邮箱 - 邮箱验证

1. 打开中国区账号注册页面

输入邮箱 - 邮箱验证

立即开始注册立即开始注册

01

填写您

注册账号的邮箱

点击“继续”

01

填写您

注册账号的邮箱

点击“继续”

02

查看您的

注册账号邮箱

发件箱 no-reply@register.signin.amazonaws.com.cn

02

查看您的

注册账号邮箱

发件箱 no-reply@register.signin.amazonaws.com.cn

03

输入

邮箱中收到的验证码

点击“继续”

03

输入

邮箱中收到的验证码

点击“继续”

注：该链接中的内容显示语言是与您的网页浏览器设置相一致的，您可以根据需要自行调整语言栏。 *图片点击可放大
2 设置用户名及密码
2. 填写用户名密码

设置用户名 - 设置密码 - 确认密码

2. 填写用户名密码

设置用户名 - 设置密码 - 确认密码

立即开始注册立即开始注册

01

请设置您的

账号用户名

*例如: webchina

01

请设置您的

账号用户名

*例如: webchina

02

为您的帐号

设置密码

02

为您的帐号

设置密码

03

重新

输入密码

03

重新

输入密码

*图片可点击放大
3 填写企业信息
3. 填写账号联系人以及公司信息

3. 填写账号联系人以及公司信息

填写姓名 - 填写联系电话 - 填写公司名称 - 填写办公地址 - 选择是否需要发票 - 点击查看客户协议

填写姓名 - 填写联系电话 - 填写公司名称 - 填写办公地址 - 选择是否需要发票 - 点击查看客户协议

立即开始注册立即开始注册

01

填写公司联系人

姓名全称

01

填写公司联系人

姓名全称

02

填写公司联系人的

联系电话

02

填写公司联系人的

联系电话

03

填写

公司名称

*重要！！！公司名称请务必与您所提供的营业执照公司名称保持一致

03

填写

公司名称

*重要！！！公司名称请务必与您所提供的营业执照公司名称保持一致

04

填写

公司办公地址

省份/自治区/直辖市 - 城市 - 区 - 街道门牌号以及楼层信息 - 邮政编码

04

填写

公司办公地址

省份/自治区/直辖市 - 城市 - 区 - 街道门牌号以及楼层信息 - 邮政编码

05

请选择

是否需要发票

*附件-申请发票流程供您参考

05

请选择

是否需要发票

*附件-申请发票流程供您参考

06

点击查看

客户协议

勾选方框表示您已阅读，并同意客户协议的条款

06

点击查看

客户协议

勾选方框表示您已阅读，并同意客户协议的条款

*图片可点击放大
4 企业信息验证
4. 企业信息验证

上传企业执照 - 填写负责人姓名 - 填写联系方式 -上传身份证件

4. 企业信息验证

上传企业执照 - 填写负责人姓名 - 填写联系方式 -上传身份证件

立即开始注册立即开始注册

01

在此上传

企业注册执照

01

在此上传

企业注册执照

02

请填写网络安全负责人的

姓名

请注意：该字段务必与您下方提供的身份证号匹配或与证件上的姓名保持一致

02

请填写网络安全负责人的

姓名

请注意：该字段务必与您下方提供的身份证号匹配或与证件上的姓名保持一致

03

请填写网络安全负责人的

联系方式

有效的电子邮件地址 - 有效的中国内地手机号码 - 座机号码（如无座机，请填写正确有效的手机号码）

03

请填写网络安全负责人的

联系方式

有效的电子邮件地址 - 有效的中国内地手机号码 - 座机号码（如无座机，请填写正确有效的手机号码）

04

在此上传网络安全负责人的

身份证件

请注意：当您选择证件类型为“身份证”时，您需要填写正确的身份证号码，选择其他证件类型时，您需要上传证件扫描稿

04

在此上传网络安全负责人的

身份证件

请注意：当您选择证件类型为“身份证”时，您需要填写正确的身份证号码，选择其他证件类型时，您需要上传证件扫描稿

*图片可点击放大
5 完成手机验证
5. 完成手机验证

输入手机号 - 输入验证码

5. 完成手机验证

输入手机号 - 输入验证码

立即开始注册立即开始注册

01

在此填写

手机号

01

在此填写

手机号

02

请输入您收到的

4 位

验证码

02

请输入您收到的 4 位

验证码

03

请点击

继续

03

请点击

继续

*图片可点击放大
6 选择支持计划
6. 选择支持计划

选择一个亚马逊云科技支持计划

6. 选择支持计划

选择一个亚马逊云科技支持计划

立即开始注册立即开始注册

请根据需求

选择一个支持计划

请根据需求

选择一个支持计划

*图片点击可放大