我们使用机器学习技术将英文博客翻译为简体中文。您可以点击导航栏中的“中文(简体)”切换到英文版本。
深入探讨:Amazon EKS 控制面板,可查看多集群运营和治理
这篇博文由容器高级解决方案架构师卡洛斯·桑塔纳、Kubernetes 高级产品经理斯里拉姆·兰加纳森、Kubernetes 产品营销经理萨巴里·萨万特和容器高级 GTM 专家弗兰克·卡尔塔共同撰写。
随着各组织在亚马逊云科技区域和账户中发展其 Kubernetes 基础设施,他们在维持对 Kubernetes 集群的监督方面面临越来越多的挑战。如果没有集中可见性,团队通常会发现集群运行过时的软件,错过安全更新,执行计划外升级,并遇到意想不到的扩展支持成本。Amazon Elastic Kubernetes Service(Amazon EKS)控制面板通过提供集中式界面来应对这些挑战,该界面使云架构师和集群管理员能够保持其 Kubernetes 集群的全组织可见性。
多集群 Kubernetes 管理中的可见性挑战
随着组织扩大其 Kubernetes 覆盖范围以满足不同的业务需求(例如提高可用性、减少延迟、强制工作负载隔离或确保数据驻留),他们通常会在亚马逊云科技区域和账户上部署多个 EKS 集群。尽管这种分布式模型带来了架构和运营方面的好处,但它也带来了一类新的挑战,可能会阻碍大规模的治理和运营效率:
- 集群蔓延:如果没有集中控制,集群会在团队、账户和亚马逊云科技区域之间迅速扩散。平台团队经常会忘记 Kubernetes 基础设施清单,从而导致环境不受托管和缺乏治理。
- 安全风险:集群可能在不受支持的 Kubernetes 版本上运行,或者包含过时的插件。这些漏洞使环境面临安全风险和合规违规行为,而缺乏组织范围的跟踪使得及时补救变得困难。
- 运营效率低下:跨集群手动协调升级和维护会减慢操作速度。团队对升级准备情况的洞察缺乏集中可见性,这会导致集群升级效率低下。
- 支持成本上升:超过其支持生命周期的集群会产生更多的扩展支持费用。如果没有成本预测或版本延迟的可见性,组织就会面临可避免的开支和预算意外。
这些挑战凸显了在组织范围内全面了解 Kubernetes 基础设施的必要性,而 Amazon EKS 控制面板是专门为提供这一能力而设计的。
介绍 Amazon EKS 控制面板
为了应对分布式 Kubernetes 环境带来的可见性、合规性和运营挑战,Amazon EKS 现在提供了集中式控制面板体验。这项原生亚马逊云科技控制台功能提供组织中所有亚马逊云科技账户和区域的 Kubernetes 资源(集群、托管节点组和 Amazon EKS 插件)的统一视图。Amazon EKS 控制面板使平台工程师和集群管理员能够监控集群运行状况和 Kubernetes 版本状态,确定计划终止支持自动升级的集群,预测使用扩展支持的集群的成本影响,并查明需要版本更新的节点组和插件。通过整合版本分发、节点类型、支持生命周期和配置等元数据,Amazon EKS 控制面板可以最大限度地减少对定制工具或第三方解决方案的需求,从而获得所有 Kubernetes 集群的可见性。这种全面的界面使平台团队能够自信而清晰地运营,确保在其 Kubernetes 集群中进行主动治理。此接口提供以下功能:
- 监控集群运行状况和 Kubernetes 版本状态
- 识别即将结束支持自动升级的集群
- 预测运行较旧集群版本的财务影响
- 无需第三方工具或自定义脚本即可简化库存跟踪
该控制面板作为原生 Amazon EKS 控制台功能提供,可确保无缝的用户体验并消除外部工具维护的负担,如下图所示。

Amazon EKS 控制面板入门
用户可以通过亚马逊云科技管理和委托管理员账户访问 Amazon EKS 控制台中的控制面板。设置过程是直接的,包括在 Amazon EKS 控制台的控制面板设置页面中一次性启用可信访问,如下图所示。启用可信访问使管理账户能够在 Amazon EKS 控制台中查看控制面板。有关设置和配置的更多信息,组织可以参阅亚马逊云科技官方文档。
图 2:仪表板设置
对于喜欢使用非管理账户使用 Amazon EKS 控制面板的组织,其组织中的任何成员账户都可以注册为 Amazon EKS 的委托管理员账户以查看控制面板。通过管理账户中的控制面板设置页面,组织可以在组织中注册任何成员账户作为 Amazon EKS 的委托管理员,如下图所示。注册完成后,用户可以通过登录委托管理员账户并导航到 Amazon EKS 控制台左侧栏上的控制面板链接来访问控制面板。
图 3:注册委派管理员
图 4:提供任何组织成员账户作为 Amazon EKS 的委托管理员
图 5:使用 Amazon EKS 控制台中的链接访问控制面板
Amazon EKS 多集群控制面板可让您查看三种关键资源类型:
集群:查看有关 EKS 集群的汇总信息,例如:
- 具有升级见解的集群
- 基于支持类型的集群分布
- 按 Kubernetes 版本划分集群
托管节点组:查看有关托管节点组的汇总信息,例如:
- 按亚马逊系统映像 (AMI) 类型(例如亚马逊 Linux 或 Bottlerocket)划分的节点组
- 节点组自动修复配置
- 实例类型分布
Amazon EKS 插件:查看有关 Amazon EKS 插件的汇总信息,例如:
- 每个插件的安装次数
- 每个插件的版本分发
- 有健康问题的附加组件
Amazon EKS 控制面板用例
在以下各节中,我们将探讨一些常见的操作场景,其中 Amazon EKS 控制面板支持多种操作场景。
用例 1:版本生命周期和成本预测
集群管理员可以使用仪表板来识别注册了扩展支持的集群。以下可视化视图根据标准支持和扩展支持之间的支持类型配置显示了组织中群集的细分。
图 6:按支持类型划分的集群仪表板控件
用户还可以按照 Kubernetes 集群版本查看哪些集群的支持已接近终止自动升级。灵活的下拉菜单允许用户选择不同的时间段,例如接下来的 30 天或其他预定义的时间间隔,如下图所示。团队可以查看哪些集群已设置为支持终止自动升级,从而可以主动跟踪和规划 Kubernetes 集群升级,同时最大限度地减少基础设施中断。
图 7:可筛选视图显示了在选定时间范围内计划自动升级的集群
除了版本管理外,组织还可以使用仪表板来预测集群未在建议的时间表内升级时与 EKS 集群相关的潜在成本,如下图所示。跟踪小工具监控集群使用旧版本的天数,并对延迟升级的财务影响提供明确的估计。这使组织能够使基础设施维护与财政计划保持一致,从而确保运营弹性和成本效益。
图 8:估算扩展支持费用的成本预测小工具
尽管跟踪 Kubernetes 版本和预测扩展支持成本可以为您的组织提供战略监督,但确保集群和节点组的运行状况对于维护强大的基础设施同样至关重要。
用例 2:集群和节点组运行状况
2.1 升级就绪:集群管理员使用控制面板筛选和显示存在升级洞察严重性问题的集群,如下图所示。仪表板提供了升级准备情况视图,该视图根据升级洞察的数量和严重性突出显示集群。这些见解表明了可能干扰成功升级版本的潜在不兼容性或配置。使用这些数据,管理员可以在启动升级之前主动解决问题,从而确保更顺畅地过渡,最大限度地减少中断,并在整个升级生命周期中保持系统完整性。
图 9:资源视图显示了每个集群的升级洞察严重性问题
2.2 节点组运行状况:尽管升级准备工作侧重于集群级别的运行状况,但同样重要的是各个节点组的运行状况。集群管理员分析各个账户和亚马逊云科技区域的节点组配置,以检测那些禁用了自动修复的节点组配置。仪表板显示了可视化细分,突出显示了有多少节点组关闭了此关键功能,如下图所示。自动修复通过自动替换运行状况不佳的节点来最大限度地减少停机时间,确保服务在实例故障期间保持可用。在未启用自动修复的情况下识别和修复节点组,使组织能够增强容错能力,支持高可用性目标,并减少恢复期间的手动干预。
图 10:按禁用自动修复筛选的资源视图
除了通过自动修复和升级准备情况检查等功能来维护集群和节点组的运行状况外,组织还必须确保对整个基础设施中的 Amazon EKS 插件进行一致的管理,以维持安全和合规标准。
用例 3:Amazon EKS 插件治理
各团队使用控制面板通过集中版本分布视图简化跨多个亚马逊云科技账户和区域的 Amazon EKS 插件管理,如下图所示。管理员选择特定的插件来查看其版本分布,从而可以有效地识别需要升级的集群。这种能力在解决安全漏洞或合规性要求时特别有价值。查看资源功能使团队能够查明运行过时附加版本的集群,从而促进有针对性的维护规划。这种集中式可见性使组织能够在其集群中保持一致的插件版本。
图 11:Amazon EKS 插件版本分布
通过控制面板建立运营监控、运行状况管理和附加监管,组织可以使用全面的报告功能来更深入地了解其跨亚马逊云科技区域和账户的 Kubernetes 基础设施。这使得数据驱动的决策和合规性验证成为可能。
图 12:按名称和版本筛选的 Amazon EKS 插件的资源视图
用例 4:报告和扩展见解
4.1 数据导出和集成:团队使用 CSV 导出功能从仪表板中提取完整和筛选的数据集。组织将此导出功能用于多种用途,例如上传到 Amazon S3 等存储服务、与审计人员共享库存信息以及与定制报告平台集成。这种灵活性使团队能够将集群和基础设施见解扩展到仪表板界面之外进行高级分析,如下图所示。
图 13:选择 "导出到 csv" 以下载 csv 文件
4.2 亚马逊云科技区域资源合规性视图:要完成分析图,各团队访问全球地图视图,监控亚马逊云科技区域的资源分布情况,以了解合规性和监管要求。控制面板支持单击访问筛选后的资源视图,允许组织验证特定亚马逊云科技区域中的集群是否符合业务监管要求,如下图所示。
图 14:全局视图显示每个亚马逊云科技区域的集群,选择区域显示集群的数量
4.3 历史趋势分析:平台团队通过历史数据可视化来跟踪关键的 Kubernetes 基础设施趋势。仪表板显示了一段时间内的集群库存增长、Kubernetes 版本采用率和支持类型注册模式,如下图所示。这种可见性使团队能够在监控组织的 Kubernetes 生态系统进展的同时做出数据驱动的决策。
图 15:历史趋势
试一试 Amazon EKS 控制面板!
Amazon EKS 控制面板在美国东部-1(弗吉尼亚北部)亚马逊云科技区域运营,无需额外费用即可聚合来自所有商业亚马逊云科技区域的 EKS 集群元数据。团队可以通过访问 Amazon EKS 控制台并启用新的控制面板体验来开始可视化他们的 Kubernetes 集群。
查看我们的容器路线图!
如果您对我们如何改进 Amazon EKS 控制面板或容器服务的其他方面有想法,请使用容器路线图向我们提供反馈并查看我们现有的路线图项目。
*前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您发展海外业务和/或了解行业前沿技术选择推荐该服务。