解锁适用于亚马逊 RDS 和亚马逊 Aurora 的亚马逊云科技 CLI 的强大功能

使用适用于亚马逊关系数据库服务 (Amazon RDS) 和 Amazon A urora 的亚马逊云科技命令行接口 (亚马逊云科技 CLI)，您可以使用 shell 命令来创建、修改、删除和生成多种对象的报告，例如数据库实例、Aurora 集群、参数组等。在这篇文章中，我们展示了如何使用亚马逊云科技 CLI 为 Aurora 和 Amazon RDS 生成自动化脚本。如果您因为不是 JavaScript 对象表示法 (JSON) 的专家而对使用亚马逊云科技 CLI 命令犹豫不决，如果您担任 DevOps 角色并且不熟悉每个 RDS 资源的每个属性，或者如果您想生成比 Amazon RDS 控制台上的控制面板或详细信息页面更自动和自定义的报告，那么这篇文章就是为你准备的。为了让数据库程序员和 shell 脚本编写者更容易理解，我们展示了如何像执行 SQL 查询一样简化亚马逊云科技 CLI 命令的输出。

这篇文章是该系列的第1部分。在后续文章中，您将学习如何创建自己的管理和报告实用程序，以涵盖基本的创建-修改-删除周期之外的场景。您可以在这些技术的基础上快速编写亚马逊云科技 CLI 命令来处理 Aurora 集群、RDS 实例和相关资源（例如参数组和代理）的管理问题。例如，您可以动态构造数据库连接字符串，或者循环浏览 Aurora 集群中的所有数据库实例，并将相同的操作应用于每个实例。

为什么要学习亚马逊云科技 CLI？

亚马逊云科技 CLI 是管理亚马逊云科技资源的有效学习环境：

以交互式和迭代的方式进行实验很容易。
了解亚马逊云科技 CLI 命令及其选项有助于揭开亚马逊云科技控制台上选择的神秘面纱，加速您的控制台学习。
学习亚马逊云科技 CLI 还可以让你在使用 Python 和 Java 等编程语言编写管理实用程序方面抢占先机。您在每个语言开发工具包中看到的 API、参数和数据结构名称与亚马逊云科技 CLI 中的命令和参数名称相似。
在创建、修改和删除亚马逊云科技资源的工具中，您将了解幕后发生的事情。这可以帮助您调试问题并利用此类工具中的高级功能。

这篇文章主要关注一个可以帮助您更快地学习亚马逊云科技 CLI 并提高其生产力的方面：捆绑到 --query 选项中的查询 语言。了解查询表示法可以让你通过操作系统命令行浏览数据库集群、数据库实例、版本和实例类等亚马逊云科技资源，就像通过 SQL 客户端工具探索数据库架构一样。

几个 Amazon RDS CLI 命令的名称中都带有 描述 前缀。这些命令纯粹是只读的，相当于数据库 SE LECT 语句。我们在本文的大多数示例中都使用这些 描述 语句。

先决条件

要按照示例进行操作，您需要使用您的亚马逊云科技证书和默认区域安装和配置亚马逊云科技 CLI。一些示例使用需要亚马逊云科技 CLI v2 的语法。有关安装、升级或配置亚马逊云科技 CLI 的说明，请参阅安装或更新亚马逊云科技 CLI 的最新版本。

在您的亚马逊云科技账户中已经拥有一些亚马逊云科技托管数据库（例如 Aurora 数据库集群或 RDS 数据库实例）会很有帮助。

亚马逊云科技 CLI 命令的 JSON 输出

当亚马逊云科技 CLI 命令生成输出时，它默认采用 JSON 格式的文档形式。JSON 文档代表嵌套的数据结构。JavaScript、Python 和 Java 程序员对带有 [] 和 {} 等分隔符的表示法看起来很熟悉。所有这些语言都有数组（在 Python 中称为列表）和哈希（也称为 关联数组 、字典、 哈希表 或键值对）的概念。

如果 JSON 格式看起来很复杂，只需将其想象成 SQL 结果集的表示形式即可。JSON 文档包含一个数组，类似于结果集的行。每个数组元素都包含一组键值对，就像列名和值一样。

JSON 输出的第一个示例

让我们仔细看看亚马逊云科技 CLI 输出以 JSON 格式构造的方式。此上下文可帮助您了解后面示例中发生的情况，这些示例简化了结构并提取了最关键的信息。

例如，让我们分解一下 describ e-db-clusters 命令的 这个输出。尽管完整的输出可能长达数千行，但从第一个简短的部分可以看出整体结构。以下示例显示了仅包含前几行的摘录：

$ aws rds describe-db-clusters
{
  "DBClusters": [
    {
      "DBClusterIdentifier": "my-db-cluster",
      "Engine": "aurora-postgresql",
      "EngineVersion": "14.6",
      "Port": 5432,
      ...

整个文档由 {} 分隔，这意味着最外层是一组键值对。 只有一个键值对，其键名为 dbClusters。 db Clusters 键的值是一个数组，由 [] 分隔。每个数组元素代表正在描述的一个项目：在本例中为该账户拥有的 Aurora 集群。 每个数组元素都是另一组键值对，同样由 {} 分隔。 这些键值对代表该特定 Aurora 数据库集群的所有属性。

您可以通过亚马逊云科技 CLI 命令一遍又一遍地看到这种模式。只有一个密钥，其名称取决于命令所作用的资源类型。输出中的关键信息是每个项目的属性列表。要获得各个属性，需要解开 JSON 文档中最外面的几个关卡。

亚马逊云科技 CLI 命令的 `--query` 选项

默认情况下，JSON 输出代表您正在操作的对象的每一个属性。如果你只需要几个屏幕输出中的一两项信息，这可能会导致信息过载。

为了使输出更易于使用，亚马逊云科技 CLI 内置了查询语言。您可以将查询作为参数字串提供给几乎所有亚马逊云科技 CLI 命令的 --query 选项。这些查询参数简化并重新格式化 JSON 输出，使其易于理解或用作其他脚本的输入。作为数据库专业人员，您可能会在 SE LECT 语句中对数据库中的系统表执行此类操作。你可以想象，CLI 命令正在向系统表中查询亚马逊云科技管理的高级云资源。

首次使用 `--query` 选项

让我们从前面的示例中 d escribe-db-clust ers 的输出进行简化。我们没有列出显示每个属性的每个集群，而是找到一个特定问题的答案： my-db-c luster 的数据库引擎和引擎版本是什么？这是 --query 选项的用武之地。它使用名为 j mesPath 的 J SON 感知表示法，通过一系列转换步骤运行亚马逊云科技 CLI 输出。为了得到这个答案，我们将集群列表变成一个项目，即我们感兴趣的集群。然后，我们将属性列表转换为包含问题答案的特定属性。您可以使用以下命令，替换您自己的集群的名称而不是 m y-db-cluster：

$ aws rds describe-db-clusters --query '*[]
  | [?DBClusterIdentifier == `my-db-cluster`]
  | [].[DBClusterIdentifier,Engine,EngineVersion]' --output text

输出应该是一行以制表符分隔的文本，其中包含集群名称、引擎名称和版本。例如：

my-db-cluster       aurora-postgresql       14.6

此示例介绍了 --query 参数字符串中管道的概念。用竖线符号分隔的查询字符串的每一段都获取前一阶段的输出，并将其更改为数组或哈希的不同布局，或者应用某些操作，例如筛选或排序。我们将在后续文章中看到这样的高级示例。由于整个查询字符串位于单引号字符串文字中，因此我们可以将流水线阶段分散到多行中，而无需使用任何行连续字符。

提取结果集的行

让我们分解前面示例中的 --query 字符串，以便我们能够理解其含义。

第一步是去除最外面的键值对。在 Amazon RDS CLI 命令中，输出始终只包含一个元素。这就是最初的 * [] 操作所做的。无论键名是什么，它都会从第一个键值对的值部分获取数组。生成的输出位于带有 [] 分隔符的数组中；带有 {} 分隔符的最外层哈希被丢弃。

$ aws rds describe-db-clusters --query '*[]'
[
    {
        "DBClusterIdentifier": "my-db-cluster",
	...

现在我们已经摆脱了最外层的 {“dbClusters”: 包装 器。输出 JSON 文档是一个数组。每个数组元素代表一个数据库集群的属性。它基本上是一个以 JSON 表示法格式化的 SQL 结果集。

构造列列表

为了将输出精简为可读的内容，让我们只从前面示例的结果集中提取几列。 您可以使用以下代码仅查询 dbC lusterIdentifier 和引擎属性。 符号 '* []。 {name1：attr1，name2：attr2} ' 表示像前面的示例一样将 JSON 文档扁平化为数组，然后使每个数组元素仅包含名称在 {} 块中指定的属性。 每个键值对都包含您选择的名称以及查询中前一阶段生成的属性的值。

$ aws rds describe-db-clusters \
  --query '*[].{DBClusterIdentifier:DBClusterIdentifier,Engine:Engine,EngineVersion:EngineVersion}'
[
    {
        "DBClusterIdentifier": "my-db-cluster",
        "Engine": "aurora-postgresql",
        "EngineVersion" 14.6
    },
    {
        "DBClusterIdentifier": "another-db-cluster",
        "Engine": "aurora-mysql",
        "EngineVersion": 8.0.mysql_aurora.3.02.3
    },
	...

要使 --query 字符串和输出具有自描述性，可以为每个键值对的两个部分重复属性名称。这样，属性名称将与该属性的值一起显示在 JSON 输出中。 {} 块中不能包含任何空格或换行符。

筛选初始数组中的项目

符号 [？thing1 comparison_operator thing2] 对先前状态的输出应用过滤器。它只会通过那些与测试相匹配的项目。有许多 JMesPath 过滤器表达式可供使用。现在，让我们继续进行相等性测试，将属性与文字值进行比较。字面值用反引号引用。例如，您可以运行一个 描述 命令，该命令仅返回具有特定属性（例如 引擎 、EngineVersion 或 状态 ）值的项目：

$ aws rds describe-db-clusters --query '*[]
  | [?DBClusterIdentifier == `my-db-cluster`]
  | [].{DBClusterIdentifier:DBClusterIdentifier,Engine:Engine,EngineVersion:EngineVersion}'
[
    {
        "DBClusterIdentifier": "my-db-cluster",
        "Engine": "aurora-postgresql",
        "EngineVersion" 14.6
    }
]

另一种查找单件商品的方法

每个 describe 命令都有一个选项来指定要描述的单个项目的标识符。 这相当于使用主键进行数据库查询。 对于 d escribe-db-cluster-cluster-cl ust er-cluster 以下示例检索的信息与前面的示例相同，只是针对一个特定的 Aurora 集群：

$ aws rds describe-db-clusters --db-cluster-identifier my-db-cluster \
  --query '*[].{DBClusterIdentifier:DBClusterIdentifier,Engine:Engine,EngineVersion:EngineVersion} | [0]'        
  
{
    "DBClusterIdentifier": "my-db-cluster",
    "Engine": "aurora-postgresql",
    "EngineVersion": 14.6
}

最后的解包

在前面的示例中， [0] 的最后阶段从结果数组中获取元素编号为零。如果没有那个阶段，输出将被封装在一个额外的 [] 数组块中。当保证输出为单个项目时，封闭的数组是多余的。

使用 `--output 选项选择输出` 格式

使用前面示例中的技术，您可以使用所需的 JSON 格式生成亚马逊云科技 CLI 输出。你可以选择使用哪种哈希和数组的嵌套方式。您可以为每个键值对选择键的名称。你可以获取该输出并使用 jq 等命令行工具或 Python 等编程语言对其进行操作，也可以将其存储在数据库中并使用 PostgreSQL 或 MySQL 中的内置 JSON 函数。

您不必在整个端到端流程中使用 JSON。如果您有经过验证的 --query 字符串生成了正确的输出，则可以在亚马逊云科技 CLI 命令中添加 -- output 选项以完全隐藏 JSON 方面。

使用 `--` output 表生成格式化报告

你可以使用 --output table 选项来获得采用 ASCII 行和方框格式良好的输出，就像在基于文本的 SQL 命令行客户端中看到的那样。属性名称成为表中的列标题。参见以下代码：

$ aws rds describe-db-instances \
  --query '*[].{DBInstanceIdentifier:DBInstanceIdentifier,Engine:Engine,EngineVersion:EngineVersion} | [0:6]' \
  --output table

----------------------------------------------------------------
|                      DescribeDBInstances                     |
+----------------------+---------------------+-----------------+
| DBInstanceIdentifier |       Engine        |  EngineVersion  |
+----------------------+---------------------+-----------------+
|  apg11-instance      |  aurora-postgresql  |  11.17          |
|  apg12-instance      |  aurora-postgresql  |  12.12          |
|  apg12-instance-b    |  aurora-postgresql  |  12.12          |
|  apg13-instance      |  aurora-postgresql  |  13.8           |
|  apg14-instance      |  aurora-postgresql  |  14.6           |
|  apg15-instance-1    |  aurora-postgresql  |  15.2           |
+----------------------+---------------------+-----------------+

`使用--output 文本生成纯文本输出`

使用相同的 --query 字符串，你可以使用 --output 文本选项在制表 符分隔的列中获得纯文本输出。您可以将纯文本输出提供给传统的基于行的Unix实用程序，例如 grep 、 剪切 和 排序 ，或任何其他未设置为处理 JSON 文档的脚本。参见以下代码：

$ aws rds describe-db-instances \
  --query '*[].{DBInstanceIdentifier:DBInstanceIdentifier,Engine:Engine,EngineVersion:EngineVersion} | [0:6]' \
  --output text
  
apg11-instance  aurora-postgresql       11.17
apg12-instance  aurora-postgresql       12.12
apg12-instance-b        aurora-postgresql       12.12
apg13-instance  aurora-postgresql       13.8
apg14-instance  aurora-postgresql       14.6
apg15-instance-1        aurora-postgresql       15.2

由于文本输出不包含任何属性或列名称，因此通常最好将文本输出与少量输出列一起使用，以便于识别字段值。例如，基于文本的输出可能是标识符的简单列表，或者标识符加上一个或两个其他属性。

如果您不需要标签进行格式化，例如在生成纯文本输出以用作 shell 脚本的输入时，则可以在最后阶段使用数组表示法（如 [attr1、attr2、attr3] ）来省略标签。该命令的这个较短版本会生成相同的文本输出。

$ aws rds describe-db-instances \
  --query '*[].[DBInstanceIdentifier,Engine,EngineVersion]' --output text
  
apg11-instance  aurora-postgresql       11.17
apg12-instance  aurora-postgresql       12.12
apg12-instance-b        aurora-postgresql       12.12
apg13-instance  aurora-postgresql       13.8
apg14-instance  aurora-postgresql       14.6
apg15-instance-1        aurora-postgresql       15.2

在最后阶段使用数组表示法还可以确保--output 表和 --out put 文本 中的列完全按照您指定的顺序打印。当输出包含标签时，将根据标签文本按字母顺序对列进行排序。使用数组表示法强制执行列顺序的折衷方案是，使用 --output 表 时，该表不包含列标题。

何时使用每种亚马逊云科技 CLI 输出格式

--输出 json 选项是默认选项。如果存储输出以供日后使用，将其作为输入提供给以具有 JSON 处理功能的语言编写的程序，或者将其存储在具有解析 JSON 文档功能的数据库中，就会使用这种方法。

如果输出纯粹用于目视检查，则使用 --output 表 选项很方便。每个值周围的线条和边框使格式一致且易于浏览。 您不会使用该格式作为需要解析输出的任何其他程序的输入，例如 grep 或 awk 。 你可以使用等宽字体将其直接复制并粘贴到报表中。

--output 文本 选项适用于只需要少量含义众所周知的输出列的情况。例如，每行输出可能是数据库或集群标识符以及一两个其他属性，例如终端节点、引擎版本、状态或 Amazon 资源名称 (ARN)。这种带有制表符分隔符的面向行的输出非常适合通过管道传输到您编写的其他面向行的 Unix 工具或脚本。

你甚至可以使用 --output 文本 格式从单个对象中提取单个属性。这样，您可以将亚马逊云科技 CLI 命令的输出直接替换为其他命令。例如，您可以使用 Unix shell 表示法 $ (aws rds ) 来返回单个标识符、终端节点、端口等。

结论

在这篇文章中，您学习了如何使用亚马逊云科技 CLI 来完成以下任务：

使用 描述 命令准备有关 RDS 和 Aurora 资源的自定义报告。您现在知道如何填写模板参数，如 --query '* []。{} ' 和 --query '* []. []' 以生成包含某些指定属性的输出。
简化 RDS 和 Aurora 资源的 创建 、 修改 和 删除 命令的输出，仅显示对您来说最重要的属性。
使用由多个过滤器和转换阶段组成的管道来编写复杂的 --query 参数。
根据您的使用场景选择 -- out put 参数的相应的 j son、 文本 和 表格 选项。
控制 --output 表生成的输出的 标签。
控制 -- output json 生成的输出的结构和嵌套。
控制 --output 文本生成的输出的 列顺序。
从涉及多个 RDS 和 Aurora 资源的报告中提取单个项目或项目子集。
详细了解可以在 --q uery 参数字符串中使用的 JMesPath 比较运算符、函数等。

在下一篇文章中，我们将看到这些技术的更多示例，以帮助自动化您在管理 RDS 和 Aurora 资源时可能遇到的用例。

作者简介

约翰·罗素 是亚马逊旗舰关系数据库Amazon Aurora的高级开发者倡导者。他在关系数据库之上记录、测试和构建工具方面拥有 20 多年的经验。他为四个知名数据库引擎的 SQL 参考和开发者文档做出了贡献。John 帮助培训刚接触亚马逊云科技、托管数据库或开源 PostgreSQL 和 MySQL 引擎的客户。在开发新的 Aurora 功能期间，John 还帮助解释和扩大开发者需求。

解锁适用于亚马逊 RDS 和亚马逊 Aurora 的 亚马逊云科技 CLI 的强大功能

为什么要学习 亚马逊云科技 CLI？