发布于: Jul 19, 2021

Amazon Redshift 对 JSON 和半结构化数据的本地支持现已在由光环新网运营的亚马逊云科技中国(北京)区域和由西云数据运营的亚马逊云科技中国(宁夏)区域中正式推出。它基于新的数据类型“SUPER”,允许您将半结构化数据提取和存储到您的 Amazon Redshift 数据仓库中。Amazon Redshift 还包括对 PartiQL 的支持,可以与 SQL 兼容的方式访问关系数据、半结构化数据和嵌套数据。通过在 Amazon Redshift 使用 SUPER 数据类型和 PartiQL,您可以执行高级分析,以便将经典的结构化 SQL 数据(如字符串、数字和时间戳)与半结构化 SUPER 数据(如 JSON)向结合,从而获得超级性能、灵活性和易用性。

SUPER 数据类型从本质上来说是无架构的,并且允许存储嵌套值,这些嵌套值可能包含 Redshift 标量值、嵌套数组或其他嵌套结构。Amazon Redshift 支持将 JSON 数据解析为 SUPER,并且与在传统标量列中插入数据相比,插入相似的 JSON/SUPER 数据的速度快高达 5 倍。PartiQL 是一项 SQL 扩展,已在多个亚马逊云科技产品中采用。PartiQL 允许通过高效对象和数组导航、取消嵌套以及利用诸如 JOIN 和聚合之类的经典分析操作的灵活组合查询来访问无架构和嵌套 SUPER 数据、。它支持可发现结构化和半结构化数据的新高级分析。数据工程师可以直接在 Redshift 集群中对插入的半结构化数据进行简单、低延迟的 ELT(提取、加载、转换)处理,而无需与外部服务集成。除了导航和取消嵌套功能之外,可加速 ELT 的 PartiQL 功能包括无架构语义、动态键入和类型自检。这些功能可以让摄取和查询无架构数据变得更加轻松,因为用户无需在查询数据时预先发现每个摄取源的数据类型,也无需处理不断演变的架构或者编写复杂的 SQL 来考虑不同类型。用户还可以通过创建实体化视图来轻松切碎半结构化数据,并且可以实现分析查询速度数量级提升,同时自动和以增量方式维护实体化视图。

Amazon Redshift 在所有商业区域均提供对 JSON 和半结构化数据的本地支持。

如需详细了解 Amazon Redshift 对 JSON 和半结构化数据的本地支持,请参阅文档