Amazon Glue 5.1 现已在亚马逊云科技中国区域推出
Amazon Glue 是一项无服务器、可扩展的数据集成服务,可简化从多个数据来源发现、准备、迁移和集成数据的流程。Amazon Glue 5.1 将核心引擎升级至 Apache Spark 3.5.6、Python 3.11 和 Scala 2.12.18,带来了性能与安全性的提升。该版本还更新了对开放表格式库(包括 Apache Hudi 1.0.2、Apache Iceberg 1.10.0 和 Delta Lake 3.3.2)的支持。此外,Amazon Glue 5.1 引入了对 Apache Iceberg 格式 3.0 版本的支持,增加了列默认值、读取时合并表的删除向量、多参数转换和行级数据血统追踪功能。此版本还将 Amazon Lake Formation 的细粒度访问控制扩展到了 Spark DataFrame 和 Spark SQL 的写入操作(DML 和 DDL),此前,该功能仅支持读取操作。Amazon Glue 5.1 还在 Apache Spark 中为 Apache Hudi 与 Delta Lake 表提供全表访问控制,从而为您的数据提供更全面的安全选项。
随着本次扩展,Amazon Glue 5.1 现已在由光环新网运营的亚马逊云科技中国(北京)区域和由西云数据运营的亚马逊云科技中国(宁夏)区域推出。
您可以通过 Amazon Glue API、Amazon 命令行界面(CLI)、Amazon 软件开发工具包(SDK)、Amazon Glue Studio 或 Amazon SageMaker 融通式合作开发工作室开始使用 Amazon Glue 5.1。 要了解更多信息,请访问 Amazon Glue 产品页面和我们的文档。