发布于: Mar 7, 2023

我们很高兴地宣布推出 Amazon Glue 4.0 版,Amazon Glue 的这一新版本可加快 Amazon 中的数据集成工作负载。Amazon Glue 4.0 将 Spark 引擎升级到 Apache Spark 3.3.0 和 Python 3.10。Glue 4.0 为客户提供最新的 Spark 和 Python 版本,因此他们可以开发、运行和扩展数据集成工作负载,并且更快地获得见解。

Amazon Glue 是一项无服务器、可扩展的数据集成服务,可轻松发现、准备、移动和集成多个来源的数据。Amazon Glue 4.0 增加了对内置 Pandas API 的支持以及对 Apache Hudi、Apache Iceberg 和 Delta Lake 格式的支持,同时提供更多分析和存储数据的选项。该版本升级 RDS、MySQL 和 SQLServer 等原生 Amazon Glue 数据库源的连接器,从而简化与常见数据库源的连接。Amazon Glue 4.0 还增加对适用于 Apache Spark 的新型 Cloud Shuffle 存储插件的原生支持,该插件可帮助客户在运行时扩展磁盘使用量。它支持自适应查询执行,可在查询运行时执行动态优化。最后,Amazon Glue 4.0 通过为错误消息添加更多上下文来改善开发人员体验。与 Amazon Glue 3.0 一样,客户只需为他们使用的资源付费。

Amazon Glue 4.0 今日在由光环新网运营的亚马逊云科技中国(北京)区域和由西云数据运营的亚马逊云科技中国(宁夏)区域中全面推出。

 

要了解更多信息,请访问我们的文档。